OpenAI อัปเกรดโมเดล AI ด้านการถอดความเสียงและการสร้างเสียง เพิ่มความสมจริงและแม่นยำมากขึ้น

Tech1 week ago34 Views

Home
Tech
OpenAI อัปเกรดโมเดล AI ด้านการถอดความเสียงและการสร้างเสียง เพิ่มความสมจริงและแม่นยำมากขึ้น

OpenAI ประกาศการอัปเกรดครั้งสำคัญให้กับโมเดล AI ด้านการถอดความเสียงและการสร้างเสียง โดยปรับปรุงบริการเดิมให้มีความสมจริงและแม่นยำมากขึ้น โมเดลใหม่ประกอบด้วย gpt-4o-transcribe, gpt-4o-mini-transcribe และ gpt-4o-mini-tts การพัฒนานี้เป็นส่วนหนึ่งของกลยุทธ์ที่กว้างขึ้นของ OpenAI ในการสร้างระบบอัตโนมัติที่ซับซ้อนมากขึ้น ซึ่งสามารถทำงานให้ผู้ใช้ได้อย่างอิสระ

คุณสมบัติและการปรับปรุงที่สำคัญ

โมเดลแปลงเสียงเป็นข้อความ: โมเดล gpt-4o-transcribe และ gpt-4o-mini-transcribe ถูกออกแบบมาเพื่อแทนที่โมเดล Whisper รุ่นเก่า โดยมอบความแม่นยำที่ดีขึ้นและลดข้อผิดพลาดในการรับรู้ โดยเฉพาะอย่างยิ่งในการจัดการกับสำเนียงการพูดและสภาพแวดล้อมที่มีเสียงรบกวน โมเดลเหล่านี้ใช้ประโยชน์จากการเรียนรู้แบบเสริมกำลัง (reinforcement learning) และชุดข้อมูลเสียงที่หลากหลาย เพื่อปรับปรุงความน่าเชื่อถือในการถอดความ

โมเดลแปลงข้อความเป็นเสียง: โมเดล gpt-4o-mini-tts ให้เสียงที่สมจริงและควบคุมได้มากขึ้น ช่วยให้นักพัฒนาสามารถปรับแต่งการออกเสียงของข้อความได้ อย่างไรก็ตาม ขณะนี้รองรับเฉพาะเสียงที่สร้างขึ้นแบบประดิษฐ์และเสียงที่กำหนดไว้ล่วงหน้าเท่านั้น

ความพร้อมใช้งานและข้อจำกัด

โมเดลใหม่นี้สามารถใช้งานได้ผ่าน API ของ OpenAI ช่วยให้นักพัฒนาสามารถสร้างตัวแทนเสียงที่ทรงพลังมากขึ้น อย่างไรก็ตาม OpenAI ไม่มีแผนที่จะเปิดตัวโมเดลการถอดความเหล่านี้อย่างเปิดเผย เนื่องจากขนาดและความซับซ้อนของโมเดล แม้จะมีการปรับปรุง แต่โมเดลยังคงเผชิญกับความท้าทาย โดยเฉพาะกับภาษาอินดิกและดราวิเดียน ซึ่งอาจมีอัตราความผิดพลาดในระดับคำที่สูง

การพัฒนาในอนาคต

OpenAI ยังคงลงทุนในการปรับปรุงความชาญฉลาดและความแม่นยำของโมเดลเสียง โดยศึกษาวิธีที่จะช่วยให้นักพัฒนาสามารถผสานเสียงที่กำหนดเองได้ ในขณะที่ยังคงปฏิบัติตามมาตรฐานความปลอดภัย การเคลื่อนไหวนี้สอดคล้องกับวิสัยทัศน์ของ OpenAI ในการสร้างประสบการณ์ AI ที่เป็นส่วนตัวและซับซ้อนมากขึ้น

ที่มา: Best of AI

OpenAI อัปเกรดโมเดล AI ด้านการถอดความเสียงและการสร้างเสียง เพิ่มความสมจริงและแม่นยำมากขึ้น

Share

Share

Leave a reply ยกเลิกการตอบ

Related Posts

Bill Gates ทำนาย AI จะแทนที่หมอและครูภายใน 10 ปี เตือนมนุษย์อาจไม่จำเป็นสำหรับงานส่วนใหญ่ในอนาคต

OpenAI ใกล้ปิดดีลระดมทุนมูลค่ามหาศาล 40,000 ล้านเหรียญสหรัฐ นำโดย SoftBank

Nvidia เจรจาซื้อกิจการ Lepton AI เดินหน้าขยายการลงทุนด้าน AI

Shoji Meguro อดีตนักแต่งเพลง Persona เปิดตัวเกม RPG ใหม่ Guns Undarkness พร้อมกับ Atlus ที่กำลังจะปล่อย Metaphor: ReFantazio

Adobe เปิดตัว Firefly AI แพลนสมาชิกใหม่สำหรับครีเอเตอร์

AMD เปิดราคาและวันวางจำหน่าย Ryzen 9 9950X3D และ 9900X3D ซีพียูเกมมิ่งไฮเอนด์รุ่นใหม่

Google เปิดตัวฟีเจอร์ใหม่ใน Pixel Studio สร้างภาพคนด้วย AI พร้อมอัปเดตฟีเจอร์อื่นๆ บน Pixel

Apple วางแผนอนาคต AirPods Pro 3 พร้อมฟีเจอร์สุขภาพและเสียงล้ำสมัย

Shoji Meguro อดีตนักแต่งเพลง Persona เปิดตัวเกม RPG ใหม่ Guns Undarkness พร้อมกับ Atlus ที่กำลังจะปล่อย Metaphor: ReFantazio

Adobe เปิดตัว Firefly AI แพลนสมาชิกใหม่สำหรับครีเอเตอร์

AMD เปิดราคาและวันวางจำหน่าย Ryzen 9 9950X3D และ 9900X3D ซีพียูเกมมิ่งไฮเอนด์รุ่นใหม่

Google เปิดตัวฟีเจอร์ใหม่ใน Pixel Studio สร้างภาพคนด้วย AI พร้อมอัปเดตฟีเจอร์อื่นๆ บน Pixel