Inception บริษัท AI จากเมือง Palo Alto ที่ก่อตั้งโดย Stefano Ermon ศาสตราจารย์จากมหาวิทยาลัยสแตนฟอร์ด เพิ่งเปิดตัวโมเดลภาษา AI รูปแบบใหม่ที่เรียกว่า DLM (Diffusion-based Large Language Model) ซึ่งสามารถทำงานได้เร็วและมีประสิทธิภาพดีกว่าโมเดลภาษาแบบเดิมอย่าง GPT-4o mini และ Claude 3.5 Haiku โดยประมวลผลได้เร็วกว่าถึง 10 เท่า และประหยัดต้นทุนได้มากกว่า 10 เท่า
เทคโนโลยีแบบ diffusion-based นี้สามารถสร้างข้อความทั้งบล็อกได้พร้อมกัน แทนที่จะต้องสร้างทีละคำเหมือนโมเดลแบบเดิม ทำให้มีประสิทธิภาพสูงและควบคุมคุณภาพผลลัพธ์ได้ดีกว่า นอกจากนี้ยังใช้งาน GPU ได้อย่างมีประสิทธิภาพมากขึ้น ทำให้สามารถนำไปใช้งานได้หลากหลายรูปแบบ ทั้ง API การติดตั้งในองค์กร และอุปกรณ์ Edge ต่างๆ โมเดลของ Inception สามารถเขียนโค้ดและตอบคำถามได้เหมือนโมเดลทั่วไป แต่ทำงานได้ดีกว่า โดยโมเดลขนาดเล็กของพวกเขาทำงานได้เทียบเท่า GPT-4o mini แต่เร็วกว่า 10 เท่า ส่วนโมเดล “mini” ก็ทำงานได้ดีกว่า Llama 3.1 8B ของ Meta โดยประมวลผลได้มากกว่า 1,000 โทเคนต่อวินาที
การค้นพบนี้คาดว่าจะปฏิวัติวงการพัฒนาและใช้งานโมเดลภาษา AI โดยเทคโนโลยีของ Inception จะช่วยให้องค์กรต่างๆ สามารถขยายระบบ AI อัจฉริยะได้อย่างมีประสิทธิภาพมากขึ้น และเพิ่มความสามารถในการตัดสินใจแบบเรียลไทม์ แนวทางที่เป็นนวัตกรรมนี้อาจกลายเป็นมาตรฐานใหม่สำหรับประสิทธิภาพของ AI ทำให้ AI ขั้นสูงสามารถเข้าถึงได้ในการใช้งานและอุปกรณ์ที่หลากหลายมากขึ้น
ที่มา: BusinessWire, BestofAI