บริษัท AI สตาร์ทอัพจากจีนอย่าง DeepSeek ได้เปิดตัวเวอร์ชันอัพเกรดของโมเดล AI โดยมุ่งเน้นไปที่การปรับปรุงความสามารถด้านการคิดเชิงเหตุผล การเขียนโค้ด และความสามารถด้านภาษา ถึงแม้จะมีการกล่าวถึงโมเดล R1 ในหัวข้อข่าว แต่การพัฒนาล่าสุดนี้มุ่งเน้นไปที่โมเดล V3 ซึ่งมีการปรับปรุงที่สำคัญหลายอย่าง
โมเดลใหม่ V3-0324 ที่เปิดตัวเมื่อวันที่ 24 มีนาคม มาพร้อมกับการเพิ่มประสิทธิภาพด้านการคิดเชิงเหตุผลอย่างมาก และทักษะการเขียนโค้ดที่ดีขึ้น โดยเฉพาะสำหรับการพัฒนาเว็บไซต์ การอัพเดตนี้แสดงให้เห็นถึงประสิทธิภาพที่ดีขึ้นในหลายเกณฑ์การวัดผล รวมถึงการทดสอบคณิตศาสตร์ AIME ที่มีความท้าทาย ซึ่งได้คะแนนสูงกว่ารุ่นก่อนหน้าเกือบ 20 คะแนน นอกจากนี้โมเดลยังมีทักษะการพัฒนาฟรอนต์เอนด์ที่ดีขึ้นและความสามารถในการใช้เครื่องมือที่ชาญฉลาดมากขึ้น รวมทั้งแสดงให้เห็นถึงรูปแบบการเขียนและคุณภาพที่ดีขึ้น โดยเฉพาะสำหรับเนื้อหาที่ยาวขึ้น
DeepSeek ยังคงวางตำแหน่งตัวเองเป็นคู่แข่งที่คุ้มค่าในตลาด AI บริษัทใช้เงินเพียง 6 ล้านเหรียญสหรัฐ (ประมาณ 210 ล้านบาท) ในการฝึกฝนโมเดล V3 ซึ่งน้อยกว่าทรัพยากรที่ใช้โดยบริษัท AI รายใหญ่ของสหรัฐฯ อย่าง OpenAI อย่างมีนัยสำคัญ ประสิทธิภาพนี้ ประกอบกับการสรรหาผู้เชี่ยวชาญชั้นนำจากมหาวิทยาลัยในจีน ทำให้ DeepSeek สามารถเพิ่มความฉลาดและความหลากหลายของโมเดลได้
โมเดล V3-0324 สามารถใช้งานได้ผ่าน HuggingFace และเว็บไซต์และแอปของ DeepSeek อย่างไรก็ตาม ยังคงมีความกังวลเกี่ยวกับช่องโหว่ด้านความปลอดภัยและความเป็นส่วนตัวของผู้ใช้ แม้ว่าโมเดลจะมีความสามารถที่ดีขึ้น แต่ผู้ใช้ควรระมัดระวังเกี่ยวกับช่องโหว่ที่อาจเกิดขึ้น ซึ่งได้มีการบันทึกไว้ในเวอร์ชันก่อนหน้าของโมเดล DeepSeek
โมเดลที่อัพเกรดของ DeepSeek เน้นย้ำถึงความพยายามของบริษัทในการแข่งขันกับบริษัท AI ชั้นนำของสหรัฐฯ โดยเฉพาะ OpenAI ผ่านประสิทธิภาพที่ดีขึ้นและความคุ้มค่า แม้จะมีความกังวลด้านความปลอดภัย การพัฒนาเหล่านี้ทำให้ DeepSeek เป็นผู้เล่นที่สำคัญในวงการ AI ระดับโลก
ที่มา: ZDNet, AA, Towards AI