Google ได้ขยายการเข้าถึงความสามารถในการสร้างภาพของ Gemini 2.0 Flash ให้กับนักพัฒนาและผู้ใช้ทั่วไป โดยสามารถทดลองใช้ฟีเจอร์นี้ผ่าน Gemini API ใน Google AI Studio แล้ว ความสามารถนี้เคยเปิดให้เฉพาะกลุ่มผู้ทดสอบที่ได้รับความไว้วางใจเท่านั้น แต่ตอนนี้ได้เปิดให้ทดสอบในวงกว้างขึ้น ทั้งนี้ Gemini 2.0 Flash เป็นส่วนหนึ่งของความพยายามของ Google ในการสร้างโมเดล AI แบบหลายโหมด (multimodal) ที่สามารถจัดการกับข้อมูลและผลลัพธ์ได้หลากหลายรูปแบบ ทั้งข้อความ เสียง และภาพ
Gemini 2.0 Flash มีฟีเจอร์ที่น่าสนใจหลายอย่าง รวมถึงความสามารถในการแก้ไขภาพผ่านการสนทนาโต้ตอบ ผู้ใช้สามารถให้คำแนะนำและปรับปรุงภาพได้หลายรอบผ่านการสนทนา เพื่อให้มั่นใจว่าผลลัพธ์สุดท้ายจะตรงตามความต้องการ โมเดลนี้มีความโดดเด่นในการสร้างภาพที่มีข้อความ ซึ่งเป็นงานที่ท้าทายสำหรับโมเดล AI หลายตัว มันใช้ความรู้เกี่ยวกับโลกและการให้เหตุผลที่ดีขึ้นเพื่อสร้างภาพที่สมจริงและมีรายละเอียด ทำให้เหมาะกับการใช้งานหลายด้าน เช่น การสร้างภาพประกอบสูตรอาหาร หรือการสร้างเรื่องราวที่มีภาพประกอบต่อเนื่องสำหรับการเล่าเรื่อง
ฟีเจอร์การสร้างภาพนี้รองรับการใช้งานได้หลากหลาย ตั้งแต่งานโฆษณา ความบันเทิง ไปจนถึงการศึกษาและการค้าปลีก นักพัฒนาสามารถนำความสามารถเหล่านี้ไปใช้ในแอปพลิเคชันที่กำหนดเองผ่าน Gemini API เพื่อทำงานอัตโนมัติ เช่น การสร้างเนื้อหาสำหรับโซเชียลมีเดีย และภาพสินค้าสำหรับอีคอมเมิร์ซ โมเดลนี้ยังสามารถรักษาความสม่ำเสมอของตัวละครในหลายภาพ ซึ่งสำคัญสำหรับการรักษาเอกลักษณ์ของแบรนด์หรือความต่อเนื่องในการเล่าเรื่อง
Gemini 2.0 Flash มีให้ใช้งานในเวอร์ชันทดลองใน Google AI Studio และผ่าน Gemini API ผู้ใช้สามารถเข้าถึงได้โดยเลือกโมเดล “gemini-2.0-flash-exp” และตั้งค่ารูปแบบผลลัพธ์เป็น “Images + text” การเปิดตัวนี้ทำให้ Google เป็นผู้เล่นสำคัญในเทคโนโลยีสร้างสรรค์ที่ขับเคลื่อนด้วย AI โดยนำเสนอโซลูชันที่ปรับขนาดได้สำหรับธุรกิจและผู้สร้างเนื้อหาที่ต้องการเพิ่มประสิทธิภาพการผลิตในขณะที่ยังคงรักษาการควบคุมด้านความคิดสร้างสรรค์
ที่มา: 9to5Google