ปัญญาประดิษฐ์

Gemini 3.1 Pro ทำสถิติใหม่ด้านการให้เหตุผล

mm

Google ได้เผยโฉม Gemini 3.1 Pro เมื่อวันที่ 19 กุมภาพันธ์ ซึ่งเป็นการอัปเดตโมเดล AI รุ่นล่าสุดของบริษัท โดยมีการปรับปรุงประสิทธิภาพการให้เหตุผลมากกว่า 2 เท่า ในขณะที่ราคา vẫnเหมือนกับรุ่นก่อนหน้า

ตัวเลขที่น่าประทับใจที่สุดคือ คะแนน 77.1% ที่ได้รับจากการทดสอบ ARC-AGI-2 ซึ่งเป็นมาตรฐานที่ทดสอบความสามารถของโมเดลในการแก้ปัญหาเชิงตรรกะที่ซับซ้อน Gemini 3 Pro ได้คะแนน 31.1% ในการทดสอบเดียวกัน ซึ่งหมายความว่า Gemini 3.1 Pro มีการปรับปรุงประสิทธิภาพการให้เหตุผลมากที่สุดในบรรดาทั้งหมด

โมเดลนี้สามารถใช้งานได้ทันทีบนแพลตฟอร์มผู้บริโภคและผู้พัฒนา của Google ผู้ใช้ Gemini App ที่มีแผน AI Pro และ AI Ultra จะสามารถใช้งานได้โดยมีขีดจำกัดการใช้งานที่สูงกว่า ในขณะที่ผู้พัฒนาสามารถใช้งานได้โดยผ่าน Gemini API ใน AI Studio, Vertex AI, Gemini CLI, Antigravity และ Android Studio

ประสิทธิภาพการให้เหตุผลที่ดีที่สุด

การ์ดโมเดลแสดงให้เห็นว่า Gemini 3.1 Pro มีคะแนนสูงสุดใน 12 จาก 18 มาตรฐานที่ติดตาม โดยนอกเหนือจาก ARC-AGI-2 แล้ว ยังมีคะแนน 94.3% ใน GPQA Diamond ซึ่งเป็นการทดสอบการให้เหตุผลทางวิทยาศาสตร์ระดับบัณฑิตศึกษา และคะแนน 2,887 Elo ใน LiveCodeBench Pro ซึ่งเป็นคะแนนสูงสุดในบรรดาทั้งหมด

ใน Humanity’s Last Exam ซึ่งเป็นมาตรฐานที่ทดสอบความสามารถในการแก้ปัญหาเชิงวิชาการ Gemini 3.1 Pro ได้คะแนน 44.4% ซึ่งสูงกว่า Gemini 3 Pro ที่ได้คะแนน 37.5% และ GPT-5.2 ที่ได้คะแนน 34.5%

โมเดลนี้ยังคงมีขนาดหน้าต่างการให้เหตุผล 1 ล้านตัว และสามารถสร้างผลลัพธ์ได้มากถึง 64,000 ตัว ซึ่งเทียบเท่ากับเครื่องมือ AI ที่ต้องการให้ข้อมูลและผลลัพธ์

การเปลี่ยนแปลงการให้เหตุผลแบบไดนามิก

Gemini 3.1 Pro ใช้การให้เหตุผลแบบไดนามิกโดยอัตโนมัติ ซึ่งเป็นแนวทางที่โมเดลปรับเปลี่ยนการให้เหตุผลภายในตามความซับซ้อนของคำถาม

ผู้พัฒนาสามารถควบคุมพฤติกรรมนี้ได้โดยผ่านพารามิเตอร์ thinking_level ใน API ซึ่งสามารถตั้งค่าความลึกสูงสุดของการให้เหตุผลภายใน

สนามการแข่งขันที่เข้มข้น

Gemini 3.1 Pro เข้าสู่ตลาดที่มีการแข่งขันที่เข้มข้น โดยมีการเปลี่ยนแปลงผู้นำในแต่ละเดือน Google’s Gemini 3 ได้กระตุ้นให้ OpenAI อัปเดต GPT-5.2 ในเวลาไม่นาน

Gemini 3.1 Pro มีข้อได้เปรียบด้านการกระจาย โดยสามารถใช้งานได้บนผลิตภัณฑ์ที่มีผู้ใช้หลายร้อยล้านคน เช่น Gmail, Docs, Search และ Personal Intelligence

สำหรับผู้พัฒนาที่เลือกใช้โมเดล AI รุ่นต่างๆ การตัดสินใจด้านราคาได้กลายเป็นเรื่องที่ง่ายขึ้น โดย Gemini 3.1 Pro มีราคาถูกกว่า OpenAI และ Anthropic

การปรับปรุงประสิทธิภาพการให้เหตุผลมีความสำคัญที่สุดสำหรับการใช้งาน AI ที่ต้องการการวางแผนและการแก้ปัญหาเชิงซับซ้อน

การเปลี่ยนแปลงในประสิทธิภาพการให้เหตุผลจะส่งผลกระทบต่อการทำงานในโลกแห่งความเป็นจริงหรือไม่นั้น จะต้องรอคำตอบจาก Google ในช่วงหลายสัปดาห์ที่จะมาถึง

Alex McFarland เป็นนักข่าวและนักเขียน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมงานกับสตาร์ทอัพ AI และสื่อสิ่งพิมพ์ต่างๆ ทั่วโลก