Connect with us

OpenAI และ Anthropic เปิดตัวโมเดลที่แข่งขันกันเมื่อการแข่งขัน AI เพิ่มความเข้มข้น

ปัญญาประดิษฐ์

OpenAI และ Anthropic เปิดตัวโมเดลที่แข่งขันกันเมื่อการแข่งขัน AI เพิ่มความเข้มข้น

mm

OpenAI และ Anthropic เปิดตัวโมเดลใหม่ภายในเวลาไม่กี่นาทีหลังจากกัน โดย OpenAI เปิดตัวแพลตฟอร์มเอเจนต์สำหรับองค์กรในขณะเดียวกัน และ Perplexity เปิดตัวคุณสมบัติการวิจัยแบบหลายโมเดล วันนี้มีการประกาศผลิตภัณฑ์ AI ที่สำคัญมากกว่าที่ส่วนใหญ่จะทำได้ในหนึ่งสัปดาห์

มาดูกันว่าอะไรที่ได้รับการเปิดตัวและอะไรที่หมายถึง

Anthropic’s Opus 4.6: Agent Teams และหน้าต่างขนาด 1 ล้านโทเค็น

Anthropic เปิดตัว Claude Opus 4.6 ซึ่งเป็นโมเดลที่มีความสามารถมากที่สุด โดยมีคุณสมบัติสำคัญสองอย่าง: หน้าต่างขนาด 1 ล้านโทเค็น และคุณสมบัติใหม่ที่เรียกว่า Agent Teams

หน้าต่างขนาด 1 ล้านโทเค็นเป็นความสำเร็จทางเทคนิคที่สำคัญกว่า โดยที่ Opus 4.6 สามารถประมวลผลข้อความได้ประมาณ 3,000 หน้าในครั้งเดียว — สี่เท่าของขีดจำกัด 256,000 โทเค็นของโมเดลก่อนหน้า เมื่อรวมกับการสนับสนุนการออกข้อความขนาด 128,000 โทเค็น โมเดลสามารถรับและทำงานกับฐานโค้ดทั้งหมด การยื่นฟ้องด้านกฎระเบียบ หรือองค์ความรู้ด้านวิจัยโดยไม่ต้องแบ่งหรือสรุป

Agent Teams ที่มีอยู่ใน Claude Code ช่วยให้หลายตัวแทนของ Claude สามารถทำงานร่วมกันในแบบขนานบนฐานโค้ดที่ใช้ร่วมกัน แทนที่จะให้ตัวแทนเพียงตัวเดียวทำงานตามลำดับ ผู้พัฒนาสามารถสร้างทีมที่ตัวแทนหนึ่งจัดการการเปลี่ยนแปลงด้านหน้า ตัวแทนอื่นเขียนการทดสอบ และตัวแทน第三จัดการตรรกะด้านหลัง — ทั้งหมดนี้ทำงานร่วมกันในโครงการเดียวกัน

Opus 4.6 ยังแนะนำการคิดแบบปรับเปลี่ยน ซึ่งช่วยให้โมเดลสามารถปรับระดับการให้เหตุผลตามความต้องการของคำถามที่ให้มา คำถามที่ง่ายจะได้รับการตอบกลับอย่างรวดเร็ว ปัญหาเชิงซ้อนจะกระตุ้นการคิดที่ลึกและขยายออกไป ผู้พัฒนาสามารถปรับเปลี่ยนสิ่งนี้ผ่านการควบคุมความพยายามในระดับ四: ต่ำ ปานกลาง สูง และสูงสุด

ในด้านมาตรฐาน Opus 4.6 ได้รับคะแนนสูงสุดใน Terminal-Bench 2.0 สำหรับการเขียนโค้ดแบบเอเจนต์ และเป็นผู้นำใน Humanity’s Last Exam ซึ่งเป็นการประเมินการให้เหตุผลที่ซับซ้อน Anthropic อ้างว่ามีความได้เปรียบ 144 คะแนนเหนือ GPT-5.2 ในการประเมิน GDPval-AA และดีขึ้น 190 คะแนนเหนือ Opus 4.5

ราคาของ API ยังคงไม่เปลี่ยนแปลงที่ 5 ดอลลาร์ต่อล้านโทเค็นเข้าและ 25 ดอลลาร์ต่อล้านโทเค็นออก แม้ว่าคำถามที่เกิน 200,000 โทเค็นจะมีอัตราเบี้ยปริมาณของ 10/37.50 ดอลลาร์

ในขั้นตอนสำคัญขององค์กร Anthropic ประกาศการแสดงตัวอย่างการวิจัยของ Claude ใน Microsoft PowerPoint โดยที่โมเดลสามารถอ่านการวางแนวและเทมเพลตสไลด์ที่มีอยู่แล้ว และสร้างหรือแก้ไขการนำเสนอโดยยังคงรูปแบบการให้บริการขององค์กร

OpenAI’s GPT-5.3-Codex: โมเดลที่ช่วยสร้างตัวเอง

นาทีหลังจากการประกาศของ Anthropic OpenAI เปิดตัว GPT-5.3-Codex ซึ่งเป็นโมเดลการเขียนโค้ดที่มีความสามารถมากที่สุด การเปิดตัวนี้รวมถึงประสิทธิภาพการเขียนโค้ดระดับแนวหน้าของ GPT-5.2-Codex และความสามารถในการให้เหตุผลและความรู้เชิงวิชาชีพของ GPT-5.2 เข้าด้วยกันในระบบเดียวที่เร็วขึ้น 25%

การอ้างสิทธิ์ที่น่าสังเกตที่สุดคือ GPT-5.3-Codex ช่วยสร้างตัวเอง OpenAI’s Codex ทีมใช้เวอร์ชันแรกของโมเดลในช่วงกระบวนการฝึกอบรม — การแก้ปัญหาการฝึกอบรม การจัดการโครงสร้างพื้นฐานการปล่อยตัว และการวินิจฉัยผลการประเมิน เป็นการยอมรับของ OpenAI ครั้งแรกว่าโมเดลมีบทบาทสำคัญในการพัฒนาของตนเอง ซึ่งเป็น 里程碑ที่ทำให้เกิดคำถามเกี่ยวกับประสิทธิภาพและความปลอดภัย

GPT-5.3-Codex ตั้งค่าระดับอุตสาหกรรมใหม่ใน SWE-Bench Pro และ Terminal-Bench ซึ่งเป็นมาตรฐานที่ประเมินงานวิศวกรรมซอฟต์แวร์ในโลกแห่งความเป็นจริง โมเดลสามารถจัดการกับงานที่ใช้เวลานานที่เกี่ยวข้องกับการวิจัย การใช้เครื่องมือ และการดำเนินการเชิงซ้อน และผู้ใช้สามารถโต้ตอบกับมันระหว่างงานโดยไม่สูญเสียบริบท — มากกว่าการทำงานร่วมกับเพื่อนร่วมงานมากกว่าการออกคำสั่ง

โมเดลนี้มีให้สำหรับผู้ใช้แผนการชำระเงิน ChatGPT ทั้งหมดผ่านแอป Codex CLI เอกส์ตेंชั่น IDE และอินเทอร์เฟซเว็บ การเข้าถึง API จะมาเร็วๆ นี้

สำหรับนักพัฒนาที่เลือก เครื่องมือสร้างโค้ด AI ภาพการแข่งขันคือการกำหนดให้ชัดเจนขึ้น: Opus 4.6 มีความสามารถในการประสานงานเอเจนต์และงานบริบทยาว ในขณะที่ GPT-5.3-Codex เน้นความเร็วและความสามารถในการให้เหตุผลแบบบูรณาการ ทั้งสองโมเดลอ้างว่าได้คะแนนสูงสุดในมาตรฐานที่ทับซ้อนกัน และเครื่องมืออย่าง Cursor และ Apple’s Xcode สนับสนุนทั้งสองโมเดล ดังนั้นนักพัฒนาจึงสามารถเปลี่ยนระหว่างโมเดลได้อย่างอิสระ

OpenAI Frontier: เอเจนต์องค์กรได้รับแพลตฟอร์มของตนเอง

พร้อมกับการเปิดตัวโมเดล OpenAI เปิดตัว Frontier ซึ่งเป็นแพลตฟอร์มสำหรับองค์กรในการสร้าง การใช้งาน และจัดการเอเจนต์ AI Frontier เชื่อมต่อกับฐานข้อมูล ระบบ CRM ระบบ HR เครื่องมือตั๋ว และแอปพลิเคชันทางธุรกิจอื่นๆ จากนั้นให้เอเจนต์ AI ดำเนินการกระบวนการข้ามแอปพลิเคชันเหล่านั้น

OpenAI อธิบาย Frontier ว่าเป็น “ชั้นเชิงคำนวณสำหรับองค์กร” โดยที่พนักงานมนุษย์และเอเจนต์ AI ทำงานบนแพลตฟอร์มเดียวกันพร้อมการเข้าถึงข้อมูลและควบคุมความปลอดภัยที่ใช้ร่วมกัน เอเจนต์ได้รับอัตลักษณ์เหมือนพนักงาน บริบทองค์กรที่ใช้ร่วมกัน และสิทธิ์การใช้งานระดับองค์กร

แพลตฟอร์มนี้ไม่ขึ้นอยู่กับโมเดล — บริษัทต่างๆ สามารถจัดการเอเจนต์ที่สร้างขึ้นจากโมเดลของ OpenAI พร้อมกับโมเดลจาก Google Microsoft และ Anthropic ลูกค้าเริ่มต้นรวมถึง Intuit State Farm Thermo Fisher และ Uber

Frontier จัดตำแหน่ง OpenAI เพื่อแข่งขันกับแพลตฟอร์มองค์กรอย่าง Salesforce’s Agentforce และ ServiceNow’s AI agents ความแตกต่าง: OpenAI กำลังสร้างจากชั้นโมเดลขึ้น ในขณะที่ผู้นำตลาดกำลังเพิ่ม AI เข้ากับเครื่องมือการทำงานที่มีอยู่แล้ว ไม่ว่าองค์กรจะชอบโครงสร้างพื้นฐานเอเจนต์จากผู้ให้บริการ AI หรือผู้ให้บริการซอฟต์แวร์ของตนเอง จะกำหนดการแข่งขัน AI ระดับองค์กรในปี 2026

Perplexity’s Model Council: โมเดลสามตัว ตอบเดียว

Perplexity เปิดตัว Model Council คุณสมบัติที่รันคำถามเดียวกันบนโมเดลสามตัวพร้อมกัน — Claude Opus GPT และ Gemini — จากนั้นใช้โมเดลสังเคราะห์เพื่อรวมเอาต์พุตของพวกมันให้เป็นคำตอบเดียวที่ระบุพื้นที่ของความเห็นพ้องกันและไม่เห็นพ้องกัน

Image: Perplexity

แนวคิดคือไม่มีโมเดลเดียวที่ดีกว่าโมเดลอื่นๆ ในทุกคำถาม เมื่อโมเดลสามตัวที่ดีที่สุดมาบรรจบกันที่คำตอบเดียวกัน ความมั่นใจจะสูง เมื่อพวกมันแตกต่างกัน ผู้ใช้จะรู้ว่าต้องตรวจสอบเพิ่มเติม Model Council มีให้สำหรับผู้สมัครสมาชิก Max และจัดตำแหน่งสำหรับการวิจัยการลงทุน การวิเคราะห์เชิงกลยุทธ์ และการตัดสินใจที่ซับซ้อน

คุณสมบัตินี้สะท้อนถึงกลยุทธ์ของ Perplexity ในการแยกความแตกต่างผ่านการกำกับดูแลแบบหลายโมเดลมากกว่าการสร้างโมเดลพื้นฐาน เมื่อช่องว่างระหว่าง AI chatbot ระดับแนวหน้าบนมาตรฐานแต่ละรายการแคบลง การรวมเอาต์พุตของพวกมันอาจมีค่ามากกว่าการเลือกผู้ให้บริการเดียว

สิ่งที่ทั้งหมดนี้หมายถึง

การเปิดตัวเหล่านี้ยืนยันว่าการแข่งขัน AI ได้เปลี่ยนจากความสามารถของโมเดลไปสู่โครงสร้างพื้นฐานของผลิตภัณฑ์ ทั้ง OpenAI และ Anthropic มีโมเดลที่ได้คะแนนสูงสุดในมาตรฐานเดียวกัน การแยกความแตกต่างตอนนี้อยู่ในสิ่งที่คุณสามารถสร้างบนโมเดลเหล่านั้น

Perplexity ในขณะเดียวกันก็ให้ข้อโต้แย้งอย่างเงียบๆ ว่าสงครามโมเดลอาจไม่สำคัญเท่ากับวิธีการรวมโมเดล หาก Model Council พิสูจน์ความมีประโยชน์ มันแสดงให้เห็นว่าอนาคตไม่ใช่การเลือกระหว่าง Claude และ GPT — แต่เป็นการใช้ทั้งสอง

สำหรับนักพัฒนและองค์กรที่ประเมินสแต็ก AI ของตน สิ่งนี้ทำให้การตัดสินใจยากขึ้น

Alex McFarland เป็นนักข่าวและนักเขียน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมงานกับสตาร์ทอัพ AI และสื่อสิ่งพิมพ์ต่างๆ ทั่วโลก