ปัญญาประดิษฐ์
OpenAI และ Anthropic เปิดตัวโมเดลที่แข่งขันกันเมื่อการแข่งขัน AI เพิ่มความเข้มข้น

OpenAI และ Anthropic เปิดตัวโมเดลใหม่ภายในเวลาไม่กี่นาทีหลังจากกัน โดย OpenAI เปิดตัวแพลตฟอร์มเอเจนต์สำหรับองค์กรในขณะเดียวกัน และ Perplexity เปิดตัวคุณสมบัติการวิจัยแบบหลายโมเดล วันนี้มีการประกาศผลิตภัณฑ์ AI ที่สำคัญมากกว่าที่ส่วนใหญ่จะทำได้ในหนึ่งสัปดาห์
มาดูกันว่าอะไรที่ได้รับการเปิดตัวและอะไรที่หมายถึง
Anthropic’s Opus 4.6: Agent Teams และหน้าต่างขนาด 1 ล้านโทเค็น
Anthropic เปิดตัว Claude Opus 4.6 ซึ่งเป็นโมเดลที่มีความสามารถมากที่สุด โดยมีคุณสมบัติสำคัญสองอย่าง: หน้าต่างขนาด 1 ล้านโทเค็น และคุณสมบัติใหม่ที่เรียกว่า Agent Teams
หน้าต่างขนาด 1 ล้านโทเค็นเป็นความสำเร็จทางเทคนิคที่สำคัญกว่า โดยที่ Opus 4.6 สามารถประมวลผลข้อความได้ประมาณ 3,000 หน้าในครั้งเดียว — สี่เท่าของขีดจำกัด 256,000 โทเค็นของโมเดลก่อนหน้า เมื่อรวมกับการสนับสนุนการออกข้อความขนาด 128,000 โทเค็น โมเดลสามารถรับและทำงานกับฐานโค้ดทั้งหมด การยื่นฟ้องด้านกฎระเบียบ หรือองค์ความรู้ด้านวิจัยโดยไม่ต้องแบ่งหรือสรุป
Agent Teams ที่มีอยู่ใน Claude Code ช่วยให้หลายตัวแทนของ Claude สามารถทำงานร่วมกันในแบบขนานบนฐานโค้ดที่ใช้ร่วมกัน แทนที่จะให้ตัวแทนเพียงตัวเดียวทำงานตามลำดับ ผู้พัฒนาสามารถสร้างทีมที่ตัวแทนหนึ่งจัดการการเปลี่ยนแปลงด้านหน้า ตัวแทนอื่นเขียนการทดสอบ และตัวแทน第三จัดการตรรกะด้านหลัง — ทั้งหมดนี้ทำงานร่วมกันในโครงการเดียวกัน
Opus 4.6 ยังแนะนำการคิดแบบปรับเปลี่ยน ซึ่งช่วยให้โมเดลสามารถปรับระดับการให้เหตุผลตามความต้องการของคำถามที่ให้มา คำถามที่ง่ายจะได้รับการตอบกลับอย่างรวดเร็ว ปัญหาเชิงซ้อนจะกระตุ้นการคิดที่ลึกและขยายออกไป ผู้พัฒนาสามารถปรับเปลี่ยนสิ่งนี้ผ่านการควบคุมความพยายามในระดับ四: ต่ำ ปานกลาง สูง และสูงสุด
ในด้านมาตรฐาน Opus 4.6 ได้รับคะแนนสูงสุดใน Terminal-Bench 2.0 สำหรับการเขียนโค้ดแบบเอเจนต์ และเป็นผู้นำใน Humanity’s Last Exam ซึ่งเป็นการประเมินการให้เหตุผลที่ซับซ้อน Anthropic อ้างว่ามีความได้เปรียบ 144 คะแนนเหนือ GPT-5.2 ในการประเมิน GDPval-AA และดีขึ้น 190 คะแนนเหนือ Opus 4.5
ราคาของ API ยังคงไม่เปลี่ยนแปลงที่ 5 ดอลลาร์ต่อล้านโทเค็นเข้าและ 25 ดอลลาร์ต่อล้านโทเค็นออก แม้ว่าคำถามที่เกิน 200,000 โทเค็นจะมีอัตราเบี้ยปริมาณของ 10/37.50 ดอลลาร์
ในขั้นตอนสำคัญขององค์กร Anthropic ประกาศการแสดงตัวอย่างการวิจัยของ Claude ใน Microsoft PowerPoint โดยที่โมเดลสามารถอ่านการวางแนวและเทมเพลตสไลด์ที่มีอยู่แล้ว และสร้างหรือแก้ไขการนำเสนอโดยยังคงรูปแบบการให้บริการขององค์กร
OpenAI’s GPT-5.3-Codex: โมเดลที่ช่วยสร้างตัวเอง
นาทีหลังจากการประกาศของ Anthropic OpenAI เปิดตัว GPT-5.3-Codex ซึ่งเป็นโมเดลการเขียนโค้ดที่มีความสามารถมากที่สุด การเปิดตัวนี้รวมถึงประสิทธิภาพการเขียนโค้ดระดับแนวหน้าของ GPT-5.2-Codex และความสามารถในการให้เหตุผลและความรู้เชิงวิชาชีพของ GPT-5.2 เข้าด้วยกันในระบบเดียวที่เร็วขึ้น 25%
การอ้างสิทธิ์ที่น่าสังเกตที่สุดคือ GPT-5.3-Codex ช่วยสร้างตัวเอง OpenAI’s Codex ทีมใช้เวอร์ชันแรกของโมเดลในช่วงกระบวนการฝึกอบรม — การแก้ปัญหาการฝึกอบรม การจัดการโครงสร้างพื้นฐานการปล่อยตัว และการวินิจฉัยผลการประเมิน เป็นการยอมรับของ OpenAI ครั้งแรกว่าโมเดลมีบทบาทสำคัญในการพัฒนาของตนเอง ซึ่งเป็น 里程碑ที่ทำให้เกิดคำถามเกี่ยวกับประสิทธิภาพและความปลอดภัย
GPT-5.3-Codex ตั้งค่าระดับอุตสาหกรรมใหม่ใน SWE-Bench Pro และ Terminal-Bench ซึ่งเป็นมาตรฐานที่ประเมินงานวิศวกรรมซอฟต์แวร์ในโลกแห่งความเป็นจริง โมเดลสามารถจัดการกับงานที่ใช้เวลานานที่เกี่ยวข้องกับการวิจัย การใช้เครื่องมือ และการดำเนินการเชิงซ้อน และผู้ใช้สามารถโต้ตอบกับมันระหว่างงานโดยไม่สูญเสียบริบท — มากกว่าการทำงานร่วมกับเพื่อนร่วมงานมากกว่าการออกคำสั่ง
โมเดลนี้มีให้สำหรับผู้ใช้แผนการชำระเงิน ChatGPT ทั้งหมดผ่านแอป Codex CLI เอกส์ตेंชั่น IDE และอินเทอร์เฟซเว็บ การเข้าถึง API จะมาเร็วๆ นี้
สำหรับนักพัฒนาที่เลือก เครื่องมือสร้างโค้ด AI ภาพการแข่งขันคือการกำหนดให้ชัดเจนขึ้น: Opus 4.6 มีความสามารถในการประสานงานเอเจนต์และงานบริบทยาว ในขณะที่ GPT-5.3-Codex เน้นความเร็วและความสามารถในการให้เหตุผลแบบบูรณาการ ทั้งสองโมเดลอ้างว่าได้คะแนนสูงสุดในมาตรฐานที่ทับซ้อนกัน และเครื่องมืออย่าง Cursor และ Apple’s Xcode สนับสนุนทั้งสองโมเดล ดังนั้นนักพัฒนาจึงสามารถเปลี่ยนระหว่างโมเดลได้อย่างอิสระ
OpenAI Frontier: เอเจนต์องค์กรได้รับแพลตฟอร์มของตนเอง
พร้อมกับการเปิดตัวโมเดล OpenAI เปิดตัว Frontier ซึ่งเป็นแพลตฟอร์มสำหรับองค์กรในการสร้าง การใช้งาน และจัดการเอเจนต์ AI Frontier เชื่อมต่อกับฐานข้อมูล ระบบ CRM ระบบ HR เครื่องมือตั๋ว และแอปพลิเคชันทางธุรกิจอื่นๆ จากนั้นให้เอเจนต์ AI ดำเนินการกระบวนการข้ามแอปพลิเคชันเหล่านั้น
OpenAI อธิบาย Frontier ว่าเป็น “ชั้นเชิงคำนวณสำหรับองค์กร” โดยที่พนักงานมนุษย์และเอเจนต์ AI ทำงานบนแพลตฟอร์มเดียวกันพร้อมการเข้าถึงข้อมูลและควบคุมความปลอดภัยที่ใช้ร่วมกัน เอเจนต์ได้รับอัตลักษณ์เหมือนพนักงาน บริบทองค์กรที่ใช้ร่วมกัน และสิทธิ์การใช้งานระดับองค์กร
แพลตฟอร์มนี้ไม่ขึ้นอยู่กับโมเดล — บริษัทต่างๆ สามารถจัดการเอเจนต์ที่สร้างขึ้นจากโมเดลของ OpenAI พร้อมกับโมเดลจาก Google Microsoft และ Anthropic ลูกค้าเริ่มต้นรวมถึง Intuit State Farm Thermo Fisher และ Uber
Frontier จัดตำแหน่ง OpenAI เพื่อแข่งขันกับแพลตฟอร์มองค์กรอย่าง Salesforce’s Agentforce และ ServiceNow’s AI agents ความแตกต่าง: OpenAI กำลังสร้างจากชั้นโมเดลขึ้น ในขณะที่ผู้นำตลาดกำลังเพิ่ม AI เข้ากับเครื่องมือการทำงานที่มีอยู่แล้ว ไม่ว่าองค์กรจะชอบโครงสร้างพื้นฐานเอเจนต์จากผู้ให้บริการ AI หรือผู้ให้บริการซอฟต์แวร์ของตนเอง จะกำหนดการแข่งขัน AI ระดับองค์กรในปี 2026
Perplexity’s Model Council: โมเดลสามตัว ตอบเดียว
Perplexity เปิดตัว Model Council คุณสมบัติที่รันคำถามเดียวกันบนโมเดลสามตัวพร้อมกัน — Claude Opus GPT และ Gemini — จากนั้นใช้โมเดลสังเคราะห์เพื่อรวมเอาต์พุตของพวกมันให้เป็นคำตอบเดียวที่ระบุพื้นที่ของความเห็นพ้องกันและไม่เห็นพ้องกัน

Image: Perplexity
แนวคิดคือไม่มีโมเดลเดียวที่ดีกว่าโมเดลอื่นๆ ในทุกคำถาม เมื่อโมเดลสามตัวที่ดีที่สุดมาบรรจบกันที่คำตอบเดียวกัน ความมั่นใจจะสูง เมื่อพวกมันแตกต่างกัน ผู้ใช้จะรู้ว่าต้องตรวจสอบเพิ่มเติม Model Council มีให้สำหรับผู้สมัครสมาชิก Max และจัดตำแหน่งสำหรับการวิจัยการลงทุน การวิเคราะห์เชิงกลยุทธ์ และการตัดสินใจที่ซับซ้อน
คุณสมบัตินี้สะท้อนถึงกลยุทธ์ของ Perplexity ในการแยกความแตกต่างผ่านการกำกับดูแลแบบหลายโมเดลมากกว่าการสร้างโมเดลพื้นฐาน เมื่อช่องว่างระหว่าง AI chatbot ระดับแนวหน้าบนมาตรฐานแต่ละรายการแคบลง การรวมเอาต์พุตของพวกมันอาจมีค่ามากกว่าการเลือกผู้ให้บริการเดียว
สิ่งที่ทั้งหมดนี้หมายถึง
การเปิดตัวเหล่านี้ยืนยันว่าการแข่งขัน AI ได้เปลี่ยนจากความสามารถของโมเดลไปสู่โครงสร้างพื้นฐานของผลิตภัณฑ์ ทั้ง OpenAI และ Anthropic มีโมเดลที่ได้คะแนนสูงสุดในมาตรฐานเดียวกัน การแยกความแตกต่างตอนนี้อยู่ในสิ่งที่คุณสามารถสร้างบนโมเดลเหล่านั้น
Perplexity ในขณะเดียวกันก็ให้ข้อโต้แย้งอย่างเงียบๆ ว่าสงครามโมเดลอาจไม่สำคัญเท่ากับวิธีการรวมโมเดล หาก Model Council พิสูจน์ความมีประโยชน์ มันแสดงให้เห็นว่าอนาคตไม่ใช่การเลือกระหว่าง Claude และ GPT — แต่เป็นการใช้ทั้งสอง
สำหรับนักพัฒนและองค์กรที่ประเมินสแต็ก AI ของตน สิ่งนี้ทำให้การตัดสินใจยากขึ้น












