ปัญญาประดิษฐ์

โมเดล Claude ใหม่ของ Anthropic สะท้อนความสมดุลระหว่างพลังของ AI และความเป็นจริง

mm

Anthropic ได้เผยโฉมการอัปเดตครั้งสำคัญของโมเดล AI Claude ของตน最近 โดยการเปิดตัวเวอร์ชันที่ได้รับการปรับปรุงของ Claude 3.5 Sonnet และเปิดตัวโมเดลใหม่ Claude 3.5 Haiku ซึ่งแสดงถึงความก้าวหน้าที่สำคัญทั้งในด้านความสามารถในการทำงานและความเสมอภาคในด้านต้นทุน

การเปิดตัวครั้งนี้แสดงถึงความก้าวหน้าเชิงกลยุทธ์ในภูมิทัศน์ของ AI โดยเฉพาะอย่างยิ่งในการปรับปรุงความสามารถในการเขียนโปรแกรมและเหตุผลเชิงตรรกะ ในขณะที่บริษัทต่างๆ ทั่วทั้งอุตสาหกรรมยังคงผลักดันขอบเขตของการพัฒนา AI การเปิดตัวครั้งล่าสุดของ Anthropic ยังคงโดดเด่น

การผ่านพื้นที่การทำงาน

โมเดลที่ได้รับการปรับปรุงแสดงให้เห็นถึงการปรับปรุงที่น่าประทับใจในหลายมาตรฐาน โดยเฉพาะอย่างยิ่งโมเดล Haiku ใหม่ที่บรรลุผลลัพธ์ที่น่าสังเกต ในงานเขียนโปรแกรม โมเดล Sonnet ที่อัปเดตแสดงผลการทำงานที่ 49.0% ในการทดสอบ SWE Bench Verified ซึ่งเป็นมาตรฐานใหม่สำหรับโมเดลที่มีอยู่สาธารณะ รวมถึงระบบเขียนโปรแกรมเฉพาะ

ความเสมอภาคในด้านต้นทุนเป็นประเด็นสำคัญของการพัฒนานี้ โมเดล Haiku ใหม่นำเสนอผลลัพธ์ที่เทียบเท่ากับโมเดล Claude 3 Opus ก่อนหน้านี้ ในขณะเดียวกันก็รักษาต้นทุนการดำเนินการที่ลดลงอย่างมีนัยสำคัญ ด้วยราคาที่ตั้งไว้ที่ 1 ดอลลาร์ต่อล้านโทเค็นอินพุตและ 5 ดอลลาร์ต่อล้านโทเคนออัพพุต องค์กรสามารถเพิ่มประสิทธิภาพการนำ AI ไปใช้ได้โดยใช้คุณสมบัติเช่นการแคชพรอมต์ และการประมวลผลแบบแบตช์

การปรับปรุงมาตรฐานไม่เพียงแต่ในด้านความสามารถในการเขียนโปรแกรมเท่านั้น โมเดลเหล่านี้แสดงให้เห็นถึงผลลัพธ์ที่ดีขึ้นในด้านความเข้าใจภาษาทั่วไปและเหตุผลเชิงตรรกะ ใน TAU Bench ซึ่งประเมินความสามารถในการใช้เครื่องมือ Sonnet แสดงให้เห็นถึงการปรับปรุงที่สำคัญในหลายภาคส่วน รวมถึงการเพิ่มขึ้นจาก 62.6% เป็น 69.2% ในแอปพลิเคชันร้านค้าปลีก

ความก้าวหน้าเหล่านี้ชี้ให้เห็นว่าแนวคิดในการพัฒนา AI กำลังเปลี่ยนแปลงไป โดยที่ความสามารถในการทำงานสูงไม่จำเป็นต้องสัมพันธ์กับต้นทุนที่สูงเกินไป การทำให้ความสามารถ AI ที่ทันสมัยมีให้เข้าถึงได้กว้างขึ้นอาจมีผลกระทบอย่างกว้างขวางต่อธุรกิจและผู้พัฒนาที่ต้องการนำโซลูชัน AI ไปใช้

Source: Anthropic

การโต้ตอบกับคอมพิวเตอร์

แทนที่จะพัฒนาเครื่องมือเฉพาะสำหรับงานเฉพาะ บริษัทได้ใช้แนวทางที่กว้างขึ้นโดยการให้ความสามารถคอมพิวเตอร์ทั่วไปแก่ Claude ซึ่งช่วยให้โมเดล AI สามารถโต้ตอบกับอินเทอร์เฟซซอฟต์แวร์มาตรฐานที่ออกแบบสำหรับผู้ใช้คน

จุดศูนย์กลางของความก้าวหน้านี้คือ API ใหม่ที่ช่วยให้ Claude สามารถรับรู้และจัดการอินเทอร์เฟซคอมพิวเตอร์ได้โดยตรง ระบบนี้ทำให้ AI สามารถดำเนินการเช่น การเคลื่อนไหสมाउส์ การเลือกองค์ประกอบ และการป้อนข้อความผ่านคีย์บอร์ดเสมือน ซึ่งเป็นขั้นตอนสำคัญในการทำงานร่วมกันระหว่างมนุษย์และ AI ที่เป็นธรรมชาติมากขึ้น

อย่างไรก็ตาม ความสามารถในปัจจุบันยังคงแสดงให้เห็นทั้งความหวังและข้อจำกัด ในขณะที่ Claude 3.5 Sonnet ได้รับคะแนน 14.9% ในหมวด “screenshots only” ของ OSWorld benchmark ซึ่งเกือบเป็นสองเท่าของระบบ AI ที่ดีที่สุดถัดไป แต่นี่ยังคงบ่งชี้ถึงพื้นที่ที่ต้องการการปรับปรุงเมื่อเทียบกับความสามารถของมนุษย์ การกระทำพื้นฐานที่มนุษย์ทำโดยไม่ต้องคิด เช่น การเลื่อนและซูม ยังคงเป็นเรื่องที่ท้าทายสำหรับระบบ AI

ผลกระทบต่อตลาดและการใช้งาน

ผลกระทบทางธุรกิจของการพัฒนานี้ขยายไปทั่วหลายภาคส่วน องค์กรสามารถเข้าถึงความสามารถ AI ที่ทันสมัยได้ในระดับต้นทุนที่จัดการได้ ซึ่งอาจเร่งการนำ AI ไปใช้ในอุตสาหกรรมต่างๆ ความสามารถในการเขียนโปรแกรมที่ดีขึ้นเป็นพิเศษส่งผลประโยชน์ต่อทีมพัฒนาソフトแวร์ ในขณะที่ความเข้าใจภาษาที่ดีขึ้นให้ประโยชน์ต่อแอปพลิเคชันการบริการลูกค้าและการสร้างเนื้อหา

ในแง่ของการวางตำแหน่งในอุตสาหกรรม แนวทางของ Anthropic ตั้ง mìnhให้แตกต่างผ่านการเน้นไปที่ความเป็นไปได้จริงและความคุ้มค่า การรวมกันของเมตริกประสิทธิภาพที่ดีขึ้นและต้นทุนที่เหมาะสมทำให้โมเดลเหล่านี้เป็นโซลูชันที่เป็นไปได้สำหรับทั้งองค์กรขนาดใหญ่และขนาดเล็กที่กำลังสำรวจการนำ AI ไปใช้

การประยุกต์ใช้จริงครอบคลุมหลายกรณีการใช้งาน:

  • การพัฒนาソフトแวร์: ความสามารถในการสร้างและแก้บั๊กโค้ดที่ดีขึ้น
  • การบริการลูกค้า: การโต้ตอบของชัตบอทที่ซับซ้อนมากขึ้น
  • การวิเคราะห์ข้อมูล: การให้เหตุผลเชิงตรรกะที่ดีขึ้นสำหรับการตีความข้อมูลที่ซับซ้อน
  • การเพิ่มประสิทธิภาพการทำงาน: การจัดการอินเทอร์เฟซคอมพิวเตอร์โดยตรงสำหรับงานประจำ

การเข้าถึงคุณสมบัติที่ทันสมัยเหล่านี้ โดยเฉพาะผ่านแพลตฟอร์มคลาวด์หลักๆ เช่น Amazon Bedrock และ Google Cloud’s Vertex AI ทำให้การรวมเข้าด้วยกันสำหรับองค์กรที่ใช้บริการเหล่านี้ง่ายขึ้น ความพร้อมใช้งานที่กว้างขวางนี้ เมื่อรวมกับรูปแบบการกำหนดราคาที่ยืดหยุ่น บ่งชี้ถึงการเร่งความเร็วในการนำ AI ไปใช้ในองค์กร

มองไปข้างหน้า

การเปิดตัวโมเดลที่ได้รับการปรับปรุงเหล่านี้แสดงถึงมากกว่าการปรับปรุงเชิงกระบวนการในเทคโนโลยี AI มันบ่งบอกถึงอนาคตที่ระบบ AI สามารถรวมเข้ากับระบบคอมพิวเตอร์และการทำงานที่มีอยู่ได้อย่างเป็นธรรมชาติมากขึ้น แม้ว่าข้อจำกัดในปัจจุบันจะยังคงมีอยู่ โดยเฉพาะอย่างยิ่งในด้านการโต้ตอบกับคอมพิวเตอร์ที่เหมือนมนุษย์ แต่พื้นฐานสำหรับการก้าวหน้าต่อไปในด้านนี้ได้ถูกวางไว้แล้ว

แนวทางที่ระมัดระวังของ Anthropic ในการนำไปใช้ โดยแนะนำให้นักพัฒนเริ่มต้นด้วยงานที่มีความเสี่ยงต่ำ แสดงให้เห็นถึงความเข้าใจทั้งในด้านศักยภาพของเทคโนโลยีและข้อจำกัดในปัจจุบัน แนวทางที่มีมาตรการนี้ เมื่อรวมกับเมตริกประสิทธิภาพที่โปร่งใส ช่วยตั้งค่าการคาดหวังที่เป็นจริงสำหรับการนำไปใช้ในองค์กร

ผลกระทบต่อเส้นทางพัฒนานั้นสำคัญ โดยมีวันปิดการรับทราบข้อมูลที่ขยายไปถึงเดือนกรกฎาคม 2024 สำหรับโมเดล Haiku เราได้เห็นแนวโน้มในการพัฒนา AI ที่ทันสมัยและเกี่ยวข้องมากขึ้น การพัฒนานี้ชี้ให้เห็นว่าฉากต่างๆ ในอนาคตอาจช่วยลดช่องว่างระหว่างฐานความรู้ของ AI และความต้องการข้อมูลแบบเรียลไทม์

ข้อพิจารณาที่สำคัญสำหรับการพัฒนาต่อๆ ไป ได้แก่:

  • การปรับปรุงความสามารถในการโต้ตอบกับคอมพิวเตอร์ต่อไป
  • การเพิ่มประสิทธิภาพอัตราส่วนประสิทธิภาพต่อค่าใช้จ่าย
  • การบูรณาการที่ดีขึ้นกับระบบธุรกิจที่มีอยู่
  • การขยายการประยุกต์ใช้ในภาคส่วนและกรณีการใช้งานใหม่ๆ

สรุป

การเปิดตัวครั้งล่าสุดของ Anthropic เป็น 里程碑 ที่สำคัญในการพัฒนาเทคโนโลยี AI โดยสร้างความสมดุลที่สำคัญระหว่างความสามารถที่ทันสมัยและข้อพิจารณาการนำไปใช้จริง แม้ว่าจะยังคงมีความท้าทายในการบรรลุการโต้ตอบกับคอมพิวเตอร์ที่เหมือนมนุษย์ แต่การผสมผสานระหว่างการปรับปรุงเมตริกประสิทธิภาพ คุณสมบัติใหม่ๆ และรูปแบบการกำหนดราคาที่เหมาะสม ทำให้พื้นฐานสำหรับการประยุกต์ใช้ที่เปลี่ยนแปลงไปในหลายอุตสาหกรรม ซึ่งอาจเปลี่ยนแปลงวิธีที่องค์กรนำ AI ไปใช้ในการดำเนินงานประจำวัน

Alex McFarland เป็นนักข่าวและนักเขียน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมงานกับสตาร์ทอัพ AI และสื่อสิ่งพิมพ์ต่างๆ ทั่วโลก