Connect with us

Anthropic นำการควบคุมเดสก์ท็อป Claude มาสู่ Mac

ปัญญาประดิษฐ์

Anthropic นำการควบคุมเดสก์ท็อป Claude มาสู่ Mac

mm

Anthropic ได้ขยายความสามารถของ Claude เพื่อรวมการควบคุมเดสก์ท็อปโดยตรงบน macOS ทำให้ AI สามารถคลิก พิมพ์ และนำทางแอปพลิเคชันบนคอมพิวเตอร์ของผู้ใช้เมื่อการรวมกับเครื่องมือเช่น Slack และแอปพลิเคชันปฏิทินไม่สามารถใช้ได้

คุณสมบัตินี้มีอยู่แล้วในฐานะการแสดงตัวอย่างการวิจัยภายใน Claude Cowork และ Claude Code สำหรับผู้สมัครรับข้อมูล Claude Pro ($20/เดือน) และ Claude Max ($100/เดือน) ปัจจุบันจำกัดเฉพาะ macOS เท่านั้น

การทำงานของการควบคุมเดสก์ท็อป

Claude ไม่ได้ใช้การควบคุมเดสก์ท็อปโดยอัตโนมัติ ระบบจะพยายามทำภารกิจผ่านการรวมกับแอปพลิเคชันที่มีอยู่ก่อน — ปฏิทิน Slack หรือเครื่องมือที่รองรับอื่นๆ เมื่อไม่มีการรวมกัน Claude จะเข้าควบคุมเมาส์และคีย์บอร์ดเพื่อทำภารกิจโดยตรง

ผู้ใช้ต้องอนุมัติแอปพลิเคชันที่ Claude ได้รับอนุญาตให้ควบคุมอย่างชัดเจน และสามารถหยุด Claude ได้ที่จุดใดก็ตามระหว่างเซสชัน การออกแบบสะท้อนถึงลำดับความสำคัญที่ระบุของ Anthropic ในการรักษาผู้คนไว้ในวงจรระหว่างการแสดงตัวอย่างการวิจัย

ร่วมกับการควบคุมเดสก์ท็อป Anthropic ได้เปิดตัว Dispatch — คุณสมบัติร่วมที่ช่วยให้ผู้ใช้สามารถมอบหมายงานให้ Claude จาก iPhone และกลับมาทำงานที่เสร็จสมบูรณ์บนเดสก์ท็อปของตน แอปพลิเคชันมือถือเชื่อมต่อกับเซสชัน Cowork ที่ใช้งานอยู่ โดยมีการประมวลผลทั้งหมดเกิดขึ้นบน Mac ท้องถิ่น

การเข้าซื้อกิจการ Vercept เป็นรากฐานของเทคโนโลยี

ความสามารถนี้สร้างขึ้นจากเทคโนโลยีของ Vercept AI ซึ่งเป็นสตาร์ทอัพในซีแอตเทิลที่ Anthropic เข้าซื้อกิจการในเดือนกุมภาพันธ์ 2026 Vercept ก่อตั้งขึ้นในเดือนพฤศจิกายน 2024 โดยนักวิจัยจาก Allen Institute for AI ซึ่งได้แก่ Kiana Ehsani, Luca Weihs, Ross Girshick และ Matt Deitke และได้ระดมทุน 16 ล้านดอลลาร์ในรอบการระดมทุนตั้งต้นโดย Fifty Years ก่อนที่จะปิดการซื้อขาย นักลงทุนเท่านั้น ได้แก่ อดีต CEO ของ Google Eric Schmidt นักวิทยาศาสตร์หัวหน้าของ Google DeepMind Jeff Dean ผู้ก่อตั้ง Cruise Kyle Vogt และผู้ร่วมก่อตั้ง Dropbox Arash Ferdowsi

ผลิตภัณฑ์ของ Vercept คือ Vy ซึ่งทำงานเป็นตัวแทนควบคุมคอมพิวเตอร์บนคลาวด์สำหรับ Mac Anthropic ให้เวลาผู้ใช้ Vercept 30 วันในการแจ้งเตือนก่อนที่จะปิด Vy ในวันที่ 25 มีนาคม และดูดซับพนักงาน ผู้ร่วมก่อตั้ง Ehsani ระบุว่าทีมของเธอ “เปิดตัวผลิตภัณฑ์แรกน้อยกว่าสี่สัปดาห์หลังจากเข้าร่วม Anthropic” โดยชี้ไปที่ Dispatch เป็นผลลัพธ์ของการวิ่งเต้นนั้น

ประสิทธิภาพการใช้คอมพิวเตอร์ของ Claude ได้ปรับปรุงอย่างมากนับตั้งแต่ Anthropic แนะนำความสามารถนี้ครั้งแรกในปลายปี 2024 ใน OSWorld Verified — การประเมินมาตรฐานสำหรับโมเดล AI ที่ใช้คอมพิวเตอร์ — รุ่น Claude Sonnet ได้รับคะแนนต่ำกว่า 15% เมื่อเปิดตัวครั้งแรก ด้วยรุ่น Claude Sonnet 4.6 คะแนนนั้นเพิ่มขึ้นเป็น 72.5% ใกล้เคียงกับมาตรฐานของมนุษย์โดยประมาณ 70-75% ในการประเมินมาตรฐานเดียวกัน รุ่น Opus 4.6 ได้รับคะแนน 72.7% ในการทดสอบเดียวกัน

ความปลอดภัยและความน่าเชื่อถือยังคงเป็นคำถามที่เปิดกว้าง

การควบคุมเดสก์ท็อปสร้างความเสี่ยงที่การรวมกับเบราว์เซอร์หรือ API ไม่มี เมื่อ Claude ใช้งานเดสก์ท็อปแบบสดๆ มันจะสามารถเข้าถึงข้อมูลที่มองเห็นได้ทั้งหมดบนหน้าจอ ไฟล์ที่เปิดอยู่ และแอปพลิเคชันที่ผู้ใช้อนุมัติ การวิจัยเกี่ยวกับการใช้คอมพิวเตอร์ของ Anthropic ในช่วงก่อนหน้านี้ระบุการฉีดตัวกระตุ้น — ซึ่งคำสั่งอันชั่วร้ายที่ฝังอยู่ในเนื้อหาบนหน้าจอสามารถบันทึกเจตนาของผู้ใช้ — เป็นพื้นที่การโจมตีหลัก และรุ่น Sonnet 4.6 แสดงให้เห็นถึงการดื้อต่อการโจมตีนี้มากกว่ารุ่นก่อนหน้า

ความน่าเชื่อถือเป็นข้อกังวลเพิ่มเติม โครงสร้างการควบคุมคอมพิวเตอร์ของ Claude ในช่วงก่อนหน้านี้ประมวลผลภาพหน้าจอแบบลำดับมากกว่าฟีดวิดีโอต่อเนื่อง ทำให้พลาดการกระทำหรือการแจ้งเตือนแบบสั้นๆ ไม่ทราบว่าแนวทางของทีม Vercept จะแก้ไขปัญหานี้ในระดับที่กว้างขวางหรือไม่

ตัวแทน macOS ของ OpenAI ที่ใช้เบราว์เซอร์ และผลิตภัณฑ์ที่คล้ายกันมีแรงเสียดทานในการนำไปใช้บางส่วน เนื่องจากการควบคุมเดสก์ท็อปแบบอัตโนมัติจะหยุดทำงานได้ง่ายเมื่อインタเฟซซอฟต์แวร์เปลี่ยนแปลง Anthropic เลือกที่จะจำกัดการควบคุมเดสก์ท็อปให้เป็นตำแหน่งการallback — ถูกกระตุ้นเฉพาะเมื่อการรวมกันมาตรฐานล้มเหลว — ทำให้พื้นที่ผิวสำหรับข้อผิดพลาดลดลง แต่ก็แคบลงในขอบเขตของคุณลักษณะเมื่อเทียบกับตัวแทนเดสก์ท็อปอัตโนมัติเต็มรูปแบบ

คำถามที่ใหญ่กว่านั้นคือว่า ตัวแทน AI สำหรับการทำงานอัตโนมัติทางธุรกิจ สามารถย้ายจากตัวอย่างที่ควบคุมไปยังสภาพแวดล้อมการผลิตแบบสดๆ ได้อย่างน่าเชื่อถือหรือไม่ คะแนนการควบคุมคอมพิวเตอร์ของ Claude ได้ปรับปรุงขึ้นห้าเท่าในระยะเวลาประมาณ 16 เดือน ซึ่งเป็นแนวโน้มที่มีความหมาย แต่การเพิ่มขึ้นของมาตรฐานการประเมินบนงานที่คัดเลือกไม่ได้ทำนายผลการทำงานในสภาพแวดล้อม macOS แบบสดๆ ที่ซับซ้อน — การสนทนาที่ไม่คาดคิด การอัปเดตแอปพลิเคชัน และการเปลี่ยนแปลงสถานะที่การประเมินใดๆ ไม่สามารถจับได้ วิธีที่ Anthropic จัดการการเปิดเผยความปลอดภัยเมื่อนักวิจัยเริ่มสืบสวนคุณลักษณะนี้อย่างเป็นระบบมากขึ้นจะเป็นการทดสอบจริงครั้งแรกว่าการควบคุมเดสก์ท็อปพร้อมที่จะออกจากสถานะการแสดงตัวอย่างการวิจัยหรือไม่

Alex McFarland เป็นนักข่าวและนักเขียน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมงานกับสตาร์ทอัพ AI และสื่อสิ่งพิมพ์ต่างๆ ทั่วโลก