หุ่นยนต์
การพัฒนา Embodied AI ที่ล้ำสมัย: วิธีการที่ Meta นำสัมผัสและความคล่องตัวแบบมนุษย์มาให้กับ AI
AI ได้พัฒนาไปอย่างมากในด้านการรับรู้ทางภาพและประมวลผลภาษา อย่างไรก็ตาม ความสามารถเหล่านี้ไม่เพียงพอสำหรับการสร้างระบบที่สามารถโต้ตอบกับโลกแห่งความเป็นจริงได้ มนุษย์ใช้สัมผัสในการจัดการวัตถุหรือการเคลื่อนไหวที่มีการควบคุมโดยใช้ความรู้สึกสัมผัส เรารู้สึกถึงเนื้อสัมผัส รู้สึกถึงอุณหภูมิ และวัดน้ำหนักเพื่อชี้นำการกระทำแต่ละอย่างด้วยความแม่นยำ ข้อมูลรับกลับทางสัมผัสนี้ช่วยให้เราสามารถจัดการกับวัตถุที่เปราะบาง ใช้เครื่องมือที่มีการควบคุม และทำงานที่ซับซ้อนได้อย่างราบรื่น
Meta ซึ่งเป็นที่รู้จักในด้านการทำงานในเรื่องของความเป็นจริงเสมือนและความเป็นจริงเสริม กำลังเผชิญความท้าทายในการสร้าง AI ที่สามารถโต้ตอบกับโลกแห่งความเป็นจริงได้เหมือนมนุษย์ ผ่านการเริ่มต้น FAIR Robotics Meta กำลังพัฒนาเครื่องมือและเฟรมเวิร์กแบบโอเพ่นซอร์สเพื่อเพิ่มประสิทธิภาพการสัมผัสและความคล่องตัวทางกายภาพของหุ่นยนต์ ความพยายามเหล่านี้อาจนำไปสู่การสร้าง Embodied AI — ระบบที่ไม่เพียงแต่เห็นเท่านั้น แต่ยังสามารถสัมผัสและจัดการวัตถุได้เหมือนมนุษย์
Embodied AI คืออะไร?
Embodied AI รวมการโต้ตอบทางกายภาพเข้ากับปัญญาประดิษฐ์ ทำให้เครื่องจักรสามารถรับรู้ ตอบสนอง และมีส่วนร่วมกับสภาพแวดล้อมของตนเองได้อย่างเป็นธรรมชาติ ไม่ใช่แค่ “เห็น” หรือ “ได้ยิน” ข้อมูลเข้าเท่านั้น แต่ยังช่วยให้ระบบ AI “รู้สึก” และ “กระทำ” ในโลกได้ ลองนึกภาพหุ่นยนต์ที่สามารถรู้สึกถึงแรงกดที่มันใช้กับวัตถุ ปรับแรงกอด และเคลื่อนไหวด้วยความคล่องตัว Embodied AI นำ AI จากหน้าจอและลำโพงเข้าสู่โลกแห่งความเป็นจริง ทำให้สามารถจัดการวัตถุ ทำงาน และโต้ตอบกับคนได้อย่างมีความหมายมากขึ้น
ตัวอย่างเช่น หุ่นยนต์ที่สร้างขึ้นบน Embodied AI สามารถช่วยคนสูงอายุในการจับวัตถุที่เปราะบางโดยไม่ทำให้วัตถุเสียหาย ในด้านการดูแลสุขภาพ มันสามารถช่วยแพทย์โดยจับเครื่องมืออย่างแม่นยำระหว่างการผ่าตัด ความเป็นไปได้นี้ไม่ได้จำกัดอยู่แค่แขนหุ่นยนต์ในห้องปฏิบัติการหรือแขนหุ่นยนต์แบบอัตโนมัติในโรงงาน แต่เป็นการสร้างเครื่องจักรที่เข้าใจและตอบสนองต่อสภาพแวดล้อมทางกายภาพในเวลาจริง
แนวทางของ Meta ในการสร้าง Embodied AI
Meta มุ่งเน้นไปที่ สามพื้นที่หลัก เพื่อนำ Embodied AI มาใกล้กับการสัมผัสและความคล่องตัวแบบมนุษย์ ประการแรก บริษัทกำลังพัฒนาเทคโนโลยีการรับรู้สัมผัสที่ล้ำสมัย ซึ่งช่วยให้เครื่องจักรสามารถตรวจจับสิ่งต่างๆ เช่น แรงกด เนื้อสัมผัส และอุณหภูมิ ประการสอง Meta กำลังสร้างแบบจำลองการรับรู้สัมผัสที่ช่วยให้ AI เข้าใจและตอบสนองต่อสัญญาณเหล่านี้ ประการสาม Meta กำลังสร้างแพลตฟอร์มพัฒนาสัมผัสที่รวมเซ็นเซอร์หลายตัวเข้ากับแบบจำลองการรับรู้ ทำให้เกิดระบบที่สมบูรณ์สำหรับการสร้าง AI ที่มีการสัมผัส
Meta Digit 360: การรับรู้สัมผัสระดับมนุษย์
Meta ได้แนะนำ Digit 360 เทคโนโลยีการรับรู้สัมผัสที่ออกแบบมาเพื่อให้ Embodied AI มีการสัมผัสแบบมนุษย์ ด้วยคุณสมบัติการรับรู้มากกว่า 18 รายการ มันสามารถตรวจจับแรงสั่นสะเทือน ความร้อน และแม้แต่สารเคมีบนพื้นผิวที่มีเซ็นเซอร์มากกว่า 8 ล้านตัว ซึ่งสามารถจับข้อมูลสัมผัสจากทุกมุม มันรู้สึกถึงรายละเอียดเล็กๆ น้อยๆ ลงไปถึงแรงที่เล็กน้อยถึงหนึ่ง มิลลินิวตัน ทำให้ Embodied AI มีความไวต่อสภาพแวดล้อม
Meta Sparsh: พื้นฐานสำหรับการรับรู้สัมผัส
Meta กำลังปรับปรุงความสามารถในการรับรู้สัมผัสเพื่อช่วยให้ AI เข้าใจและตอบสนองต่อการกระตุ้นทางกายภาพ ที่เรียกว่า Sparsh ซึ่งเป็น “สมองสัมผัส” สำหรับ Embodied AI โมเดลนี้ช่วยให้เครื่องจักรสามารถตีความสัญญาณสัมผัสที่ซับซ้อน เช่น แรงกดและการจับ
คุณสมบัติที่โดดเด่นของ Sparsh คือความสามารถในการปรับเปลี่ยนได้ ระบบสัมผัสแบบดั้งเดิมใช้แบบจำลองแยกสำหรับการทำงานแต่ละอย่าง โดยพึ่งพาข้อมูลที่มีฉลากและเซ็นเซอร์เฉพาะ Sparsh เปลี่ยนแนวทางนี้โดยสิ้นเชิง ในฐานะแบบจำลองที่มีจุดมุ่งหมายทั่วไป มันปรับให้เข้ากับเซ็นเซอร์และงานต่างๆ ได้ มันเรียนรู้รูปแบบสัมผัสโดยใช้ การเรียนรู้แบบไม่มีการกำกับ (SSL) บนฐานข้อมูลภาพสัมผัสมากกว่า 460,000 ภาพ โดยไม่ต้องการข้อมูลที่มีฉลาก
Meta Digit Plexus: แพลตฟอร์มสำหรับการพัฒนาระบบสัมผัส
Meta ได้แนะนำ Digit Plexus เพื่อรวมเทคโนโลยีการรับรู้สัมผัสและแบบจำลองการรับรู้สัมผัสเพื่อสร้างระบบ Embodied AI แพลตฟอร์มนี้รวมเซ็นเซอร์ปลายนิ้วและฝ่ามือเข้าด้วยกันในมือหุ่นยนต์เดียว ทำให้สามารถตอบสนองสัมผัสที่สอดคล้องกันมากขึ้น การตั้งค่านี้ช่วยให้ Embodied AI สามารถประมวลผลข้อมูลสัมผัสและปรับเปลี่ยนการกระทำในเวลาจริง เช่นเดียวกับมือมนุษย์ที่เคลื่อนไหวและตอบสนอง
ด้วยการกำหนดมาตรฐานการให้ข้อมูลสัมผัสทั่วทั้งมือ Digit Plexus เพิ่มความแม่นยำและควบคุมของ Embodied AI การพัฒนานี้มีความสำคัญอย่างยิ่งในการผลิตและดูแลสุขภาพ ซึ่งการจัดการอย่างระมัดระวังเป็นสิ่งจำเป็น แพลตฟอร์มนี้เชื่อมต่อเซ็นเซอร์ เช่น ปลายนิ้วและ ReSkin เข้ากับระบบควบคุม ทำให้สามารถรวบรวมข้อมูล ควบคุม และวิเคราะห์ได้อย่างง่ายดายผ่านสายเคเบิลเพียงเส้นเดียว
Meta กำลังเผยแพร่การออกแบบซอฟต์แวร์และฮาร์ดแวร์สำหรับ Digit Plexus ให้กับชุมชนโอเพ่นซอร์ส เพื่อส่งเสริมการทำงานร่วมกันและเร่งการวิจัยในด้าน Embodied AI โดยขับเคลื่อนนวัตกรรมและความก้าวหน้าในด้านเหล่านี้
การส่งเสริมการวิจัยและพัฒนา Embodied AI
Meta ไม่เพียงแต่พัฒนาเทคโนโลยีเท่านั้น แต่ยังพัฒนาแหล่งข้อมูลเพื่อส่งเสริมการวิจัยและพัฒนา Embodied AI หนึ่งในโครงการสำคัญคือการพัฒนาเกณฑ์มาตรฐานสำหรับการประเมินโมเดล AI หนึ่งในเกณฑ์มาตรฐานเหล่านี้คือ PARTNR (Planning And Reasoning Tasks in humaN-Robot collaboration) ซึ่งประเมินว่า AI โมเดลโต้ตอบกับมนุษย์ระหว่างการทำงานในครัวเรือนได้อย่างไร โดยใช้ซิมูเลเตอร์ Habitat 3.0 PARTNR ให้สภาพแวดล้อมที่สมจริงที่หุ่นยนต์ช่วยเหลือในการทำงาน เช่น การทำความสะอาดและการปรุงอาหาร ด้วยงานที่ใช้ภาษามากกว่า 100,000 งาน มันพยายามเร่งความก้าวหน้าในด้าน Embodied AI
除了การดำเนินโครงการภายใน Meta ยังร่วมมือกับองค์กร เช่น GelSight Inc. และ Wonik Robotics เพื่อเร่งการนำเทคโนโลยีการรับรู้สัมผัสไปใช้ GelSight จะจัดจำหน่ายเซ็นเซอร์ Digit 360 ในขณะที่ Wonik Robotics จะผลิต Allegro Hand ซึ่งรวมเทคโนโลยี Digit Plexus โดยการทำให้เทคโนโลยีเหล่านี้มีให้ใช้ผ่านแพลตฟอร์มโอเพ่นซอร์สและความร่วมมือ Meta ช่วยสร้างระบบนิเวศที่อาจนำไปสู่นวัตกรรมในด้านการดูแลสุขภาพ การผลิต และการช่วยเหลือในบ้าน
สรุป
Meta กำลังพัฒนา Embodied AI นำ AI ไปไกลกว่าการมองเห็นและเสียงเพื่อรวมการสัมผัสด้วย ด้วยนวัตกรรม เช่น Digit 360 และ Sparsh ระบบ AI ได้รับการปรับปรุงให้สามารถสัมผัสและตอบสนองต่อสภาพแวดล้อมได้อย่างแม่นยำ โดยการแบ่งปันเทคโนโลยีเหล่านี้กับชุมชนโอเพ่นซอร์สและร่วมมือกับองค์กรสำคัญ Meta ช่วยเร่งการวิจัยเกี่ยวกับการรับรู้สัมผัส ซึ่งอาจนำไปสู่การสร้างสรรค์นวัตกรรมในด้านการดูแลสุขภาพ การผลิต และการช่วยเหลือในบ้าน ทำให้ AI มีความสามารถและตอบสนองต่อการทำงานในโลกแห่งความเป็นจริงมากขึ้น












