Connect with us

Phát triển Trí tuệ Nhân tạo Nhúng: Cách Meta Đưa Chạm và Khéo léo của Con người vào Trí tuệ Nhân tạo

Robot

Phát triển Trí tuệ Nhân tạo Nhúng: Cách Meta Đưa Chạm và Khéo léo của Con người vào Trí tuệ Nhân tạo

mm

Trí tuệ Nhân tạo đã đi được một chặng đường dài trong việc nhận thức thị giác và xử lý ngôn ngữ. Tuy nhiên, những khả năng này là không đủ để xây dựng các hệ thống có thể tương tác với thế giới vật lý. Con người xử lý các vật thể hoặc thực hiện các chuyển động được kiểm soát bằng cách sử dụng cảm giác chạm. Chúng ta cảm nhận được kết cấu, cảm nhận nhiệt độ và đo lường trọng lượng để hướng dẫn mỗi hành động với độ chính xác. Thông tin phản hồi này cho phép chúng ta thao tác các vật thể dễ vỡ, sử dụng các công cụ với sự kiểm soát và thực hiện các nhiệm vụ phức tạp một cách mượt mà.

Meta, nổi tiếng với công việc trong lĩnh vực thực tế ảo và thực tế tăng cường, hiện đang đối mặt với thách thức của việc tạo ra Trí tuệ Nhân tạo có thể tương tác với thế giới vật lý giống như con người. Thông qua sáng kiến FAIR Robotics, Meta đang phát triển các công cụ và khuôn khổ mã nguồn mở để nâng cao cảm giác chạm và sự linh hoạt thể chất của robot. Những nỗ lực này có thể dẫn đến sự phát triển của Trí tuệ Nhân tạo nhúng – các hệ thống không chỉ nhìn thấy mà còn có thể cảm nhận và thao tác các vật thể giống như con người.

Trí tuệ Nhân tạo Nhúng là gì?

Trí tuệ Nhân tạo Nhúng kết hợp tương tác vật lý với trí tuệ nhân tạo, cho phép máy móc cảm nhận, phản ứng và tương tác tự nhiên với môi trường xung quanh. Thay vì chỉ “nhìn” hoặc “nghe” các đầu vào, nó cho phép các hệ thống Trí tuệ Nhân tạo cảm nhậnhoạt động trong thế giới. Hãy nghĩ về một robot có thể cảm nhận áp lực nó áp dụng cho một vật thể, điều chỉnh lực nắm và di chuyển với sự linh hoạt. Trí tuệ Nhân tạo Nhúng di chuyển Trí tuệ Nhân tạo từ màn hình và loa vào thế giới vật lý, làm cho nó có khả năng thao tác các vật thể, thực hiện các nhiệm vụ và tương tác có ý nghĩa hơn với con người.

Ví dụ, một robot được xây dựng trên Trí tuệ Nhân tạo Nhúng có thể giúp một người cao tuổi nhặt các vật thể dễ vỡ mà không làm hỏng chúng. Trong lĩnh vực chăm sóc sức khỏe, nó có thể hỗ trợ các bác sĩ bằng cách cầm các công cụ chính xác trong quá trình phẫu thuật. Tiềm năng này mở rộng xa hơn các cánh tay robot trong phòng thí nghiệm hoặc cánh tay tự động trong nhà máy; nó là về việc tạo ra các máy móc hiểu và phản ứng với môi trường vật lý của chúng trong thời gian thực.

Phương pháp của Meta đối với Trí tuệ Nhân tạo Nhúng

Meta đang tập trung vào ba lĩnh vực chính để đưa Trí tuệ Nhân tạo Nhúng đến gần với cảm giác chạm của con người. Đầu tiên, công ty đang phát triển các công nghệ cảm biến chạm tiên tiến cho phép máy móc phát hiện các thứ như áp lực, kết cấu và nhiệt độ. Thứ hai, Meta đang tạo ra các mô hình nhận thức chạm cho phép Trí tuệ Nhân tạo hiểu và phản ứng với các tín hiệu này. Cuối cùng, Meta đang xây dựng một nền tảng phát triển chạm tích hợp nhiều cảm biến với các mô hình nhận thức này, cung cấp một hệ thống hoàn chỉnh để xây dựng Trí tuệ Nhân tạo có khả năng chạm. Dưới đây là cách Meta đang thúc đẩy tiến bộ trong Trí tuệ Nhân tạo Nhúng trên từng lĩnh vực này.

Meta Digit 360: Cảm giác Chạm Cấp độ Con người

Meta đã giới thiệu ngón tay Digit 360, một công nghệ cảm biến chạm được thiết kế để cung cấp cho Trí tuệ Nhân tạo Nhúng cảm giác chạm giống như con người. Với hơn 18 tính năng cảm biến, nó có thể phát hiện rung động, nhiệt và thậm chí các chất hóa học trên bề mặt. Được trang bị một chip Trí tuệ Nhân tạo, ngón tay xử lý dữ liệu chạm ngay lập tức, cho phép phản ứng nhanh với các đầu vào như nhiệt của một bếp lò hoặc một cái chọc nhẹ của một kim. Công nghệ này hoạt động như một “hệ thống thần kinh ngoại vi” trong Trí tuệ Nhân tạo Nhúng, mô phỏng các phản ứng tự động tương tự như phản ứng của con người. Meta đã phát triển ngón tay này với một hệ thống quang học độc đáo chứa hơn 8 triệu taxels có thể chụp cảm giác chạm từ mọi góc độ. Nó cảm nhận được các chi tiết nhỏ, xuống đến các lực nhỏ như một millinewton, cung cấp cho Trí tuệ Nhân tạo Nhúng một sự nhạy cảm tinh tế với môi trường của nó.

Meta Sparsh: Nền tảng cho Nhận thức Chạm

Meta đang nâng cao khả năng nhận thức chạm để giúp Trí tuệ Nhân tạo hiểu và phản ứng với các cảm giác vật lý. Được đặt tên theo từ tiếng Sanskrit có nghĩa là “chạm”, Sparsh hoạt động như một “bộ não chạm” cho Trí tuệ Nhân tạo Nhúng. Mô hình này cho phép máy móc giải thích các tín hiệu chạm phức tạp như áp lực và lực nắm.

Một trong những tính năng nổi bật của Sparsh là sự linh hoạt của nó. Các hệ thống chạm truyền thống sử dụng các mô hình riêng biệt cho từng nhiệm vụ, phụ thuộc nặng vào dữ liệu được gắn nhãn và các cảm biến cụ thể. Sparsh thay đổi hoàn toàn cách tiếp cận này. Là một mô hình đa năng, nó thích nghi với các cảm biến và nhiệm vụ khác nhau. Nó học các mẫu chạm bằng cách sử dụng học tự giám sát (SSL) trên một cơ sở dữ liệu khổng lồ với hơn 460.000 hình ảnh chạm – mà không cần dữ liệu được gắn nhãn.

Meta cũng đã giới thiệu TacBench, một điểm chuẩn mới với sáu nhiệm vụ dựa trên chạm để đánh giá khả năng của Sparsh. Meta tuyên bố rằng Sparsh đã vượt trội so với các mô hình truyền thống với 95,1%, đặc biệt là trong các kịch bản dữ liệu thấp. Các phiên bản của Sparsh được xây dựng trên kiến trúc I-JEPA và DINO của Meta đã thể hiện khả năng đáng chú ý trong các nhiệm vụ như ước tính lực, phát hiện trượt và thao tác phức tạp.

Meta Digit Plexus: Một Nền tảng cho Phát triển Hệ thống Chạm

Meta đã giới thiệu Digit Plexus để tích hợp các công nghệ cảm biến và mô hình nhận thức chạm cho việc tạo ra một hệ thống Trí tuệ Nhân tạo Nhúng. Nền tảng này kết hợp cảm biến ngón tay và cảm biến lòng bàn tay trong một tay robot để cho phép các phản ứng chạm được phối hợp hơn. Thiết lập này cho phép Trí tuệ Nhân tạo Nhúng xử lý thông tin phản hồi cảm biến và điều chỉnh hành động của nó trong thời gian thực, giống như cách một bàn tay con người di chuyển và phản ứng.

Bằng cách tiêu chuẩn hóa thông tin phản hồi chạm trên toàn bộ bàn tay, Digit Plexus tăng cường độ chính xác và kiểm soát của Trí tuệ Nhân tạo Nhúng. Sự phát triển này đặc biệt quan trọng trong các lĩnh vực như sản xuất và chăm sóc sức khỏe, nơi việc xử lý cẩn thận là điều cần thiết. Nền tảng này liên kết các cảm biến như ngón tay và ReSkin với một hệ thống điều khiển, đơn giản hóa việc thu thập dữ liệu, điều khiển và phân tích – tất cả thông qua một cáp duy nhất.

Meta đang phát hành thiết kế phần mềm và phần cứng cho Digit Plexus cho cộng đồng mã nguồn mở. Mục tiêu là thúc đẩy sự hợp tác và tăng tốc nghiên cứu trong Trí tuệ Nhân tạo Nhúng, thúc đẩy sự đổi mới và tiến bộ trong các lĩnh vực này.

Thúc đẩy Nghiên cứu và Phát triển Trí tuệ Nhân tạo Nhúng

Meta đang thúc đẩy không chỉ công nghệ mà còn các tài nguyên để thúc đẩy nghiên cứu và phát triển Trí tuệ Nhân tạo Nhúng. Một trong những sáng kiến chính là việc phát triển các điểm chuẩn để đánh giá các mô hình Trí tuệ Nhân tạo. Một điểm chuẩn như vậy, PARTNR (Lập kế hoạch và Lý luận trong các Nhiệm vụ Hợp tác giữa Người và Robot), đánh giá cách các mô hình Trí tuệ Nhân tạo tương tác với con người trong các nhiệm vụ gia đình. Sử dụng mô拟 Habitat 3.0, PARTNR cung cấp một môi trường thực tế nơi robot hỗ trợ các nhiệm vụ như dọn dẹp và nấu ăn. Với hơn 100.000 nhiệm vụ dựa trên ngôn ngữ, nó nhằm mục đích tăng tốc tiến bộ trong Trí tuệ Nhân tạo Nhúng.

Ngoài các sáng kiến nội bộ, Meta đang hợp tác với các tổ chức như GelSight Inc.Wonik Robotics để tăng tốc việc áp dụng các công nghệ cảm biến chạm. GelSight sẽ phân phối cảm biến Digit 360, trong khi Wonik Robotics sẽ sản xuất Allegro Hand, tích hợp công nghệ Digit Plexus. Bằng cách làm cho các công nghệ này có sẵn thông qua các nền tảng mã nguồn mở và quan hệ đối tác, Meta đang giúp tạo ra một hệ sinh thái có thể dẫn đến các đổi mới trong chăm sóc sức khỏe, sản xuất và hỗ trợ gia đình.

Kết luận

Meta đang phát triển Trí tuệ Nhân tạo Nhúng, đưa nó vượt ra ngoài tầm nhìn và âm thanh để bao gồm cả cảm giác chạm. Với các đổi mới như Digit 360 và Sparsh, các hệ thống Trí tuệ Nhân tạo đang có được khả năng cảm nhận và phản ứng với môi trường xung quanh với độ chính xác. Bằng cách chia sẻ các công nghệ này với cộng đồng mã nguồn mở và hợp tác với các tổ chức quan trọng, Meta đang giúp tăng tốc việc phát triển cảm biến chạm. Tiến bộ này có thể dẫn đến các đột phá trong các lĩnh vực như chăm sóc sức khỏe, sản xuất và hỗ trợ gia đình, làm cho Trí tuệ Nhân tạo trở nên có khả năng và phản ứng hơn trong các nhiệm vụ thế giới thực.

Tiến sĩ Tehseen Zia là Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, nắm giữ bằng Tiến sĩ về Trí tuệ Nhân tạo từ Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ Nhân tạo, Học máy, Khoa học Dữ liệu và Thị giác Máy tính, ông đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã dẫn dắt các dự án công nghiệp khác nhau với tư cách là Điều tra viên Chính và từng là Tư vấn viên Trí tuệ Nhân tạo.