sơ khai Hệ thống AI có thể nhận diện cử chỉ tay chính xác - Unite.AI
Kết nối với chúng tôi

Robotics

Hệ thống AI có thể nhận dạng chính xác cử chỉ tay

cập nhật on
Tín dụng: Đại học Công nghệ Nanyang (NTU)

Một hệ thống trí tuệ nhân tạo (AI) mới có khả năng nhận dạng cử chỉ tay vừa được các nhà khoa học đến từ Đại học Công nghệ Nanyang, Singapore (NTU Singapore) phát triển. Công nghệ này hoạt động bằng cách kết hợp các thiết bị điện tử giống như da với thị giác máy tính.

Sự phát triển của các hệ thống AI để nhận dạng cử chỉ tay của con người đã diễn ra được khoảng 10 năm và hiện nó đang được sử dụng trong robot phẫu thuật, thiết bị theo dõi sức khỏe và trong các hệ thống chơi game. 

Các hệ thống nhận dạng cử chỉ AI ban đầu chỉ có hình ảnh và đầu vào từ các cảm biến có thể đeo được đã được tích hợp để cải thiện chúng. Điều này được gọi là "hợp nhất dữ liệu". Một trong những khả năng cảm nhận được gọi là "cảm giác cơ thể" và các cảm biến đeo trên người có thể tái tạo nó. 

Độ chính xác của nhận dạng cử chỉ vẫn khó đạt được do chất lượng dữ liệu thấp đến từ các cảm biến có thể đeo được. Điều này xảy ra do sự cồng kềnh và khả năng tiếp xúc kém với người dùng, cũng như ảnh hưởng của các vật thể bị che khuất tầm nhìn và ánh sáng kém. 

Nhiều thách thức hơn đến từ việc tích hợp dữ liệu trực quan và cảm giác, vì các bộ dữ liệu không khớp cần được xử lý riêng biệt và cuối cùng được hợp nhất ở cuối. Quá trình này không hiệu quả và dẫn đến thời gian phản hồi chậm hơn. 

Nhóm NTU đã nghĩ ra một số cách để vượt qua những thách thức này, bao gồm việc tạo ra một hệ thống tổng hợp dữ liệu 'lấy cảm hứng từ sinh học' dựa trên các cảm biến căng có thể co giãn giống như da được làm từ các ống nano carbon đơn vách. Nhóm cũng dựa vào AI như một cách để thể hiện cách các giác quan của da và thị giác được xử lý cùng nhau trong não.

Ba phương pháp tiếp cận mạng lưới thần kinh đã được kết hợp thành một hệ thống để phát triển hệ thống AI. Ba loại mạng thần kinh là: mạng thần kinh tích chập, mạng thần kinh thưa thớt và mạng thần kinh nhiều lớp.

Bằng cách kết hợp ba điều này, nhóm nghiên cứu có thể phát triển một hệ thống có khả năng nhận dạng cử chỉ của con người chính xác hơn so với các phương pháp khác.

Giáo sư Chen Xiaodon là tác giả chính của nghiên cứu. Anh ấy đến từ Trường Khoa học Vật liệu và Kỹ thuật tại NTU. 

“Kiến trúc hợp nhất dữ liệu của chúng tôi có các tính năng lấy cảm hứng từ sinh học độc đáo của riêng nó, bao gồm một hệ thống do con người tạo ra giống như hệ thống phân cấp hợp nhất thị giác-giá thể trong não. Chúng tôi tin rằng các tính năng như vậy làm cho kiến ​​trúc của chúng tôi trở nên độc đáo so với các phương pháp hiện có.”

Chen cũng là Giám đốc Trung tâm Đổi mới Thiết bị Linh hoạt (iFLEX) tại NTU. 

“So với các cảm biến cứng nhắc có thể đeo trên người không tạo ra sự tiếp xúc đủ mật thiết với người dùng để thu thập dữ liệu chính xác, cải tiến của chúng tôi sử dụng các cảm biến căng có thể co giãn gắn vào da người một cách thoải mái. Điều này cho phép thu được tín hiệu chất lượng cao, điều này rất quan trọng đối với các nhiệm vụ nhận dạng có độ chính xác cao,” Chen nói.

Phát hiện của nhóm gồm các nhà khoa học từ NTU Singapore và Đại học Công nghệ Sydney (UTS) đã được công bố vào tháng XNUMX trên tạp chí khoa học Tự nhiên Điện tử.

Kiểm tra hệ thống

Nhóm đã thử nghiệm hệ thống AI lấy cảm hứng từ sinh học với một robot được điều khiển thông qua cử chỉ tay. Rô bốt được hướng dẫn qua một mê cung và kết quả đã chứng minh rằng hệ thống nhận dạng cử chỉ tay AI có thể hướng dẫn rô bốt đi qua mê cung mà không gặp lỗi. Điều này so với một hệ thống nhận dạng dựa trên hình ảnh, vốn mắc sáu lỗi trong cùng một mê cung.

Thử nghiệm trong điều kiện không tốt như nhiễu và điều kiện ánh sáng không tốt, hệ thống AI vẫn giữ được độ chính xác cao. Tỷ lệ nhận dạng chính xác đạt trên 96.7%.

Tiến sĩ Wang Ming từ Trường Khoa học & Kỹ thuật Vật liệu tại NTU Singapore là tác giả đầu tiên của nghiên cứu. 

“Bí mật đằng sau độ chính xác cao trong kiến ​​trúc của chúng tôi nằm ở chỗ thông tin thị giác và cảm giác thân thể có thể tương tác và bổ sung cho nhau ở giai đoạn đầu trước khi thực hiện diễn giải phức tạp,” Ming nói. “Kết quả là, hệ thống có thể thu thập thông tin mạch lạc một cách hợp lý với ít dữ liệu dư thừa hơn và ít sự mơ hồ về nhận thức hơn, dẫn đến độ chính xác cao hơn.”

Theo quan điểm độc lập từ Giáo sư Markus Antonietti, Giám đốc Viện Chất keo và Giao diện Max Planck ở Đức, “Những phát hiện từ bài báo này mang lại cho chúng ta một bước tiến nữa tới một thế giới thông minh hơn và được máy móc hỗ trợ nhiều hơn. Giống như việc phát minh ra điện thoại thông minh đã cách mạng hóa xã hội, công việc này mang đến cho chúng ta hy vọng rằng một ngày nào đó chúng ta có thể kiểm soát vật lý toàn bộ thế giới xung quanh với độ tin cậy và độ chính xác cao thông qua một cử chỉ.”

“Đơn giản là có vô số ứng dụng cho công nghệ như vậy trên thị trường để hỗ trợ tương lai này. Ví dụ, từ điều khiển rô-bốt từ xa tại nơi làm việc thông minh đến bộ xương ngoài cho người già.”

Nhóm nghiên cứu hiện sẽ làm việc trên hệ thống VR và AR dựa trên hệ thống AI lấy cảm hứng từ sinh học.

 

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.