Kết nối với chúng tôi

Kỷ nguyên Người máy chưa đến — Nó đã đến rồi

Lãnh đạo tư tưởng

Kỷ nguyên Người máy chưa đến — Nó đã đến rồi

mm

Đầu tháng này, tại Trung Quốc, một robot hình người có tên Shuang Shuang lên sân khấu tại một buổi lễ tốt nghiệp trung học ở Phúc Kiến để nhận bằng tốt nghiệp — bắt tay và làm cả học sinh lẫn giáo viên đều vui mừng. Những khoảnh khắc như thế này đại diện cho một sự thay đổi ý nghĩa, một sự thay đổi mà robot hình người đang bắt đầu xâm nhập vào đời sống công cộng theo những cách rất dễ nhận thấy.

Những khoảnh khắc này không chỉ đánh dấu sự tò mò của công chúng — chúng báo hiệu một bước chuyển hướng tới sự tích hợp trong thế giới thực. Bài viết này khám phá cách robot hình người chuyển từ hình thức trình diễn sang chức năng — và tại sao những gì tưởng chừng như chỉ là một kỳ tích về phần cứng, thực chất lại là trí thông minh tích hợp cho phép những cỗ máy này đi lại, tương tác và học hỏi trong môi trường không được lập trình sẵn cho tự động hóa. Chúng tôi cũng sẽ thảo luận về cách chúng tôi tiếp cận thương mại hóa thông qua việc triển khai sớm và hợp tác lâu dài.

Người máy đưa AI vào thế giới thực như thế nào

Khoảng cách giữa hiệu suất ảo và độ tin cậy vật lý vẫn là một trong những thách thức bị bỏ qua nhiều nhất trong AI. Một chatbot có thể tạo ra các đoạn văn bản trôi chảy mà không cần phải hành động trên đó — giống như cách một mô hình thị giác có thể xác định một bước trong hình ảnh mà không cần phải di chuyển vật lý hoặc có nguy cơ bị ngã. Robot người không có được điều đó.

Để hoạt động trong thế giới thực, AI phải bỏ lại phía sau những tập dữ liệu tĩnh và các điều kiện được kiểm soát. Nó phải quan sát, quyết định và hành động trong những môi trường thay đổi từng giây. Điều này bao gồm sàn nhà không bằng phẳng, đồ vật bị đặt sai vị trí, hành vi khó lường của con người và các tín hiệu phi ngôn ngữ phụ thuộc vào ngữ cảnh. Kết quả là hàng ngày phải đối mặt với nhiễu loạn, sự mơ hồ và khả năng thất bại.

Đây là lúc lý luận thực thể - nơi ngôn ngữ được xây dựng dựa trên không gian, thời gian và hệ quả - bắt đầu trở nên quan trọng hơn so với dự đoán mang tính biểu tượng. Ví dụ, nếu con người nói "Coi chừng, trơn trượt đấy", robot cần kết nối cụm từ đó không chỉ với định nghĩa của từ, mà còn với nhận thức không gian, rủi ro tiềm ẩn và các điều chỉnh theo thời gian thực.

Đồng thời, việc học tập đa phương thức trở nên thiết yếu, bởi vì không có kênh đầu vào đơn lẻ nào đủ tin cậy để hoạt động độc lập. Camera có thể bỏ sót một bề mặt trơn trượt, nhưng cảm biến áp suất ở bàn chân có thể phát hiện sự mất lực kéo đột ngột. Hoặc, trong một tình huống khác, nhận dạng giọng nói có thể không hoạt động trong một nhà kho ồn ào, nhưng tín hiệu thị giác hoặc cử chỉ có thể lấp đầy khoảng trống.

Khả năng khái quát hóa cũng trở nên quan trọng. Một robot không thể trông cậy vào việc nhìn thấy chính xác môi trường hai lần. Nó cần phải điều chỉnh hành vi khi sàn nhà ướt, ánh sáng thay đổi, hoặc hộp không còn ở đúng vị trí ngày hôm qua. Đây chính là yếu tố quyết định thành công hay thất bại.

Tại Humanoid, đây là lý do tại sao chúng tôi bắt đầu thử nghiệm sớm với các đối tác thương mại. Chúng tôi tích hợp robot vào môi trường thực tế để nhanh chóng phát hiện các lỗi tiềm ẩn và đảm bảo hoạt động tối ưu trước khi triển khai. Một robot hoạt động tốt trong mô phỏng hoặc demo không giống với một robot tạo được niềm tin dưới áp lực, bởi vì niềm tin đó cuối cùng được xây dựng dựa trên việc học hỏi từ thực tế.

Chúng tôi biết robot hình người sẽ được thương mại hóa trong vòng hai năm tới — nhưng chúng tôi không chần chừ. Đối với chúng tôi, thương mại hóa bắt đầu từ sớm. Điều này đồng nghĩa với việc xây dựng quan hệ đối tác lâu dài dựa trên các ứng dụng thực tế. Thông qua một loạt chương trình thí điểm, chúng tôi không chỉ đào tạo các đối tác về công nghệ — mà còn cùng họ học hỏi. Quy trình học tập chung này cũng giúp chúng tôi tinh chỉnh cấu trúc chi phí và độ tin cậy hiệu suất ngay từ ngày đầu — đảm bảo tổng chi phí sở hữu (TCO) tốt nhất có thể khi hệ thống mở rộng quy mô.

Tại sao người máy là nền tảng thử nghiệm cuối cùng cho trí thông minh chung

Thế giới chúng ta tạo ra trong hàng trăm năm qua được thiết kế theo kích thước con người. Tay nắm cửa, xe nâng, nhà kho — mọi thứ đều có kích thước, phạm vi chuyển động và hành vi xã hội ngầm định. Người máy phải thích nghi với thực tế đó, nếu không chúng có nguy cơ bị hạn chế rất nhiều về chức năng.

Để đi lên cầu thang, mang một vật, diễn giải cử chỉ chỉ tay, hay nhận ra sự do dự trong giọng nói, một robot phải hiểu ngữ cảnh vượt xa khả năng phân loại trực quan hay lập kế hoạch chuyển động theo kịch bản. Nó phải suy ra ý định, học một nhiệm vụ mới bằng cách quan sát con người, điều chỉnh kỹ năng đó cho phù hợp với một bố cục hơi khác một chút và cải thiện hiệu suất theo thời gian. Trên thực tế, hệ thống này đang mở rộng hiệu quả những gì AI có thể làm trong những điều kiện thực tế.

Tại Humanoid, chúng tôi đẩy nhanh quá trình đó thông qua điều khiển từ xa. Trong giai đoạn đầu phát triển, người vận hành sẽ hướng dẫn robot thực hiện các nhiệm vụ chính. Dữ liệu thực hành này trở thành nền tảng để đào tạo các hành vi mới. Theo thời gian, những buổi trình diễn này sẽ được đưa vào các mô hình đầu cuối của chúng tôi, giúp chúng tôi xây dựng khả năng tự chủ đáng tin cậy.

Từ hệ thống hẹp đến trí tuệ tích hợp

Hầu hết các hệ thống AI ngày nay đều vượt trội trong các nhiệm vụ hẹp. Khi hoạt động độc lập, mỗi hệ thống đều hoạt động tốt. Nhưng người máy không cần các chuyên gia rời rạc. Để tích hợp thành công, chúng ta cần các hệ thống có khả năng suy luận trên nhiều phương thức và khung thời gian.

Một người máy có thể nhận được một hướng dẫn khá mơ hồ — "Hãy mang cho tôi chiếc hộp màu vàng từ phòng chứa đồ ở bên kia hành lang" — và phải giải mã hướng dẫn đó thành một chuỗi các nhiệm vụ phụ: xác định vị trí của người nói, di chuyển trong hành lang, xác định đúng chiếc hộp, điều chỉnh lực cầm, tránh va chạm và tất nhiên là trở về an toàn.

Mỗi phần của chuỗi đó đều liên quan đến một hệ thống con khác nhau — thị giác, vận động, ngôn ngữ, thao tác và phản hồi. Và độ tin cậy của toàn bộ hệ thống phụ thuộc vào mức độ giao tiếp tốt của các phần đó trong điều kiện thay đổi.

Kiến trúc mô-đun là một cách để đáp ứng thách thức này. Điều này cho phép chúng tôi lặp lại các hệ thống con một cách độc lập mà vẫn đạt được sự phối hợp toàn hệ thống. Ngoài ra, kiến trúc mô-đun cho phép chúng tôi mở rộng khả năng trên nhiều môi trường mà không cần phải xây dựng lại từ đầu. Đây là cách chúng tôi chuyển từ mô hình demo kín sang hiệu suất thế giới mở.

Cổ phần rất lớn — và chúng mang tính toàn cầu

Thật dễ dàng để gán cho robot dạng người là tương lai. Nhưng khi chúng tôi nói chuyện với khách hàng, nhu cầu thực sự là cấp thiết. Rất nhiều nhà kho, dây chuyền lắp ráp và các công trường khác từng rất bận rộn giờ đây đang phải vật lộn để duy trì nhân sự.

Những tình trạng thiếu hụt lao động này là vấn đề nhân khẩu học. Ở Nhật Bản, gần 30% dân số trên 65 tuổi. Ở Châu Âu, các lĩnh vực quan trọng — có sự kết hợp bảng lương 1.7 nghìn tỷ đô la - Chúng tôi đang gặp khó khăn trong việc tuyển dụng lao động trẻ. Đây không phải là loại vai trò mà hầu hết mọi người mong muốn và ngày càng không phải là loại vai trò mà mọi người sẵn sàng đảm nhận.

Bằng cách hỗ trợ chứ không phải thay thế, robot người có thể đảm nhận những công việc đòi hỏi thể lực, lặp đi lặp lại hoặc nguy hiểm — di chuyển hàng tồn kho, chất hàng lên pallet, vận hành máy móc — mà không sợ mệt mỏi hay chấn thương. Điều này giúp người lao động có thời gian tập trung vào những khía cạnh phức tạp, sáng tạo hoặc giao tiếp cá nhân hơn của công việc.

Hơn nữa, điều này tạo ra khả năng phục hồi kinh tế lâu dài. Khi nguồn lao động không ổn định hoặc không có sẵn, máy móc thông minh có thể giúp đảm bảo tính liên tục — tất cả mà không ảnh hưởng đến sự an toàn, chất lượng hoặc khả năng thích ứng.

Một khía cạnh khác cần nhấn mạnh là khuôn khổ pháp lý. Hầu hết các nhóm — đặc biệt là ở những khu vực pháp lý lỏng lẻo — đều chưa nghĩ đến điều này. Chúng tôi bắt đầu từ đó. Luật an toàn và dữ liệu của châu Âu là một trong những luật khắt khe nhất thế giới, nhưng thay vì coi chúng là rào cản, chúng tôi coi đó là lợi thế cạnh tranh của mình. Khi các thị trường khác áp dụng các quy định nghiêm ngặt hơn, chúng tôi sẽ sẵn sàng đáp ứng, trong khi các công ty khác có thể gặp khó khăn.

Một cuộc đua AI mới — nhưng không phải là cuộc đua bạn nghĩ

Phần lớn các cuộc thảo luận về AI ngày nay tập trung vào sức mạnh tính toán, các tham số và dữ liệu đào tạo. Nhưng bước đột phá thực sự có thể đến từ một lĩnh vực khác: tích hợp vào thế giới vật lý. Đó là nơi trí tuệ phải học cách vận hành, thay vì chỉ đơn thuần là dự đoán.

Về mặt này, cuộc đua hướng đến hệ thống có năng lực nhất — hệ thống có thể hoạt động ở không gian công cộng, trong điều kiện an toàn và có sự tham gia của con người. Hệ thống này, bên cạnh việc học hỏi từ dữ liệu, cũng sẽ — và đặc biệt — học hỏi từ thực tế và hoạt động cùng con người mà không làm gián đoạn dòng chảy của mọi thứ.

Đó là lý do tại sao chúng tôi không đợi đến khi triển khai mới bắt đầu. Ngay từ đầu, chúng tôi làm việc trực tiếp với các đối tác thương mại để tích hợp vào môi trường thực tế — đảm bảo hệ thống được cải thiện ở điểm quan trọng nhất: trong thực tế.

Kiểu học tập thực tế đó chính là điểm yếu của các hệ thống hẹp. Mặc dù chúng đã đưa chúng ta đi xa, nhưng chúng chưa bao giờ được thiết kế cho mức độ phức tạp này. Người máy dạng người cần một thứ khác — sự phối hợp, tính mạnh mẽ, và như đã đề cập, khả năng học hỏi từ những điều bất ngờ.

Đó là cơ hội to lớn trước mắt chúng ta. Không phải tự động hóa mọi thứ, mà là chế tạo những cỗ máy có thể hiểu, điều hướng và hợp tác với thế giới con người.

Artem Sokolov là người sáng lập Hình người, đồng thời là một nhà đầu tư và doanh nhân toàn cầu. Ông đã tiếp quản thành công doanh nghiệp gia đình và phát triển nó lên mức định giá 1 tỷ đô la. Sau đó, ông thành lập Humanoid để chế tạo robot hình người an toàn và đáng tin cậy, giúp con người thoát khỏi những công việc nặng nhọc. Hiện nay, ông lãnh đạo một đội ngũ hơn 130 chuyên gia đến từ một số công ty công nghệ hàng đầu thế giới, mang đến chiều sâu kỹ thuật đẳng cấp thế giới để kiến tạo tương lai của sự hợp tác giữa con người và máy móc.