Lãnh đạo tư tưởng

Tư duy ngoài khuôn khổ để thúc đẩy sự đổi mới trong Trí tuệ nhân tạo

Published June 3, 2024

Updated April 27, 2026

Iain Wallace, Director of Machine Learning at Ultraleap

Đối với nhiều người trong chúng ta đang đổi mới trong lĩnh vực Trí tuệ nhân tạo, chúng ta đang làm việc trong một lãnh thổ chưa được khám phá. Nhìn vào tốc độ phát triển công nghệ mới của các công ty Trí tuệ nhân tạo, người ta có thể cho rằng công việc chăm chỉ đằng sau những cảnh đó là điều đương nhiên. Nhưng trong một lĩnh vực như XR, nơi nhiệm vụ là làm mờ ranh giới giữa thế giới thực và thế giới kỹ thuật số — hiện tại không có nhiều dữ liệu lịch sử hoặc nghiên cứu để dựa vào; vì vậy chúng ta cần phải tư duy ngoài khuôn khổ.

Trong khi việc dựa vào sự khôn ngoan của học máy thông thường và các phương pháp đã được thử nghiệm là điều tiện lợi nhất, nhưng điều này thường không thể thực hiện được (hoặc không phải là giải pháp đầy đủ) trong các lĩnh vực mới nổi. Để giải quyết các vấn đề chưa từng được giải quyết trước đây, chúng cần phải được tiếp cận theo những cách mới.

Đây là một thách thức buộc bạn phải nhớ lại lý do tại sao bạn bước vào lĩnh vực kỹ thuật, khoa học dữ liệu hoặc phát triển sản phẩm từ đầu: niềm đam mê khám phá. Tôi trải nghiệm điều này mỗi ngày trong vai trò của mình tại Ultraleap, nơi chúng tôi phát triển phần mềm có thể theo dõi và phản hồi các chuyển động của bàn tay con người trong môi trường thực tế ảo. Vậy là rất nhiều điều chúng tôi nghĩ mình đã biết về việc đào tạo mô hình học máy bị đảo lộn trong công việc của chúng tôi, vì bàn tay con người — cùng với các vật thể và môi trường nó gặp phải — là cực kỳ khó dự đoán.

Dưới đây là một số cách tiếp cận mà nhóm của tôi và tôi đã thực hiện để tưởng tượng lại thực nghiệm và khoa học dữ liệu để mang lại tương tác trực quan đến thế giới kỹ thuật số, đó là chính xác và cảm giác tự nhiên như trong thế giới thực.

Đổi mới trong khuôn khổ

Khi đổi mới trong một không gian mới, bạn thường phải đối mặt với các hạn chế dường như mâu thuẫn với nhau. Nhóm của tôi được giao nhiệm vụ thu thập các sắc thái của chuyển động tay và ngón tay, và cách tay và ngón tay tương tác với thế giới xung quanh chúng. Tất cả đều được đóng gói vào mô hình theo dõi tay vẫn phù hợp với phần cứng XR trên tính toán bị giới hạn. Điều này có nghĩa là các mô hình của chúng tôi — mặc dù tinh vi và phức tạp — phải chiếm ít bộ nhớ và tiêu thụ ít năng lượng hơn (tương đương 1/100.000) so với các LLMs khổng lồ đang làm chủ tiêu đề. Nó mang lại cho chúng tôi một thách thức thú vị, đòi hỏi phải thực nghiệm và đánh giá mô hình của chúng tôi một cách tàn bạo trong ứng dụng thực tế.

Nhưng vô số thử nghiệm và thí nghiệm đều đáng giá: tạo ra một mô hình mạnh mẽ vẫn cung cấp chi phí suy luận thấp, tiêu thụ năng lượng và độ trễ là một điều kỳ diệu có thể được áp dụng trong tính toán biên даже ngoài không gian XR.

Các hạn chế chúng tôi gặp phải trong khi thí nghiệm sẽ ảnh hưởng đến các ngành công nghiệp khác. Một số doanh nghiệp sẽ có những thách thức duy nhất do sự tinh tế trong các lĩnh vực ứng dụng của họ, trong khi những doanh nghiệp khác có thể có dữ liệu hạn chế để làm việc do đang ở trong một thị trường ngách mà các công ty công nghệ lớn chưa chạm đến.

Trong khi các giải pháp một kích cỡ phù hợp với tất cả có thể đủ cho một số nhiệm vụ, nhiều lĩnh vực ứng dụng cần giải quyết các vấn đề thực sự thách thức cụ thể cho nhiệm vụ của họ. Ví dụ, các dây chuyền lắp ráp ô tô triển khai mô hình ML để kiểm tra khuyết tật. Các mô hình này phải đối mặt với hình ảnh có độ phân giải rất cao cần thiết để xác định các khuyết tật nhỏ trên một diện tích lớn của ô tô. Trong trường hợp này, ứng dụng đòi hỏi hiệu suất cao, nhưng vấn đề cần giải quyết là làm thế nào để đạt được tốc độ khung hình thấp nhưng độ phân giải cao.

Đánh giá kiến trúc mô hình để thúc đẩy đổi mới

Một tập dữ liệu tốt là lực lượng thúc đẩy đằng sau bất kỳ đột phá Trí tuệ nhân tạo thành công nào. Nhưng điều gì làm cho một tập dữ liệu “tốt” cho một mục tiêu cụ thể, vậy? Và khi bạn đang giải quyết các vấn đề chưa từng được giải quyết trước đây, làm thế nào bạn có thể tin tưởng rằng dữ liệu hiện có sẽ có liên quan? Chúng tôi không thể giả định rằng các chỉ số mà tốt cho một số nhiệm vụ ML sẽ chuyển thành hiệu suất nhiệm vụ kinh doanh cụ thể. Đây là nơi chúng tôi được kêu gọi đi ngược lại các “sự thật” ML thông thường và thay vào đó tích cực khám phá cách chúng tôi gắn nhãn, làm sạch và áp dụng cả dữ liệu mô phỏng và dữ liệu thế giới thực.

Bằng bản chất, lĩnh vực của chúng tôi là thách thức để đánh giá và đòi hỏi phải đảm bảo chất lượng thủ công – được thực hiện bằng tay. Chúng tôi không chỉ nhìn vào các chỉ số chất lượng của dữ liệu của chúng tôi. Chúng tôi lặp lại các tập dữ liệu và nguồn dữ liệu của chúng tôi và đánh giá chúng dựa trên các đặc điểm của các mô hình chúng tạo ra trong thế giới thực. Khi chúng tôi đánh giá lại cách chúng tôi xếp hạng và phân loại dữ liệu của chúng tôi, chúng tôi thường tìm thấy các tập dữ liệu hoặc xu hướng mà chúng tôi có thể đã bỏ qua. Bây giờ với những tập dữ liệu đó, và vô số thí nghiệm cho thấy chúng tôi không nên dựa vào dữ liệu nào, chúng tôi đã mở ra một con đường mới mà chúng tôi đã bỏ lỡ trước đó.

Nền tảng theo dõi tay mới nhất của Ultraleap, Hyperion, là một ví dụ tuyệt vời về điều này. Các tiến bộ trong các tập dữ liệu của chúng tôi đã giúp chúng tôi phát triển theo dõi tay tinh vi hơn có thể theo dõi chính xác các chuyển động tay vi mô cũng như chuyển động tay ngay cả khi người dùng đang cầm một vật thể.

Một bước nhỏ lùi lại, một bước nhảy lớn tiến lên

Trong khi tốc độ đổi mới dường như không bao giờ chậm lại, chúng ta có thể. Chúng ta đang trong lĩnh vực thí nghiệm, học hỏi, phát triển và khi chúng ta dành thời gian để làm điều đó, chúng ta thường tạo ra điều gì đó có giá trị hơn nhiều so với khi chúng ta làm theo sách và vội vàng đưa ra đổi mới công nghệ tiếp theo. Không có sự thay thế cho những đột phá xảy ra khi chúng ta khám phá các chú thích dữ liệu của chúng tôi, đặt câu hỏi về nguồn dữ liệu của chúng tôi và重新 định nghĩa các chỉ số chất lượng. Và cách duy nhất chúng ta có thể làm điều này là bằng cách thí nghiệm trong lĩnh vực ứng dụng thực tế với hiệu suất mô hình đo lường chống lại nhiệm vụ. Thay vì nhìn thấy các yêu cầu và hạn chế không phổ biến là hạn chế, chúng ta có thể lấy những thách thức này và biến chúng thành cơ hội cho đổi mới và cuối cùng là lợi thế cạnh tranh.

Iain Wallace, Director of Machine Learning at Ultraleap

Iain Wallace là Giám đốc Nghiên cứu Máy học và Theo dõi tại Ultraleap, một nhà lãnh đạo toàn cầu trong tầm nhìn máy tính và máy học. Ông là một nhà khoa học máy tính bị thu hút bởi nghiên cứu và phát triển hệ thống trí tuệ nhân tạo tập trung vào ứng dụng. Tại Ultraleap, Iain dẫn đầu nhóm nghiên cứu theo dõi tay của mình để cho phép các tương tác mới trong AR, VR, MR, ngoài nhà và bất kỳ nơi nào khác bạn tương tác với thế giới kỹ thuật số. Ông đã nhận được bằng Thạc sĩ Kỹ thuật về Hệ thống và Phần mềm Máy tính tại Đại học York và bằng Tiến sĩ về Tin học (Trí tuệ Nhân tạo) từ Đại học Edinburgh.

Unite.AI

Tư duy ngoài khuôn khổ để thúc đẩy sự đổi mới trong Trí tuệ nhân tạo

Đổi mới trong khuôn khổ

Đánh giá kiến trúc mô hình để thúc đẩy đổi mới

Một bước nhỏ lùi lại, một bước nhảy lớn tiến lên

You may like