Trí tuệ nhân tạo
Học Tập Đa Phương Thức Đang Trở Nên Prominent Trong Số Các Nhà Phát Triển Trí Tuệ Nhân Tạo

Venture Beat (VB) đã dành một trong những báo cáo hàng tuần của mình để nói về những lợi thế của học tập đa phương thức trong việc phát triển trí tuệ nhân tạo. Câu chuyện của họ được bắt đầu từ một báo cáo của ABI Research về vấn đề này.
Khái niệm chính nằm ở chỗ rằng “các tập dữ liệu là những khối xây dựng cơ bản của các hệ thống trí tuệ nhân tạo,” và rằng không có các tập dữ liệu, “các mô hình không thể học được các mối quan hệ mà thông tin dự đoán của chúng.” Báo cáo của ABI dự đoán rằng “trong khi tổng số thiết bị trí tuệ nhân tạo được lắp đặt sẽ tăng từ 2,69 tỷ vào năm 2019 lên 4,47 tỷ vào năm 2024, thì tương đối ít trong số chúng sẽ có khả năng tương tác trong thời gian ngắn.”
Điều này có thể đại diện cho một sự lãng phí đáng kể về thời gian, năng lượng và tài nguyên, “thay vì kết hợp các gigabyte đến petabyte dữ liệu chảy qua chúng vào một mô hình trí tuệ nhân tạo hoặc khuôn khổ duy nhất, chúng sẽ hoạt động độc lập và dị hình để hiểu dữ liệu mà chúng được cho.”
Để vượt qua điều này, ABI đề xuất học tập đa phương thức, một phương pháp có thể kết hợp dữ liệu “từ các cảm biến và đầu vào khác nhau vào một hệ thống duy nhất. Học tập đa phương thức có thể mang lại thông tin hoặc xu hướng bổ sung, thường chỉ trở nên rõ ràng khi tất cả chúng được bao gồm trong quá trình học tập.”
VB trình bày một ví dụ khả thi xem xét hình ảnh và chú thích văn bản. “Nếu các từ khác nhau được ghép với hình ảnh tương tự, thì những từ này có khả năng được sử dụng để mô tả cùng một thứ hoặc đối tượng. Ngược lại, nếu một số từ xuất hiện cạnh các hình ảnh khác nhau, điều này ngụ ý rằng những hình ảnh này đại diện cho cùng một đối tượng. Vì vậy, nó nên có thể cho một mô hình trí tuệ nhân tạo dự đoán các đối tượng hình ảnh từ mô tả văn bản, và thực sự, một lượng lớn tài liệu học thuật đã chứng minh điều này là đúng.”
Mặc dù có những lợi thế có thể, ABI lưu ý rằng thậm chí các gã khổng lồ công nghệ như IBM, Microsoft, Amazon, và Google vẫn tập trung chủ yếu vào các hệ thống đơn phương thức. Một trong những lý do là những thách thức mà một sự chuyển đổi như vậy sẽ đại diện.
Tuy nhiên, các nhà nghiên cứu của ABI dự đoán rằng “tổng số thiết bị được vận chuyển sẽ tăng từ 3,94 triệu vào năm 2017 lên 514,12 triệu vào năm 2023, được thúc đẩy bởi việc áp dụng trong các lĩnh vực robot, tiêu dùng, chăm sóc sức khỏe, và truyền thông và giải trí.” Trong số các ví dụ về các công ty đã triển khai học tập đa phương thức, họ đề cập đến Waymo đang sử dụng các phương pháp như vậy để xây dựng “các phương tiện tự lái siêu nhận thức,” và Intel Labs, nơi đội ngũ kỹ sư của công ty đang “điều tra các kỹ thuật để thu thập dữ liệu cảm biến trong môi trường thực tế.”
Kỹ sư chính của Intel Labs, Omesh Tickoo, đã giải thích với VB rằng “Điều chúng tôi làm là, bằng cách sử dụng các kỹ thuật để xác định ngữ cảnh như thời gian trong ngày, chúng tôi đã xây dựng một hệ thống cho biết khi nào dữ liệu của cảm biến không phải là chất lượng cao nhất. Với giá trị tin cậy đó, nó sẽ cân nhắc các cảm biến khác nhau tại các khoảng thời gian khác nhau và chọn sự kết hợp phù hợp để đưa ra câu trả lời mà chúng tôi đang tìm kiếm.”
VB lưu ý rằng học tập đơn phương thức sẽ vẫn chiếm ưu thế ở những nơi nó cực kỳ hiệu quả – trong các ứng dụng như nhận dạng hình ảnh và xử lý ngôn ngữ tự nhiên. Đồng thời, nó dự đoán rằng “khi điện tử trở nên rẻ hơn và tính toán trở nên có thể mở rộng hơn, học tập đa phương thức có khả năng sẽ chỉ tăng lên về tầm quan trọng.”






