sơ khai Trí tuệ nhân tạo tham gia cuộc thi học máy Minecraft - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

AI tham gia cuộc thi học máy Minecraft

mm
cập nhật on

Theo báo cáo của Thiên nhiên, một cuộc thi AI mới sẽ sớm diễn ra, cuộc thi MineRL, cuộc thi này sẽ khuyến khích các kỹ sư và lập trình viên AI tạo ra các chương trình có khả năng học hỏi thông qua quan sát và ví dụ. Trường hợp thử nghiệm cho các hệ thống AI này sẽ là trò chơi video sinh tồn và chế tạo rất phổ biến Minecraft.

Hệ thống trí tuệ nhân tạo đã đạt được một số thành tựu ấn tượng gần đây khi nói đến trò chơi điện tử. Mới gần đây, một AI đã đánh bại những người chơi giỏi nhất thế giới trong trò chơi chiến lược StarCraft II. Tuy nhiên, StarCraft II có các mục tiêu có thể xác định dễ dàng hơn để chia thành các bước mạch lạc mà AI có thể sử dụng để đào tạo. Một nhiệm vụ khó khăn hơn nhiều đối với AI là học cách điều hướng một trò chơi hộp cát thế giới mở rộng lớn như Minecraft. Các nhà nghiên cứu đang hướng tới việc giúp các chương trình AI học thông qua quan sát và lấy ví dụ, và nếu thành công, họ có thể giảm đáng kể lượng sức mạnh xử lý cần thiết để đào tạo một chương trình trí tuệ nhân tạo.

Những người tham gia cuộc thi sẽ có bốn ngày để tạo ra một AI sẽ được thử nghiệm với Minecraft, mất tới tám triệu bước để huấn luyện AI của họ. Mục tiêu của AI là tìm một viên kim cương trong trò chơi bằng cách đào. Tám triệu bước đào tạo là khoảng thời gian ngắn hơn nhiều so với lượng thời gian cần thiết để đào tạo các mô hình AI mạnh mẽ ngày nay, vì vậy những người tham gia cuộc thi cần thiết kế các phương pháp cải thiện đáng kể so với các phương pháp đào tạo hiện tại.

Các phương pháp đang được những người tham gia sử dụng dựa trên một kiểu học gọi là học bắt chước. Học bắt chước trái ngược với học tăng cường, đây là phương pháp phổ biến để huấn luyện các hệ thống tinh vi như cánh tay rô-bốt trong nhà máy hoặc AI có khả năng đánh bại người chơi là con người tại StarCraft II. Hạn chế chính của các thuật toán học tăng cường là chúng yêu cầu sức mạnh xử lý máy tính cực lớn để đào tạo, dựa vào hàng trăm hoặc thậm chí hàng nghìn máy tính được liên kết với nhau để học. Ngược lại, học bắt chước là một phương pháp đào tạo hiệu quả hơn và ít tính toán hơn. Các thuật toán học bắt chước cố gắng bắt chước cách con người học bằng cách quan sát.

William Guss, ứng cử viên tiến sĩ về lý thuyết học sâu tại Đại học Carnegie Mellon giải thích với Nature rằng để AI khám phá và học các mẫu trong môi trường là một nhiệm vụ cực kỳ khó khăn, nhưng học bắt chước cung cấp cho AI nền tảng kiến ​​thức hoặc kiến ​​thức tốt. các giả định trước đó về môi trường. Điều này có thể giúp đào tạo AI nhanh hơn nhiều so với học tăng cường.

Minecraft phục vụ như một môi trường đào tạo đặc biệt hữu ích vì nhiều lý do. Một lý do là Minecraft cho phép người chơi sử dụng các khối xây dựng đơn giản để tạo các cấu trúc và vật phẩm phức tạp, đồng thời nhiều bước cần thiết để tạo các cấu trúc này đóng vai trò là dấu hiệu tiến trình hữu hình mà các nhà nghiên cứu có thể sử dụng làm thước đo. Minecraft cũng cực kỳ phổ biến và vì điều này, việc thu thập dữ liệu đào tạo tương đối dễ dàng. Ban tổ chức cuộc thi MineRL đã tuyển dụng nhiều người chơi Minecraft để thể hiện nhiều nhiệm vụ khác nhau như tạo công cụ và phá vỡ các khối. Bằng cách sử dụng nguồn lực cộng đồng để tạo dữ liệu, các nhà nghiên cứu đã có thể nắm bắt được 60 triệu ví dụ về các hành động có thể được thực hiện trong trò chơi. Các nhà nghiên cứu đã cung cấp khoảng 1000 giờ video cho các đội thi đấu.

Rohin Shah, Ph.D. ứng cử viên khoa học máy tính tại Đại học California, Berkeley giải thích với Nature rằng cuộc thi này có thể là cuộc thi đầu tiên tập trung vào việc sử dụng kiến ​​thức mà con người đã tạo ra để đẩy nhanh quá trình đào tạo AI.

Guss và các nhà nghiên cứu khác hy vọng rằng cuộc thi có thể mang lại kết quả có ý nghĩa ngoài Minecraft, tạo ra các thuật toán học bắt chước tốt hơn và truyền cảm hứng cho nhiều người hơn coi việc học bắt chước là một hình thức đào tạo AI khả thi. Nghiên cứu này có khả năng giúp tạo ra các AI có khả năng tương tác tốt hơn với con người trong những môi trường phức tạp và luôn thay đổi.