sơ khai Từ bản phác thảo đến nền tảng: Phương pháp tiếp cận nghệ thuật của Google Genie đối với việc tạo trò chơi - Unite.AI
Kết nối với chúng tôi

Trí tuệ nhân tạo

Từ bản phác thảo đến nền tảng: Phương pháp tiếp cận nghệ thuật của Google Genie đối với việc tạo trò chơi

mm
cập nhật on
Khám phá cách phép thuật AI của Google Genie biến đổi các hình ảnh hoặc lời nhắc văn bản đơn lẻ thành thế giới 2D tương tác, có thể chơi được.

thần đèn, một sáng tạo đáng chú ý của Google DeepMind, đã thu hút trí tưởng tượng của các nhà nghiên cứu cũng như các game thủ. Tên đầy đủ của nó, “Môi trường tương tác thế hệ”, gợi ý về những khả năng phi thường của nó. Khác với mức trung bình Mô hình AI, Genie sở hữu sức mạnh độc nhất để biến các hình ảnh hoặc lời nhắc văn bản đơn lẻ thành thế giới 2D tương tác, có thể chơi được.

Genie nổi bật nhờ khả năng tạo hoạt ảnh cho thế giới ảo bằng cách tiếp thu kiến ​​thức từ các video Internet không được gắn nhãn. Nó hoạt động như một miếng bọt biển kỹ thuật số giúp hấp thụ các sắc thái của các môi trường và tương tác khác nhau.

Về cốt lõi, Genie là một mô hình thế giới nền tảng bao gồm một kiến trúc thần kinh với 11 tỷ thông số. Các thành phần không thể thiếu của nó, chẳng hạn như Công cụ mã thông báo video không gian thời gian, Mô hình động lực học tự hồi quy, và điều cốt yếu Mô hình hành động tiềm ẩn, hoạt động hài hòa để xây dựng môi trường sống động mà người dùng có thể dễ dàng tương tác.

Genie thể hiện khả năng đáng kể trong việc chuyển từ những khu rừng trù phú với những kho báu ẩn giấu sang các cấp độ trò chơi giàu trí tưởng tượng lấy cảm hứng từ những bức vẽ nguệch ngoạc của các nghệ sĩ trẻ. Nó thể hiện khả năng biến đổi đặc biệt vì nó học tập một cách cộng tác mà không cần nhãn hành động cụ thể hoặc các yêu cầu dành riêng cho miền, mang lại trải nghiệm sáng tạo mở rộng và không giới hạn.

Genie hoạt động như thế nào?

Trong thế giới hấp dẫn của Genie, những hình ảnh tĩnh biến thành những cảnh động, tương tác thông qua sự kết hợp giữa tính nghệ thuật và khả năng tính toán. Hãy tưởng tượng những hình ảnh tĩnh này dưới dạng các khung hình trong một video về thế giới khác, mỗi hình ảnh tiết lộ những cảnh mới đầy quyến rũ, vượt xa các bản phác thảo truyền thống và phát triển thành những câu chuyện sống động.

Cốt lõi của Genie nằm ở cách tiếp cận dựa trên video, xử lý các hình ảnh ban đầu dưới dạng khung hình trong một cuốn sách lật hấp dẫn. Điều này mang lại sức sống cho các bản phác thảo theo những cách đáng chú ý. Ví dụ: một bản phác thảo lâu đài đơn giản có thể biến thành một pháo đài rộng lớn với những căn phòng ẩn giấu, những lối đi bí mật và những tòa tháp cao. Tương tự, một đường quanh co có thể biến thành một dòng sông uốn lượn với những chú cá hoạt hình và những bệ nổi để phiêu lưu. Phương pháp dựa trên video của Genie kết hợp trí tưởng tượng và thực tế, mời người dùng vào một thế giới hấp dẫn.

Khả năng phép thuật của Genie bắt nguồn từ quá trình luyện tập nghiêm ngặt của nó. Nó lấy cảm hứng từ một bộ sưu tập lớn các 200,000 giờ của các video nền tảng 2D có sẵn công khai trực tuyến. Genie đã lựa chọn tỉ mỉ 30,000 giờ video tiêu chuẩn hóa từ hàng trăm trò chơi 2D từ kho báu này. Những trải nghiệm chơi trò chơi này đã trở thành bức vẽ của Genie, thấm đẫm bản chất của những cuộc phiêu lưu pixel, những cú nhảy chính xác và tinh thần của các nhân vật chơi game mang tính biểu tượng.

Giống như một trò chơi điện tử, Genie có thể dự đoán và tạo ra các hành động tương tác giống như một thầy phù thủy. Hãy tưởng tượng việc nhấn các nút trên bộ điều khiển trò chơi—Genie cũng làm điều tương tự. Nó có các phần tử tĩnh (giống như một cái cây) và biến chúng thành các đặc điểm động một cách kỳ diệu. Ví dụ: nhấn “up” có thể biến một cái cây tĩnh lặng thành một cây nho đung đưa, có thể trèo được với những chiếc lá rung chuyển. Và khi các nhân vật cần nhảy qua những khoảng trống nguy hiểm, Genie sẽ thể hiện sự can đảm bằng hoạt hình các chuyển động pixel của họ. Chúng ta có thể tưởng tượng nó giống như Genie nhảy múa giữa thế giới thực và thế giới ma thuật, khiến mọi thứ trở nên sống động.

Thần đèn hoạt động như một quả cầu pha lê, sử dụng mô hình dự đoán của mình để đoán trước điều gì sẽ xảy ra tiếp theo. Nó xem xét các khung hình ngẫu nhiên và các hành động có thể xảy ra, đưa ra những phỏng đoán có căn cứ về hình ảnh sau đây. Điều này tương tự như cách biên tập phim, với mỗi cảnh quay dẫn đến cảnh tiếp theo, tạo nên một câu chuyện trôi chảy, hồi hộp và phấn khích. Khi những dự đoán của Genie diễn ra, những gì bắt đầu từ những bức ảnh tĩnh sẽ chuyển thành những cảnh cảm động và thú vị.

Tiềm năng nghệ thuật của Genie

Kỹ năng nghệ thuật của Genie rất xuất sắc, giống như biến những nét vẽ nguệch ngoạc của một đứa trẻ thành một thế giới sống động. Hãy tưởng tượng một vài dòng trên giấy biến thành một cuộc phiêu lưu thú vị với những điều cần khám phá, những thử thách cần vượt qua và những nhân vật thú vị.

Đối với người kể chuyện, Genie đưa ra một số lựa chọn. Ví dụ: một lời nhắc bằng hình ảnh có thể tạo ra cả một thế giới trò chơi nơi người chơi có thể khám phá các câu chuyện và giải đáp những bí ẩn. Nó giống một câu chuyện trực quan hơn, sẵn sàng mở ra khi người kể chuyện tưởng tượng.

Ngoài ra, Genie không chỉ dành cho trò chơi; nó là một công cụ linh hoạt dành cho các nghệ sĩ và người kể chuyện, biến những ý tưởng đơn giản thành những trải nghiệm tương tác kết nối quá khứ và hiện tại.

Các ứng dụng biến đổi của Genie

Khả năng quyến rũ của Genie có thể dẫn đến một kỷ nguyên ứng dụng mới. Một số miền ứng dụng như sau:

Genie là nguồn cảm hứng kỳ diệu tạo ra khả năng sáng tạo vô tận bằng cách biến những ý tưởng cơ bản thành trò chơi 2D chi tiết. Những bức vẽ và lời nhắc bằng văn bản của trẻ em tạo tiền đề cho những cuộc phiêu lưu thú vị và những địa điểm xa lạ giàu trí tưởng tượng, truyền cảm hứng cho những người sáng tạo khám phá thế giới trí tưởng tượng rộng lớn.

Ngoài chơi game, khả năng cốt lõi của Genie nằm ở việc mô hình hóa thế giới nền tảng, nơi nắm giữ những bí mật có thể cách mạng hóa học máy. Chúng ta có thể tưởng tượng nó dự đoán các cảnh động hữu ích cho việc hướng dẫn ô tô tự lái dọc theo những con đường có pixel hoặc để đào tạo các bác sĩ đầy tham vọng về mô phỏng y tế.

Phép thuật của Genie không chỉ dành cho trò chơi; nó cũng giúp ích trong học tập và nghệ thuật. Các bài học lịch sử có thể trở thành những cuộc phiêu lưu thú vị khi các mốc thời gian trở thành những chuyến đi tương tác vào những thời điểm khác nhau. Trong các phòng trưng bày nghệ thuật, các tác phẩm pixel của Genie có thể được treo bên cạnh những bức tranh thông thường, trộn lẫn các ý tưởng sáng tạo.

Thách thức và xu hướng tương lai

Bên cạnh những tính năng ưu việt, Genie còn phải đối mặt với một số thách thức. Đảm bảo mọi thứ trông đẹp mắt và nhất quán cũng giống như trò tung hứng, biến một nét vẽ nguệch ngoạc thành một kiệt tác, nhưng việc tìm ra sự cân bằng phù hợp lại rất khó khăn. Vì vậy, Genie phải quyết định làm thế nào để kết hợp sự hỗn loạn vui tươi với kế hoạch cẩn thận.

Tương tự như vậy, việc tạo ra những trò chơi phù hợp để người chơi chơi là một thách thức. Nếu quá dễ, chúng có thể không vui; nếu quá khó, người chơi có thể bỏ cuộc. Vì vậy, Genie phải giống như một nhà thiết kế trò chơi, điều chỉnh cách nhân vật nhảy cao, nơi kẻ thù bật lên và nơi xuất hiện sức mạnh.

Khi phép thuật của Genie lan rộng, một số câu hỏi cũng được đặt ra. Ví dụ: ai xứng đáng được ghi nhận cho trò chơi mà Genie tạo ra? Đó là người đưa ra ý tưởng ban đầu, mô hình ma thuật mang sức sống vào đó hay người chơi đắm mình trong thế giới ảo? Genie phải giải quyết những câu hỏi này một cách thận trọng, giải quyết vấn đề ai sở hữu trò chơi và ý tưởng của nó.

The Bottom Line

Trong kết luận, thần đèn, sáng tạo đổi mới của Google DeepMind, vượt qua các mô hình AI truyền thống nhờ sức mạnh biến đổi của nó. Từ trải nghiệm chơi game nâng cao đến cách mạng hóa máy học và thúc đẩy khả năng sáng tạo trong nhiều lĩnh vực khác nhau, Genie đã nổi lên như một lực lượng đa năng.

Trong khi đối mặt với những thách thức, cách tiếp cận độc đáo của nó đối với động lực dự đoán và tiềm năng nghệ thuật sẽ mở đường cho một tương lai nơi trí tưởng tượng và công nghệ kết hợp liền mạch, mở ra những con đường thú vị cho sự khám phá và sáng tạo tương tác.

Tiến sĩ Assad Abbas, một Phó giáo sư chính thức tại Đại học COMSATS Islamabad, Pakistan, lấy bằng Tiến sĩ. từ Đại học bang North Dakota, Hoa Kỳ. Nghiên cứu của ông tập trung vào các công nghệ tiên tiến, bao gồm điện toán đám mây, sương mù và biên, phân tích dữ liệu lớn và AI. Tiến sĩ Abbas đã có những đóng góp đáng kể với các công bố trên các tạp chí và hội nghị khoa học có uy tín.