Connect with us

人工智能

从草图到平台游戏:Google Genie 的艺术方法生成游戏

mm
Discover how Google Genie’s AI magic transforms single images or text prompts into interactive, playable 2D worlds.

Genie,一个由 Google DeepMind 创建的杰出作品,已经吸引了研究人员和游戏玩家的想象力。它的全名“GENerative Interactive Environment”暗示了它的非凡能力。与普通的 AI 模型 不同,Genie 拥有将单个图像或文本提示转化为交互式、可玩的 2D 世界的独特力量。

Genie 通过其能够通过吸收无标签的互联网视频知识来使虚拟世界动起来而与众不同。它像一个数字海绵一样,吸收各种环境和交互的细微差别。

在其核心,Genie 是一个基础的世界模型,具有 神经架构,拥有 110 亿参数。其组成部分,如 时空视频标记器、自回归动态模型和关键的 潜在动作模型,协同工作来构建身临其境的环境,用户可以轻松地与之交互。

Genie 展示了从富饶的森林到年轻艺术家涂鸦启发的想象游戏关卡的显著转变能力。它展示了异常的转化能力,因为它可以在不需要特定动作标签或域特定要求的情况下协同学习,提供广阔和无限的创造性体验。

Genie 如何工作?

在 Genie 的迷人世界中,静态图像通过艺术和计算能力的融合转化为动态、交互式的场景。想象这些静态图像作为一个超凡的视频中的帧,每个帧揭示了令人着迷的新场景,超越了传统的草图,并演变成身临其境的叙事。

Genie 的核心在于其基于视频的方法,将初始图像视为一个令人着迷的翻页书中的帧。这使得草图以惊人的方式变得生动。例如,一个简单的城堡草图可以变成一个拥有隐藏的房间、秘密通道和高塔的广阔堡垒。同样,一条歪斜的线可以变成一条有动画鱼和浮动平台的蜿蜒河流。Genie 的基于视频的方法将想象力和现实结合起来,邀请用户进入一个迷人的世界。

Genie 的魔力来自其严格的训练。它从大量的 20 万小时 的在线公开 2D 平台游戏视频中汲取灵感。Genie 精心选择了其中的 3 万小时的标准化视频,来自数百个 2D 游戏。这些游戏体验成为 Genie 的画布,注入了像素冒险、精确跳跃和标志性游戏角色精神的精髓。

像一个视频游戏一样,Genie 可以预测和创建交互式的动作。想象按下游戏控制器的按钮——Genie 做的事情类似。它将静态元素(例如一棵树)变成动态的特征。例如,按下“”可以将一棵静止的树变成一条摇曳的、可攀爬的藤蔓,树叶也会摇晃。当角色需要跳过危险的间隙时,Genie 会将他们的像素化运动动画化,展现出勇气。我们可以想象它像 Genie 在现实世界和魔幻世界之间跳跃,使事物变得生动。

Genie 就像一个水晶球,使用其预测模型来预测接下来会发生什么。它查看随机帧和可能的动作,根据下一个图像做出有根据的猜测。这类似于电影的编辑方式,每个镜头都通向下一个,创造出一个带有流畅、悬念和激动的故事。随着 Genie 的预测展开,最初的静态图像变成了动态、激动人心的场景。

Genie 的艺术潜力

Genie 的艺术技巧非常出色,例如将一个孩子的涂鸦变成一个生动的世界。想象几条线变成一个令人兴奋的冒险,里面有东西可以探索、挑战可以克服和有趣的角色。

对于讲故事的人来说,Genie 提供了多种选择。例如,一个图像提示可以创建一个完整的游戏世界,玩家可以在其中发现故事和解谜。它更像是一个准备展开的视觉故事,讲故事的人可以想象。

此外,Genie 不仅仅适用于游戏;它是一个多功能的工具,适用于艺术家和讲故事的人,将简单的想法变成交互式的体验,将过去和现在连接起来。

Genie 的转化应用

Genie 的迷人能力可以带来一个新的应用时代。几个应用领域如下:

Genie 是一个神奇的灵感,通过将基本的想法变成详细的 2D 游戏,创造出无尽的创造力。孩子们的绘画和书面提示为令人兴奋的冒险和想象中的外星地方搭建了舞台,激发创作者探索想象力的广阔世界。

除了游戏以外,Genie 的核心能力在于基础的世界建模,这其中隐藏着可能会革命性地改变 机器学习 的秘密。我们可以想象它预测动态场景,用于引导自动驾驶汽车沿着像素化的道路行驶,或者用于训练有志于成为医生的医学生进行医疗模拟。

Genie 的魔力不仅仅适用于游戏;它还帮助学习和艺术。历史课可以变成令人兴奋的冒险,因为时间轴变成了在不同时间进行的交互式旅行。在艺术画廊中,Genie 的像素化创作可能会与普通的绘画一起展示,混合了创造力的想法。

挑战和未来方向

除了优秀的功能,Genie 面临一些挑战。确保一切看起来很好并保持一致性就像杂技,变一个涂鸦为一件杰作,但找到合适的平衡是很棘手的。因此,Genie 必须决定如何混合有趣的混乱和周密的规划。

同样,制作适合玩家的游戏是具有挑战性的。如果游戏太容易,可能不会很有趣;如果太难,玩家可能会放弃。因此,Genie 必须像一个游戏设计师一样,调整角色跳跃的高度、敌人出现的位置以及强化道具的位置。

随着 Genie 的魔力传播,一些问题也随之而来。例如,谁应该为 Genie 创建的游戏承担信用?是最初的想法提供者、将其赋予生命的魔力模型,还是沉浸在虚拟世界中的玩家?Genie 必须谨慎地处理这些问题,处理谁拥有游戏及其想法的问题。

总结

总之,Genie,Google DeepMind 的创新创作,超越了传统的 AI 模型,具有变革性的力量。从增强的游戏体验到革命性的机器学习和促进各个领域的创造力,Genie 已经成为一个多功能的力量。

虽然面临挑战,但其独特的预测动态和艺术潜力为未来铺平了道路,在那里想象力和技术可以无缝地融合,开启了令人兴奋的交互式探索和创造力的途径。

阿萨德·阿巴斯博士(Dr. Assad Abbas)是巴基斯坦伊斯兰堡COMSATS大学的终身副教授,他在美国北达科他州立大学获得了博士学位。他的研究重点是包括云计算、雾计算、边缘计算、大数据分析和人工智能在内的先进技术。阿巴斯博士在著名的科学期刊和会议上发表了大量的论文,并做出了重要的贡献。他也是 MyFastingBuddy 的创始人。