人工智能
从草图到平台游戏:Google Genie 的游戏生成艺术方法
Genie,一个非凡的创造 谷歌深度思维,激发了研究人员和游戏玩家的想象力。它的全名“GENerative Interactive Environment”暗示了其非凡的能力。与平均水平不同 AI模型,Genie 拥有将单个图像或文本提示转换为交互式、可玩的 2D 世界的独特能力。
Genie 的独特之处在于它能够通过吸收未标记的互联网视频中的知识来动画化虚拟世界。它就像一块数字海绵,吸收各种环境和交互的细微差别。
Genie 的核心是一个基础世界模型,其特点是 神经结构 11亿参数。它的组成部分,例如 时空视频分词器, 自回归动力学模型,以及关键的 潜在行动模型,和谐地构建用户可以轻松参与的沉浸式环境。
Genie 展示了从隐藏着宝藏的茂密森林转变为受年轻艺术家涂鸦启发的富有想象力的游戏关卡的强大能力。它展示了卓越的变革能力,因为它无需特定的操作标签或特定领域的要求即可进行协作学习,从而提供了广泛且无限的创意体验。
精灵如何工作?
在 Genie 的迷人世界中,静态图像通过艺术性和计算能力的融合转变为动态的交互式场景。将这些静态图像想象为超凡脱俗的视频中的帧,每个帧都揭示了超越传统草图并演变成身临其境的叙事的迷人新场景。
Genie 的核心在于其基于视频的方法,将初始图像视为引人入胜的翻页书中的框架。这以非凡的方式为草图注入了生命。例如,一个简单的城堡草图可以演变成一座带有隐藏房间、秘密通道和高塔的庞大堡垒。同样,一条弯曲的线可以变成一条蜿蜒的河流,里面有动画鱼和冒险的浮动平台。 Genie 基于视频的方法将想象与现实结合起来,邀请用户进入一个迷人的世界。
精灵的神奇能力源于其严格的训练。它从大量的收藏中汲取灵感 200,000小时 在线公开的 2D 平台游戏视频。 Genie 从这个宝库中的数百款 30,000D 游戏中精心挑选了 2 小时的标准化视频。这些游戏体验成为 Genie 的画布,融入了像素化冒险、精确跳跃的精髓以及标志性游戏角色的精神。
就像视频游戏一样,Genie 可以像巫师一样预测并创建交互式动作。想象一下按下游戏控制器上的按钮 - Genie 会做类似的事情。它需要静态元素(像一棵树)并神奇地将它们转化为动态特征。例如,按“up”可以将一棵静止的树变成一棵摇曳的、可攀爬的藤蔓,叶子摇曳。当角色需要跨越危险的间隙时,精灵会勇敢地动画化他们的像素化动作。我们可以想象它就像精灵在现实世界和魔法世界之间跳舞一样,让一切变得生动起来。
Genie 就像一个水晶球,利用其预测模型来预测接下来会发生什么。它会查看随机帧和可能的动作,对下图做出有根据的猜测。这类似于电影的剪辑方式,每个镜头都通向下一个镜头,创造出一个充满流畅、悬念和刺激的故事。随着吉尼的预测的实现,一开始的静态图片变成了动人且令人兴奋的场景。
精灵的艺术潜力
Genie的艺术功力非常出色,就像把孩子的涂鸦变成了一个生动的世界。想象一下纸上的几行文字会变成一场激动人心的冒险,其中有值得探索的事物、需要克服的挑战和有趣的角色。
对于讲故事的人来说,Genie 提供了多种选择。例如,一张图片提示可以创建一个完整的游戏世界,玩家可以在其中发现故事并解开谜团。它更像是一个视觉故事,准备按照故事讲述者的想象展开。
此外,Genie 不仅仅适用于游戏;它还适用于游戏。它是艺术家和讲故事者的多功能工具,可以将简单的想法转化为连接过去和现在的互动体验。
Genie 的变革性应用
Genie 的诱人能力可以引领应用程序的新时代。一些应用领域如下:
Genie 是一种神奇的灵感,通过将基本想法转化为详细的 2D 游戏来创造无尽的创造力。孩子们的绘画和书面提示为激动人心的冒险和富有想象力的外星之地奠定了基础,激发创作者探索广阔的想象世界。
除了游戏之外,Genie 的核心能力还在于基础世界建模,其中蕴藏着可能带来革命性变革的秘密 机器学习。我们可以想象它预测的动态场景对于引导自动驾驶汽车沿着像素化道路行驶或在医学模拟中培训有抱负的医生有用。
Genie 的魔力不仅仅适用于游戏;它还适用于游戏。它也有助于学习和艺术。随着时间线变成不同时间的互动旅行,历史课程可以变成令人兴奋的冒险。在艺术画廊中,吉尼的像素化创作可能会挂在普通绘画旁边,混合创意的想法。
挑战和未来方向
除了出色的功能之外,Genie 还面临一些挑战。确保一切看起来都很棒并保持一致就像变戏法一样,将涂鸦变成杰作,但找到正确的平衡是很棘手的。因此,精灵必须决定如何将有趣的混乱与仔细的计划结合起来。
同样,制作适合玩家玩的游戏也具有挑战性。如果它们太简单,可能就不那么有趣了;如果太难,玩家可能会放弃。因此,Genie必须像游戏设计师一样,调整角色跳跃的高度、敌人在哪里弹出、以及道具出现在哪里。
随着精灵魔法的传播,一些问题也随之出现。例如,谁应该因 Genie 创造的游戏而受到赞扬?是最初的创意赋予者、赋予其生命的魔幻模型,还是沉浸在虚拟世界中的玩家? Genie 必须明智地解决这些问题,处理谁拥有游戏及其想法。
底线
总之, Genie谷歌DeepMind的创新创造,以其变革力量超越了传统的AI模型。从增强的游戏体验到彻底改变机器学习并促进各个领域的创造力,Genie 已成为一支多才多艺的力量。
在面临挑战的同时,其独特的预测动态和艺术潜力的方法为想象力和技术无缝融合的未来铺平了道路,为互动探索和创造力开辟了令人兴奋的途径。