スタブ スケッチからプラットフォーマーへ: ゲーム生成に対する Google Genie の芸術的アプローチ - Unite.AI
私達と接続

Artificial Intelligence

スケッチからプラットフォーマーへ: ゲーム生成に対する Google Genie の芸術的アプローチ

mm
更新中 on
Google Genie の AI 魔法が、単一の画像やテキスト プロンプトをインタラクティブで再生可能な 2D 世界にどのように変換するかをご覧ください。

精霊による注目に値する作品です。 Google DeepMind、研究者とゲーマーの想像力を同様に魅了しました。その正式名称は「GENerative Interactive Environmental」であり、その並外れた能力を示唆しています。平均とは異なります AIモデル, Genie は、単一の画像やテキスト プロンプトをインタラクティブでプレイ可能な 2D 世界に変換する独自のパワーを持っています。

Genie は、ラベルのないインターネット ビデオから知識を吸収して仮想世界をアニメーション化する能力によって際立っています。さまざまな環境や相互作用のニュアンスを吸収するデジタル スポンジとして機能します。

Genie の核となるのは、以下を特徴とする基礎的な世界モデルです。 ニューラルアーキテクチャ   11億のパラメーター。その統合コンポーネントとしては、 時空間ビデオトークナイザー, 自己回帰ダイナミクスモデル、そして重要な 潜在行動モデル、ユーザーが簡単に参加できる没入型環境を構築するために調和して機能します。

Genie は、宝物が隠された豊かな森から、若いアーティストの落書きにインスピレーションを得た想像力豊かなゲーム レベルに移行する優れた能力を示しています。特定のアクション ラベルやドメイン固有の要件を必要とせずに共同学習するため、優れた変革能力を発揮し、拡張的で無限のクリエイティブ エクスペリエンスを提供します。

ジーニーはどのように機能しますか?

Genie の魅力的な世界では、芸術性と計算能力の融合によって、静止画像がダイナミックでインタラクティブなシーンに変わります。これらの静止画像を別世界のビデオ内のフレームとして想像してください。それぞれが従来のスケッチを超え、没入型の物語に進化する魅力的な新しいシーンを明らかにします。

Genie の核心はビデオベースのアプローチにあり、最初の画像を魅力的なフリップブックのフレームとして扱います。これにより、驚くべき方法でスケッチに生命が吹き込まれます。たとえば、単純な城のスケッチを、隠し部屋、秘密の通路、高い塔を備えた広大な要塞に変えることができます。同様に、曲がったラインは、アニメーションの魚や冒険のための浮遊プラットフォームのある曲がりくねった川に変わります。 Genie のビデオベースの方法論は想像力と現実を組み合わせ、ユーザーを魅力的な世界に誘います。

ジーニーの魔法の能力は、厳しい訓練から生まれました。膨大なコレクションからインスピレーションを得て、 200,000時間 オンラインで公開されている 2D プラットフォーマー ビデオのリスト。 Genie は、この宝の山から何百もの 30,000D ゲームから 2 時間の標準化されたビデオを細心の注意を払って選択しました。これらのゲームプレイ体験は Genie のキャンバスとなり、ピクセル化された冒険、正確なジャンプ、そして象徴的なゲーム キャラクターの精神のエッセンスが注入されました。

ビデオ ゲームのように、Genie はウィザードのようにインタラクティブなアクションを予測して作成できます。ゲーム コントローラーのボタンを押すことを想像してください。Genie も同様のことを行います。静的要素 (木のように)そしてそれらを魔法のように動的な特徴に変換します。たとえば、「」を押すと、up」と言うと、静止した木を、葉が揺れて登れる蔓に変えることができます。そして、キャラクターが危険な隙間を飛び越える必要があるとき、Genie は勇気を持ってピクセル化された動きをアニメーション化します。ジーニーが現実世界と魔法の世界の間で踊り、物事に命を吹き込むようなものだと想像できます。

Genie は水晶玉のように機能し、予測モデルを使用して次に何が起こるかを予測します。ランダムなフレームと可能なアクションを調べて、次の画像について知識に基づいた推測を行います。これは映画の編集方法と似ており、各ショットが次のショットにつながり、流れ、サスペンス、興奮のあるストーリーが作成されます。ジーニーの予言が展開するにつれ、最初は静止画だったものが、感動的でエキサイティングなシーンに変わります。

ジーニーの芸術的可能性

ジーニーの芸術的スキルは優れており、子供の落書きを生き生きとした世界に変えるようなものです。紙に書かれた数行が、探索すべきもの、克服すべき課題、そして興味深いキャラクターたちによるエキサイティングな冒険に変わるところを想像してみてください。

ストーリーテラー向けに、Genie はいくつかのオプションを提供します。たとえば、1 つの画像プロンプトで、プレイヤーがストーリーを発見し、謎を解くことができるゲーム世界全体を作成できます。それはむしろ、語り手の想像どおりに展開する準備ができている視覚的な物語に似ています。

さらに、Genie はゲームだけではありません。これはアーティストやストーリーテラーにとって多用途のツールであり、シンプルなアイデアを過去と現在をつなぐインタラクティブな体験に変えることができます。

Genie の革新的なアプリケーション

Genie の魅力的な能力は、新しい時代のアプリケーションにつながる可能性があります。いくつかのアプリケーション ドメインは次のとおりです。

Genie は、基本的なアイデアを詳細な 2D ゲームに変えることで、無限の創造性を生み出す魔法のようなインスピレーションです。子どもたちの絵や書かれたプロンプトは、エキサイティングな冒険や想像力豊かな異国の場所の舞台を設定し、クリエイターに広大な想像力の世界を探索するよう促します。

ゲームを超えて、Genie の中核となる能力は基礎的な世界モデリングにあり、そこには革命を起こす可能性のある秘密が隠されています。 機械学習。ピクセル化された道路に沿って自動運転車を誘導したり、医療シミュレーションで意欲的な医師を訓練したりするのに役立つ動的なシーンを予測することを想像するかもしれません。

Genie の魔法はゲームだけではありません。学習や芸術にも役立ちます。タイムラインがさまざまな時間にインタラクティブな旅行になるため、歴史の授業はエキサイティングな冒険になる可能性があります。アート ギャラリーでは、ジーニーのピクセル化された作品が通常の絵画の横に展示され、創造性のアイデアが混ざり合うことがあります。

課題と今後の方向性

Genie は優れた機能に加えて、いくつかの課題にも直面しています。すべての見栄えを良くし、一貫性を保つことは、落書きを傑作に変えるジャグリングのようなものですが、適切なバランスを見つけるのは難しいものです。したがって、ジーニーは、遊び心のあるカオスと慎重な計画をどのように組み合わせるかを決定する必要があります。

同様に、プレイヤーがプレイするのに最適なゲームを作成することは困難です。簡単すぎると面白くないかもしれません。難しすぎると、プレイヤーは諦めてしまうかもしれません。したがって、ジーニーはゲームデザイナーのように、キャラクターがどのくらい高くジャンプするか、どこに敵が出現するか、どこにパワーアップが表示されるかを調整する必要があります。

ジーニーの魔法が広まるにつれ、いくつかの疑問も生じます。たとえば、Genie が作成したゲームの功績は誰にあるのでしょうか?それは最初のアイデアの提供者でしょうか、それに命を吹き込む魔法のモデルでしょうか、それとも仮想世界に没頭するプレイヤーでしょうか? Genie は、ゲームとそのアイデアの所有者が誰であるかに対処しながら、これらの質問に賢明に対処する必要があります。

ボトムライン

結論として、 精霊, Google DeepMind の革新的な作品は、その変革力で従来の AI モデルを超越しています。強化されたゲーム体験から機械学習の革命、さまざまな分野での創造性の促進まで、Genie は多用途の勢力として台頭してきました。

課題に直面しながらも、予測ダイナミクスと芸術的可能性への独自のアプローチは、想像力とテクノロジーがシームレスに融合する未来への道を切り開き、インタラクティブな探索と創造性のためのエキサイティングな道を開きます。

アサド・アッバス博士 終身准教授 パキスタンのイスラマバードCOMSATS大学で博士号を取得。 米国ノースダコタ州立大学出身。 彼の研究は、クラウド、フォグ、エッジ コンピューティング、ビッグ データ分析、AI などの高度なテクノロジーに焦点を当てています。 アッバス博士は、評判の高い科学雑誌や会議に出版物を発表し、多大な貢献をしてきました。