スタブ ゲーム開発者は新たなクリエイティブの機会を求めて AI の声に注目 - Unite.AI
私達と接続

Artificial Intelligence

ゲーム開発者は新たなクリエイティブの機会を求めて AI の声を求めている

mm
更新中 on

近年、音声合成技術、特に音声合成技術が高度化しています。 テキスト読み上げ技術は何十年も前から存在していますが、その技術はより自然な音声になるようになりました。 最近のアルゴリズムでは、わずか数時間のオーディオを使用して、非常にリアルなオーディオ サンプルを合成できます。 テクノロジーが進歩するにつれて、クリエイティブなメディアの可能性を含め、より多くのアプリケーションが開かれます。 最近、  VentureBeat が報じたとおり、ビデオゲーム会社は、ビデオゲームの対話を生成するためにAI音声生成の使用を調査し始めています。

ある会社、 リヴァイアサン ゲームは、現在開発中のゲーム内に音声AIの実装を開始しました。 Leviathan Games のオーナーである Wyeth Ridgway 氏は、音声 AI はゲームデザインを劇的に変える可能性があると説明しました。 Ridgway 氏は、ゲーム デザインにおける音声 AI の使用が新たなトレンドであると説明し、ピクサーのような企業がアニメーションとモデリングを容易にすることを目的とした独自のソフトウェアを開発するなど、過去 3 年間で XNUMXD アニメーション ソフトウェアがどのように変化したかに例えました。

音声を生成する従来の方法は、事前に録音されたサウンド ファイルをその場で追加し、既存の単語やフレーズから文をつなぎ合わせます。 この音声生成方法では、数百時間相当の会話を録音し、サウンド クリップに手動でラベルを付ける必要があります。 また、抑揚や強調が単語間で移動する傾向があるため、やや不自然に聞こえます。 それに比べて、最先端の音声 AI ははるかに自然に聞こえ、異なる方法で動作します。

音声 AI はディープ ニューラル ネットワークに基づいています。 WaveNet は、説得力のある自然なサウンドのオーディオ サンプルを生成できる最初の AI の XNUMX つでした。 サウンド サンプルは最初から生成されるため、十分なトレーニング データが利用できる限り、何百時間もの対話を事前に録音する必要はありません。 最適化された GAN と LSTM モデルは、わずか数時間のラベル付き音声でトレーニングした後、音声を生成できます。 Google の Duplex 実験など、その結果は非常に説得力のあるものになる可能性があります。 予約をするために美容院に電話しました。

これらのテクノロジーがより強力になり、標準化され、クラウド コンピューティングを通じて簡単にアクセスできるようになるにつれて、より多くのゲーム開発者が制作時間とコストを削減するために音声 AI に注目するようになるでしょう。 一部の企業は、ゲーム開発者が使用できる可能性のあるモデルをすでに作成しています。 レプリカスタジオ AI 音声テクノロジーを専門とし、そのテクノロジーによって生成された音声サンプルの一部をリンクで聞くことができます。 こちら および こちら.

ゲーム開発者が AI ではなく声優の使用を放棄することを選択する可能性は低いです。 実際、音声AIは声優にとってより多くのチャンスを広げる可能性があります。 現在、多くのゲーム開発会社は、音声対話の作成にかかる時間とコストの理由から、音声対話を省略することがよくあります。 脚本に変更があった場合、またはゲームディレクターが別の種類のパフォーマンスを望んでいる場合、声優は再収録セッションのために呼び戻されることがよくあります。 音声 AI を使用して対話の実験やプロトタイプを作成し、プロの声優を呼んで脚本を録音する前に、どのような種類の脚本の変更や修正を行う必要があるかを把握することができます。 これにより、より多くの企業が音声対話の作成に投資するリソースを得ることができるようになる可能性があります。

AI 音声モデルは、特定の声優の声でトレーニングすることもでき、声優に音声の使用料が支払われている限り、AI は簡単な会話クリップを生成するために使用されます。 VentureBeat が報じたとおり、サイモン J. スミスのような声優は、音声 AI モデルの使用が増加し、新しい声優の機会が開かれる可能性について楽観的です。

音声 AI を使用してスクリプトのプロトタイプを作成したり、脇役のセリフを作成したりするだけでなく、ゲーム開発者は音声 AI を使用して、ロールプレイング ビデオ ゲームのより多くのカスタマイズ オプションをプレーヤーに提供することもできます。 現在、プレイヤーがアバターの声を選択できるゲームであっても、通常は選択肢がほんのわずかしかありません。 音声 AI を使用すると、オプションは機能的に無限になる可能性があります。

専門分野を持つブロガーおよびプログラマー 機械学習 および 深層学習 トピック。 ダニエルは、他の人が社会利益のために AI の力を活用できるよう支援したいと考えています。