부본 게임 개발자는 새로운 창의적 기회를 위해 음성 AI를 찾습니다 - Unite.AI
Rescale 미팅 예약

인공 지능

게임 개발자는 새로운 창의적 기회를 위해 음성 AI를 찾습니다.

mm
업데이트 on

사운드 합성 기술, 특히 음성 합성은 최근 몇 년 동안 훨씬 더 정교해졌습니다. 텍스트 음성 변환 기술은 수십 년 동안 사용되어 왔지만 이 기술은 훨씬 더 자연스러운 소리가 되었습니다. 최신 알고리즘은 몇 시간의 오디오만 있으면 매우 사실적인 오디오 샘플을 합성할 수 있습니다. 기술이 발전함에 따라 창의적인 미디어의 가능성을 포함하여 더 많은 응용 프로그램이 열립니다. 최근에,  VentureBeat에서 보고한 바와 같이, 비디오 게임 회사는 AI 음성 생성을 사용하여 비디오 게임용 대화를 생성하는 방법을 조사하기 시작했습니다.

한 회사, 리바이어던 게임, 현재 개발 중인 게임 내에서 음성 AI를 구현하기 시작했습니다. Leviathan Games의 소유자인 Wyeth Ridgway는 음성 AI가 게임 디자인을 극적으로 바꿀 수 있다고 설명했습니다. Ridgway는 게임 디자인에서 음성 AI를 사용하는 것이 새로운 추세라고 설명하고 이를 3D 애니메이션 소프트웨어가 지난 XNUMX년 동안 애니메이션과 모델링을 용이하게 하기 위한 독점 소프트웨어를 만드는 Pixar와 같은 회사에서 어떻게 변화했는지와 비교했습니다.

음성을 생성하는 전통적인 방법은 사전 녹음된 사운드 파일을 즉석에서 함께 추가하고 이전에 존재하는 단어와 구에서 문장을 함께 연결하는 방식으로 작동합니다. 이 음성 생성 방법에는 수백 시간 분량의 대화를 녹음하고 사운드 클립에 수동으로 레이블을 지정해야 합니다. 또한 어조와 강조가 단어 간에 이동하는 경향이 있기 때문에 다소 부자연스럽게 들립니다. 이에 비해 최첨단 음성 AI는 훨씬 더 자연스럽게 들리고 다른 방식으로 작동합니다.

음성 AI는 심층 신경망을 기반으로 합니다. WaveNet 설득력 있고 자연스러운 오디오 샘플을 생성할 수 있는 최초의 AI 중 하나였습니다. 사운드 샘플이 처음부터 생성되기 때문에 충분한 교육 데이터를 사용할 수 있는 한 수백 시간의 대화를 미리 녹음할 필요가 없습니다. 최적화된 GAN 및 LSTM 모델은 레이블이 지정된 오디오에서 단 몇 시간 동안 훈련된 후에 오디오를 생성할 수 있습니다. 결과는 Google의 Duplex 실험과 같이 매우 설득력이 있을 수 있습니다. 약속을 잡기 위해 미용실에 전화를 걸었다.

이러한 기술이 더욱 강력해지고 표준화되며 클라우드 컴퓨팅을 통해 쉽게 액세스할 수 있게 됨에 따라 더 많은 게임 개발자가 제작 시간과 비용을 줄이기 위해 음성 AI로 전환할 가능성이 높습니다. 일부 회사는 이미 게임 개발자가 잠재적으로 사용할 수 있는 모델을 만들고 있습니다. 레플리카 스튜디오 AI 음성 기술에 특화되어 있으며, 그들의 기술로 생성된 일부 오디오 샘플은 링크에서 들을 수 있습니다. 여기에서 지금 확인해 보세요.여기에서 지금 확인해 보세요..

게임 개발자가 AI보다 성우 사용을 포기할 가능성은 낮습니다. 사실 음성 AI는 성우들에게 더 많은 기회를 열어줄 수 있다. 현재 많은 게임 개발 회사는 음성 대화 생성과 관련된 시간 투자 및 비용 때문에 음성 대화를 건너뛰는 경우가 많습니다. 대본에 변경 사항이 있거나 게임 감독이 다른 종류의 공연을 원하는 경우 더 많은 녹음 세션을 위해 성우를 다시 데려와야 하는 경우가 많습니다. 음성 AI는 대본을 녹음하기 위해 전문 성우를 부르기 전에 어떤 종류의 대본 변경 및 수정이 필요한지 감을 잡고 대화를 실험/시제품화하는 데 사용할 수 있습니다. 이로 인해 더 많은 회사가 음성 대화 생성에 투자할 자원을 갖게 될 수 있습니다.

AI 음성 모델은 특정 성우의 음성에 대해 훈련될 수도 있으며, 배우가 음성 사용에 대해 비용을 지불하는 한 AI는 사소한 대화 클립을 생성하는 데 사용됩니다. VentureBeat에서 보고한 바와 같이, Simon J. Smith와 같은 성우들은 음성 AI 모델의 사용 증가와 새로운 음성 연기 기회를 열 수 있는 잠재력에 대해 낙관하고 있습니다.

음성 AI를 사용하여 스크립트의 프로토타입을 만들거나 작은 캐릭터를 위한 음성 대사를 만드는 것 외에도 게임 개발자는 음성 AI를 사용하여 플레이어에게 롤 플레잉 비디오 게임을 위한 더 많은 사용자 지정 옵션을 제공할 수 있습니다. 현재 플레이어가 아바타의 목소리를 선택할 수 있는 게임도 일반적으로 몇 가지 옵션만 있습니다. 음성 AI를 사용하면 옵션이 기능적으로 무한할 수 있습니다.