заглушки Disney объединяет компьютерную графику с нейронным рендерингом, чтобы справиться со «зловещей долиной» — Unite.AI
Свяжитесь с нами:

Artificial Intelligence

Disney объединяет компьютерную графику с нейронным рендерингом, чтобы справиться со «зловещей долиной»

mm
обновленный on

Исследовательское подразделение Disney по искусственному интеллекту разработало гибридный метод симуляции лица кинематографического качества, сочетающий сильные стороны нейронного рендеринга лица с последовательностью подхода, основанного на компьютерной графике.

Находящаяся на рассмотрении статья называется Рендеринг со стилем: сочетание традиционного и нейронного подходов для высококачественного рендеринга лица, и просматривается в новое 10-минутное видео на канале Disney Research на YouTube (встроено в конце этой статьи*).

Меши в сочетании с нейронными рендерами лица. Источник: https://www.youtube.com/watch?v=k-RKSGbWLng

Меши в сочетании с нейронными рендерами лица. См. видео, встроенное в конце статьи, для большей детализации и качества. Источник: https://www.youtube.com/watch?v=k-RKSGbWLng (с момента замены на https://www.youtube.com/watch?v=TwpLqTmvqVk)

Как отмечается в видео, нейронная визуализация лиц (включая дипфейки) может создать гораздо более реалистичный интерьер глаз и рта, чем способен CGI, в то время как текстуры лица, основанные на CGI, более последовательны и подходят для вывода визуальных эффектов кинематографического уровня.

Поэтому Disney экспериментирует, позволяя NVIDIA СтильГан2 Нейронный генератор обрабатывает окружающие черты лица и «жизненно важные» элементы, такие как глаза, в то же время накладывая на результат последовательную компьютерную графику кожи лица и связанные элементы.

Из видео (см. в конце статьи) архитектурная концепция гибридного подхода Диснея, где сетка компьютерной графики старой школы, используемая для воссоздания «молодой» Кэрри Фишер и покойного Питера Кушинга для «Изгоя-один» (2016), интегрированы в нейровизуализированную среду лица.

Из видео (см. в конце статьи) архитектурная концепция гибридного подхода Диснея, где сетка компьютерной графики старой школы, используемая для воссоздания «молодой» Кэрри Фишер и покойного Питера Кушинга для «Изгоя-один» (2016), интегрированы в нейровизуализированную среду лица.

В видео содержится неявная ссылка на частую критику недостоверности и эффекта «зловещей долины» компьютерной графики поздних британцев. Star Wars актер Питер Кушинг в Разбойник Один (2016), допуская:

«[Существует] по-прежнему огромный разрыв между тем, что люди могут легко запечатлеть и визуализировать, и окончательными фотореалистичными цифровыми двойниками с волосами, глазами и внутренним ртом. Чтобы закрыть этот пробел, обычно требуется много ручной работы от квалифицированных художников».

По правде говоря, даже самые современные системы захвата лица даже не пытаются воссоздать глаза, внутреннюю часть рта или волосы, которые либо имеют проблемы с подлинностью в таких методах (глаза), либо с временной согласованностью (волосы).

Видео иллюстрирует, что получат художники VFX после типичного современного сеанса захвата лица. Глаза, волосы, растительность на лице и внутренняя часть рта должны будут обрабатываться отдельными командами в производственном конвейере.

Видео иллюстрирует, что получат художники VFX после типичного современного сеанса захвата лица. Глаза, волосы, растительность на лице и внутренняя часть рта должны будут обрабатываться отдельными командами в производственном конвейере, в дополнение к текстурированию и освещению.

Управление освещением

Гибридный подход также является преимуществом повторного освещения — заметной проблемой для нейронного рендеринга лиц, поскольку наложения кожи CGI легче повторно освещать.

Анимационная версия подхода CGI/Neural.

Анимационная версия подхода CGI/Neural.

В более сложных условиях, таких как внешние съемки, исследователи разработали метод рисования вокруг своего рода демилитаризованной зоны, окружающей «созданного» человека.

Создается черное поле, чтобы обеспечить «холст» для рисования внешних частей личности и интеграции оболочки CGI в комбинированный вывод CGI / нейронных сетей.

Создается черное поле, чтобы обеспечить «холст» для рисования внешних частей личности и интеграции оболочки CGI в комбинированный вывод CGI / нейронных сетей.

В видео отмечается:

«[] Нейронный рендеринг не полностью соответствует фоновому ограничению. - это только руководство, поскольку главной целью является оптимизация для реалистичных человеческих компонентов, таких как волосы, глаза и зубы. Более сложной задачей является попытка сохранить постоянную идентичность при изменении освещения окружающей среды».

Создание CGI-сеток из нейронных визуализаций

Исследовательская группа также разработала вариационный автоэнкодер, обученный на (неуказанной) большой базе данных 3D-изображений лиц, и утверждает, что он может создавать «случайные, но правдоподобные» 3D-сетки лиц на основе достоверных данных.

Существуют ограничения для этого исследования, которые необходимо преодолеть, в том числе сложность в том, чтобы волосы оставались согласованными во времени в нейронной визуализации, а видео (см.

Временная согласованность в нейронном рендеринге видео — гораздо более широкая проблема, чем просто проблема Диснея, и кажется вероятным, что более поздние итерации этой системы могут прибегнуть к добавлению волос «в пост» или к различным другим возможным подходам к генерации волос, чем надеяться на новый нейронный подход. в конце концов решить это.

Использование для генерации набора данных

Этот метод предлагается также как потенциальный метод генерации синтетических данных и обогащения ландшафта набора изображений лица, который в последние годы стал опасно монотонный.

Дисней предполагает новую технику заполнения наборов данных изображений лиц.

Дисней предполагает новую технику заполнения наборов данных изображений лиц.

«[Каждый] фотореалистичный результат, который мы генерируем, имеет в основе соответствующую геометрию и карты внешнего вида, визуализированные с неизвестных точек обзора камеры с известным освещением. Эта «наземная истина» может иметь жизненно важное значение для обучения последующих приложений, таких как монокуляр, трехмерная реконструкция лица, распознавание лиц или понимание сцены. Таким образом, каждый рендеринг результатов можно рассматривать как выборку данных, и мы можем генерировать множество вариаций для многих разных людей.

«Кроме того, даже для одного человека, визуализируемого с одним выражением лица, с одной точкой обзора и освещением, мы можем генерировать случайные вариации фотореалистичного рендеринга, изменяя начальное число рандомизации во время оптимизации».

Исследователи отмечают, что такое разнообразие настраиваемых выходных данных может быть полезно при обучении приложений распознавания лиц, заключая:

«[Наш] метод может использовать современные технологии для захвата, моделирования и рендеринга кожи лица и автоматически создавать полные фотореалистичные рендеры лица, которые соответствуют желаемой личности, выражению и конфигурации сцены. Этот подход имеет приложения и рендеринг лица для фильмов и развлечений, экономя ручной труд художников, а также для генерации данных в различных областях глубокого обучения».

Для более глубокого ознакомления с новым подходом посмотрите 10-минутное видео, выпущенное сегодня:

Рендеринг со стилем, сочетающий традиционный и нейронный подходы для высококачественного рендеринга лица

 * Исходная ссылка на видео была заменена другой, по-видимому, идентичной через 8 часов после публикации этой статьи. Я изменил все соответствующие ссылки, так как от оригинального видео не осталось и следа.

 

8:24 GMT+2 — Заменено видео, так как оно по какой-то причине было заменено каналом Disney Research на YouTube.