Connect with us

Эрнест Пятрович, менеджер продукта в ARTA – Серия интервью

Интервью

Эрнест Пятрович, менеджер продукта в ARTA – Серия интервью

mm

Эрнест Пятрович – менеджер продукта в AIBY Group, возглавляющий один из флагманских приложений компании, ARTA – генератор изображений на основе ИИ для iPhone и Android. Его стратегическое видение и творческое мышление привели к тому, что приложение заняло 2-е место в чартах App Store США вскоре после выпуска, превысив отметку в 15 миллионов загрузок по всему миру, и предлагая лучшие аватары на основе ИИ, созданные с помощью уникальной внутренней трубы, среди других успехов.

Вы были ответственны за управление ARTA – генератором искусства на основе ИИ с момента его создания до настоящего времени. Не могли бы вы поделиться некоторыми идеями о ранних днях?

Конечно! Это были динамические времена. Мы смогли выпустить хорошо сделанное приложение всего за неделю, став одним из первых создателей потребительских приложений, предлагающих функцию генерации изображений на основе текста на мобильных устройствах. Наша цель была создать массовый продукт, предоставляющий людям «художника» в кармане. Итак, с момента концептуализации и ранних этапов разработки мы сосредоточились на удобстве использования и масштабируемости. Но, несмотря на своевременное вход на рынок, было довольно сложно увеличить объем наших установок до достаточного уровня, даже с нашей блестящей командой медиа-покупок. Значительный толчок произошел через три месяца после выпуска приложения, когда наш аватарный функционал стал популярным. Объем быстро стал умеренно высоким для нашей ниши, и с тех пор нашей задачей было поддерживать и увеличивать его.

Какой был исходный стек технологий, на котором вы запустили и какие были некоторые проблемы с генерацией искусства в этот период?

Мы запустились на основе Stable Diffusion 1.3, используя официальный API от Stability.ai. Я должен сказать, что ситуация с качеством генераций тогда и сейчас – как день и ночь. Когда мы впервые начали, наши менеджеры по контролю качества часто сообщали о проблемах, связанных с эстетической ценностью изображений или неточностями в представлении определенных концепций и особенностей. Однако это было стандартом для Stable Diffusion в то время. Сейчас качество генераций намного лучше во всех аспектах, включая стилистическую репродукцию, композиционную связность, визуальную точность, уровень детализации и многое другое.

Вскоре после выпуска приложения мы начали арендовать серверы на Amazon, и поддержка их оказалась довольно сложной. Даже с достаточными средствами может не быть свободного A100, когда вам это нужно, и вам придется ждать пару дней. Таким образом, нам пришлось обходиться без автомасштабирования, перенаправляя весь избыточный трафик на API наших партнеров.

Поддержание всего этого остается довольно сложным и по сей день, с незначительными проблемами, возникающими на одном конце или другом каждый месяц или около того. Например, мы иногда сталкиваемся с временными проблемами с качеством генераций, когда провайдер обновляет сервер, тестирует веса или реализует другие изменения, влияющие на выход генерации. Такие ошибки могут длиться от часа до половины дня и являются непредсказуемыми и трудными для отслеживания. Обычно к тому времени, когда наше отделение поддержки получает отчет пользователя о размытых изображениях или другой возникшей проблеме, провайдер API уже исправил проблему. Однако это серьезная проблема для наших пользователей. Поэтому мы сейчас строим систему, которая объединяет несколько провайдеров и наши собственные серверы для специальных генераций, позволяя нам иметь больше контроля над нашей стороны.

Как менеджер продукта, какие стратегические решения были решающими для руководства ARTA к ее позиции в топ-чартах вскоре после выпуска?

Ранний рост ARTA (в то время называвшегося Aiby) был результатом своевременного решения реализовать вирусную функцию аватара, когда она только начала распространяться в социальных сетях. Мы быстро признали растущий интерес к этой функциональности. Наша вся команда, включая продукт, маркетинг и разработку, была на одной длине волны и видела успех. Мы также признали, что короткое время выхода на рынок было крайне важно. Итак, с первого дня мы посвятили все наши ресурсы реализации этой функции, отдали ей приоритет над другими задачами.

Поскольку наш срок был «как можно скорее», чтобы не пропустить момент, когда аватары на основе ИИ достигнут пика популярности, мы решили использовать решение третьей стороны и адаптировать его для нашего приложения. Хотя аватары начали набирать популярность на мобильных устройствах, технология уже была доступна на веб-страницах в течение некоторого времени, даже с API. Благодаря集中енным усилиям нашей команды, наша первая рабочая версия была в App Store всего за пять дней, предлагая очень конкурентоспособный аватарный выход. Это помогло нам достичь 2-го места в американских топ-чартах и остаться вторым по количеству загрузок в США в течение недели.

Ваша команда недавно выпустила обновление функции генерации аватаров ARTA. Не могли бы вы поделиться некоторыми подробностями об этом?

Модели ИИ склонны добавлять общие черты лица во время обучения, делая аватары выглядящими иначе, чем исходные фотографии, и чем более уникальны черты человека, тем более непохожим может быть интерпретация ИИ. Чтобы решить эту проблему, мы решили создать свою собственную аватарную службу. Мы использовали API третьей стороны в течение долгого времени, но не добились значительных улучшений. С переходом на сервер мы смогли настроить более оптимальную технологию обучения, чтобы лучше сохранять сходство лица пользователя в аватарном выходе. Хотя я не могу раскрыть наш уникальный конвейер в деталях, он стал возможным благодаря конкретной комбинации настроек SDXL, LORAs и усилителей лица, и мы еще не видели лучших результатов где-либо еще.

С новым сервером мы отказались от фиксированной стоимости за каждый аватарный пакет и перешли на ежемесячную плату за сервер, и теперь можем предложить аватары через еженедельную подписку вместо отдельных покупок в приложении. Это создает более удовлетворяющий опыт и намного дешевле для наших пользователей, если они хотят сгенерировать, например, пять аватарных пакетов в течение недели или изменить входную фотографию по мере продвижения. Учитывая все вышесказанное, наше предложение аватаров в настоящее время имеет лучшее соотношение цены и производительности на рынке. Хотя есть приложения, способные создавать высококачественные реалистичные аватары, ARTA выделяется тем, что предлагает разнообразный спектр ярких и цветных вариантов выхода, помимо реалистичных стилей, все с одинаковой точной степенью распознавания лица.

Какими еще способами команда улучшила возможности приложения?

Мы пришли к выводу, что использование API третьих сторон более эффективно для общих случаев, таких как генерация изображений на основе текста, преобразование изображений и инпейтинг. Этот подход исключает необходимость тратить время на выяснение, как интегрировать эти функции в нашу серверную инфраструктуру. Кроме того, это снижает затраты в ситуациях, когда новая функция не оправдывает ожиданий, и мы решаем удалить ее. Индустрия генерации изображений на основе ИИ развивается быстро, и существует много специализированных сервисов, поэтому мы исследуем и постепенно принимаем те, которые соответствуют нашим целям.

В то же время потребности ARTA часто оказываются довольно уникальными, требующими внутренних открытий. В случаях, когда адаптированные API либо не существуют, либо не обеспечивают удовлетворительного качества выхода, мы специализируемся и настраиваем наши внутренние сервисы и разрабатываем свои собственные решения, чтобы достичь желаемых результатов. Например, помимо обновления аватаров на основе ИИ, наши инженеры-исследователи и промптеры разработали новый конвейер для функции «Фильтры ИИ» (Селфи) приложения. Мы также разработали уникальный алгоритм для нашей будущей функции «ИИ-ребенок» – генерирующей функции, которая позволяет двум людям объединить свои фотографии и увидеть, как может выглядеть их ребенок. Основываясь на моем восприятии мира как менеджера продукта, я первоначально сомневался в ее успехе, но рекламные креативы, в которых фигурирует эта концепция, очень популярны. Итак, проверка маркетинговых прозрений особенно полезна в связанных с контентом случаях.

Могут ли пользователи влиять на художественный процесс в ARTA? Если да, то какие инструменты и варианты доступны пользователям для настройки сгенерированного ИИ-искусства?

Мы обрабатываем все сложные аспекты, связанные с генерацией, стремясь предоставить нашим пользователям простой художественный опыт без ненужной технической перегрузки. Итак, основным способом, которым пользователи влияют на выход, является через подсказки. Мы сохраняем этот процесс прозрачным, показывая точный текстовый запрос, который будет отправлен модели для генерации, и предлагая помощь в составлении эффективных подсказок, если это необходимо.

Мы выбираем лучшие значения по умолчанию для каждой интегрированной модели, чтобы пользователи не беспокоились об этом. Обычно нет необходимости регулировать их, чтобы максимизировать результаты, поскольку они уже производят оптимальный выход генерации. Тем не менее, если пользователь хочет экспериментировать, режим для продвинутых пользователей находится всего в одном касании, и некоторые более глубокие параметры находятся в разделе настроек.

Скоро мы добавим параметр «Сид», позволяющий пользователям иметь полный контроль над генерацией, когда им нужно воссоздать идентичное изображение с нуля. Кроме того, мы планируем расширить список соотношений сторон. Мы также думаем о добавлении нескольких контрольных сетей к регулярным генерациям. Они уже поддерживаются на серверной стороне, поскольку мы используем их для генерации фильтров ИИ и эскизов, но они еще не доступны конечным пользователям.

Как вы воспринимаете влияние ИИ, подобного ARTA, на традиционный рынок искусства? Видите ли вы генерацию искусства на основе ИИ как нарушение или улучшение индустрии искусства?

Я вижу это как улучшение. Генеративный ИИ ввел новые и ценные возможности для улучшения художественного процесса, значительно сокращая время выполнения. Он помогает цифровым художникам, дизайнерам, иллюстраторам и другим создателям визуального контента с разнообразными задачами, от изучения идей и разработки концепций до генерации эскизов и готовых изображений. В конечном итоге, наша способность использовать его достижения ограничена только нашим воображением.

Например, у меня есть хобби – создание игр для ПК, и недавно я использовал ARTA, чтобы сгенерировать набор иконок для навыков и предметов. Я мог бы разработать их самостоятельно, используя Adobe Illustrator, но с генератором изображений я получил то, что мне нужно,几乎 сразу. Моя жена, в свою очередь, является ретушером-фотографом. Благодаря функции «Генеративный заполнить» в Photoshop она работает намного быстрее и имеет больше свободного времени (или больше дохода, если она решит принять больше заказов на ретушь).

Когда это сделано хорошо, изображения, сгенерированные ИИ, могут выглядеть неразличимо от профессиональных произведений искусства. Однако, по моему мнению, ИИ никогда не заменит真正щего профессионала. Независимо от того, насколько умелыми становятся нейронные сети, они все равно обучаются на данных, созданных людьми, что означает, что все, что они генерируют, уже существует где-то. Как и раньше, действительно инновационные идеи могут быть произведены только людьми. Хотя традиционное значение искусства остается связанным с произведениями, созданными человеком, искусство на основе ИИ – это как ожидаемый спин-офф, приглашающий всех, независимо от художественного прошлого, попробовать новый увлекательный опыт.

Глядя за пределы простого улучшения качества изображения, куда, по вашему мнению, движется будущее генерации изображений на основе ИИ?

Вместе с качеством изображения скорость генераций увеличится, что автоматически приведет к более эффективным выходам.

Я думаю, что не пройдет много времени, прежде чем будет простой способ сгенерировать одних и тех же персонажей в разных средах и положениях, и мы увидим рост ИИ в комиксах, детских книгах, графике игр и многом другом. Интерьерный дизайн и производство рекламных креативов уже являются сферами, активно использующими генеративный ИИ, но впереди нас ждет еще больше, поскольку технология продолжает развиваться.

Учитывая, что все генерации требуют сильных GPU, эти технологии будут развиваться вместе с ИИ в течение довольно долгого времени. Мы только в начале пути. Может быть, новый Apple нашего времени будет Nvidia, и все, или хотя бы те, кто в индустрии ИТ, будут с нетерпением ждать новых выпусков видеокарт, как мы все это делали с iPhone.

Генераторы изображений на основе ИИ будут продолжать доставлять веселые и увлекательные trải nghiệm, будь то введение новых концепций, возникающих из поп-культуры, или возрождение старых идей с лучшей технологией. Например, интерес к генерации ИИ-детей в настоящее время растет. Одна недавняя технология, основанная на Stable Diffusion, продемонстрировала впечатляющие результаты, объединив черты двух людей, чтобы показать потенциальный вид их биологического ребенка. Результаты намного превосходят то, что было доступно на сайтах гороскопов несколько лет назад, и люди с нетерпением ждут, чтобы попробовать это еще раз.

Что, по вашему мнению, мы должны ожидать дальше от генеративного ИИ?

Волна популярности видеогенерации уже на горизонте. С достижением технологий достаточного уровня, безусловно, будут попытки обучить нейронные сети, используя выражения лица и жесты людей, для создания видео-аватаров, потенциально даже с уникальными голосами пользователей.

ИИ-аудио – это еще один значительный прорыв, открывающий новую эру для индустрии музыкального производства. Эта технология уже представила удивительные возможности для создания песен на основе текстового ввода, что делает ее отличным инструментом для создания индивидуальных не-стоковых саундтреков для различных типов видеоконтента. В целом, это действительно весело слушать что-то такое будничное, как Условия использования, прочитанное или спетое с романтической интонацией.

Спасибо за отличный интервью, читателям, которые хотят узнать больше или сгенерировать некоторые изображения, следует посетить ARTA.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.