Connect with us

Ернест Пятровіч, Продукт Менеджер у ARTA – Інтерв’ю Серія

Інтерв’ю

Ернест Пятровіч, Продукт Менеджер у ARTA – Інтерв’ю Серія

mm

Ернест Пятровіч є Продукт Менеджером у AIBY Group, очолюючи один з топ- застосунків компанії, ARTA – Генератор зображень AI для iPhone та Android. Його стратегічне бачення та творче мислення призвели до того, що застосунок досяг 2-го місця у чартах US App Store невдовзі після його випуску, перетнув межу у 15 мільйонів завантажень по всьому світу та пропонує найкращі аватари AI, засновані на унікальному внутрішньому конвеєрі, серед інших успіхів.

Ви були відповідальними за керування ARTA – Генератором мистецтва AI з фази ідеї до сьогодні. Чи можете поділитися деякими висновками про ці перші дні?

Звичайно! Ті були динамічні часи. Ми змогли випустити добре зроблений застосунок лише за тиждень, ставши одним з перших споживчих застосунків, які пропонували функціональність генерації зображень з тексту на мобільних пристроях. Наша мета була побудувати масовий продукт, який би надав людям «художника» в кишені. Отже, починаючи з концептуалізації та ранніх стадій розробки, ми зосередилися на зручності та масштабованості. Але попри те, що ми вступили на ринок дуже вчасно, було досить складно збільшити обсяги встановлення до адекватного рівня, навіть з нашою блискучою командою медійних покупок. Значний імпульс стався через три місяці після випуску застосунку, коли наша функція аватарів стала популярною. Об’єм швидко став помірно високим для нашої ніші, і з того часу нашою задачею було підтримувати та збільшувати його.

Яка була原始на технологічна база, на якій ви запустили застосунок, і які були деякі з проблем з генерацією мистецтва під час цього періоду?

Ми запустили застосунок на основі Stable Diffusion 1.3, використовуючи офіційний API від Stability.ai. Я повинен сказати, що ситуація з якістю генерацій на той час і зараз є як день і ніч. Коли ми вперше почали, наші менеджери з якості часто повідомляли про проблеми, пов’язані з естетичною цінністю зображень або неточностями у відображенні конкретних концепцій та функцій. Однак це було стандартом для Stable Diffusion на той час. Тепер генерація виводу значно краща у всіх аспектах, включаючи стилістичну репродукцію, композиційну узгодженість, візуальну вірогідність, рівень деталізації та інше.

Невдовзі після випуску застосунку ми почали орендувати сервери на Amazon, і підтримка їх виявилася досить складною. Навіть з достатнім фінансуванням може не бути вільного A100, коли вам це потрібно, і вам доведеться чекати кілька днів. Отже, нам довелося обходитися без автомасштабування, перенаправляючи весь надмірний трафік на API наших партнерів.

Підтримання всього цього залишається досить складним і до сьогодні, з малими проблемами, які виникають кожний місяць або близько того. Наприклад, ми періодично зустрічаємо тимчасові проблеми з якістю генерацій, коли постачальник оновлює сервер, тестиє ваги або впроваджує інші зміни, які впливають на генерацію виводу. Такі помилки можуть тривати від години до півдня і є непередбачуваними та складними для відстеження. Зазвичай, до того часу, як наш відділ підтримки отримує звіт про розмиті зображення або іншу проблему, постачальник API вже виправив проблему. Однак це є серйозною проблемою для наших користувачів. Отже, ми зараз будуємо систему, яка поєднує кілька постачальників та наші власні сервери для спеціальних генерацій, що дозволяє нам мати більше контролю над нашою стороною справ.

Як Продукт Менеджер, які стратегічні рішення були вирішальними для керівництва ARTA до його топ-рейтингової позиції невдовзі після випуску?

Ранні успіхи ARTA (на той час називається Aiby) були результатом своєчасного рішення про впровадження вірусної функції аватарів, коли вона тільки почала набирати популярність у соціальних мережах. Ми швидко визнали зростаючий інтерес до цієї функціональності. Наша整个 команда, включаючи продукт, маркетинг та розвиток, була на одному хвилі та мала спільне бачення її успіху. Ми також визнали, що короткий час до ринку був критично важливим. Отже, з першого дня ми присвятили всі наші ресурси реалізації цієї функції, надавши їй пріоритет над іншими завданнями.

Оскільки наш термін був «якнайшвидше», щоб не пропустити момент, коли аватари AI досягнуть піку популярності, ми вирішили використовувати рішення третього боку та адаптувати його для нашого застосунку. Хоча аватари тільки почали набирати популярність на мобільних пристроях, технологія вже була доступна на веб-сторінках протягом певного часу, навіть з API. Дякуючи зосередженим зусиллям команди, наш перший робочий варіант був у App Store вже за п’ять днів, пропонуючи дуже конкурентоспроможний аватарний вивід. Це допомогло нам досягнути 2-го місця у американських топ-чартах та залишитися другим найбільш завантажуваним застосунком у США протягом тижня.

Ваша команда нещодавно випустила оновлення функції генерації аватарів ARTA. Чи можете поділитися деякими деталями щодо цього?

Моделі AI схильні додавати загальні риси обличчя під час навчання, роблячи аватари відмінними від оригінальних фотографій, і чим більш унікальні риси людини, тим більш відмінним може бути інтерпретація AI. Щоб вирішити цю проблему, ми вирішили створити власну службу аватарів. Ми використовували API третього боку протягом тривалого часу, але не досягли значних поліпшень. З переходом на сервер ми змогли встановити більш оптимальну технологію навчання, щоб краще зберегти схожість справжнього обличчя користувача у виводі аватара. Хоча я не можу розкрити наш унікальний конвеєр у деталях, це стало можливим завдяки певній комбінації налаштувань SDXL, LORAs та покращувачів обличчя, і ми ще не бачили кращих результатів деінде.

З новим сервером ми перейшли від фіксованої плати за кожний пакет аватарів до щомісячної плати за сервер і тепер можемо пропонувати аватари через щотижневу підписку замість окремих покупок у застосунку. Це створює більш задовільний досвід і значно дешевше для наших користувачів, якщо вони хочуть генерувати, наприклад, п’ять пакетів аватарів протягом тижня або змінити фотографічний вхід під час виконання. Враховуючи все вище, наша пропозиція аватарів зараз має найкраще співвідношення ціни та продуктивності на ринку. Хоча є застосунки, які можуть створювати високоякісні реалістичні аватари, ARTA виділяється тим, що пропонує різноманітний ряд яскравих та кольорових варіантів виводу, окрім реалістичних стилів, усі з тим же точним рівнем розпізнавання обличчя.

Якими іншими способами команда покращила можливості застосунку?

Ми дійшли висновку, що використання API третього боку є більш ефективним для загальних випадків використання, таких як генерація зображень з тексту, перетворення зображень та інпейнтінг. Цей підхід усуває необхідність витрачати час на визначення того, як інтегрувати ці функції у нашу серверну інфраструктуру. Крім того, це зменшує витрати у ситуаціях, коли нова функція не виходить так, як очікувалося, і ми вирішуємо її видалити. Промисловість генерації зображень AI розвивається швидко, з багатьма спеціалізованими послугами, доступними на ринку, тому ми досліджуємо та поступово впроваджουμε ті, які відповідають нашим цілям.

Одночасно з цим, потреби ARTA часто виявляються досить унікальними, що вимагає внутрішніх відкриттів. У випадках, коли спеціалізовані API відсутні або не забезпечують задовільної якості виводу, ми спеціалізуємося та адаптуємо наші внутрішні служби та розробляємо власні рішення, щоб досягнути бажаних результатів. Наприклад, окрім покращення аватарів AI, наші інженери з машинного навчання та промптерів розробили новий конвеєр для функції AI Фільтрів (Селфі) застосунку. Ми також розробили унікальний алгоритм для нашої майбутньої функції AI Дитина – функції генерації, яка дозволяє двом людям об’єднати свої фотографії та побачити, яким міг би бути їхній потенційний дитина. На основі мого сприйняття світу як Продукт Менеджера, я спочатку сумнівався у його успіху, але рекламні твори, що містять цю концепцію, дуже популярні. Отже, перевірка маркетингових ідей особливо корисна у випадках, пов’язаних з контентом.

Чи можуть користувачі впливати на художній процес у ARTA? Якщо так, то які інструменти та варіанти доступні користувачам для налаштування генерованих AI-мистецтва?

Ми обробляємо всі складні аспекти, пов’язані з генерацією, спрямовані на надання нашим користувачам простого художнього досвіду без зайвого технічного навантаження. Отже, основним способом, яким користувачі впливають на вивід, є промптери. Ми зберігаємо цей процес прозорим, показуючи точну слово-запит, який буде надіслано моделі для генерації, і пропонуємо допомогу у складанні ефективних промптерів, якщо це потрібно.

Ми вибираємо найкращі значення за замовчуванням для кожної інтегрованої моделі, так що користувачам не потрібно турбуватися про це. Зазвичай, немає потреби регулювати їх, щоб максимізувати результати, оскільки вони вже забезпечують оптимальний вивід генерації. Однак, якщо користувач хоче експериментувати, режим для досвідчених користувачів знаходиться за одним кліком, а деякі глибші параметри знаходяться у розділі налаштувань.

Невдовзі ми додамо параметр Насіння, який дозволить користувачам мати повний контроль над генерацією, коли їм потрібно відтворити ідентичне зображення з нуля. Крім того, ми плануємо розширити список пропорцій. Ми також думаємо про додавання декількох контрольних мереж до регулярних генерацій. Вони вже підтримуються на серверній стороні, оскільки ми використовуємо їх для генерації AI Фільтрів та ескізів, але вони ще не доступні кінцевим користувачам.

Як ви сприймаєте вплив AI, подібного до ARTA, на традиційний ринок мистецтва? Чи бачите ви генерацію AI-мистецтва як порушення або покращення індустрії мистецтва?

Я бачу це як покращення. Генеративний AI ввів нові та цінні можливості для покращення художнього процесу, суттєво зменшуючи час виконання. Він допомагає цифровим художникам, дизайнерам, ілюстраторам та іншим творцям візуального контенту з різними завданнями, від дослідження ідей та розробки концепцій до генерації ескізів та готових зображень. В кінцевому підсумку, наша здатність використовувати його досягнення обмежена лише нашою уявою.

Наприклад, у мене є хобі – створення ігор для ПК, і нещодавно я використав ARTA, щоб генерувати набір іконок для навичок та предметів. Я міг би самостійно розробити їх, використовуючи Adobe Illustrator, але з генератором зображень я отримав те, що мені потрібно, майже одразу. Моя дружина, у свою чергу, є ретушером-фотографом. Дякуючи Генеративному заповненню у Photoshop, вона працює значно швидше та має більше вільного часу (або більшого доходу, якщо вона вирішить приймати більше замовлень на ретуш).

Хоча зображення, згенеровані AI, можуть бути незрівнянними з професійним мистецтвом, я вважаю, що AI ніколи не зможе замінити справжнього професіонала. Навіть якщо нейронні мережі стануть ще більш досконалими, вони все одно будуть навчені на даних, створених людьми, що означає, що все, що вони генерують, вже існує десь. Як і раніше,真正ні інноваційні ідеї можуть бути створені тільки людьми. Хоча традиційне значення мистецтва залишається пов’язаним з людьми, створеними шедеврами, AI-мистецтво є очікуваним спін-офом, який запрошує всіх, незалежно від художнього досвіду, спробувати новий та цікавий досвід.

Погляньте за межі покращення якості зображень, куди ви бачите майбутнє генерації зображень AI?

Разом із якістю зображень, швидкість генерацій також збільшиться, автоматично ведучи до більш ефективних виводів.

Я думаю, що не мине багато часу, поки не з’явиться простий спосіб генерації тих самих персонажів у різних середовищах та позиціях, так що ми побачимо підйом AI у коміксах, дитячих книгах, графіці та інше. Інтер’єрний дизайн та виробництво рекламних творів вже є сферами, які активно використовують генеративний AI, але попереду нас ще багато чого. Ці технології будуть розвиватися разом з AI протягом довгого часу. Ми тільки на початку нашої подорожі. Можливо, новий Apple нашого часу буде Nvidia, з усіма, або хоча б тими, хто в індустрії IT, очікуючи нових випусків відеокарт, як ми всі це робили з iPhone.

Генератори зображень AI продовжуватимуть надавати розважливі та привабливі досвіди, чи то вводячи нові концепції, що виникають з поп-культури, чи оживляючи старі ідеї з покращеною технологією. Наприклад, інтерес до генерації AI-Дитини зараз зростає. Одна з недавніх технологій, заснованих на Stable Diffusion, продемонструвала вражаючі результати з об’єднання рис двох осіб для відкриття потенційного вигляду їхньої дитини. Результати значно перевершують те, що було доступно на сайтах гороскопів кілька років тому, і люди бажають спробувати це ще раз.

Які ваші передбачення щодо того, чого ми повинні очікувати далі від Генеративного AI?

Хвильа популярності відеогенерації вже на горизонті. З досягненням технологічних досягнень достатнього рівня, безсумнівно, будуть спроби тренувати нейронні мережі, використовуючи вирази обличчя та жести людей, для створення відео-аватарів, потенційно навіть з унікальними голосами користувачів.

AI Аудіо є ще одним значним проривом, який започатковує нову еру для індустрії музичної продукції. Ця технологія вже представила чудові можливості для створення пісень на основі текстових вхідних даних, роблячи її чудовим інструментом для створення не-стокових саундтреків для різних типів відеоконтенту. Загалом, це дуже весело слухати щось таке буденне, як Умови використання, рэп чи спів з романтичною інтонацією.

Дякую за чудове інтерв’ю, читачам, які бажають дізнатися більше або згенерувати деякі зображення, слід відвідати ARTA.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.