Interviuri
Ernest Piatrovich, Manager de Produs la ARTA – Seria de Interviuri

Ernest Piatrovich este Manager de Produs la AIBY Group, conducând una dintre aplicațiile de top ale companiei, bazate pe inteligență artificială, ARTA – Generator de Imagini AI pentru iPhone și Android. Viziunea sa strategică și gândirea creativă au dus la atingerea poziției #2 în topul magazinului de aplicații din SUA, la scurt timp după lansare, depășind pragul de 15 milioane de descărcări la nivel global și oferind avataruri AI cu performanțe de top, bazate pe o conductă internă unică, printre alte succese.
Ați fost responsabil pentru gestionarea ARTA – Generator de Artă AI, de la faza de idee până în prezent. Puteți împărtăși câteva perspective asupra acestor zile de început?
Desigur! Aceleaua fost perioade dinamice. Am reușit să lansăm o aplicație finisată în doar o săptămână, devenind unul dintre primii creatori de aplicații pentru consumatori care oferă funcționalitate de generare de imagini pe baza textului pe dispozitive mobile. Obiectivul nostru a fost să construim un produs de masă care să ofere oamenilor „un artist” în buzunar. Așadar, de la început, ne-am concentrat pe utilizabilitate și scalabilitate. Dar, în ciuda faptului că am intrat pe piață la momentul oportun, a fost destul de dificil să creștem volumul de descărcări la un nivel adecvat, chiar și cu o echipă de cumpărare media excelentă. Un impuls semnificativ a avut loc la trei luni după lansarea aplicației, când funcția noastră Avatar a devenit populară. Volumul a crescut rapid la un nivel moderat pentru nișa noastră, și de atunci, sarcina noastră a fost să menținem și să creștem acest volum.
Care a fost stiva tehnologică originală pe care ați lansat-o și care au fost unele dintre provocările legate de generarea de artă în această perioadă?
Am lansat pe baza Stable Diffusion 1.3, utilizând API-ul oficial de la Stability.ai. Trebuie să spun că situația cu calitatea generărilor de atunci și de acum este ca noapte și zi. Când am început, managerii noștri de asigurare a calității raportau frecvent probleme legate de valoarea estetică a imaginilor sau inexactități în reprezentarea anumitor concepte și caracteristici. Cu toate acestea, aceasta a fost o situație standard pentru Stable Diffusion la acea vreme. Acum, ieșirea generării este mult mai bună în toate aspectele, inclusiv reproducerea stilistică, coerența compoziției, fidelitatea vizuală, nivelul de detaliu și multe altele.
La scurt timp după lansarea aplicației, am început să închiriem servere pe Amazon, și întreținerea lor s-a dovedit a fi destul de dificilă. Chiar și cu fonduri suficiente, nu există întotdeauna un A100 disponibil când aveți nevoie, și veți trebui să așteptați câteva zile. Prin urmare, am fost nevoiți să trăim fără autoscalare, redirecționând tot traficul excesiv către API-urile partenerilor noștri.
Menținerea tuturor acestor aspecte rămâne destul de dificilă și astăzi, cu probleme minore care apar la un capăt sau la altul, în fiecare lună sau așa. De exemplu, întâlnim uneori probleme temporare cu calitatea generărilor atunci când furnizorul actualizează serverul, testează greutățile sau implementează alte modificări care afectează ieșirea generării. Astfel de erori pot dura de la o oră la jumătate de zi și sunt imprevizibile și dificil de urmărit. De obicei, până când departamentul nostru de suport primește un raport de la utilizator despre imagini blurate sau despre o problemă care apare, furnizorul API a remediat deja problema. Cu toate acestea, este o preocupare serioasă pentru utilizatorii noștri. Prin urmare, suntem în prezent în proces de construire a unui sistem care combină mai mulți furnizori și serverele noastre pentru generări speciale, ceea ce ne permite să avem mai mult control asupra aspectelor noastre.
Ca manager de produs, ce decizii strategice au fost decisive în ghidarea ARTA către poziția sa de top, la scurt timp după lansare?
Ascensiunea timpurie a ARTA (denumită atunci Aiby) a rezultat din decizia oportună de a implementa funcția virală Avatar, când aceasta a început să facă valuri pe rețelele sociale. Am recunoscut rapid interesul crescând pentru această funcționalitate. Întreaga noastră echipă, inclusiv produs, marketing și dezvoltare, a fost pe aceeași lungime de undă și vizionară cu privire la succesul său. Am recunoscut, de asemenea, că timpul de lansare a fost crucial. Prin urmare, de la început, am dedicat toate resursele noastre pentru a face această funcție, prioritară față de alte sarcini.
Deoarece termenul nostru limită era „cât mai curând posibil”, pentru a nu rata momentul în care avatarurile AI ajung la apogeul popularității, am optat pentru utilizarea unei soluții terțe și personalizarea acesteia pentru aplicația noastră. În timp ce avatarurile începeau să câștige teren pe dispozitive mobile, tehnologia era deja disponibilă pe web de ceva timp, chiar și cu un API. Mulțumită eforturilor concentrate ale echipei noastre, prima noastră versiune funcțională a fost în App Store în doar cinci zile, oferind o ieșire de avatar foarte competitivă. Acest lucru ne-a ajutat să atingem poziția #2 în topul din SUA și să rămânem a doua aplicație cea mai descărcată în SUA timp de o săptămână.
Echipa dvs. a lansat recent o actualizare a funcției de generare a avatarului AI din ARTA. Puteți împărtăși câteva detalii despre aceasta?
Modelele de inteligență artificială au tendința de a adăuga caracteristici faciale generice în timpul antrenamentului, făcând ca avatarurile să arate diferit de fotografiile sursă, și cu cât trăsăturile cuiva sunt mai unice, cu atât mai puțin asemănătoare interpretarea AI poate apărea. Pentru a aborda această problemă, am decis să creăm propriul nostru serviciu de avatar. Am folosit o API terță parte timp de multă vreme, dar nu am obținut îmbunătățiri semnificative. Cu schimbarea serverului, am putut configura o tehnologie de antrenament mai optimă pentru a păstra asemănarea feței reale a utilizatorului în ieșirea avatarului. Deși nu pot dezvălui pipeline-ul nostru unic în detaliu, acesta a devenit posibil datorită unei combinații specifice de setări SDXL, LORAs și îmbunătățitori de față, și încă nu am văzut rezultate mai bune în altă parte.
Cu noul server, ne-am îndepărtat de la un cost fix pentru fiecare pachet de avatar la o taxă lunară de server și putem oferi acum avataruri prin abonament săptămânal, în loc de a cere achiziții în aplicație separate. Acest lucru creează o experiență mult mai plăcută și este mult mai ieftin pentru utilizatorii noștri, dacă doresc să genereze, de exemplu, cinci pachete de avatar într-o săptămână sau să schimbe imaginea de intrare pe parcurs. Luând în considerare toate acestea, oferta noastră de avatar se bucură în prezent de cel mai bun raport preț-performanță de pe piață. În timp ce există aplicații capabile să creeze avataruri realiste de înaltă calitate, ARTA se remarcă prin oferirea unei game diverse de variații de ieșire strălucitoare și colorate, pe lângă stilurile realiste, toate cu același nivel precis de recunoaștere facială.
În ce alte moduri a îmbunătățit echipa capacitățile aplicației?
Am concluzionat că utilizarea API-urilor terțe este mai eficientă pentru cazurile de utilizare comune, cum ar fi generarea de imagini pe baza textului, conversia de imagini și umplerea golurilor. Acest abordaj elimină nevoia de a cheltui timp pentru a descoperi cum să integreze aceste funcționalități în infrastructura noastră de server. Mai mult, reduce costurile în situațiile în care o funcție nouă nu decoltează așa cum se aștepta și decidem să o eliminăm. Industria generării de imagini cu inteligență artificială evoluează rapid, cu numeroase servicii dedicate disponibile, așa că explorăm și adoptăm gradual acestea care se aliniază cu obiectivele noastre.
În același timp, nevoile ARTA sunt adesea destul de unice, necesitând descoperiri interne. În cazurile în care API-urile personalizate fie nu există, fie nu oferă o calitate a ieșirii satisfăcătoare, ne specializăm și personalizăm serviciile noastre interne și dezvoltăm soluții proprii pentru a obține rezultatele pe care le dorim. De exemplu, pe lângă îmbunătățirea avatarurilor AI, inginerii noștri de învățare automată și de promt au venit cu o nouă conductă pentru funcția Filtre AI (Selfies) a aplicației. De asemenea, am dezvoltat un algoritm unic pentru funcția noastră viitoare AI Baby – o funcționalitate de generare care permite a doua persoane să-și combine fotografiile și să vadă cum ar putea arăta copilul lor. Pe baza percepției mele asupra lumii ca manager de produs, am îndoiat inițial succesul acestuia, dar reclamele care prezintă acest concept sunt foarte populare. Prin urmare, verificarea insight-urilor de marketing este deosebit de utilă în cazurile legate de conținut.
Utilizatorii pot influența procesul artistic în ARTA? Dacă da, care sunt uneltele și opțiunile disponibile pentru utilizatori pentru a personaliza opera de artă generată de inteligență artificială?
Ne ocupăm de toate aspectele complexe legate de generare, urmărind să oferim utilizatorilor noștri o experiență artistică simplă, fără o suprasarcină tehnică inutilă. Prin urmare, principala modalitate prin care utilizatorii influențează ieșirea este prin promturi. Păstrăm acest proces transparent, afișând exact cererea de cuvinte care va fi trimisă modelului pentru generare și oferind asistență pentru compunerea de promturi eficiente, dacă este necesar.
Selectăm cele mai bune setări implicite pentru fiecare model integrat, astfel încât utilizatorii să nu se preocupe de asta. De obicei, nu există nevoie să ajustați acestea pentru a maximiza rezultatele, deoarece ele produc deja o ieșire de generare optimă. Cu toate acestea, dacă utilizatorul dorește să experimenteze, modul avansat este la doar un tap distanță, iar unele parametri mai profunzi se află în secțiunea de setări.
Curând, vom adăuga un parametru Seed, care va permite utilizatorilor să aibă control complet asupra generării atunci când trebuie să recrieze o imagine identică de la zero. De asemenea, planificăm să extindem lista de rapoarte de aspect. Suntem, de asemenea, în proces de adăugare a controlnet-urilor pentru generările regulate. Acestea sunt deja suportate pe partea serverului, deoarece le utilizăm pentru a genera filtre AI și schițe, dar încă nu le-am livrat utilizatorilor finali.
Cum percepeți impactul inteligenței artificiale, cum ar fi ARTA, asupra pieței de artă tradiționale? Ați vedea generarea de artă cu inteligență artificială ca o perturbare sau o îmbunătățire a industriei de artă?
O văd ca o îmbunătățire. Inteligența artificială generativă a introdus oportunități noi și valoroase pentru a îmbunătăți procesul artistic, reducând în mod semnificativ timpul de întoarcere. Aceasta asistă artiștii digitali, designerii, ilustratorii și alți creatori de conținut vizual cu o varietate de sarcini, de la explorarea ideilor și dezvoltarea conceptelor la generarea de schițe și imagini gata de utilizat. În cele din urmă, capacitatea noastră de a valorifica progresele sale este limitată doar de imaginația noastră.
De exemplu, am un hobby de a crea jocuri pentru PC, și recent am utilizat ARTA pentru a genera un set de icone pentru abilități și articole. Aș fi putut proiecta acestea singur, utilizând Adobe Illustrator, dar cu un generator de imagini, am obținut ceea ce aveam nevoie aproape imediat. Soția mea, la rândul ei, este retușator-fotograf. Mulțumită funcției Generative Fill din Photoshop, lucrează mult mai rapid și are mai mult timp liber (sau mai mult venit, dacă decide să accepte mai multe comenzi de retușare).
Când este făcută bine, imaginile generate de inteligență artificială pot arăta indistinct de arta profesională. Cu toate acestea, în opinia mea, inteligența artificială nu va înlocui niciodată un profesionist adevărat. Indiferent cât de abile devin rețelele neuronale, acestea sunt încă antrenate pe date create de oameni, ceea ce înseamnă că tot ceea ce generează există deja undeva. Atât atunci, cât și acum, idei cu adevărat inovatoare pot fi produse doar de oameni. În timp ce sensul tradițional al artei rămâne asociat cu piesele create de oameni, arta generată de inteligență artificială este ca o ramură anticipată, care invită pe toată lumea, indiferent de background-ul artistic, să încerce o experiență nouă și interesantă.
Privind dincolo de îmbunătățirea calității imaginilor, unde vedeți viitorul generării de imagini cu inteligență artificială?
Pe lângă calitatea imaginilor, viteza generărilor va crește, conducând automat la ieșiri mai rentabile.
Cred că nu va dura mult până când va exista o modalitate ușoară de a genera aceleași personaje în medii și poziții diferite, astfel încât vom asista la apariția inteligenței artificiale în benzi desenate, cărți pentru copii, grafică de jocuri și multe altele. Designul interior și producția de creații publicitare sunt deja domenii care valorifică activ inteligența artificială generativă, dar mai multe sunt înaintea noastră, pe măsură ce tehnologia continuă să evolueze.
Luând în considerare faptul că toate generările necesită GPU-uri puternice, aceste tehnologii vor continua să se dezvolte odată cu inteligența artificială, pentru o perioadă considerabilă de timp. Suntem doar la începutul călătoriei. Poate că noul Apple al timpului nostru va fi Nvidia, cu toată lumea, sau cel puțin cei din industria IT, așteptând cu nerăbdare noile lansări de plăci video, așa cum am făcut cu iPhone-urile.
Generatoarele de imagini cu inteligență artificială vor continua să ofere experiențe amuzante și captivante, fie prin introducerea de noi concepte care apar în cultura populară, fie prin readucerea la viață a ideilor mai vechi, îmbunătățite cu tehnologia mai bună. De exemplu, interesul pentru generarea de avataruri AI este în creștere în prezent. O tehnologie recentă bazată pe Stable Diffusion a demonstrat ieșiri impresionante prin combinarea caracteristicilor a două persoane pentru a revela aspectul potențial al copilului lor biologic. Rezultatele depășesc cu mult ceea ce era disponibil pe site-urile de horoscop cu câțiva ani în urmă, și oamenii sunt dornici să o încerce din nou.
Ce sunt previziunile dvs. pentru ceea ce ar trebui să așteptăm în continuare de la Inteligența Artificială Generativă?
Valul de popularitate pentru generarea de videoclipuri este pe punctul de a apărea. Odată cu progresele tehnologiei care ajung la un nivel suficient, vor exista, fără îndoială, încercări de a antrena rețele neuronale utilizând expresii faciale și gesturi ale oamenilor pentru a crea avataruri video, posibil chiar și cu voci unice de utilizator.
Inteligența Artificială Audio este o altă descoperire semnificativă care marchează o nouă eră pentru industria de producție muzicală. Această tehnologie a prezentat deja oportunități uimitoare pentru compunerea de cântece pe baza exclusivă a intrărilor de text, făcând-o un instrument excelent pentru crearea de coloane sonore personalizate pentru diverse tipuri de conținut video. În general, este foarte amuzant să asculți ceva atât de banal, cum ar fi Termenii și Condițiile, recitate sau cântate cu intonație romantică.
Vă mulțumim pentru acest interviu minunat. Citiitorii care doresc să afle mai multe sau să genereze imagini ar trebui să viziteze ARTA.












