Intervjuer
Ernest Piatrovich, produktchef pĂ„ ARTA â Intervjuserie

Ernest Piatrovich Ă€r produktchef pĂ„ AIBY Group, som leder en av företagets toppklassiga AI-drivna appar, KONSTEN â AI Image Generator för iPhone och Android. Hans strategiska vision och kreativa tĂ€nkande resulterade i att appen nĂ„dde #2-positionen i den amerikanska App Store-topplistan kort efter lanseringen, korsade milstolpen med 15 miljoner nedladdningar över hela vĂ€rlden och erbjuder de bĂ€st presterande AI-avatarerna baserade pĂ„ en unik in- huspipeline, bland andra framgĂ„ngar.
Du har varit ansvarig för att hantera ARTA â AI Art-generatorn frĂ„n idĂ©fasen fram till nu. Skulle du kunna dela med dig av nĂ„gra insikter om dessa tidiga dagar?
SjÀlvklart! Det var dynamiska tider. Vi lyckades slÀppa en vÀlgjord applikation inom bara en vecka, och blev en av de första konsumentappskaparna som erbjuder text-till-bild-genereringsfunktioner pÄ mobilen. VÄrt mÄl var att bygga en massmarknadsprodukt som ger mÀnniskor "en artist" i fickan. SÄ sedan konceptualiseringen och tidiga utvecklingsstadier har vi fokuserat pÄ anvÀndbarhet och skalbarhet. Men trots att vi kom in pÄ marknaden mycket lÀgligt var det ganska utmanande att öka vÄra installationsvolymer i tillrÀcklig utstrÀckning, Àven med ett briljant medieköpteam som vÄrt. En betydande ökning intrÀffade tre mÄnader efter appens lansering nÀr vÄr Avatar-funktion blev hypad. Volymen blev snabbt mÄttligt hög för vÄr nisch och sedan dess har vÄr uppgift varit att underhÄlla och öka den.
Vilken var den ursprungliga teknikstacken som du startade pÄ och vilka var nÄgra av utmaningarna med konstgenerering under denna period?
Vi lanserade baserat pÄ Stable Diffusion 1.3 med det officiella API:et frÄn Stability.ai. Jag skulle sÀga att situationen med kvaliteten pÄ generationer dÄ och nu Àr som natt och dag. NÀr vi först började rapporterade vÄra QA-chefer ofta problem relaterade till det estetiska vÀrdet av bilder eller felaktigheter i att representera specifika koncept och funktioner. Det var dock standard för Stable Diffusion pÄ den tiden. Nu Àr produktionen mycket bÀttre i alla aspekter, inklusive stilistisk Ätergivning, kompositionssammanhang, visuell trohet, detaljnivÄ och mer.
Strax efter att appen slĂ€pptes började vi hyra servrar pĂ„ Amazon, och det visade sig vara en stor utmaning att stödja dem. Ăven med tillrĂ€ckliga medel, kanske det inte finns nĂ„gon gratis A100 tillgĂ€nglig nĂ€r du behöver den, och du mĂ„ste vĂ€nta i ett par dagar. DĂ€rmed var vi tvungna att leva utan automatisk skalning och omdirigera all överskottstrafik till vĂ„ra partners API:er.
Att underhÄlla allt detta Àr fortfarande ganska svÄrt Àn idag, med mindre problem som uppstÄr i den ena eller andra Ànden varje mÄnad eller sÄ. Till exempel stöter vi ibland pÄ tillfÀlliga problem med kvaliteten pÄ generationer nÀr leverantören uppdaterar servern, testar vikter eller implementerar andra Àndringar som pÄverkar generationsutdata. SÄdana fel kan pÄgÄ frÄn en timme till en halv dag och Àr oförutsÀgbara och svÄra att spÄra. Vanligtvis, nÀr vÄr supportavdelning fÄr en anvÀndarrapport om suddiga bilder eller nÄgot annat förekommande problem, har API-leverantören redan ÄtgÀrdat problemet. Det Àr dock ett allvarligt bekymmer för vÄra anvÀndare. DÀrför bygger vi nu ett system som kombinerar flera leverantörer och vÄra egna servrar för speciella generationer, vilket gör att vi kan ha mer kontroll pÄ vÄr sida.
Vilka strategiska beslut som produktchef har varit avgörande för att vÀgleda ARTA till sin topplacering kort efter lanseringen?
ARTA:s (pÄ den tiden kallade Aiby) tidiga uppgÄngen var resultatet av det snabba beslutet att implementera den virala Avatar-funktionen nÀr den precis började göra rundor pÄ sociala medier. Vi insÄg snabbt det vÀxande intresset för denna funktionalitet. Hela vÄrt team, inklusive produkt, marknadsföring och utveckling, var pÄ samma vÄglÀngd och visionÀr om dess framgÄng. Vi erkÀnde ocksÄ att en kort tid till marknaden var avgörande. SÄ frÄn dag ett Àgnade vi alla vÄra resurser Ät att realisera den hÀr funktionen och prioriterade den framför andra uppgifter.
Eftersom vÄr deadline var ASAP för att inte missa ögonblicket nÀr AI-avatarer nÄr sin hype-peak, valde vi att anvÀnda en tredjepartslösning och anpassa den för vÄr app. Medan avatarer började fÄ dragkraft pÄ mobilen, hade tekniken redan varit tillgÀnglig pÄ webben ett tag, Àven med ett API. Tack vare teamets koncentrerade anstrÀngningar fanns vÄr första fungerande version i App Store pÄ bara fem dagar, och erbjuder mycket konkurrenskraftiga avatarutdata. Det hjÀlpte oss att nÄ #2-positionen pÄ de amerikanska topplistorna och förbli den nÀst mest nedladdade appen i USA i en vecka.
Ditt team har nyligen slÀppt en uppgradering till ARTAs AI-avatargenereringsfunktion. Kan du dela med dig av nÄgra detaljer om detta?
AI-modellerna tenderar att lĂ€gga till generiska ansiktsdrag under trĂ€ning, vilket gör att avatarer ser annorlunda ut Ă€n kĂ€llbilderna, och ju mer unika ens egenskaper Ă€r, desto mer olik AI-tolkningen kan verka. För att lösa detta problem bestĂ€mde vi oss för att skapa vĂ„r egen avatartjĂ€nst. Vi hade anvĂ€nt ett tredjeparts-API under lĂ„ng tid men gav inga betydande förbĂ€ttringar. Med serverskiftet kunde vi stĂ€lla in mer optimal trĂ€ningsteknik för att bĂ€ttre bibehĂ„lla likheten med anvĂ€ndarens verkliga ansikte i avatarutgĂ„ngen. Ăven om jag inte kan avslöja vĂ„r unika pipeline i detalj, blev det möjligt pĂ„ grund av en specifik kombination av SDXL-instĂ€llningar, LORAs och ansiktsförstĂ€rkare, och vi har Ă€nnu inte sett bĂ€ttre resultat nĂ„gon annanstans.
Med den nya servern gick vi bort frĂ„n en fast kostnad för varje avatarpaket till en mĂ„natlig serveravgift och kan nu erbjuda avatarer genom ett veckoabonnemang istĂ€llet för att krĂ€va separata köp i appen. Det skapar en mer tillfredsstĂ€llande upplevelse och Ă€r mycket billigare för vĂ„ra anvĂ€ndare om de vill generera till exempel fem avatarpaket inom en vecka eller Ă€ndra fotoinmatningen allt eftersom. Med tanke pĂ„ allt ovanstĂ„ende har vĂ„rt avatarerbjudande för nĂ€rvarande det bĂ€sta pris-prestanda-förhĂ„llandet pĂ„ marknaden. Ăven om det finns appar som kan skapa realistiska avatarer av hög kvalitet, utmĂ€rker sig ARTA genom att tillhandahĂ„lla ett brett utbud av ljusa och fĂ€rgglada utdatavarianter förutom realistiska stilar, alla med samma exakta nivĂ„ av ansiktsigenkĂ€nning.
PÄ vilka andra sÀtt har teamet förbÀttrat appens möjligheter?
Vi drog slutsatsen att det Àr mer effektivt att anvÀnda API:er frÄn tredje part för vanliga anvÀndningsfall som text-till-bild-generering, bildkonvertering och mÄlning. Detta tillvÀgagÄngssÀtt eliminerar behovet av att lÀgga tid pÄ att ta reda pÄ hur man integrerar dessa funktioner i vÄr serverinfrastruktur. Dessutom minskar det kostnaderna i situationer nÀr en ny funktion inte tar fart som förvÀntat och vi beslutar att ta bort den. AI-bildgenereringsbranschen utvecklas snabbt, med mÄnga dedikerade tjÀnster tillgÀngliga, sÄ vi utforskar och antar gradvis de som Àr i linje med vÄra mÄl.
Samtidigt visar sig ARTAs behov ofta vara ganska unika och krĂ€ver in-house fynd. I de fall dĂ„ skrĂ€ddarsydda API:er antingen inte finns eller inte ger tillfredsstĂ€llande utskriftskvalitet, specialiserar och anpassar vi vĂ„ra interna tjĂ€nster och utvecklar vĂ„ra egna lösningar för att uppnĂ„ de resultat vi vill ha. Till exempel, förutom att uppgradera AI-avatarer, har vĂ„ra ML- och snabbingenjörer kommit med en ny pipeline för appens AI-filter (Selfies)-funktion. Vi har ocksĂ„ utvecklat en unik algoritm för vĂ„r kommande AI Baby-funktion â en genererande funktion som lĂ„ter tvĂ„ personer slĂ„ samman sina bilder och se hur deras barn kan se ut. Baserat pĂ„ min uppfattning om vĂ€rlden som produktchef tvivlade jag först pĂ„ dess framgĂ„ng, men annonsmaterial med detta koncept Ă€r mycket populĂ€ra. SĂ„ att kolla upp marknadsföringsinsikter Ă€r sĂ€rskilt anvĂ€ndbart i innehĂ„llsrelaterade fall.
Kan anvÀndare pÄverka den konstnÀrliga processen i ARTA? Om sÄ Àr fallet, vilka verktyg och alternativ finns tillgÀngliga för anvÀndare att anpassa det AI-genererade konstverket?
Vi hanterar alla komplexa aspekter relaterade till generation, med mÄlet att ge vÄra anvÀndare en enkel konstnÀrlig upplevelse utan onödig teknisk överbelastning. SÄ det primÀra sÀttet som anvÀndare pÄverkar resultatet Àr genom uppmaningar. Vi hÄller denna process transparent genom att visa den exakta ordförfrÄgan som kommer att skickas till modellen för generering och erbjuder endast hjÀlp med att skapa effektiva uppmaningar om det behövs.
Vi vĂ€ljer de bĂ€sta standardinstĂ€llningarna för varje integrerad modell sĂ„ att anvĂ€ndarna inte bryr sig om det. Vanligtvis finns det inget behov av att justera dem för att maximera resultatet, eftersom de redan producerar en optimal produktion. ĂndĂ„, om anvĂ€ndaren vill experimentera, Ă€r ett avancerat lĂ€ge ett tryck bort, och nĂ„gra djupare parametrar finns i instĂ€llningssektionen.
Snart kommer vi att lÀgga till en Seed-parameter, sÄ att anvÀndare kan ha fullstÀndig kontroll över genereringen nÀr de behöver Äterskapa en identisk bild frÄn grunden. Dessutom planerar vi att utöka listan över bildförhÄllanden. Vi funderar ocksÄ pÄ att lÀgga till flera kontrollnÀt till vanliga generationer. De stöds redan pÄ serversidan, eftersom vi anvÀnder dem för att generera AI-filter och skisser, men de har Ànnu inte levererats till slutanvÀndare.
Hur uppfattar du effekten av AI som ARTA pÄ den traditionella konstmarknaden? Ser du AI-konstgenerering som en störning eller en förbÀttring av konstindustrin?
Jag ser det som en förbÀttring. Generativ AI har introducerat nya och vÀrdefulla möjligheter för att förbÀttra den konstnÀrliga processen samtidigt som den avsevÀrt minskar omloppstiden. Den hjÀlper digitala konstnÀrer, designers, illustratörer och andra skapare av visuellt innehÄll med en mÀngd olika uppgifter, frÄn att utforska idéer och utveckla koncept till att skapa skisser och fÀrdiga bilder. I slutÀndan Àr vÄr förmÄga att utnyttja dess framsteg endast begrÀnsad av vÄr fantasi.
Till exempel har jag en hobby att skapa PC-spel, och nyligen anvÀnde jag ARTA för att skapa en uppsÀttning ikoner för fÀrdigheter och föremÄl. Jag kunde designa dem pÄ egen hand med Adobe Illustrator, men med en bildgenerator fick jag det jag behövde nÀstan direkt. Min fru Àr i sin tur retuschör-fotograf. Tack vare Photoshops Generative Fill arbetar hon mycket snabbare och har mer fritid (eller mer inkomst om hon bestÀmmer sig för att acceptera fler retuscheringsbestÀllningar).
NÀr de görs vÀl kan AI-genererade bilder se omöjliga att skilja frÄn professionella konstverk. Men enligt min Äsikt kommer AI aldrig att ersÀtta en riktig professionell. Oavsett hur skickliga neurala nÀtverk blir, trÀnas de fortfarande pÄ data som skapats av mÀnniskor, vilket betyder att allt de genererar redan finns nÄgonstans. Som dÄ och nu kan verkligt innovativa idéer bara produceras av mÀnniskor. Medan den traditionella betydelsen av konst förblir förknippad med mÀnskliga verk, Àr AI-konst som en förvÀntad spinoff, som bjuder in alla, oavsett konstnÀrlig bakgrund, att prova en spÀnnande ny upplevelse.
Om du ser bortom att bara förbÀttra bildkvaliteten, var ser du framtiden för AI-bildgenerering pÄ vÀg?
Tillsammans med bildkvaliteten kommer generationshastigheten att öka, vilket automatiskt leder till mer kostnadseffektiva utdata.
Jag tror att det inte kommer att dröja lÀnge innan det finns ett enkelt sÀtt att generera samma karaktÀrer i olika miljöer och positioner sÄ att vi kommer att se framvÀxten av AI i serier, barnböcker, spelgrafik och mer. Inredningsdesign och produktion av annonsmaterial Àr redan de sfÀrer som aktivt utnyttjar generativ AI, men mer ligger framför oss nÀr tekniken fortsÀtter att utvecklas.
Med tanke pÄ att alla generationer krÀver starka GPU:er kommer dessa teknologier att utvecklas tillsammans med AI under ganska lÄng tid. Vi Àr bara i början av resan. Kanske kommer vÄr tids nya Apple att vara Nvidia, dÀr alla, eller Ätminstone de inom IT-branschen, vÀntar pÄ nya grafikkortsslÀpp precis som vi alla gjorde med iPhones.
AI-bildgeneratorer kommer att fortsÀtta att leverera roliga och engagerande upplevelser, antingen genom att introducera nya koncept som kommer frÄn popkulturen eller genom att Äteruppliva Àldre idéer förstÀrkta med bÀttre teknik. Till exempel vÀxer intresset för AI Baby-generationer för nÀrvarande. En ny teknik baserad pÄ stabil diffusion har visat imponerande resultat frÄn att slÄ samman tvÄ individers egenskaper för att avslöja deras biologiska barns potentiella utseende. Resultaten övertrÀffar vida vad som fanns pÄ horoskopsajter för nÄgra Är sedan, och folk Àr ivriga att ge det ett nytt försök.
Vad Àr dina förutsÀgelser om vad vi kan förvÀnta oss hÀrnÀst av Generative AI?
VÄgen av popularitet för videogenerering Àr vid horisonten. Med framsteg inom teknik som nÄr en tillrÀcklig nivÄ kommer det utan tvekan att finnas försök att trÀna neurala nÀtverk med hjÀlp av mÀnniskors ansiktsuttryck och gester för att skapa videoavatarer, potentiellt Àven med unika anvÀndarröster.
AI Audio Àr ett annat betydande genombrott som inleder en ny era för musikproduktionsindustrin. Den hÀr tekniken har redan presenterat fantastiska möjligheter för att komponera lÄtar baserade enbart pÄ textinmatning, vilket gör den till ett utmÀrkt verktyg för att skapa anpassade ljudspÄr som inte finns i lager för olika typer av videoinnehÄll. Sammantaget Àr det riktigt kul att lyssna pÄ nÄgot sÄ vardagligt som anvÀndarvillkor som rappas eller sjungs med romantisk intonation.
Tack för den fantastiska intervjun, lÀsare som vill veta mer eller generera nÄgra bilder bör besöka KONSTEN.