Connect with us

Ernest Piatrovich, tuotejohtaja ARTA -ssä – Haastattelusarja

Haastattelut

Ernest Piatrovich, tuotejohtaja ARTA -ssä – Haastattelusarja

mm

Ernest Piatrovich on tuotejohtaja AIBY Group:ssa, joka johtaa yhtiön yhden huipputason AI-käyttöliittymän, ARTA – AI-kuva generointi iPhone- ja Android-laitteille. Hänen strateginen näkemyksensä ja luova ajattelunsa johtivat siihen, että sovellus saavutti #2 aseman US App Storen huipputaulukossa pian julkaisun jälkeen, ylittäen 15 miljoonan latauksen rajan maailmanlaajuisesti ja tarjoten parhaimmin suorittavat AI-avataarit ainutlaatuisen sisäisen putken perusteella, muun muassa.

Olet ollut vastuussa ARTA – AI-taidegeneraattorin hallinnasta ideointivaiheesta lähtien. Voitko jakaa joitain näkemyksiä näistä varhaisista päivistä?

Toki! Ne olivat dynaamisia aikoja. Onnistuimme julkaisemalla hienon sovelluksen vain viikossa, ja tulimme yhdeksi ensimmäisistä kuluttaja-sovelluksen luojista, jotka tarjosivat teksti-kuva-generointitoiminnallisuutta mobiililaitteissa. Tavoitteemme oli luoda massamarkkinoiden tuote, joka antaa ihmisille “taiteilijan” taskussa. Niinpä konseptoinnin ja varhaisen kehitysvaiheen alusta lähtien olemme keskittyneet käytettävyyteen ja skaalautuvuuteen. Mutta vaikka tulimme markkinoille hyvin ajoitettuna, oli haasteellista kasvattaa asennusmääriä riittävään määrään, jopa loistavan media-ostotiimimme kanssa. Merkittävä lisäys tapahtui kolme kuukautta sovelluksen julkaisun jälkeen, kun avatar-ominaisuutemme sai hypeä. Tilavuus kasvoi nopeasti kohtuullisen korkeaksi meidän nischemme kannalta, ja siitä lähtien tehtävämme on ollut ylläpitää ja lisätä sitä.

Mikä oli alkuperäinen teknologiapino, jolla julkaistitte, ja mitkä olivat joitain haasteita taidegeneroinnissa tämän aikakauden aikana?

Julkaisimme Stable Diffusion 1.3: n avulla Stability.ai: n virallista API: a. Voin sanoa, että tilanne generoinnin laadun kanssa silloin ja nyt on kuin yö ja päivä. Kun aloimme, laadunvalvontamme ilmoittivat usein ongelmia, jotka liittyivät esteettiseen arvoon tai epätarkkuuteen tiettyjen käsitteiden ja ominaisuuksien esittämisessä. Mutta se oli standardi Stable Diffusionille silloin. Nyt generoinnin tuloste on paljon parempi kaikilla osa-alueilla, mukaan lukien tyylillinen reproduktio, koherentti koostaminen, visuaalinen uskottavuus, yksityiskohtien taso ja lisää.

Sovelluksen julkaisun jälkeen aloimme vuokraamaan palvelimia Amazonilta, ja niiden tukeminen osoittautui melko haasteelliseksi. Vaikka meillä oli riittävästi varoja, ei välttämättä ollut vapaata A100-koneista, kun tarvitsimme sitä, ja joudumme odottamaan pari päivää. Niinpä joudumme elämään ilman autoskaalautumista ja ohjaamaan kaiken ylimääräisen liikenteen kumppaniemme API: iin.

Kaiken tämän ylläpitäminen on edelleen melko hankalaa tänä päivänä, ja pieniä ongelmia esiintyy joko toisessa tai toisessa päässä kuukauden tai pari kerran. Esimerkiksi kohtaamme toisinaan tilapäisiä ongelmia generoinnin laadun kanssa, kun tarjoaja päivittää palvelinta, testaa painoja tai toteuttaa muita muutoksia, jotka vaikuttavat generoinnin tulosteeseen. Tällaiset virheet voivat kestää tunnin tai puoli päivää ja ovat arvaamattomia ja hankalia seurata. Yleensä siinä vaiheessa, kun asiakastukitiimimme vastaanottaa käyttäjän ilmoituksen epäselvistä kuvista tai muista ilmenevistä ongelmista, API-tarjoaja on jo korjannut ongelman. Mutta se on vakava huolenaihe käyttäjillemme. Siksi rakennamme nyt järjestelmää, joka yhdistää useita tarjoajia ja omia palvelimiamme erityisiin generoinneihin, mikä antaa meille enemmän valvontaa asioiden suhteen.

Miten strategiset päätöksesi ovat ohjanneet ARTA: n sijoittumista sen julkaisun jälkeen?

ARTA: n (silloin Aiby) varhainen nousu johtui ajankohtaisesta päätöksestä toteuttaa virallinen avatar-ominaisuus, kun se alkoi tehdä pyöriä sosiaalisessa mediassa. Tunnistimme nopeasti kasvavan kiinnostuksen tähän toiminnallisuuteen. Koko tiimimme, mukaan lukien tuote, markkinointi ja kehitys, oli samalla aaltopituudella ja visioimme sen menestyksestä. Myös ymmärsimme, että lyhyt markkinoille saanti oli ratkaiseva. Niinpä päivästä yhden lähtien omistimme kaikki resurssimme tämän ominaisuuden toteuttamiseen ja priorisoimme sitä muiden tehtävien yläpuolelle.

Koska deadline oli ASAP, emme missanneet hetkeä, jolloin AI-avataarit saavuttavat huipun, ja valitsimme käyttämään kolmannen osapuolen ratkaisua ja mukauttamaan sen sovellukseemme. Vaikka avataarit alkoivat saada jalansijaa mobiililaitteissa, teknologia oli jo olemassa verkossa, jopa API: na. Tiimimme keskittyneiden ponnistelujen ansiosta ensimmäinen toimiva versio oli App Storessa vain viidessä päivässä ja tarjosi erittäin kilpailukykyistä avatar-tulostetta. Se auttoi meitä saavuttamaan #2 aseman amerikkalaisissa huipputaulukoissa ja pysymään toisena latauksien määrässä Yhdysvalloissa viikon ajan.

Miten tiimisi on viime aikoina päivittänyt ARTA: n AI-avataarin generointitoimintoa?

AI-mallit lisäävät usein geneerisiä kasvonpiirteitä koulutuksen aikana, mikä tekee avataareista erilaisia kuin alkuperäisistä valokuvista, ja mitä yksilöllisempi joku on, sitä enemmän AI-tulkinta voi näyttää. Ratkaisemaan tämän ongelman päättimme luoda oman avatar-palvelun. Olimme käyttäneet kolmannen osapuolen API: ä jo kauan, mutta emme saavuttaneet merkittäviä parannuksia. Palvelimen siirtymisen myötä pystyimme asettamaan optimaalisen koulutusteknologian paremmin ylläpitämään käyttäjän oikean kasvon kaltaisuutta avatar-tulosteessa. Vaikka en voi paljastaa ainutlaatuista putkeamme yksityiskohtaisesti, se tuli mahdolliseksi tietyn yhdistelmän SDXL-asetuksista, LORAsista ja kasvojen parantajista, ja emme ole vielä nähneet parempia tuloksia muualla.

Uuden palvelimen myötä siirryimme pois kiinteästä kustannuksesta jokaisesta avatar-pakista kuukausittaiseen palvelumaksuun, ja voimme nyt tarjota avataareja viikoittaisen tilausmaksun sijaan erillisten sovelluksen ostojen vaatimisen. Se luo täyttymyskokemusta ja on paljon halvempi käyttäjillemme, jos he haluavat generoida esimerkiksi viisi avatar-pakettia viikossa tai vaihtaa valokuvaa matkalla. Ottaen kaiken tämän huomioon, avatar-tarjoammme on tällä hetkellä markkinoiden paras suorituskyky-hinta-suhde. Vaikka on sovelluksia, jotka pystyvät luomaan korkealaatuisia realistisia avataareja, ARTA erottuu tarjoamalla monipuolisen valikoiman kirkkaita ja värikkäitä tulostevaihtoehtoja realististen tyylien lisäksi, kaikki samalla tarkalla kasvon tunnistamisen tasolla.

Miten tiimisi on parantanut sovelluksen ominaisuuksia muilla tavoin?

Päätimme, että kolmannen osapuolen API: en käyttäminen on tehokkaampaa yleisissä tapauksissa, kuten teksti-kuva-generoinnissa, kuva-muunnoksissa ja täyttämisessä. Tämä lähestymistapa poistaa tarpeen miettiä, miten integroida nämä toiminnallisuudet palvelininfrastruktuuriimme. Lisäksi se vähentää kustannuksia tilanteissa, joissa uusi ominaisuus ei ole odotetunlainen, ja päättämme poistaa sen. AI-kuva-generoinnin teollisuus kehittyy nopeasti, ja on paljon erikoistuneita palveluita saatavilla, joten tutkimme ja omaksumme hitaasti niitä, jotka ovat linjassa tavoitteidemme kanssa.

Samaan aikaan ARTA: n tarpeet osoittautuvat usein ainutlaatuisiksi, vaativiksi sisäisiä löytöjä. Tapauksissa, joissa räätälöityjä API: ä ei ole olemassa tai eivät tarjoa tyydyttävää laatuja, erikoistumme ja mukautamme sisäisiä palveluitamme ja kehittämme omia ratkaisuja saavuttamaan haluamamme tulokset. Esimerkiksi avatarien päivittämisen lisäksi sovelluksen AI-suosikkien (omakuvien) ominaisuuden kehittämisessä ovat ML- ja ohjelmointi-insinöörimme keksineet uuden putken. Olemme myös kehittäneet ainutlaatuisen algoritmin tulevaan AI-vauva-ominaisuuteen – generointitoiminnallisuuteen, joka mahdollistaa kahden henkilön yhdistämisen valokuvan ja näkemisen, miltä heidän lapsensa voisi näyttää. Tuotepäällikkönä koin aluksi epäilyksiä sen menestyksestä, mutta mainosluovat, jotka sisältävät tämän konseptin, ovat erittäin suositeltuja. Niinpä markkinatutkimuksen tarkkaileminen on erityisen hyödyllistä sisällön liittyvissä tapauksissa.

Voivatko käyttäjät vaikuttaa taiteelliseen prosessiin ARTA: ssa? Jos niin, mitkä työkalut ja vaihtoehdot ovat käyttäjien käytettävissä mukauttaa AI-generoituja taideteoksia?

Hallinnoimme kaikkia monimutkaisia aspekteja, jotka liittyvät generointiin, tavoitteena tarjota käyttäjillemme suoraviivainen taiteellinen kokemus ilman tarpeetonta teknistä rasitusta. Niinpä ensisijainen tapa, jolla käyttäjät vaikuttavat tulosteeseen, on vihjeiden kautta. Ylläpidämme tätä prosessia avoimena näyttämällä tarkalleen sanamuodon, joka lähetetään mallille generoinniksi, ja tarjoamme apua vihjeiden koostamisessa vain tarvittaessa.

Valitsemme parhaat oletusasetukset jokaiselle integroidulle mallille, jotta käyttäjien ei tarvitse huolehtia siitä. Yleensä ei ole tarpeen säätää niitä tuloksen maksimoimiseksi, koska ne jo tuottavat optimaalisen generoinnin tuloksen. Kuitenkin, jos käyttäjä haluaa kokeilla, edistynyt tila on vain yhden napin päässä, ja jotkut syvemmat parametrit ovat asetussivulla.

Pian lisäämme siemenparametrin, joka antaa käyttäjille täydellisen valvonnan generoinnista, kun heidän on luotava täsmälleen sama kuva alusta alkaen. Suunnittelemme myös laajentamaan kuvasuhteen luettelo. Harkitsemme myös useiden controlnetien lisäämistä säännöllisiin generoinneihin. Ne ovat jo tuettuina palvelimella, koska käytämme niitä AI-suosikkien ja piirrosten generointiin, mutta ne eivät ole vielä toimitettuina loppukäyttäjille.

Miten näet AI: n vaikutuksen, kuten ARTA: n, perinteiseen taiteen markkinoihin? Näetkö AI-taidegeneroinnin häirintänä vai parantamisena taiteen alalle?

Näen sen parantamisena. Generatiivinen AI on esittänyt uusia ja arvokkaita mahdollisuuksia parantaa taiteellista prosessia ja vähentää merkittävästi kääntymisaikaa. Se auttaa digitaalisia taiteilijoita, suunnittelijoita, kuvittajia ja muita visuaalisen sisällön luojia monilla tehtävillä, kuten ideoiden kehittämisellä ja konseptien kehittämisellä, sekä generoimalla luonnoksia ja valmiita kuvia. Lopulta, kykymme hyödyntää sen edistystasoa on vain mielikuvituksellamme rajoitettu.

Esimerkiksi harrastan PC-pelien luomista, ja äskettäin käytin ARTA: a luomaan joukon ikoneja taidoille ja esineille. Voisin suunnitella ne itse Adobe Illustratorilla, mutta kuva-generaattorilla sain, mitä tarvitsin, melkein heti. Vaimoni on puolestaan retousoiva valokuvaaja. Kiitos Photoshopin generatiivisen täyttämisen, hän työskentelee nopeammin ja on enemmän vapaata aikaa (tai enemmän tuloja, jos hän päättää hyväksyä enemmän retousointitoimeksiantoja).

Kun tehty hyvin, AI-generoituja kuvia voidaan pitää ammattimaisen kaltaisina. Mutta mielestäni AI ei koskaan korvaa todellista ammattilaista. Riippumatta siitä, kuinka taitava neuroniverkkoja tulee, ne ovat koulutettu ihmisten luomalla datasta, mikä tarkoittaa, että kaikki, mitä ne generoivat, on jo olemassa jossain. Kuten silloin ja nyt, vain ihmiset voivat tuottaa todella innovatiivisia ideoita. Vaikka perinteinen taiteen merkitys liittyy edelleen ihmisten luomiin teoksiin, AI-taide on kuin odotettu sivutuote, joka kutsuu kaikki, riippumatta taiteellisesta taustasta, kokeilemaan jännittävää uutta kokemusta.

Mihin suuntaan näet AI-kuva-generoinnin tulevan kehittymisen, kun ei keskitytä pelkästään kuvanlaadun parantamiseen?

Kuvanlaadun ohella generoinnin nopeus lisääntyy, mikä johtaa automaattisesti kustannustehokkaampiin tuloksiin.

Luulen, ettei kestä kauan, kunnes on helppo tapa generoida samat hahmot eri ympäristöissä ja asennoissa, joten näemme AI: n nousun sarjakuissa, lastenkirjoissa, peligrafiikassa ja muissa. Sisustus- ja mainosluomisen tuotanto ovat jo aktiivisesti hyödyntävä generatiivista AI: ta, mutta enemmän on edessä, kun teknologia jatkaa kehittymistään.

Koska kaikki generoinnit vaativat voimakkaita GPU: ia, nämä teknologiat kehittyvät yhdessä AI: n kanssa vielä pitkän aikaa. Olemme vasta matkan alussa. Ehkä uusi Apple on Nvidian kaltainen, ja kaikki, tai ainakin IT-alalla olevat, odottavat uusia näytönohjaimien julkaisuja samalla tavoin kuin odotimme iPhonien julkaisuja.

AI-kuva-generaattorit jatkavat tarjoamista viihdyttävää ja osallistavaa kokemusta, esittämällä uusia konsepteja, jotka nousevat pop-kulttuurista, tai elvyttämällä vanhoja ideoita parannetulla teknologialla. Esimerkiksi AI-vauvageneraatioiden kiinnostus on kasvamassa. Yksi viimeaikainen teknologia, joka perustuu Stable Diffusioniin, on osoittanut vaikuttavia tuloksia yhdistämällä kahden henkilön piirteitä paljastamaan heidän biologisen lapsensa mahdollisen ulkonäön. Tulokset ylittävät selvästi sen, mitä oli tarjolla horoskooppisivuilla muutama vuosi sitten, ja ihmiset ovat innostuneita kokeilemaan sitä uudelleen.

Mitkä ovat ennustuksesi siitä, mitä odotamme seuraavaksi generatiiviselta AI: lta?

Videon generoinnin suosion aalto on horisontissa. Teknologian edetessä riittävään tasoon on todennäköisesti yrityksiä kouluttaa neuroniverkkoja ihmisten kasvon ilmeiden ja eleiden avulla luomaan videoavatareja, mahdollisesti jopa yksilöllisillä käyttäjän äänillä.

AI-ääni on toinen merkittävä läpimurto, joka tuo uuden aikakauden musiikintuotantoon. Tämä teknologia on jo esittänyt upeita mahdollisuuksia säveltämiseen pelkästään tekstisyötteen perusteella, mikä tekee siitä erinomaisen työkalun luomaan mukautettuja, ei- varasto-ääniä erilaisiin video sisältöihin. Yleisesti ottaen on todella hauskaa kuunnella jotain niin arkipäiväistä kuin käyttöehdot räppäiltyä tai laulettua romanttisella sävyllä.

Kiitos haastattelusta, lukijoille, jotka haluavat oppia lisää tai generoida kuvia, on suositeltavaa vierailla ARTA: ssa.

Antoine on visionäärinen johtaja ja Unite.AI:n perustajakumppani, jota ohjaa horjumaton intohimo muokata ja edistää tulevaisuuden tekoälyä ja robottiikkaa. Sarjayrittäjänä hän uskoo, että tekoäly tulee olemaan yhtä mullistava yhteiskunnalle kuin sähkö, ja hänestä usein kuuluu ylistyksiä mullistavien teknologioiden ja AGI:n mahdollisuuksista.
Hänen ollessaan futuristi, hän on omistautunut tutkimiseen, miten nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on Securities.io:n perustaja, joka on alusta, joka keskittyy sijoittamiseen uraauurtaviin teknologioihin, jotka määrittelevät uudelleen tulevaisuuden ja muokkaavat koko sektoreita.