Interviuri

Dr. Yair Adato, CEO și fondator al Bria – Seria de interviuri

mm

Dr. Yair Adato, CEO și fondator al Bria, este un expert în învățare automată și viziune computerizată, recunoscut pentru capacitatea sa de a combina tehnologia avansată cu aplicații comerciale din lumea reală. Înainte de a fonda Bria, el a ocupat funcția de CTO la Trax Retail, unde a jucat un rol central în transformarea companiei dintr-un startup cu 20 de angajați într-un unicorn global cu peste 850 de angajați. De-a lungul carierei sale, Yair a contribuit și ca consilier pentru mai multe întreprinderi conduse de inteligență artificială, printre care Sparx, Vicomi, Tasq, DataGen și Anima. Conducerea sa se caracterizează printr-un angajament puternic față de inovarea responsabilă, proprietatea datelor și democratizarea tehnologiei inteligenței artificiale.

Bria este o companie pionieră în domeniul inteligenței artificiale generative vizuale responsabile, fondată cu misiunea de a crea o platformă deschisă și etică pentru generarea de imagini. Abordarea unică a companiei recompensează proprietarii de date pentru contribuțiile lor prin intermediul unui motor de atribuire, asigurând transparența și echitatea în ecosistemul inteligenței artificiale. Prin concentrarea pe creativitate, colaborare și conformitate, Bria împuternicește organizațiile să integreze inteligența artificială generativă în siguranță în fluxurile lor de lucru, stabilind noi standarde pentru responsabilitate și încredere în industria conținutului vizual..

Ați fondat Bria pentru a crea o platformă responsabilă și deschisă pentru inteligența artificială generativă vizuală. Ce v-a inspirat să înființați compania și ce provocări sau insight-uri timpurii au modelat direcția acesteia?

Am văzut prezentarea lui Goodfellow despre articolul GAN în 2014 și a fost imediat clar că producția creativă urma să se schimbe fundamental. În timp ce urmăream prezentarea, implicațiile erau evidente – aceasta nu era doar o îmbunătățire incrementală, ci o paradigmă diferită pentru modul în care mașinile ar putea învăța să genereze conținut vizual.

Dar de la început, am recunoscut o lacună fundamentală în modul în care aceste sisteme erau construite: nu exista nicio răspundere pentru datele de antrenare, nicio cadră pentru implementarea responsabilă, nicio considerație pentru creatorii ale căror lucrări făceau posibil totul.

Provocările timpurii nu au fost tehnice – au fost structurale. Cum se poate construi inteligență artificială generativă care să îmbunătățească lucrările creative fără a submina oamenii care le creează? Cum se poate face ca aceste sisteme să fie utilizabile în medii de producție în care certitudinea juridică contează la fel de mult ca și calitatea ieșirii? Aceste întrebări au modelat tot ceea ce am construit. Am fondat Bria pe principiul că inovarea și responsabilitatea nu sunt forțe opuse – ele trebuie să progreseze împreună, sau tehnologia eșuează pentru toată lumea.

Fondul dvs. academic în viziune computerizată și cele peste 50 de brevete de invenție care combină cercetarea și inovarea reală v-au influențat experiența în ceea ce privește direcția tehnică și strategia pe termen lung a Bria?

Experiența mea de cercetare m-a învățat să gândesc în sisteme – cum se conectează diferitele straturi de înțelegere pentru a forma sens. Multe dintre brevetele mele se concentrează pe modul în care mașinile interpretează structura informației vizuale, și această mentalitate s-a transformat natural în abordarea Bria. Ne uităm la generarea de imagini ca la un proces compozițional, nu la unul aleatoriu.

Dar brevetele nu se referă doar la tehnologie – ele se referă la puntea dintre tehnologie și realitatea comercială. O parte semnificativă a portofoliului nostru de proprietate intelectuală se adresează stratului sistemelor: cum se pot crea cadre de atribuire care conectează conținutul generat la sursele sale de antrenare? Cum se pot construi modele economice care să compenseze creatorii la scară? Acestea nu sunt doar probleme tehnice – ele sunt întrebări de infrastructură, modele de afaceri și proiectare a pieței.

Această perspectivă mai largă a modelat strategia noastră pe termen lung. Inovarea nu se referă doar la îmbunătățirea modelelor subiacente. Ea se referă la crearea unor structuri economice noi, a unor cadre contractuale noi, a unor modalități noi pentru industrie de a opera în mod durabil. Scopul nu este doar să producă rezultate mai bune – este să înțelegem cum sunt formate aceste rezultate, cine a contribuit la ele și cum se transferă valoarea prin sistem. Acesta este punctul în care știința se întâlnește cu gândirea de produs și cu arhitectura de afaceri.

Bria a anunțat recent FIBO, descris ca primul model de fundație vizuală determinist pentru generarea profesională de inteligență artificială. Ce face FIBO fundamental diferit de sistemele vizuale de inteligență artificială existente?

Numele în sine semnalează abordarea noastră: FIBO este prescurtarea de la Fibonacci, secvența matematică faimoasă pentru proprietățile sale estetice inerente. Raportul de aur – raportul dintre numerele consecutive în secvența Fibonacci – apare în ceea ce percepem ca proporții vizual plăcute în matematică, artă vizuală, geometrie și arhitectură. Îl vedem în dimensiunile Pantheonului Roman și ale Casei Albe, în corpul uman și în fața ilustrată de Leonardo da Vinci în Omul Vitruvian, și în forme naturale. Această legătură dintre structura matematică și frumusețea vizuală este exact ceea ce FIBO încorporează: calitate estetică prin structură formală.

FIBO schimbă relația dintre intenție și ieșire. Cele mai multe sisteme de inteligență artificială vizuală introduc straturi de interpretare între ceea ce doriți și ceea ce obțineți – scrieți un prompt, modelul îl traduce prin codificatori de limbaj, îl difuzează prin zgomot și sperați că rezultatul se potrivește cu viziunea dvs. FIBO elimină complet aceste straturi.

Am făcut inteligența artificială vizuală să funcționeze ca și codul – fiecare element creativ devine editabil și reutilizabil. Acesta este un progres pentru profesioniștii care au fost blocați cu ruleta prompturilor. Acest lucru înseamnă că fiecare element, direcția iluminatului, unghiul camerei, paleta de culori, compoziția, stilul există ca o proprietate explicită și controlabilă. Structura JSON permite modificarea doar a parametrilor pe care doriți să îi modificați, în timp ce blochează toate celelalte. Puteți ajusta intensitatea iluminatului fără a afecta compoziția sau schimba unghiul camerei fără a altera paleta de culori. Sistemul face exact ceea ce specificați, de fiecare dată.

Suntem în curs de a organiza hackathoane cu Fal și NVIDIA pentru a arăta dezvoltatorilor cum funcționează generarea deterministă în practică. Structura JSON însăși deschide cutia neagră – puteți vedea exact ce parametri au creat o imagine, o puteți reproduce și modifica cu precizie. Este o paradigmă complet diferită de ingineria prompturilor.

Sistemele tradiționale text-imagini se bazează pe prompturi din ce în ce mai elaborate pentru a obține rezultate specifice. Cum rezolvă abordarea FIBO problema complexității prompturilor?

Două probleme trebuie abordate. În primul rând, problemele aleatorii ale prompturilor există pentru că modelele actuale încearcă să extragă intenția utilizatorului și să adauge ceea ce modelul “crede” că este estetic sau de dorit prin îmbunătățirea promptului. În al doilea rând, lipsește controlul asupra proprietăților profesionale.

FIBO inversează această situație. Modelul a fost antrenat pe peste 1.000 de cuvinte de descrieri vizuale pe imagine care codifică explicit peste 100 de atribute independente în format JSON. Acest lucru nu a fost post-procesat sau extras – a fost formatul de antrenare nativ. Deoarece fiecare atribut este reprezentat structural de la început, modelul a învățat compoziția vizuală ca un set de parametri controlabili și discreți, mai degrabă decât ca o interpretare neclară a textului.

Ce înseamnă acest lucru în practică: definiți intenția estetică prin structură, nu prin “prompt și rugăciune”. Nivelul de aliniere text-imagini este fundamental mai mare pentru că nu există un strat de traducere. Vorbiți limba nativă a modelului. Și deoarece proprietățile sunt independente, puteți itera asupra iluminatului fără a schimba accidental compoziția sau ajusta paleta de culori fără a afecta stilul. Controlul este chirurgical.

FIBO introduce un flux de lucru “refine” care diferă de generarea iterativă tipică. Cum schimbă acest lucru modul în care profesioniștii abordează producția vizuală?

Cele mai multe fluxuri de lucru generative sunt iterative într-un mod frustrant – generați, evaluați, ajustați promptul, generați din nou, sperați că este mai aproape. Acest “prompt și rugăciune”. Niciodată nu sunteți sigur ce s-a schimbat sau de ce.

Refine transformă experimentarea în proiectare. Nu ghiciți ce ar putea face un nou prompt – sunteți la cârma imaginii, exact așa cum ați ajusta lumina sau culoarea în Photoshop. Nu trebuie să lucrați la nivelul JSON direct – un model de limbaj-viziune modifică JSON-ul pentru dvs. pe baza instrucțiunilor de limbaj natural. Dar JSON-ul însuși vă permite să înțelegeți exact ce s-a întâmplat. Generezi o imagine inițială, examinați reprezentarea JSON a acesteia, identificați care proprietăți necesită ajustări – poate intensitatea iluminatului este prea ridicată sau unghiul camerei trebuie să se schimbe cu 15 grade – și modificați doar acele valori prin instrucțiuni simple. Totul rămâne blocat.

Această structură este perfectă pentru fluxurile de lucru agențice. Un agent de inteligență artificială poate analiza JSON-ul, înțelege starea completă a imaginii, face modificări țintite și explică raționamentul său – totul pentru că parametrii sunt expliciți și interpretabili. Agentul nu ghicește ce ar putea face o schimbare de prompt; face ajustări precise la proprietăți cunoscute.

Acest lucru elimină imprevizibilitatea care a ținut profesioniștii sceptici față de inteligența artificială generativă. Când puteți vedea setul complet de parametri care a creat o imagine, înțelegeți ce controlează fiecare proprietate și modificați atribute individuale cu încredere că nimic altceva nu se va schimba, nu mai experimentați – proiectați. Vizibilitatea JSON deschide complet cutia neagră. Pentru fluxurile de producție profesională în care controllul și coerența contează mai mult decât noutate, acesta este diferența dintre un jucărie creativă și un instrument de producție.

Etica datelor și siguranța mărcii au devenit centrale pentru inteligența artificială a întreprinderilor. Cum asigură utilizarea de către Bria a datelor cu licență deplină și curățate din punct de vedere al drepturilor, atât conformitatea, cât și respectul pentru proprietatea intelectuală a creatorilor?

De la început, am decis că dacă industria urma să crească în mod responsabil, trebuia să înceapă cu integritatea datelor. Fiecare imagine care a antrenat FIBO provine din surse licențiate și curățate din punct de vedere al drepturilor prin parteneriate cu lideri de conținut precum Getty Images și Envato. Acest lucru ne asigură că modelele noastre sunt conforme și corecte. Vedem respectul pentru creatori ca parte a lanțului de valoare, nu ca o constrângere. Întreprinderile beneficiază de această integritate deoarece le oferă certitudinea juridică și etică de care au nevoie pentru a se extinde cu încredere.

FIBO a fost antrenat pentru a învăța stilul și identitatea unică a fiecărei companii. Cum schimbă această capacitate modul în care mărcile globale abordează crearea de conținut și coerența vizuală?

Mărcile au propriul lor ADN vizual – un mod unic de a exprima emoție, încredere și scop prin design. FIBO poate învăța acest limbaj. Odată antrenat, generează imagini care reflectă aceeași compoziție, ton și atmosferă care definesc identitatea unei mărci. Acest lucru transformă inteligența artificială dintr-un asistent creativ într-un activ al mărcii. Ajută echipele globale să creeze cu aliniere, nu cu aproximare. Rezultatul este coerența la scară, fără a pierde individualitatea.

Cu adoptatorii timpurii care utilizează deja FIBO pentru a automatiza designul de ambalaj, imagini de produs și campanii creative, ce rezultate sau feedback au fost cele mai remarcabile pentru dvs. până acum?

Schimbarea de mentalitate. Echipele încep să trateze inteligența artificială ca parte a setului lor de instrumente operaționale, nu ca o noutate. O marcă globală generează variante regionale de ambalaj mult mai rapid, menținând în același timp coerența mărcii. O agenție de creație de top a accelerat dezvoltarea campaniilor de zece ori prin iterare controlată. Dar semnalul real vine de la directorii creativi care ne spun că se simt mai în control; că modelul înțelege intenția lor vizuală. Acesta este punctul de cotitură pentru industrie.

Bria se poziționează ca lider în inteligență artificială etică și controlabilă. Cum credeți că această filozofie va modela viitoarele reglementări sau standarde de industrie pentru inteligența artificială vizuală?

Am ajuns la un moment în care inovarea și guvernanța trebuie să progreseze împreună. Reglementarea nu este un obstacol, ci mai degrabă infrastructura pentru creșterea durabilă. Abordarea noastră – date transparente, ieșiri deterministe, proveniență clară – se aliniază strâns cu ceea ce politiciile emergente cer. Cred că vom vedea noi standarde care vor prioriza trasabilitatea, explicabilitatea și protecția drepturilor. Filozofia Bria este de a ajuta la definirea acestor standarde prin practică, nu prin declarații de politică.

Privind înainte, ce urmează pentru Bria după FIBO? Vă imaginați extinderea în inteligență artificială multimodală care unește generarea de imagini, video și 3D sub o singură platformă controlabilă?

Da. Principiile care alimentează FIBO – structură, control, transparență – se aplică în toate domeniile vizuale. Suntem deja în curs de a explora extinderi în video și 3D, unde determinismul poate aduce aceeași fiabilitate pe care întreprinderile o au acum cu imaginile. Scopul nostru este simplu: faceți inteligența artificială creativă la fel de controlabilă și sigură ca și scrierea de cod – și extindeți-o în toate mediile vizuale, de la imagine la video la 3D.

Mulțumim pentru acest interviu minunat, cititorilor care doresc să afle mai multe despre Bria.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.