Interviuri

Dr. Xianxin Guo, CEO și Co-Fondator al Lumai – Seria de Interviuri

mm

Dr. Xianxin Guo, CEO și Co-Fondator al Lumai, este fizician și antreprenor de tehnologie avansată, specializat în calculul optic și hardware-ul inteligenței artificiale, cu un doctorat în fizică cuantică și optică neliniară de la Universitatea Științifică și Tehnologică din Hong Kong. El a ocupat anterior roluri de cercetare, inclusiv o poziție postdoctorală la Universitatea din Calgary și o bursă de cercetare 1851 la Universitatea din Oxford, unde a contribuit la progresele în domeniul fotonicii și accelerării inteligenței artificiale. Avansând de la șef de cercetare la CEO, el este inventatorul principal din spatele tehnologiei de bază a companiei și aduce peste un deceniu de experiență la intersecția fizicii, învățării automatizate și sistemelor de calcul avansate.

Lumai este o spin-off a Universității Oxford, care dezvoltă procesoare de inteligență artificială de ultimă generație bazate pe calculul optic 3D, folosind lumina în loc de electricitate pentru a efectua calculele cheie ale inteligenței artificiale. Tehnologia sa este proiectată pentru a accelera operațiile de matrice care stau la baza modelului modern de inteligență artificială, oferind viteze de procesare semnificativ mai rapide și reducând consumul de energie în comparație cu procesoarele GPU tradiționale pe bază de siliciu. Prin integrarea calculului optic în medii de centre de date existente, Lumai își propune să permită o implementare mai scalabilă și mai eficientă din punct de vedere al costurilor a inteligenței artificiale, abordând limitările crescânde legate de puterea de calcul și consumul de energie în sistemele de inteligență artificială la scară largă.

Ați început cariera în fizica cuantică și optică neliniară, devenind ulterior bursier de cercetare 1851 la Universitatea din Oxford, înainte de a co-fonda Lumai din cercetarea dvs. Care a fost momentul crucial în care ați realizat că calculul optic poate trece de la teoria academică la o companie comercial viabilă?

În timpul meu la Universitatea din Oxford, am explorat modul în care proprietățile luminii în spațiu liber pot fi utilizate pentru a rezolva tipurile de operații de matrice care stau la baza învățării automate. În același timp, limitările hardware-ului convențional pentru inteligența artificială deveneau tot mai importante. Convergența acestor provocări pe care le-am rezolvat în cercetarea noastră și nevoia de calcul mai eficient ne-a dat încrederea că putem lua ideile noastre și rezolva probleme din lumea reală.

Am parcurs un drum lung de la acea cercetare inițială – la Lumai am construit acum primul sistem de calcul optic capabil să ruleze modele de inteligență artificială cu miliarde de parametri în timp real.

Lumai abordează una dintre cele mai mari blocaje din inteligența artificială de astăzi, limitările de energie și scalabilitate ale calculului pe bază de siliciu. Care au fost limitările specifice din arhitecturile tradiționale care v-au împins către o abordare fundamental diferită folosind lumina?

Ceea ce ne-a împins a fost traiectoria limitată a soluțiilor pe bază de siliciu. Cu siliciul, veți vedea câștiguri incrementale, dar acestea vin cu creșteri disproporționate ale puterii și complexității. Limitarea scalării siliciului este în primul rând din cauza fizicii – frecvențele nu cresc, iar numărul de tranzistoare care pot fi comutate este limitat de termale. Curenții de scurgere continuă să fie o problemă. Se estimează că siliciul contribuie doar la o creștere anuală de 25% a performanței.

În acest moment, are sens să ne întrebăm dacă un mediu fizic diferit ar putea gestiona aceste operații într-un mod mai natural, în loc de a continua să împingem electronii mai tare.

Lucrarea dvs. se axează pe calculul optic și învățarea automată. Cum folosirea fotonilor în loc de electroni schimbă fundamental modul în care are loc calculul la nivel de hardware?

Cu electronii, calculul este în mod inerent secvențial și pierditor – comutați tranzistoare, mutați sarcina, generați căldură. Fiecare operație are un cost termic, iar acest cost se acumulează.

Fotonii se comportă foarte diferit. Lumina călătorește fără pierderi rezistive similare, iar prin utilizarea proprietăților luminii, un număr enorm de operații de matrice pot fi executate în paralel, simplu prin structurarea modului în care interacționează fasciculele de lumină printr-un mediu fizic. Calculul are loc în propagarea luminii în sine, nu în comutarea a miliarde de porți.

Tehnologia Lumai folosește procesarea optică 3D și paralelismul spațial masiv. Puteți explica cum această arhitectură permite îmbunătățiri dramatice în ceea ce privește debitul și eficiența în comparație cu procesoarele GPU?

Scopul este de a efectua înmulțirea matricelor dense cât mai eficient și mai rapid posibil într-un singur ciclu. Abordarea Lumai face exact acest lucru, folosind lumina într-un volum tridimensional, efectuând milioane de operații simultan.

Pur și simplu, nu puteți obține acel nivel de paralelism în structuri 2D, unde operațiile sunt procesate pe sute de nuclee, necesitând mișcarea constantă a datelor. Acest paralelism inerent – combinat cu faptul că, odată ce sunteți în domeniul luminii, operațiile pot fi efectuate fără a arde putere – conduce atât la îmbunătățirea debitului, cât și la reducerea dramatică a energiei pe token.

Majoritatea companiilor de infrastructură pentru inteligență artificială se concentrează încă pe antrenament, în timp ce Lumai se axează pe inferență. De ce credeți că inferența este provocarea definitorie a acestei faze următoare a inteligenței artificiale?

Inferența este acolo unde inteligența artificială face ceva util – fiecare întrebare răspunsă, fiecare sarcină a agentului finalizată, fiecare document generat. Am intrat acum în era inferenței, iar cererea crește la un ritm la care hardware-ul orientat spre antrenament nu a fost niciodată proiectat să absoarbă.

Economia este, de asemenea, diferită: inferența rulează continuu, pe milioane de utilizatori. Costul pe token devine metrica definitorie, iar acolo lovește peretele de energie.

Ceea ce face inferența deosebit de potrivită pentru calculul optic este că stadiul de preumplere este puternic legat de calcul. În acest stadiu de inferență descentralizată, întregul context este procesat înainte de a genera un răspuns. Acest lucru se potrivește aproape perfect cu motorul nostru optic și este acolo unde ne-am concentrat mai întâi.

Una dintre provocările de lungă durată în calculul optic a fost stabilitatea și scalabilitatea. Care au fost principalele descoperiri tehnice care au permis Lumai să depășească aceste bariere?

Provocarea nu a fost niciodată demonstrarea că optica poate efectua calcul – cercetătorii au arătat că, în principiu, de ani de zile. Provocarea a fost să facă acest lucru la scară, în afara laboratorului.

Două lucruri au contat cel mai mult. În primul rând, folosim aceleași componente deja utilizate în centrele de date de astăzi pentru comunicații și rețele. Niciun material exotic, nicio lanț de aprovizionare speculativă. În al doilea rând, am făcut o alegere arhitecturală deliberată de a utiliza o proiectare hibridă, combinând motorul tensorial optic cu procesarea digitală pentru controlul sistemului și software.

Sistemul dvs. folosește o abordare hibridă, combinând componente optice și digitale. Cât de importantă este această echilibru pentru a face calculul optic practic pentru implementarea în centrele de date reale?

Este fundamental. Calculul optic nu înseamnă înlocuirea totul cu lumină. Sistemele digitale sunt extraordinar de bune la control, secvențiere și interfațarea cu ecosistemul software pe care industria l-a construit timp de decenii. Motorul nostru optic excelează la operațiile matematice de bază care domină calculul inferenței. Arhitectura hibridă ne permite fiecărui component să facă ceea ce face cel mai bine.

În ceea ce privește implementarea, aceasta contează enorm. Lumai Iris se integrează în infrastructura existentă a centrelor de date, utilizează interfețe standard și rulează modele reale, inclusiv Llama 8B și 70B, astăzi.

Prin anunțul lansării familiei de servere Lumai Iris, în special serverul Iris Nova, ce semnifică atingerea inferenței în timp real pe modele cu miliarde de parametri pentru viitorul infrastructurii de inteligență artificială?

Acesta semnifică faptul că calculul optic a trecut de la cercetare la realitate. Rularea modelelor cu miliarde de parametri în timp real este punctul de referință de care avea nevoie industria. Familia de servere Lumai Iris cuprinde trei servere: Nova, Aura și Tetra. Lumai Iris Nova, primul server din familie, este disponibil pentru evaluare acum, și suntem deja implicați cu parteneri care doresc să-l pună la lucru împotriva unor sarcini reale de inferență.

Mai larg, acesta semnifică faptul că traiectoria infrastructurii de inteligență artificială este pe cale să se schimbe. Presupunerea a fost că scalarea inferenței înseamnă cumpărarea de mai multe GPU-uri, atragerea mai multă putere, construirea de centre de date mai mari. Lumai Iris Nova arată că există o altă cale – una care oferă performanță dramatic mai mare pe kilowatt și o structură de cost fundamental diferită pe token. Pe măsură ce familia de servere Lumai Iris se dezvoltă, implicațiile pentru modul în care hyperscalers și întreprinderile gândesc despre achiziționarea de calcul vor fi semnificative.

Comunicatul de presă subliniază până la 90% reducere a consumului de energie în comparație cu sistemele tradiționale. Cât de semnificativă este această descoperire în contextul constrângerilor energetice crescânde cu care se confruntă centrele de date globale?

Constrângerea energetică este provocarea de infrastructură definitorie a erei inteligenței artificiale – capacitatea de putere este deja un factor limitativ pentru planurile de implementare, și am lovit peretele de putere numit.

În acest context, o reducere cu 90% a consumului de energie schimbă fundamental economia și fezabilitatea inteligenței artificiale la scară. Un singur sistem Lumai poate înlocui zeci de GPU-uri consumatoare de energie, ceea ce se traduce printr-o schimbare semnificativă a ceea ce este realizabil într-un anumit cadru de putere.

Există, de asemenea, o dimensiune de cost: costurile de construire a centrelor de date reflectă capacitatea de putere, deci un centru de date cu consum redus de energie costă mai puțin să fie construit. Reducerea consumului de energie reduce direct costul pe token – care este, în cele din urmă, ceea ce face inteligența artificială viabilă din punct de vedere economic la scala pe care industria se îndreaptă.

Privind înainte, pe măsură ce industria începe să vorbească despre o eră post-siliciu, cum vedeți evoluția calculului optic în următorul deceniu, și ce rol va juca Lumai în modelarea acestei tranziții?

Era post-siliciu a început deja, și se întâmplă în același timp cu trecerea la era inferenței și cererea continuă de performanță mai mare la un cost mai mic pe token. Siliciul va continua, desigur, să joace un rol, dar presupunerea că fiecare generație de îmbunătățire a calculului provine din avansarea nodurilor de siliciu nu mai este credibilă la ritmul cerut de inteligența artificială. Viziunea noastră este o lume în care costul energetic al inteligenței scade, și în care un centru de date de scară megawatt poate genera același volum de token ca o instalație de scară gigawatt de astăzi.

Acea viitor nu este o speculație îndepărtată. Am construit primul sistem care demonstrează că calculul optic funcționează la scară. Totul de aici înainte este inginerie.

Mulțumim pentru acest interviu minunat, cititorii care doresc să afle mai multe despre Lumai pot vizita Lumai.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.