Wywiady
Dr. Xianxin Guo, CEO i współzałożyciel Lumai – seria wywiadów

Dr. Xianxin Guo, CEO i współzałożyciel Lumai, jest fizykiem i przedsiębiorcą z branży deep-tech, specjalizującym się w optycznych komputerach i sprzęcie AI, z tytułem doktora w dziedzinie fizyki kwantowej i optyki nieliniowej na Uniwersytecie Nauki i Technologii w Hongkongu. Wcześniej pełnił role badawcze, w tym stanowisko postdoktoranckie na Uniwersytecie w Calgary i stypendium badawcze 1851 na Uniwersytecie w Oksfordzie, gdzie przyczynił się do postępów w dziedzinie fotoniki i przyspieszania AI. Awansując w Lumai od kierownika badań do CEO, jest głównym wynalazcą technologii rdzeniowej firmy i posiada ponad dekadę doświadczenia na styku fizyki, uczenia maszynowego i zaawansowanych systemów komputerowych.
Lumai to spin-off Uniwersytetu w Oksfordzie, rozwijający następną generację procesorów AI opartych na 3D optycznych komputerach, wykorzystujących światło zamiast prądu do wykonywania kluczowych obliczeń AI. Jego technologia jest zaprojektowana do przyspieszania operacji macierzy, które są podstawą nowoczesnych modeli AI, dostarczając znacznie szybsze prędkości przetwarzania przy jednoczesnym zmniejszeniu zużycia energii w porównaniu z tradycyjnymi procesorami GPU opartymi na krzemie. Poprzez integrację obliczeń optycznych w istniejące środowiska centrów danych, Lumai ma na celu umożliwić bardziej skalowalne i ekonomiczne wdrożenie AI, rozwiązując rosnące ograniczenia związane z mocą obliczeniową i zużyciem energii w dużych systemach AI.
Rozpocząłeś swoją karierę w fizyce kwantowej i optyce nieliniowej, później zostając stypendystą badawczym 1851 na Uniwersytecie w Oksfordzie, zanim współzałożyłeś Lumai. Jaki był decydujący moment, kiedy zrozumiałeś, że optyczne komputery mogą przenieść się z teorii akademickiej do komercyjnie wykonalnej firmy?
Podczas mojego pobytu na Uniwersytecie w Oksfordzie, badaliśmy, jak właściwości światła w przestrzeni swobodnej mogą być wykorzystane do rozwiązania rodzajów operacji macierzy, które są podstawą uczenia maszynowego. W tym samym czasie, ograniczenia konwencjonalnego sprzętu AI stawały się coraz bardziej istotne. Zbieżność tych wyzwań, które rozwiązaлиśmy w naszych badaniach, i potrzeba bardziej wydajnych obliczeń dały nam pewność, że możemy wziąć nasze pomysły i rozwiązać prawdziwe problemy świata.
Przeszliśmy długą drogę od tego początkowego badania – w Lumai zbudowaliśmy już pierwszy na świecie system komputerowy optycznego, który może uruchamiać miliardowe parametry LLM w czasie rzeczywistym.
Lumai rozwiązuje jeden z największych problemów w AI dzisiaj, limity energii i skalowalności komputerów opartych na krzemie. Jakie konkretnie ograniczenia w tradycyjnych architekturach skierowały cię ku fundamentalnie odmiennemu podejściu wykorzystującemu światło?
To, co nas skierowało, to ograniczona trajektoria rozwiązań krzemowych. Z krzemem widzimy stopniowe zyski, ale przychodzą one z nieproporcjonalnymi wzrostami mocy i złożoności. Ograniczenie skalowania krzemowego jest głównie spowodowane fizyką – częstotliwości nie zwiększają się, a liczba tranzystorów, które mogą być przełączane, jest ograniczona przez czynniki termiczne. Prądy przeciekujące nadal stanowią problem. Szacuje się, że krzem przyczynia się tylko do 25% wzrostu wydajności rocznie.
W tym momencie ma sens zapytać, czy inny nośnik fizyczny mógłby obsłużyć te operacje w sposób bardziej naturalny, zamiast dalszego forsowania elektronów.
Twoja praca koncentruje się na optycznych komputerach i uczeniu maszynowym. Jak wykorzystywanie fotonów zamiast elektronów zmienia fundamentalnie sposób, w jaki obliczenia zachodzą na poziomie sprzętu?
Z elektronami, obliczenia są intrinsicznie sekwencyjne i stratne – przełączasz tranzystory, przenosisz ładunek, generujesz ciepło. Każda operacja ma koszt termiczny, a ten koszt kumuluje się.
Fotony zachowują się bardzo inaczej. Światło podróżuje bez tych samych strat rezystancyjnych, a co najważniejsze, wykorzystując właściwości światła, ogromne liczby operacji macierzy mogą być wykonywane równolegle, po prostu strukturyzując, jak wiązki światła oddziałują przez medium fizyczne. Obliczenia zachodzą w samym przewodzeniu światła, a nie w przełączaniu miliardów bramek.
Technologia Lumai wykorzystuje 3D przetwarzanie optyczne i masową równoległość przestrzenną. Jak to architektura umożliwia tak dramatyczne poprawy w przepływności i wydajności w porównaniu z procesorami GPU?
Celem jest wykonanie gęstych mnożeń macierzy jak najszybciej i najwydajniej w jednym cyklu. Podejście Lumai robi to właśnie, wykorzystując światło w trójwymiarowej objętości, wykonując miliony operacji jednocześnie.
Prosto nie można osiągnąć takiego poziomu równoległości w strukturach 2D, gdzie operacje są przetwarzane przez setki rdzeni, wymagając ciągłego przemieszczania danych. To wewnętrzna równoległość – w połączeniu z faktem, że raz w dziedzinie światła, operacje mogą być wykonywane bez spalania mocy – napędza zarówno poprawę przepływności, jak i dramatyczne zmniejszenie zużycia energii na token.
Wiele firm infrastruktury AI nadal koncentruje się na szkoleniu, podczas gdy Lumai koncentruje się na inferencji. Dlaczego uważasz, że inferencja jest definiującym wyzwaniem tej następnej fazy AI?
Inferencja to miejsce, gdzie AI naprawdę robi coś użytecznego – każda odpowiedź na zapytanie, każde zadanie agenta, każdy wygenerowany dokument. Weszliśmy w erę inferencji, a popyt rośnie w tempie, którego sprzęt ukierunkowany na szkolenie nigdy nie był zaprojektowany, aby pochłonąć.
Ekonomika jest również inna: inferencja działa nieprzerwanie, przez miliony użytkowników. Koszt na token staje się definiującą miarą, a to jest miejsce, gdzie ściana energii uderza najmocniej.
Co sprawia, że inferencja jest szczególnie dobrze dopasowana do optycznych komputerów, to fakt, że etap wstępny jest silnie związany z obliczeniami. W tym etapie inferencji rozproszonej pełny kontekst jest przetwarzany przed wygenerowaniem odpowiedzi. To mapuje się prawie idealnie na nasz silnik optyczny i to jest miejsce, gdzie skupiliśmy się najpierw.
Jednym z długotrwałych wyzwań w optycznych komputerach była stabilność i skalowalność. Jakie były kluczowe przełomy techniczne, które pozwoliły Lumai na pokonanie tych barier?
Wyzwaniem nie było udowodnienie, że optyka może wykonywać obliczenia – badacze pokazali to w zasadzie przez lata. Wyzwaniem było to, aby to działało w skali, poza laboratorium.
Dwie rzeczy były najważniejsze. Po pierwsze, wykorzystujemy te same komponenty, które są już wdrożone w centrach danych dzisiaj do komunikacji i sieci. Żadnych egzotycznych materiałów, żadnej spekulatywnej łańcuchy dostaw. Po drugie, podjęliśmy świadomą decyzję architektoniczną, aby wykorzystać hybrydowy projekt, łącząc optyczny silnik tensorowy z przetwarzaniem cyfrowym dla kontroli systemu i oprogramowania.
Twój system wykorzystuje podejście hybrydowe, łącząc komponenty optyczne i cyfrowe. Jak ważna jest ta równowaga w czynieniu optycznych komputerów praktycznymi dla wdrożenia w środowisku centrum danych?
Jest to fundamentalne. Optyczne komputery nie oznaczają zastąpienia wszystkiego światłem. Systemy cyfrowe są nadzwyczajnie dobre w kontroli, sekwencjonowaniu i interfejsowaniu z ekosystemem oprogramowania, który przemysł zbudował przez dziesięciolecia. Nasz silnik optyczny wyróżnia się w podstawowych operacjach matematycznych, które dominują w obliczeniach inferencji. Architektura hybrydowa pozwala każdemu komponentowi robić to, co robi najlepiej.
Od strony wdrożenia, to ma ogromne znaczenie. Lumai Iris integruje się z istniejącą infrastrukturą centrum danych, wykorzystuje standardowe interfejsy i uruchamia prawdziwe modele, w tym Llama 8B i 70B dzisiaj.
Wraz z ogłoszeniem rodziny serwerów Lumai Iris, szczególnie serwera Iris Nova, co oznacza osiągnięcie inferencji w czasie rzeczywistym na modelach o miliardzie parametrów dla przyszłości infrastruktury AI?
Oznacza to, że optyczne komputery przekroczyły granicę od badań do rzeczywistości. Uruchamianie modeli o miliardzie parametrów w czasie rzeczywistym jest punktem odniesienia, którego potrzebował przemysł. Rodzina serwerów Lumai Iris składa się z trzech serwerów: Nova, Aura i Tetra. Lumai Iris Nova, pierwszy serwer w rodzinie, jest dostępny do oceny teraz, a już angażujemy się z partnerami, którzy chcą go wykorzystać przeciwko prawdziwym obciążeniom inferencji.
W szerszym zakresie, oznacza to, że trajektoria infrastruktury AI jest na punkcie zmiany. Założeniem było, że skalowanie inferencji oznacza kupowanie więcej GPU, pobieranie więcej mocy, budowanie większych centrów danych. Lumai Iris Nova pokazuje, że jest inna ścieżka – ta, która dostarcza dramatycznie lepszą wydajność na kilowat i fundamentalnie inną strukturę kosztów na token. W miarę rozwoju rodziny serwerów Lumai Iris, implikacje dla tego, jak hyperscalers i przedsiębiorstwa myślą o zakupie obliczeń, będą znaczące.
Komunikat prasowy podkreśla do 90% niższe zużycie energii w porównaniu z tradycyjnymi systemami. Jak istotny jest ten przełom w kontekście rosnących ograniczeń energetycznych, z którymi borykają się globalne centra danych?
Ograniczenie energii jest definiującym wyzwaniem infrastruktury ery AI – pojemność mocy jest już czynnikiem ograniczającym plany wdrożeniowe, i uderzyliśmy w tzw. ścianę mocy.
Przeciwko temu tłu, 90% redukcja zużycia energii zmienia fundamentalną ekonomię i wykonalność AI w skali. Jeden system Lumai może zastąpić dziesiątki głodnych mocy GPU, co przekłada się na znaczącą zmianę w tym, co jest osiągalne w ramach danego limitu mocy.
Istnieje również wymiar kosztowy: koszty budowy centrum danych odzwierciedlają pojemność mocy, więc centrum danych o niższej mocy kosztuje mniej. Redukując zużycie energii, bezpośrednio redukuje się koszt na token – co ostatecznie sprawia, że AI jest ekonomicznie wykonalna w skali, do której przemysł zmierza.
Spójrzając w przyszłość, gdy przemysł zaczyna mówić o erze po krzemie, jak widzisz ewolucję optycznych komputerów w ciągu najbliższej dekady, i jaką rolę Lumai odegra w kształtowaniu tego przejścia?
Era po krzemie już się zaczyna, i dzieje się to w tym samym czasie, co przejście do ery inferencji i kontynuacja popytu na lepszą wydajność przy niższych kosztach na token. Krzem oczywiście nadal będzie odgrywał rolę, ale założenie, że każde pokolenie poprawy obliczeń pochodzi z postępu węzłów krzemowych, nie jest już wiarygodne w tempie, w jakim AI tego wymaga. Widzimy, że optyczne komputery będą wykorzystywane w kluczowych częściach stosu, gdzie potrzebne jest wysoko równoległe i wydajne przetwarzanie.
Dla Lumai, mapa drogowa polega na dalszym pchaniu gęstości, wydajności i możliwości obliczeń optycznych i wdrażaniu ich w centra danych. Wizja to świat, w którym koszt energii inteligencji spada, a centrum danych o mocy megawatowej może wygenerować taki sam wolumen tokenów, jaki centrum danych o mocy gigawatowej generuje dzisiaj.
-Ta przyszłość nie jest odległą spekulacją. Zbudowaliśmy pierwszy system, który udowadnia, że optyczne komputery działają w skali. Wszystko od tego momentu to inżynieria. Dziękuję za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić Lumai.












