Connect with us

Lumai onthult optische AI-server voor de volgende generatie inference

Kunstmatige intelligentie

Lumai onthult optische AI-server voor de volgende generatie inference

mm

Lumai heeft aangekondigd wat het beschrijft als een belangrijke stap voorwaarts in AI-infrastructuur: een optisch computersysteem dat in staat is om billion-parameter large language models in real-time uit te voeren. Het nieuwe systeem, genaamd Iris Nova, markeert een verschuiving weg van traditionele siliconen-gebaseerde verwerking naar een fundamenteel andere aanpak gebaseerd op licht.

De aankondiging komt op een moment dat de AI-industrie snel overgaat van modeltraining naar implementatie op grote schaal, waardoor een ongekende druk op de bestaande compute-infrastructuur ontstaat.

Verder gaan dan siliciumbeperkingen

Gedurende jaren is de vooruitgang in AI sterk afhankelijk geweest van de vooruitgang in siliciumchips, met name GPUs. Maar dit model begint tekenen van spanning te vertonen. Het energieverbruik stijgt scherp en prestatiewinsten worden moeilijker te behalen zonder aanzienlijk meer kosten en energievraag.

Lumai’s aanpak vervangt elektronen door fotonen. In plaats van berekeningen uit te voeren via elektrische signalen, gebruikt het systeem licht om gegevens te verwerken. Dit maakt een enorme parallelle verwerking mogelijk, waarbij miljoenen operaties tegelijkertijd in driedimensionale ruimte kunnen plaatsvinden in plaats van over vlakke siliciumoppervlakken.

Volgens het bedrijf kan deze architectuur aanzienlijk hogere doorvoersnelheden bieden en het energieverbruik met tot 90% verminderen in vergelijking met conventionele systemen.

De groeiende druk op datacenters

De timing van deze lancering weerspiegelt bredere industrie-uitdagingen. AI-werklasten breiden zich snel uit, met name in inference, wat het uitvoeren van getrainde modellen in real-world toepassingen inhoudt.

Datacenters worden steeds vaker beperkt door de beschikbaarheid van stroom. De wereldwijde vraag naar datacenter-energie zal naar verwachting dubbel zijn tegen het einde van het decennium, waardoor exploitanten worden gedwongen om onconventionele oplossingen te zoeken, zoals speciale stroomopwekking en alternatieve energievormen.

Tegelijkertijd wordt het schalen van traditionele hardware minder efficiënt. Elke nieuwe generatie silicium biedt incrementele verbeteringen, maar vereist vaak onevenredig meer energie en koeling.

Lumai positioneert optische computing als een manier om deze beperkingen volledig te omzeilen in plaats van ze incrementeel te verbeteren.

Hoe Iris Nova werkt

Het Iris Nova-systeem gebruikt een hybride architectuur die optische en digitale componenten combineert. De optische motor verwerkt de kernwiskundige operaties die AI-modellen aandrijven, terwijl conventionele digitale systemen software- en controlefuncties beheren.

Deze ontwerpkeuze maakt het mogelijk om het systeem te integreren in bestaande datacenter-omgevingen zonder dat een complete herziening van de infrastructuur nodig is.

Een van de gebieden waarop het systeem bijzonder is geoptimaliseerd, is de “prefill”-fase van inference, waarin modellen grote hoeveelheden invoergegevens verwerken voordat ze antwoorden genereren. Door deze fase te versnellen, beoogt het systeem de algehele doorvoersnelheid en efficiëntie te verbeteren.

Lumai meldt dat Iris Nova modellen zoals Llama 8B en 70B in real-time kan uitvoeren, wat suggereert dat het in staat is om productieschaal-werklasten aan te pakken en niet alleen experimentele use-cases.

Een verschuiving naar de inference-era

De lancering weerspiegelt een bredere verschuiving in AI-prioriteiten. Terwijl het trainen van steeds grotere modellen de headlines heeft gedomineerd, wordt de real-world impact van AI nu gedefinieerd door inference – hoe efficiënt deze modellen kunnen worden geïmplementeerd en geschaald.

Deze verschuiving legt knelpunten bloot die minder zichtbaar waren tijdens de trainingsfase. Inference-werklasten zijn continu, latency-gevoelig en energievraag, waardoor efficiëntie een kritische factor wordt.

Lumai’s systeem is specifiek ontworpen voor deze fase, met een focus op doorvoersnelheid per watt in plaats van alleen brute rekenkracht.

Vroeg toegang en industrie-implicaties

De Iris Nova-server is nu beschikbaar voor evaluatie door hyperscalers, ondernemingen en onderzoeksinstellingen. Aanvullende systemen in de Iris-familie, waaronder Aura en Tetra, worden verwacht om te volgen, waardoor de prestaties en implementatie-opties worden uitgebreid.

Als optische computing zijn beloften op grote schaal kan waarmaken, kan het de economie van AI-infrastructuur herdefiniëren. Lagere energievraag en hogere efficiëntie zouden niet alleen operationele kosten verlagen, maar ook de groeiende bezorgdheid over de milieueffecten van AI aanpakken.

Hoewel het nog onduidelijk is hoe snel de technologie zal worden overgenomen, benadrukt Lumai’s aankondiging een duidelijke richting: de toekomst van AI-computing hoeft niet alleen te zijn gebouwd op silicium.

Antoine is een visionaire leider en oprichtend partner van Unite.AI, gedreven door een onwankelbare passie voor het vormgeven en promoten van de toekomst van AI en robotica. Een seriële ondernemer, hij gelooft dat AI net zo disruptief voor de samenleving zal zijn als elektriciteit, en wordt vaak betrapt op het enthousiast praten over het potentieel van disruptieve technologieën en AGI. Als een futurist, is hij toegewijd aan het onderzoeken van hoe deze innovaties onze wereld zullen vormgeven. Bovendien is hij de oprichter van Securities.io, een platform dat zich richt op investeren in cutting-edge technologieën die de toekomst opnieuw definiëren en hele sectoren herschappen.