Kunstmatige intelligentie
Lumai onthult optische AI-server voor de volgende generatie inference

Lumai heeft aangekondigd wat het beschrijft als een belangrijke stap voorwaarts in AI-infrastructuur: een optisch computersysteem dat in staat is om billion-parameter large language models in real-time uit te voeren. Het nieuwe systeem, genaamd Iris Nova, markeert een verschuiving weg van traditionele siliconen-gebaseerde verwerking naar een fundamenteel andere aanpak gebaseerd op licht.
De aankondiging komt op een moment dat de AI-industrie snel overgaat van modeltraining naar implementatie op grote schaal, waardoor een ongekende druk op de bestaande compute-infrastructuur ontstaat.
Verder gaan dan siliciumbeperkingen
Gedurende jaren is de vooruitgang in AI sterk afhankelijk geweest van de vooruitgang in siliciumchips, met name GPUs. Maar dit model begint tekenen van spanning te vertonen. Het energieverbruik stijgt scherp en prestatiewinsten worden moeilijker te behalen zonder aanzienlijk meer kosten en energievraag.
Lumai’s aanpak vervangt elektronen door fotonen. In plaats van berekeningen uit te voeren via elektrische signalen, gebruikt het systeem licht om gegevens te verwerken. Dit maakt een enorme parallelle verwerking mogelijk, waarbij miljoenen operaties tegelijkertijd in driedimensionale ruimte kunnen plaatsvinden in plaats van over vlakke siliciumoppervlakken.
Volgens het bedrijf kan deze architectuur aanzienlijk hogere doorvoersnelheden bieden en het energieverbruik met tot 90% verminderen in vergelijking met conventionele systemen.
De groeiende druk op datacenters
De timing van deze lancering weerspiegelt bredere industrie-uitdagingen. AI-werklasten breiden zich snel uit, met name in inference, wat het uitvoeren van getrainde modellen in real-world toepassingen inhoudt.
Datacenters worden steeds vaker beperkt door de beschikbaarheid van stroom. De wereldwijde vraag naar datacenter-energie zal naar verwachting dubbel zijn tegen het einde van het decennium, waardoor exploitanten worden gedwongen om onconventionele oplossingen te zoeken, zoals speciale stroomopwekking en alternatieve energievormen.
Tegelijkertijd wordt het schalen van traditionele hardware minder efficiënt. Elke nieuwe generatie silicium biedt incrementele verbeteringen, maar vereist vaak onevenredig meer energie en koeling.
Lumai positioneert optische computing als een manier om deze beperkingen volledig te omzeilen in plaats van ze incrementeel te verbeteren.
Hoe Iris Nova werkt
Het Iris Nova-systeem gebruikt een hybride architectuur die optische en digitale componenten combineert. De optische motor verwerkt de kernwiskundige operaties die AI-modellen aandrijven, terwijl conventionele digitale systemen software- en controlefuncties beheren.
Deze ontwerpkeuze maakt het mogelijk om het systeem te integreren in bestaande datacenter-omgevingen zonder dat een complete herziening van de infrastructuur nodig is.
Een van de gebieden waarop het systeem bijzonder is geoptimaliseerd, is de “prefill”-fase van inference, waarin modellen grote hoeveelheden invoergegevens verwerken voordat ze antwoorden genereren. Door deze fase te versnellen, beoogt het systeem de algehele doorvoersnelheid en efficiëntie te verbeteren.
Lumai meldt dat Iris Nova modellen zoals Llama 8B en 70B in real-time kan uitvoeren, wat suggereert dat het in staat is om productieschaal-werklasten aan te pakken en niet alleen experimentele use-cases.
Een verschuiving naar de inference-era
De lancering weerspiegelt een bredere verschuiving in AI-prioriteiten. Terwijl het trainen van steeds grotere modellen de headlines heeft gedomineerd, wordt de real-world impact van AI nu gedefinieerd door inference – hoe efficiënt deze modellen kunnen worden geïmplementeerd en geschaald.
Deze verschuiving legt knelpunten bloot die minder zichtbaar waren tijdens de trainingsfase. Inference-werklasten zijn continu, latency-gevoelig en energievraag, waardoor efficiëntie een kritische factor wordt.
Lumai’s systeem is specifiek ontworpen voor deze fase, met een focus op doorvoersnelheid per watt in plaats van alleen brute rekenkracht.
Vroeg toegang en industrie-implicaties
De Iris Nova-server is nu beschikbaar voor evaluatie door hyperscalers, ondernemingen en onderzoeksinstellingen. Aanvullende systemen in de Iris-familie, waaronder Aura en Tetra, worden verwacht om te volgen, waardoor de prestaties en implementatie-opties worden uitgebreid.
Als optische computing zijn beloften op grote schaal kan waarmaken, kan het de economie van AI-infrastructuur herdefiniëren. Lagere energievraag en hogere efficiëntie zouden niet alleen operationele kosten verlagen, maar ook de groeiende bezorgdheid over de milieueffecten van AI aanpakken.
Hoewel het nog onduidelijk is hoe snel de technologie zal worden overgenomen, benadrukt Lumai’s aankondiging een duidelijke richting: de toekomst van AI-computing hoeft niet alleen te zijn gebouwd op silicium.












