Künstliche Intelligenz
Lumai stellt optischen AI-Server vor, um die nächste Ära der Inferenz zu ermöglichen

Lumai hat bekannt gegeben, was es als einen großen Schritt vorwärts in der AI-Infrastruktur bezeichnet: ein optisches Computersystem, das in der Lage ist, Billionen-Parameter-große Sprachmodelle in Echtzeit auszuführen. Das neue System, genannt Iris Nova, signalisiert einen Wechsel weg von herkömmlichen siliziumbasierten Prozessoren hin zu einem grundlegend anderen Ansatz, der auf Licht basiert.
Die Ankündigung erfolgt zu einem Zeitpunkt, an dem die AI-Branche rapide von der Modellierung zur Bereitstellung im großen Maßstab wechselt, was einen beispiellosen Druck auf die bestehende Recheninfrastruktur ausübt.
Jenseits der Silizium-Beschränkungen
Jahrelang hat der Fortschritt in der AI stark auf den Fortschritten in Silizium-Chips, insbesondere GPUs, basiert. Doch dieses Modell beginnt, Anzeichen von Belastung zu zeigen. Der Stromverbrauch steigt stark an, und Leistungssteigerungen werden ohne signifikante Erhöhung der Kosten und Energieanforderungen immer schwieriger zu erreichen.
Lumais Ansatz ersetzt Elektronen durch Photonen. Anstatt Berechnungen durch elektrische Signale durchzuführen, verwendet sein System Licht, um Daten zu verarbeiten. Dies ermöglicht eine massive Parallelität, bei der Millionen von Operationen gleichzeitig in einem dreidimensionalen Raum und nicht auf flachen Silizium-Oberflächen durchgeführt werden können.
Laut dem Unternehmen kann diese Architektur eine wesentlich höhere Durchsatzleistung liefern, während der Energieverbrauch um bis zu 90% im Vergleich zu herkömmlichen Systemen reduziert wird.
Der wachsende Druck auf Rechenzentren
Die Timing dieser Veröffentlichung spiegelt die breiteren Branchenherausforderungen wider. AI-Workloads expandieren rapide, insbesondere in der Inferenz, die das Ausführen trainierter Modelle in realen Anwendungen beinhaltet.
Rechenzentren sind zunehmend durch die Verfügbarkeit von Strom eingeschränkt. Die globale Nachfrage nach Rechenzentrumsenergie wird bis zum Ende des Jahrzehnts verdoppeln, was die Betreiber zwingt, unkonventionelle Lösungen wie dedizierte Stromerzeugung und alternative Energiequellen zu erkunden.
Gleichzeitig wird das Skalieren herkömmlicher Hardware weniger effizient. Jede neue Generation von Silizium bietet inkrementelle Verbesserungen, erfordert aber oft unverhältnismäßig mehr Energie und Kühlung.
Lumai positioniert optisches Rechnen als Möglichkeit, diese Einschränkungen vollständig zu umgehen, anstatt sie inkrementell zu verbessern.
Wie Iris Nova funktioniert
Das Iris-Nova-System verwendet eine Hybrid-Architektur, die optische und digitale Komponenten kombiniert. Der optische Motor übernimmt die Kernmathematikoperationen, die AI-Modelle antreiben, während herkömmliche digitale Systeme Software- und Steuerungsfunktionen verwalten.
Dieses Design ermöglicht es dem System, sich in bestehende Rechenzentrumsumgebungen zu integrieren, ohne dass eine vollständige Überholung der Infrastruktur erforderlich ist.
Ein Bereich, in dem das System besonders optimiert ist, ist die “Prefill”-Phase der Inferenz, in der Modelle große Mengen an Eingabedaten verarbeiten, bevor sie Antworten generieren. Durch die Beschleunigung dieser Phase zielt das System darauf ab, die Gesamtdurchsatzleistung und -effizienz zu verbessern.
Lumai berichtet, dass Iris Nova Modelle wie Llama 8B und 70B in Echtzeit ausführen kann, was darauf hindeutet, dass es in der Lage ist, produktionsreife Workloads und nicht nur experimentelle Anwendungsfälle zu bewältigen.
Ein Wechsel zur Inferenz-Ära
Die Veröffentlichung spiegelt einen breiteren Wechsel in den AI-Prioritäten wider. Während das Training immer größerer Modelle die Schlagzeilen dominiert hat, wird der realweltliche Einfluss von AI nun durch die Inferenz definiert – wie effizient diese Modelle bereitgestellt und skaliert werden können.
Dieser Wechsel deckt Engpässe auf, die während der Trainingsphase weniger sichtbar waren. Inferenz-Workloads sind kontinuierlich, latenzsensitiv und energieintensiv, was die Effizienz zu einem kritischen Faktor macht.
Lumais System ist speziell für diese Phase konzipiert, wobei der Fokus auf der Durchsatzleistung pro Watt und nicht nur auf der rohen Rechenleistung liegt.
Frühzugang und Branchenimplikationen
Der Iris-Nova-Server ist jetzt für die Bewertung durch Hyperscaler, Unternehmen und Forschungseinrichtungen verfügbar. Weitere Systeme in der Iris-Familie, einschließlich Aura und Tetra, sollen folgen und die Leistung und Bereitstellungsoptionen erweitern.
Wenn optisches Rechnen seine Versprechen im großen Maßstab einhalten kann, könnte es die Ökonomie der AI-Infrastruktur neu gestalten. Ein geringerer Energieverbrauch und eine höhere Effizienz würden nicht nur die Betriebskosten senken, sondern auch die wachsenden Bedenken hinsichtlich der Umweltauswirkungen von AI angehen.
Obwohl es noch unklar ist, wie schnell die Technologie angenommen wird, hebt Lumais Bekanntgabe eine klare Richtung auf: die Zukunft der AI-Berechnung wird möglicherweise nicht allein auf Silizium basieren.












