Intelligenza artificiale
Lumai Presenta il Server di Intelligenza Artificiale Ottico per Potenziare l’Era Successiva dell’Inferenza

Lumai ha annunciato un importante passo avanti nell’infrastruttura di intelligenza artificiale: un sistema di calcolo ottico in grado di eseguire modelli di linguaggio grandi come un miliardo di parametri in tempo reale. Il nuovo sistema, chiamato Iris Nova, segnala un passaggio dalle tradizionali tecnologie di elaborazione basate su silicio verso un approccio fondamentalmente diverso basato sulla luce.
L’annuncio arriva in un momento in cui l’industria dell’intelligenza artificiale sta passando rapidamente dalla formazione dei modelli alla loro distribuzione su larga scala, ponendo una pressione senza precedenti sull’infrastruttura di calcolo esistente.
Superare i Limiti del Silicio
Per anni, i progressi dell’intelligenza artificiale hanno fatto affidamento pesantemente sui progressi delle schede di silicio, in particolare le GPU. Tuttavia, questo modello inizia a mostrare segni di affaticamento. Il consumo di energia sta aumentando rapidamente e i guadagni di prestazioni stanno diventando più difficili da ottenere senza aumentare significativamente i costi e i requisiti energetici.
L’approccio di Lumai sostituisce gli elettroni con i fotoni. Invece di eseguire calcoli attraverso segnali elettrici, il suo sistema utilizza la luce per elaborare i dati. Ciò consente un parallelismo massiccio, dove milioni di operazioni possono verificarsi simultaneamente nello spazio tridimensionale anziché su superfici piatte di silicio.
Secondo l’azienda, questa architettura può offrire un throughput significativamente più alto riducendo il consumo di energia fino al 90% rispetto ai sistemi convenzionali.
La Pressione Crescente sui Data Center
Il momento di questo lancio riflette le sfide più ampie dell’industria. I carichi di lavoro dell’intelligenza artificiale stanno aumentando rapidamente, in particolare nell’inferenza, che consiste nell’esecuzione di modelli formati in applicazioni del mondo reale.
I data center sono sempre più vincolati dalla disponibilità di energia. La domanda globale di energia per i data center è prevista raddoppiare entro la fine del decennio, costringendo gli operatori a esplorare soluzioni non convenzionali come la generazione di energia dedicata e fonti di energia alternative.
Allo stesso tempo, la scalabilità del hardware tradizionale sta diventando meno efficiente. Ogni nuova generazione di silicio offre miglioramenti incrementali, ma spesso richiede energia e raffreddamento sproporzionatamente maggiori.
Lumai sta posizionando il calcolo ottico come un modo per superare completamente queste limitazioni anziché migliorarle in modo incrementale.
Come Funziona Iris Nova
Il sistema Iris Nova utilizza un’architettura ibrida che combina componenti ottici e digitali. Il motore ottico gestisce le operazioni matematiche di base che alimentano i modelli di intelligenza artificiale, mentre i sistemi digitali convenzionali gestiscono le funzioni software e di controllo.
Questo design consente al sistema di integrarsi negli ambienti dei data center esistenti senza richiedere una completa revisione dell’infrastruttura.
Un’area in cui il sistema è particolarmente ottimizzato è la fase di “prefill” dell’inferenza, dove i modelli elaborano grandi quantità di dati di input prima di generare risposte. Accelerando questa fase, il sistema mira a migliorare il throughput e l’efficienza complessivi.
Lumai riporta che Iris Nova può eseguire modelli come Llama 8B e 70B in tempo reale, suggerendo che è in grado di gestire carichi di lavoro di produzione su larga scala anziché solo casi d’uso sperimentali.
Un Passaggio Verso l’Era dell’Inferenza
Il lancio riflette un passaggio più ampio nelle priorità dell’intelligenza artificiale. Mentre la formazione di modelli sempre più grandi ha dominato i titoli, l’impatto reale dell’intelligenza artificiale è ora definito dall’inferenza – quanto efficientemente quei modelli possono essere distribuiti e scalati.
Questo passaggio sta esponendo collo di bottiglia che erano meno visibili durante la fase di formazione. I carichi di lavoro dell’inferenza sono continui, sensibili alla latenza e intensivi in termini di energia, rendendo l’efficienza un fattore critico.
Il sistema di Lumai è progettato specificamente per questa fase, concentrandosi sul throughput per watt anziché sulla sola potenza di calcolo.
Accesso Anticipato e Implicazioni per l’Industria
Il server Iris Nova è ora disponibile per la valutazione da parte di hyperscaler, aziende e istituti di ricerca. Sistemi aggiuntivi nella famiglia Iris, tra cui Aura e Tetra, sono previsti per seguire, ampliando le opzioni di prestazioni e distribuzione.
Se il calcolo ottico può mantenere le sue promesse su larga scala, potrebbe ridisegnare l’economia dell’infrastruttura di intelligenza artificiale. Un minor consumo di energia e una maggiore efficienza non solo ridurrebbero i costi operativi, ma affronterebbero anche le crescenti preoccupazioni relative all’impatto ambientale dell’intelligenza artificiale.
Sebbene non sia ancora chiaro quanto rapidamente la tecnologia verrà adottata, l’annuncio di Lumai sottolinea una direzione chiara: il futuro del calcolo dell’intelligenza artificiale potrebbe non essere costruito solo sul silicio.












