Leader del pensiero
I mega modelli non sono il fulcro della crisi informatica

Ogni volta che viene lanciato un nuovo modello di intelligenza artificiale – aggiornamenti GPT, DeepSeek, Gemini – le persone rimangono a bocca aperta di fronte alle dimensioni, alla complessità e, sempre più, alla fame di elaborazione di questi mega-modelli. Il presupposto è che questi modelli stiano definendo il fabbisogno di risorse della rivoluzione dell'intelligenza artificiale.
Questa supposizione è sbagliata.
Sì, i modelli di grandi dimensioni richiedono molta potenza di calcolo. Ma la maggiore pressione sull'infrastruttura di intelligenza artificiale non deriva da una manciata di mega-modelli, bensì dalla silenziosa proliferazione di modelli di intelligenza artificiale in tutti i settori, ognuno ottimizzato per applicazioni specifiche e che consuma risorse di calcolo su una scala senza precedenti.
Nonostante la potenziale competizione tra i LLM, il panorama dell'IA in generale non si sta centralizzando, ma frammentando. Ogni azienda non si limita a utilizzare l'IA: sta anche addestrando, personalizzando e implementando modelli privati su misura per le proprie esigenze. È quest'ultima situazione che creerà una curva di domanda infrastrutturale per la quale i provider cloud, le aziende e i governi non sono pronti.
Abbiamo già visto questo schema in passato. Il cloud non ha consolidato i carichi di lavoro IT; ha creato un ecosistema ibrido tentacolare. Prima, la proliferazione incontrollata dei server. Poi la proliferazione delle VM. Ora? La proliferazione dell'intelligenza artificiale. Ogni ondata di elaborazione ha portato alla proliferazione, non alla semplificazione. L'intelligenza artificiale non fa eccezione.
Espansione dell'IA: perché il futuro dell'IA è un milione di modelli, non uno
Finanza, logistica, sicurezza informatica, assistenza clienti, ricerca e sviluppo: ognuno ha il proprio modello di intelligenza artificiale ottimizzato per la propria funzione. Le organizzazioni non stanno addestrando un solo modello di intelligenza artificiale per governare l'intera attività. Ne stanno addestrando migliaia. Ciò significa più cicli di addestramento, più elaborazione, maggiore richiesta di storage e maggiore espansione delle infrastrutture.
Non si tratta di teoria. Anche nei settori tradizionalmente cauti nell'adozione della tecnologia, gli investimenti nell'IA stanno accelerando. Un rapporto McKinsey del 2024 ha rilevato che le organizzazioni ora utilizzano l'IA in media in tre funzioni aziendali, con produzione, supply chain e sviluppo prodotto in testa.McKinsey).
L'assistenza sanitaria ne è un esempio lampante. Navina, una startup che integra l'intelligenza artificiale nelle cartelle cliniche elettroniche per ottenere informazioni cliniche, ha appena raccolto 55 milioni di dollari in finanziamenti di serie C da Goldman Sachs (Business Insider). L’energia non è diversa: i leader del settore hanno lanciato l’Open Power AI Consortium per portare l’ottimizzazione dell’intelligenza artificiale nelle operazioni di rete e degli impianti (Axios).
Lo stress informatico di cui nessuno parla
L'intelligenza artificiale sta già rompendo i modelli infrastrutturali tradizionali. L'ipotesi che il cloud possa scalare all'infinito per supportare la crescita dell'intelligenza artificiale è completamente sbagliata. L'intelligenza artificiale non scala come i carichi di lavoro tradizionali. La curva di domanda non è graduale, ma esponenziale, e gli hyperscaler non riescono a tenere il passo.
- Vincoli di potere:I data center specifici per l'intelligenza artificiale vengono ora costruiti tenendo conto della disponibilità di energia, non solo delle dorsali di rete.
- Colli di bottiglia della rete:Gli ambienti IT ibridi stanno diventando ingestibili senza automazione, situazione che i carichi di lavoro dell'intelligenza artificiale non faranno che aggravare.
- Pressione economica:I carichi di lavoro dell'intelligenza artificiale possono consumare milioni di dollari in un solo mese, creando imprevedibilità finanziaria.
I data center rappresentano già l'1% del consumo globale di elettricità. In Irlanda, consumano ormai il 20% della rete elettrica nazionale, una quota destinata ad aumentare significativamente entro il 2030 (AIE).
A ciò si aggiunga l'incombente pressione sulle GPU. Bain & Company ha recentemente avvertito che la crescita dell'intelligenza artificiale sta preparando il terreno per una carenza di semiconduttori, alimentata dalla domanda esplosiva di chip di livello data center (Bain).
Nel frattempo, il problema della sostenibilità dell'intelligenza artificiale cresce. Un'analisi del 2024 in Città e società sostenibili avverte che l'adozione diffusa dell'intelligenza artificiale nel settore sanitario potrebbe aumentare sostanzialmente il consumo energetico e le emissioni di carbonio del settore, a meno che non venga compensata da efficienze mirate (ScienceDirect).
L'espansione dell'intelligenza artificiale è più grande del mercato: è una questione di potere statale
Se pensate che la proliferazione incontrollata dell'IA sia un problema aziendale, ripensateci. Il principale motore della frammentazione dell'IA non è il settore privato, ma i governi e le agenzie di difesa militare, che implementano l'IA su una scala che nessun hyperscaler o azienda può eguagliare.
Solo il governo degli Stati Uniti ha implementato l'intelligenza artificiale in oltre 700 applicazioni in 27 agenzie, coprendo analisi di intelligence, logistica e altro ancora (Rivista FedTech).
Il Canada sta investendo fino a 700 milioni di dollari per espandere la capacità di calcolo dell'intelligenza artificiale nazionale, lanciando una sfida nazionale per rafforzare l'infrastruttura dei data center sovrani (Innovazione, scienza e sviluppo economico Canada).
E si moltiplicano le richieste per un “programma Apollo” per le infrastrutture di intelligenza artificiale, evidenziando l’elevazione dell’intelligenza artificiale da vantaggio commerciale a imperativo nazionale (MIT Technology Review).
L'IA militare non sarà efficiente, coordinata o ottimizzata in termini di costi: sarà guidata da obblighi di sicurezza nazionale, urgenza geopolitica e dalla necessità di sistemi di IA chiusi e sovrani. Anche se le aziende frenassero la proliferazione incontrollata dell'IA, chi direbbe ai governi di rallentare?
Perché quando è in gioco la sicurezza nazionale, nessuno si ferma a chiedersi se la rete elettrica è in grado di gestirla.