Leader del pensiero

L'era umanoide non sta arrivando: è già qui

Pubblicato il Luglio 30, 2025

Artem Sokolov, Fondatore di Humanoid

All'inizio di questo mese, in Cina, un robot umanoide di nome Shuang Shuang è salito sul palco durante una cerimonia di consegna dei diplomi a una scuola superiore nel Fujian, stringendo mani e deliziando studenti e insegnanti. Momenti come questi rappresentano un cambiamento significativo, in cui i robot umanoidi stanno iniziando a entrare nella vita pubblica in modi molto visibili.

Questi momenti non sono solo un semplice momento di curiosità pubblica: segnalano un passaggio verso l'integrazione con il mondo reale. Questo articolo esplora come gli umanoidi passino dallo spettacolo alla funzionalità, e perché quella che sembra un'impresa esclusivamente hardware riguardi in realtà l'intelligenza integrata che consente a queste macchine di camminare, interagire e apprendere in ambienti non programmati per l'automazione. Discuteremo anche di come affrontiamo la commercializzazione attraverso l'implementazione precoce e partnership a lungo termine.

Come gli umanoidi spingono l'intelligenza artificiale nel mondo reale

Il divario tra prestazioni virtuali e affidabilità fisica rimane una delle sfide più trascurate nell'intelligenza artificiale. Un chatbot può generare paragrafi di testo fluente senza dover mai agire su di essi, allo stesso modo in cui un modello di visione può identificare un passaggio in un'immagine senza doverlo percorrere fisicamente o rischiare di cadere. Gli umanoidi non possono permettersi questo lusso.

Per funzionare nel mondo reale, l'IA deve abbandonare set di dati statici e condizioni controllate. Deve vedere, decidere e agire in ambienti che cambiano di secondo in secondo. Tra questi, pavimenti irregolari, oggetti fuori posto, comportamenti umani imprevedibili e segnali non verbali dipendenti dal contesto. Il risultato è un confronto quotidiano con rumore, ambiguità e potenziali fallimenti.

È qui che il ragionamento incarnato – in cui il linguaggio è fondato su spazio, tempo e conseguenze – inizia a contare più della previsione simbolica. Ad esempio, se un essere umano dice "attenzione, è scivoloso", il robot deve collegare quella frase non solo a una definizione verbale, ma anche alla consapevolezza spaziale, ai potenziali rischi e agli aggiustamenti in tempo reale.

Allo stesso tempo, l'apprendimento multimodale diventa essenziale, perché nessun singolo canale di input è sufficientemente affidabile per funzionare da solo. Una telecamera potrebbe non rilevare una superficie scivolosa, ma i sensori di pressione nel piede possono rilevare un'improvvisa perdita di aderenza. Oppure, in un'altra situazione, il riconoscimento vocale potrebbe fallire in un magazzino rumoroso, ma segnali visivi o gesti possono colmare la lacuna.

Anche la generalizzazione diventa fondamentale. Un robot non può contare sulla visione esatta dell'ambiente due volte. Deve adattare il suo comportamento quando il pavimento è bagnato, l'illuminazione cambia o la scatola non è più dove si trovava ieri. Questo fa la differenza tra un'esecuzione riuscita e un fallimento.

In Humanoid, questo è il motivo per cui iniziamo a testare in anticipo con i partner commerciali. Integriamo i nostri robot in ambienti reali per individuare tempestivamente potenziali difetti e garantire un funzionamento ottimale prima dell'implementazione. Un robot che funziona bene in una simulazione o in una demo non è lo stesso di uno che guadagna fiducia sotto pressione, perché questa fiducia si basa in ultima analisi sull'apprendimento nel mondo reale.

Sappiamo che gli umanoidi saranno disponibili in commercio entro i prossimi due anni, ma non aspettiamo. Per noi, la commercializzazione inizia presto. Significa costruire partnership a lungo termine basate su casi d'uso reali. Attraverso una serie di programmi pilota, non solo formiamo i nostri partner sulla tecnologia, ma impariamo anche insieme a loro. Questo processo di apprendimento condiviso ci aiuta anche a perfezionare le strutture dei costi e l'affidabilità delle prestazioni fin dal primo giorno, garantendo il miglior costo totale di proprietà (TCO) possibile man mano che i sistemi crescono.

Perché gli umanoidi sono il banco di prova definitivo per l'intelligenza generale

Il mondo che abbiamo creato negli ultimi cento anni è su misura per l'uomo. Maniglie delle porte, carrelli elevatori, magazzini: tutto assume determinate dimensioni, gamme di movimento e comportamenti sociali impliciti. Gli umanoidi devono adattarsi a questa realtà o rischiano di essere estremamente limitati nelle loro funzionalità.

Per salire le scale, trasportare un oggetto, interpretare un gesto di indicazione o riconoscere un'esitazione in una voce, un robot deve comprendere il contesto ben oltre la classificazione visiva o la pianificazione di movimenti programmati. Deve dedurre l'intenzione, apprendere un nuovo compito osservando un essere umano, adattare tale abilità a una configurazione leggermente diversa e migliorare le proprie prestazioni nel tempo. In pratica, questo sistema sta effettivamente ampliando ciò che l'IA può fare in condizioni di vincoli reali.

In Humanoid, acceleriamo questo processo attraverso la teleoperazione. Nelle prime fasi di sviluppo, gli operatori umani guidano il robot in compiti chiave. Questi dati pratici diventano la base per l'addestramento di nuovi comportamenti. Nel tempo, queste dimostrazioni alimentano i nostri modelli end-to-end, aiutandoci a raggiungere un'autonomia affidabile.

Dai sistemi ristretti all'intelligenza integrata

La maggior parte dei sistemi di intelligenza artificiale odierni eccelle in compiti specifici. Isolati, ognuno di essi funziona bene. Ma gli umanoidi non hanno bisogno di specialisti isolati. Per integrarsi con successo, abbiamo bisogno di sistemi in grado di ragionare in modo trasversale, sia in modalità che in tempi diversi.

Un umanoide potrebbe ricevere un'istruzione relativamente vaga (ad esempio "Vai a prendermi la scatola gialla dal ripostiglio dall'altra parte del corridoio") e doverla decodificare in una sequenza di sotto-attività: localizzare chi parla, orientarsi in un corridoio, identificare la scatola giusta, regolare la forza della presa, evitare collisioni e, naturalmente, tornare sano e salvo.

Ogni parte di questa sequenza coinvolge un sottosistema diverso: visione, locomozione, linguaggio, manipolazione e feedback. E l'affidabilità dell'insieme dipende da quanto bene queste parti comunicano in condizioni mutevoli.

L'architettura modulare è un modo per affrontare questa sfida. Questo ci consente di iterare sui sottosistemi in modo indipendente, mantenendo comunque il coordinamento a livello di sistema. Inoltre, ci consente di scalare le funzionalità su più ambienti senza dover ricostruire il progetto da zero. È così che passiamo dalle demo chiuse alle prestazioni open-world.

La posta in gioco è enorme e globale

È facile definire gli umanoidi come futuristici. Ma quando parliamo con i nostri clienti, la necessità è immediata. Molti magazzini, catene di montaggio e altri luoghi di lavoro un tempo affollati ora faticano a mantenere il personale.

Questa carenza di manodopera è dovuta a problemi demografici. In Giappone, quasi il 30% della popolazione ha più di 65 anniIn Europa, i settori chiave, che hanno un impatto combinato libro paga di 1.7 trilioni di dollari - siamo difficoltà a reclutare lavoratori più giovaniQuesti non sono i ruoli che la maggior parte delle persone desidera e, sempre più spesso, non sono nemmeno i ruoli che le persone sono disposte a ricoprire.

Offrendosi come aiuto, non come sostituti, gli umanoidi possono svolgere compiti fisicamente impegnativi, ripetitivi o pericolosi – spostare l'inventario, caricare pallet, azionare macchinari – senza il rischio di affaticamento o infortuni. Questo consente ai lavoratori umani di concentrarsi su aspetti più complessi, creativi o interpersonali del lavoro.

Inoltre, questo crea resilienza economica a lungo termine. Quando la manodopera è volatile o indisponibile, le macchine intelligenti possono contribuire a garantire la continuità, il tutto senza sacrificare sicurezza, qualità o adattabilità.

Un altro aspetto da evidenziare è il quadro normativo. La maggior parte dei team, soprattutto nelle giurisdizioni poco regolamentate, aspetta a pensarci. Noi siamo partiti da lì. Le leggi europee sulla sicurezza e sui dati sono tra le più severe al mondo, ma invece di trattarle come ostacoli, le consideriamo un vantaggio competitivo. Man mano che altri mercati adotteranno normative più severe, saremo pronti ad adeguarci, mentre altre aziende potrebbero arrancare.

Una nuova razza di intelligenza artificiale, ma non quella che pensi

Gran parte del dibattito odierno sull'intelligenza artificiale si concentra sulla potenza di calcolo, sui parametri e sui dati di addestramento. Ma la vera svolta potrebbe arrivare da una frontiera diversa: l'integrazione nel mondo fisico. È lì che l'intelligenza deve imparare a funzionare, invece di limitarsi a prevedere.

A questo proposito, la gara si gioca sul sistema più efficiente, in grado di operare in spazi pubblici, nel rispetto dei limiti di sicurezza e con l'intervento umano. Questo sistema, oltre ad apprendere dai dati, imparerà anche – e soprattutto – dalla realtà e lavorerà a stretto contatto con le persone senza interrompere il flusso delle cose.

Ecco perché non aspettiamo l'implementazione per iniziare. Fin dall'inizio, collaboriamo direttamente con i partner commerciali per integrarli in ambienti reali, garantendo che il sistema migliori dove più conta: nella pratica.

Questo tipo di apprendimento nel mondo reale è esattamente il punto in cui i sistemi ristretti falliscono. Sebbene ci abbiano portato lontano, non sono mai stati progettati per questo tipo di complessità. Gli umanoidi richiedono qualcos'altro: coordinamento, robustezza e, come detto, la capacità di imparare dall'imprevisto.

Questa è la grande opportunità che abbiamo davanti. Non automatizzare tutto, ma costruire macchine in grado di comprendere, navigare e collaborare con il mondo umano.

Argomenti correlati:umanoide Robotica

Artem Sokolov, fondatore di Humanoid

Artem Sokolov è il fondatore di Umanoide, nonché investitore e imprenditore globale. Ha rilevato con successo l'azienda di famiglia e l'ha portata a una valutazione di 1 miliardo di dollari. In seguito ha fondato Humanoid per costruire robot umanoidi sicuri e affidabili che liberassero gli esseri umani da lavori fisicamente impegnativi. Oggi guida un team di oltre 130 professionisti provenienti da alcune delle principali aziende tecnologiche mondiali, apportando una competenza tecnica di livello mondiale per progettare il futuro della collaborazione uomo-macchina.

Unite.AI