Leader del pensiero

Dentro la nuova corsa alla robotica: dati, modelli e produzione

Pubblicato il 16 Marzo 2026

Michael Abramov, Fondatore e CEO di Introspector

L'innovazione raramente emerge in isolamento. Più spesso, nasce da conversazioni tra ingegneri, fondatori, ricercatori e investitori che cercano di capire in quale direzione si sta muovendo la tecnologia.

Nel corso di un anno, ho partecipato a decine di conferenze in tutto il mondo. I viaggi di lavoro a volte durano mesi e gli incontri con partner e clienti si svolgono dall'Asia al Nord America. Eppure, uno dei miei recenti viaggi in Svizzera si è rivelato particolarmente interessante, soprattutto per le persone e le conversazioni che vi si sono svolte.

Zurigo si è dimostrata uno dei luoghi in cui il futuro della robotica e AI fisica Oggi se ne discute attivamente. E più queste discussioni si approfondiscono, più diventa evidente che la vera corsa nella robotica si sta svolgendo attorno ai dati.

La Silicon Valley europea

Zurigo è tradizionalmente associata al settore finanziario, ma negli ultimi anni è sempre più spesso definita la Silicon Valley europea. Gran parte di questa reputazione è legata al Politecnico di Zurigo (ETH), una delle università di ingegneria più prestigiose d'Europa. Attira ricercatori, dottorandi, imprenditori e ingegneri da tutto il mondo. Di conseguenza, attorno all'università si è formato un potente ecosistema tecnologico, dove ricerca, startup e progetti industriali si sviluppano quasi simultaneamente.

Uno dei motivi del mio viaggio era quello di ottenere una comprensione più profonda di cosa Introspettore Il mercato della robotica, in forte espansione dall'inizio del 2025, può offrire un contributo significativo. Si tratta di un settore in cui numerose startup stanno cercando di inserirsi, mentre le innovazioni tecnologiche delle principali aziende del settore lo stanno attivamente rimodellando. Tuttavia, nonostante tutto questo slancio, il campo solleva ancora più interrogativi di quanti ne risolva.

Zurigo è anche la sede dei nostri partner Leggermente, che mi ha aiutato a entrare in contatto con colleghi che lavorano all'intersezione tra robotica, visione artificiale e intelligenza artificiale. C'è un aspetto importante dell'ecosistema tecnologico locale che vorrei sottolineare: le persone qui sono straordinariamente aperte e accoglienti. Non hanno paura di condividere le loro idee e ipotesi, di parlare delle sfide che stanno cercando di risolvere e degli esperimenti che stanno conducendo. Di conseguenza, si inizia a comprendere il contesto reale del mercato e la direzione in cui si sta muovendo il settore molto più rapidamente.

A proposito, quando mi chiedono in cosa la "Silicon Valley" europea si differenzi da quella americana, la risposta spesso li sorprende. A Zurigo, l'equilibrio tra lavoro e vita privata è molto più forte: sport al mattino, lavoro concentrato durante il giorno con un ritmo calmo ma produttivo, e serate trascorse in montagna con la famiglia o semplicemente rilassandosi. A San Francisco, si ha spesso la sensazione di dover dimostrare costantemente di lavorare più duramente degli altri. A Zurigo, il ritmo è diverso, più sostenibile. Eppure, il livello di ambizione tecnologica non è inferiore.

Dati migliori prima di robot migliori

Uno dei principali spunti emersi da questo viaggio è stata un'osservazione piuttosto semplice: oggi molte persone desiderano lavorare nel campo della robotica. Tuttavia, nonostante l'enorme interesse per il settore, molti team sono ancora in una fase esplorativa, cercando di capire quale ruolo possono svolgere nella nuova ondata di robotica e intelligenza artificiale fisica e quale contributo possono apportare.

Molte conversazioni alla fine convergono sullo stesso argomento: i dati. Oggi, il settore mancano dati sui compiti di destrezza, ovvero, abilità motorie fini. In questo ambito, le capacità dei robot rimangono estremamente limitate. Ciò che gli esseri umani fanno con le mani quasi automaticamente – raccogliere un oggetto, ruotarlo, posizionarlo con cura da qualche parte o eseguire una piccola manipolazione – rimane uno dei compiti più difficili per i robot.

La chiave per progredire in questo campo risiede principalmente nella raccolta di grandi quantità di dati in modo appropriato. Oggi si parla spesso di set di dati egocentrici, registrati da una prospettiva in prima persona, in cui il sistema cattura le azioni umane come se le stesse eseguendo in prima persona. Tuttavia, in pratica, il concetto stesso di "set di dati egocentrico" può assumere significati molto diversi e solleva una serie di questioni tecniche. Dove dovrebbe essere posizionata la telecamera? Sulla fronte, sul petto o forse all'altezza degli occhi? Quali sensori dovrebbero accompagnare la registrazione video? Se si tratta di riprendere i movimenti delle mani, gli operatori dovrebbero indossare guanti speciali? E in tal caso, questi guanti dovrebbero includere sensori tattili, giroscopi o altri sistemi di tracciamento del movimento?

Si pone quindi una questione ancora più complessa: come catturare correttamente la profondità del movimento. Dopotutto, è importante comprendere non solo la posizione di una mano su un piano bidimensionale, ma anche come si muove nello spazio tridimensionale: in avanti, indietro, in alto o in basso.

Finora, il settore non ha ancora trovato una risposta univoca. Per questo motivo, molti team stanno sperimentando diverse configurazioni di sensori, metodi di registrazione e formati di dati.

Sistemi multimodali

Non appena la conversazione si sposta sulla raccolta dati per la robotica, emerge rapidamente un altro argomento: sensori aggiuntivi e multimodalità, che consentono di acquisire movimenti del corpo, azioni delle mani e interazioni con gli oggetti con maggiore precisione. Contribuiscono inoltre a ridurre gli errori durante la raccolta dei dati.

Quando una persona riprende le proprie azioni con una videocamera, esiste sempre il rischio che parte del materiale risulti inutilizzabile. La videocamera potrebbe spostarsi leggermente, l'angolazione di ripresa potrebbe essere errata, l'operatore potrebbe girarsi accidentalmente nella direzione sbagliata o eseguire un movimento troppo rapidamente. Di conseguenza, una parte significativa del materiale registrato viene scartata. Un semplice esempio: per ottenere un'ora di video effettivamente utilizzabile, un operatore ha spesso bisogno di registrare circa due ore di filmato grezzo.

Sensori aggiuntivi contribuiscono a compensare alcuni di questi problemi. Anche se la telecamera si sposta leggermente, i dati dei sensori consentono comunque di ricostruire il movimento della mano o la posizione del corpo nello spazio. Di conseguenza, anziché due ore di registrazione, potrebbero bastare circa un'ora e venti minuti per ottenere la stessa quantità di dati utilizzabili. Ciò aumenta significativamente l'efficienza della raccolta dei set di dati e ne riduce i costi di creazione.

Non è quindi un caso che molti team stiano notando un crescente interesse per l'annotazione di dati multimodali. Questa è diventata una delle tendenze più evidenti direttamente collegate allo sviluppo della robotica e dell'intelligenza artificiale incarnata.

Il punto successivo riguarda l'etichettatura di tali set di dati. Abbiamo incontrato domande simili a Macchina per scrivere chiavi Quando si lavora con dataset di clienti per casi di robotica: che aspetto dovrebbe avere in pratica un'annotazione di questo tipo? Dovrebbe essere scheletrica? Bidimensionale o tridimensionale? Dovrebbero essere integrati elementi di apprendimento per rinforzo nel processo? Ci sono decine di domande di questo genere. Gli ingegneri stessi ammettono che nessuno può ancora dire con certezza quale particolare configurazione di dati porterà in definitiva a una vera svolta tecnologica.

Queste preoccupazioni sono comprensibili. La creazione di dataset complessi è un processo costoso. Ogni errore nella struttura dei dati può costare migliaia o addirittura milioni di dollari. È possibile raccogliere il dataset "sbagliato" o registrarlo in condizioni difficili da riprodurre nel mondo reale, compromettendo in definitiva l'intero progetto. È proprio per questo che oggi si presta sempre più attenzione sia ai modelli stessi, sia alla qualità e all'architettura dei dati su cui tali modelli vengono addestrati.

Che tipo di robot richiede il mercato?

I robot industriali classici, che operano da decenni nelle linee di assemblaggio automobilistiche, in realtà richiedono ben poca visione artificiale o complessi modelli di intelligenza artificiale. Il loro compito è estremamente specifico: eseguire movimenti rigorosamente ripetitivi – sinistra, destra, su, giù – con elevata precisione e costanza. In questo ambito, hanno da tempo superato gli esseri umani.

Una categoria completamente diversa è quella dei robot umanoidi. Questi sistemi richiedono un "cervello": la capacità di muoversi nello spazio, percepire l'ambiente circostante, comprendere il contesto di una situazione e controllare i manipolatori non attraverso traiettorie pre-programmate, ma adattandosi al mondo reale.

Nonostante l'elevato livello di automazione presente negli stabilimenti moderni, molte mansioni sono ancora svolte da esseri umani. Spostare un oggetto, sollevare una scatola, smistare componenti, fissare un pezzo o organizzare i materiali: si tratta di piccole azioni che richiedono flessibilità e coordinazione. Questo ambito rimane uno dei più difficili da automatizzare, ed è proprio qui che i sistemi umanoidi potrebbero trovare la loro applicazione.

Molti dei team con cui ho parlato utilizzano un modello di business simile. Si rivolgono a una fabbrica e propongono di risolvere uno specifico problema di produzione. Ad esempio, un operaio potrebbe trascorrere l'intera giornata a spostare scatole tra diverse zone del magazzino. Gli ingegneri suggeriscono un esperimento relativamente semplice: dotare l'operaio di una telecamera e di una serie di sensori, registrare migliaia di ore delle sue attività e utilizzare questi dati per addestrare un modello che controllerà un robot umanoide. In questo modo, il robot impara a svolgere esattamente i compiti eseguiti dall'operaio umano.

In sostanza, l'azienda acquista una piattaforma umanoide, mentre il team di sviluppo crea un modello personalizzato che replica il comportamento di uno specifico operatore. Non si tratta di un'intelligenza universale in grado di risolvere qualsiasi compito, bensì di un insieme di competenze addestrate per uno scenario particolare o per un gruppo di attività produttive. Per molti ingegneri, questo approccio appare oggi molto più realistico. Invece di tentare di creare immediatamente un robot universale, i team si concentrano su scenari di automazione specifici ma economicamente sostenibili.

La dimensione aziendale

Se il futuro risiede nei modelli personalizzati, è importante comprendere che, da un punto di vista economico, si tratta di un percorso di sviluppo piuttosto lungo.

Ogni settore industriale è essenzialmente un mondo a sé. Ogni ambiente produttivo ha i suoi processi, flussi di lavoro ed eccezioni. Un robot addestrato per operare in una fabbrica automobilistica non può essere semplicemente trasferito alla produzione alimentare o alla logistica di magazzino. In ogni caso, il sistema deve essere riaddestrato da zero.

Ciò ci porta alla domanda successiva, logica: chi saranno i primi clienti di questa tecnologia?

In questa fase, i principali utilizzatori saranno probabilmente le grandi imprese, ovvero quelle con i budget necessari e per le quali l'automazione può generare un impatto economico significativo. Oggi, un robot umanoide costa all'incirca tra i 60,000 e i 90,000 dollari solo per l'hardware. Questa è solo la configurazione base. A ciò si aggiungono i costi di manutenzione, le batterie, le stazioni di ricarica, l'infrastruttura e il software.

Di conseguenza, le aziende più adatte a sperimentare tali sistemi sono le grandi organizzazioni, le case automobilistiche, le aziende alimentari e le principali imprese industriali.

Certo, anche i settori più piccoli potrebbero vedere alcuni pionieri nell'adozione di queste tecnologie. Alcune aziende potrebbero acquistare uno o due robot per compiti specifici. Tuttavia, nella maggior parte dei casi, queste imprese non sono ancora pronte a investire centinaia di migliaia di euro nella raccolta e nell'annotazione dei set di dati personalizzati necessari per addestrare i sistemi a scenari operativi altamente specifici. Per loro, il lavoro umano rimane ancora l'opzione più economica.

La lunga partita dell'innovazione robotica

Arriviamo infine a una questione economica fondamentale: cosa è più efficiente, un essere umano o un robot? Se guardiamo all'economia odierna, la risposta è ovvia: il lavoro umano costa meno, si adatta più rapidamente alle nuove condizioni e non richiede infrastrutture complesse.

Perché dunque l'industria continua a investire nella robotica ancora oggi? La risposta è in gran parte strategica.

Molte aziende comprendono che è in corso una sorta di corsa alla leadership tecnologica. Stanno già sviluppando soluzioni, nonostante gli alti costi, per essere all'avanguardia quando il contesto economico della robotica cambierà.

Con il progresso dell'elettronica, la diminuzione dei costi dei componenti e il miglioramento dell'efficienza computazionale, la robotica diventerà inevitabilmente più accessibile. E quando ciò accadrà, il vantaggio sarà delle aziende che avranno già realizzato prototipi, accumulato dati e creato l'infrastruttura tecnologica necessaria.

Immaginiamo, ad esempio, che vengano introdotte nuove normative che consentano l'utilizzo su larga scala di robot umanoidi nel settore manifatturiero. Oppure che i governi inizino a sovvenzionare la robotizzazione delle industrie. In uno scenario del genere, il mercato potrebbe crescere vertiginosamente in pochi anni. E coloro che si saranno preparati in anticipo, coloro che dispongono di modelli, ricerche, set di dati e una solida infrastruttura tecnologica, saranno quelli che ne trarranno maggior vantaggio.

Ecco perché lo sviluppo continua ancora oggi, nonostante il quadro economico non sia ancora ideale. Per molte aziende, si tratta di un investimento nel futuro, nel momento in cui le tecnologie diventano più accessibili e la domanda aumenta vertiginosamente.

In questa corsa, come in molte rivoluzioni tecnologiche, un fattore si rivela spesso decisivo: chi ha iniziato prima. In questo senso, la robotica odierna assomiglia molto alle prime fasi dell'intelligenza artificiale. Anche allora c'erano più domande che risposte. Eppure, furono i team che iniziarono a lavorare con dati e infrastrutture prima degli altri a plasmare, in definitiva, la direzione dell'intero settore.

Argomenti correlati:Introspettore Robotica

Michael Abramov, fondatore e CEO di Introspector

Michael Abramov è il fondatore e CEO di Introspettore, apportando oltre 15 anni di esperienza in ingegneria del software e sistemi di intelligenza artificiale per la visione artificiale alla creazione di strumenti di etichettatura di livello aziendale.

Michael ha iniziato la sua carriera come ingegnere del software e responsabile della ricerca e sviluppo, sviluppando sistemi di dati scalabili e gestendo team di ingegneria interfunzionali. Fino al 2025, ha ricoperto il ruolo di CEO di Macchina per scrivere chiavi, un'azienda di servizi di etichettatura dei dati, dove è stato pioniere nei flussi di lavoro con coinvolgimento umano, nei sistemi di controllo qualità avanzati e negli strumenti su misura per supportare le esigenze di dati autonomi e di visione artificiale su larga scala.

Ha conseguito una laurea in Informatica e una formazione in ingegneria e arti creative, offrendo una prospettiva multidisciplinare alla risoluzione di problemi complessi. Michael vive all'intersezione tra innovazione tecnologica, leadership strategica di prodotto e impatto nel mondo reale, guidando la prossima frontiera dei sistemi autonomi e dell'automazione intelligente.

Unite.AI