Suivez nous sur

L'ère humanoïde n'est pas pour demain, elle est déjà là

Des leaders d'opinion

L'ère humanoïde n'est pas pour demain, elle est déjà là

mm

Plus tôt ce mois-ci, en Chine, un robot humanoïde nommé Shuang Shuang est monté sur scène Lors d'une cérémonie de remise de diplômes dans un lycée du Fujian, ils ont serré des mains et ont ravi élèves et enseignants. Des moments comme ceux-ci représentent un tournant significatif, celui où les robots humanoïdes commencent à faire une entrée remarquée dans la vie publique.

Ces moments marquent plus que la simple curiosité du public : ils signalent une évolution vers l'intégration au monde réel. Cet article explore comment les humanoïdes passent du spectacle à la fonctionnalité, et pourquoi ce qui semble être une prouesse purement matérielle relève en réalité de l'intelligence intégrée qui permet à ces machines de marcher, d'interagir et d'apprendre dans des environnements non programmés pour l'automatisation. Nous aborderons également notre approche de la commercialisation par le biais d'un déploiement précoce et de partenariats à long terme.

Comment les humanoïdes propulsent l'IA dans le monde réel

L'écart entre performances virtuelles et fiabilité physique reste l'un des défis les plus négligés de l'IA. Un chatbot peut générer des paragraphes de texte fluide sans même avoir à agir dessus, de la même manière qu'un modèle de vision peut identifier une étape dans une image sans avoir à la parcourir physiquement ni à risquer de tomber. Les humanoïdes n'ont pas ce luxe.

Pour fonctionner dans le monde réel, l'IA doit abandonner les ensembles de données statiques et les conditions contrôlées. Elle doit voir, décider et agir dans des environnements qui évoluent de seconde en seconde. Cela inclut des sols irréguliers, des objets mal placés, des comportements humains imprévisibles et des signaux non verbaux contextuels. Il en résulte une confrontation quotidienne avec le bruit, l'ambiguïté et des risques d'échec.

C'est là que le raisonnement incarné – où le langage est ancré dans l'espace, le temps et les conséquences – prend plus d'importance que la prédiction symbolique. Par exemple, si un humain dit « Attention, c'est glissant », le robot doit relier cette phrase non seulement à la définition d'un mot, mais aussi à la perception spatiale, aux risques potentiels et aux ajustements en temps réel.

Parallèlement, l'apprentissage multimodal devient essentiel, car aucun canal d'entrée n'est suffisamment fiable pour fonctionner seul. Une caméra peut rater une surface glissante, mais des capteurs de pression intégrés au pied peuvent détecter une perte d'adhérence soudaine. Ou, dans une autre situation, la reconnaissance vocale peut échouer dans un entrepôt bruyant, mais des repères visuels ou gestuels peuvent combler le vide.

La généralisation devient également essentielle. Un robot ne peut pas se contenter de voir deux fois le même environnement. Il doit adapter son comportement lorsque le sol est mouillé, que l'éclairage change ou que la boîte n'est plus là où elle était la veille. C'est ce qui fait la différence entre une exécution réussie et un échec.

Chez Humanoid, c'est pourquoi nous commençons les tests en amont avec nos partenaires commerciaux. Nous intégrons nos robots dans des environnements réels afin de détecter rapidement les failles potentielles et de garantir un fonctionnement optimal avant le déploiement. Un robot performant en simulation ou en démonstration n'est pas synonyme de robot capable de gagner la confiance sous pression, car cette confiance repose en fin de compte sur l'apprentissage en situation réelle.

Nous savons que les humanoïdes seront disponibles commercialement d'ici deux ans, mais nous n'attendons pas. Pour nous, la commercialisation commence tôt. Cela implique de construire des partenariats à long terme autour de cas d'usage réels. Grâce à une série de programmes pilotes, nous formons non seulement nos partenaires à la technologie, mais nous apprenons aussi à leurs côtés. Ce processus d'apprentissage partagé nous permet également d'affiner les structures de coûts et la fiabilité des performances dès le premier jour, garantissant ainsi le meilleur coût total de possession (TCO) possible à mesure que les systèmes évoluent.

Pourquoi les humanoïdes sont le banc d’essai ultime de l’intelligence générale

Le monde que nous avons créé au cours des cent dernières années est taillé à l'échelle humaine. Poignées de porte, chariots élévateurs, entrepôts : tout suppose des dimensions, des amplitudes de mouvement et des comportements sociaux implicites. Les humanoïdes doivent s'adapter à cette réalité, sous peine de voir leurs fonctionnalités extrêmement limitées.

Pour monter un escalier, porter un objet, interpréter un geste de pointage ou reconnaître une hésitation dans une voix, un robot doit comprendre le contexte bien au-delà de la classification visuelle ou de la planification de mouvements scénarisés. Il doit déduire une intention, apprendre une nouvelle tâche en observant un humain, adapter cette compétence à une configuration légèrement différente et améliorer ses performances au fil du temps. En pratique, ce système élargit efficacement les capacités de l'IA sous des contraintes réelles.

Chez Humanoid, nous accélérons ce processus grâce à la téléopération. Dès les premières étapes du développement, des opérateurs humains guident le robot dans ses tâches clés. Ces données pratiques constituent la base de l'apprentissage de nouveaux comportements. Au fil du temps, ces démonstrations alimentent nos modèles complets, nous aidant à construire une autonomie fiable.

Des systèmes étroits à l'intelligence intégrée

La plupart des systèmes d'IA actuels excellent dans des tâches spécifiques. Isolément, chacun d'eux fonctionne bien. Mais les humanoïdes n'ont pas besoin de spécialistes isolés. Pour réussir leur intégration, nous avons besoin de systèmes capables de raisonner sur plusieurs modalités et échelles de temps.

Un humanoïde pourrait recevoir une instruction relativement vague — « Va me chercher la boîte jaune dans la salle de stockage de l’autre côté du couloir » — et devoir la décoder en une séquence de sous-tâches : localiser l’orateur, naviguer dans un couloir, identifier la bonne boîte, ajuster la force de préhension, éviter les collisions et, bien sûr, revenir en toute sécurité.

Chaque partie de cette séquence implique un sous-système différent : la vision, la locomotion, le langage, la manipulation et la rétroaction. La fiabilité de l'ensemble dépend de la qualité de la communication de ces parties dans des conditions changeantes.

L'architecture modulaire est une solution pour relever ce défi. Elle nous permet d'itérer sur des sous-systèmes indépendamment tout en assurant une coordination à l'échelle du système. De plus, elle nous permet de faire évoluer les capacités sur plusieurs environnements sans avoir à tout reconstruire. C'est ainsi que nous passons des démonstrations fermées aux performances d'un monde ouvert.

Les enjeux sont énormes et mondiaux

Il est facile de présenter les humanoïdes comme futuristes. Mais lorsque nous discutons avec nos clients, le besoin est immédiat. De nombreux entrepôts, chaînes de montage et autres sites de travail autrefois très fréquentés peinent désormais à maintenir leur personnel.

Ces pénuries de main-d'œuvre sont des problèmes démographiques. Au Japon, près de 30 % de la population a plus de 65 ansEn Europe, les secteurs clés — qui ont une part combinée masse salariale de 1.7 billion de dollars - sont peine à recruter des jeunes travailleursCe ne sont pas le genre de rôles que la plupart des gens souhaitent jouer, et de plus en plus, ce ne sont pas ceux que les gens sont prêts à jouer.

En intervenant comme auxiliaires, et non comme remplaçants, les humanoïdes peuvent assumer des tâches physiquement exigeantes, répétitives ou dangereuses (déplacer des stocks, charger des palettes, utiliser des machines) sans risque de fatigue ni de blessure. Les travailleurs humains peuvent ainsi se concentrer sur des aspects plus complexes, créatifs ou relationnels de leur travail.

De plus, cela crée une résilience économique à long terme. Lorsque la main-d'œuvre est volatile ou indisponible, les machines intelligentes peuvent contribuer à assurer la continuité, sans sacrifier la sécurité, la qualité ou l'adaptabilité.

Un autre aspect à souligner est le cadre réglementaire. La plupart des équipes, surtout dans les juridictions peu réglementées, attendent avant d'y réfléchir. C'est là que nous avons commencé. Les lois européennes en matière de sécurité et de données sont parmi les plus strictes au monde, mais au lieu de les considérer comme des obstacles, nous les considérons comme notre avantage concurrentiel. À mesure que d'autres marchés adopteront des réglementations plus strictes, nous serons prêts à les respecter, tandis que d'autres entreprises pourraient se démener.

Une nouvelle race d'IA — mais pas celle que vous imaginez

Aujourd'hui, le discours sur l'IA se concentre principalement sur la puissance de calcul, les paramètres et les données d'entraînement. Mais la véritable avancée pourrait venir d'un autre horizon : l'intégration dans le monde physique. C'est là que l'intelligence doit apprendre à performer, au lieu de se contenter de prédire.

À cet égard, la course porte sur le système le plus performant, capable de fonctionner dans l'espace public, dans des conditions de sécurité strictes et avec l'intervention humaine. Ce système, en plus d'apprendre à partir des données, apprendra aussi – et surtout – de la réalité et collaborera avec les utilisateurs sans perturber le flux des choses.

C'est pourquoi nous n'attendons pas le déploiement pour commencer. Dès le début, nous collaborons directement avec nos partenaires commerciaux pour intégrer le système dans des environnements réels, garantissant ainsi une amélioration là où c'est le plus important : en pratique.

C'est précisément ce type d'apprentissage concret qui pose problème aux systèmes étroits. Bien qu'ils nous aient permis de progresser, ils n'ont jamais été conçus pour une telle complexité. Les humanoïdes requièrent autre chose : coordination, robustesse et, comme mentionné précédemment, la capacité à apprendre de l'inattendu.

C'est l'immense opportunité qui s'offre à nous. Non pas de tout automatiser, mais de construire des machines capables de comprendre, de naviguer et de collaborer avec le monde humain.

Artem Sokolov est le fondateur de Humanoïde, ainsi qu'investisseur et entrepreneur mondial. Il a repris avec succès l'entreprise familiale et l'a portée à une valorisation d'un milliard de dollars. Il a ensuite fondé Humanoid pour concevoir des robots humanoïdes sûrs et fiables qui libèrent les humains des tâches physiques exigeantes. Aujourd'hui, il dirige une équipe de plus de 1 professionnels issus de certaines des plus grandes entreprises technologiques mondiales, apportant une expertise technique de pointe pour façonner l'avenir de la collaboration homme-machine.