Connect with us

Penser en dehors de la boîte pour stimuler l’innovation dans l’IA

Leaders d’opinion

Penser en dehors de la boîte pour stimuler l’innovation dans l’IA

mm

Pour beaucoup d’entre nous qui innovons dans le domaine de l’IA, nous travaillons dans un territoire inexploré. Étant donné la rapidité avec laquelle les entreprises d’IA développent de nouvelles technologies, on pourrait prendre pour acquis le travail acharné qui se déroule dans les coulisses. Mais dans un domaine comme l’XR, où la mission est de brouiller les lignes entre les mondes réel et numérique — il n’y a actuellement pas beaucoup de données historiques ou de recherches sur lesquelles s’appuyer ; nous devons donc penser en dehors de la boîte.

Alors que cela est le plus pratique pour s’appuyer sur la sagesse conventionnelle de l’apprentissage automatique et les pratiques éprouvées, cela n’est souvent pas possible (ou la solution complète) dans les domaines émergents. Pour résoudre des problèmes qui n’ont jamais été résolus auparavant, ils doivent être abordés de nouvelles manières.

C’est un défi qui vous oblige à vous rappeler pourquoi vous êtes entré dans le domaine de l’ingénierie, de la science des données ou du développement de produits en premier lieu : une passion pour la découverte. J’en fais l’expérience chaque jour dans mon rôle chez Ultraleap, où nous développons des logiciels qui peuvent suivre et répondre aux mouvements de la main humaine dans un environnement de réalité mixte. Une grande partie de ce que nous pensions savoir sur la formation de modèles d’apprentissage automatique est renversée dans notre travail, car la main humaine — ainsi que les objets et les environnements qu’elle rencontre — est extrêmement imprévisible.

Voici quelques approches que mon équipe et moi avons prises pour réimaginer l’expérimentation et la science des données pour apporter une interaction intuitive au monde numérique, qui soit précise et ressemble autant que possible à ce que l’on trouve dans le monde réel.

Innover dans les limites

Lorsque l’on innove dans un espace naissant, on est souvent confronté à des contraintes qui semblent être en contradiction les unes avec les autres. Mon équipe est chargée de capturer les complexités des mouvements de la main et des doigts, et de la façon dont les mains et les doigts interagissent avec le monde qui les entoure. Tout cela est conditionné dans des modèles de suivi de la main qui s’intègrent toujours dans le matériel XR sur un calcul contraint. Cela signifie que nos modèles — bien que sophistiqués et complexes — doivent occuper nettement moins d’espace de stockage et consommer nettement moins d’énergie (à hauteur de 1/100 000e) que les énormes LLM qui dominent les actualités. Cela nous présente un défi passionnant, nécessitant une expérimentation et une évaluation impitoyables de nos modèles dans leur application réelle.

Mais les innombrables tests et expériences en valent la peine : créer un modèle puissant qui livre toujours sur un coût d’inférence faible, une consommation d’énergie et une latence est une merveille qui peut être appliquée dans le calcul de bord même en dehors de l’espace XR.

Les contraintes que nous rencontrons lors de l’expérimentation auront un impact sur d’autres industries. Certaines entreprises auront des défis uniques en raison de subtilités dans leurs domaines d’application, tandis que d’autres peuvent avoir des données limitées à disposition en raison du fait qu’elles sont dans un marché de niche que les grands acteurs de la technologie n’ont pas touché.

Alors que les solutions universelles peuvent suffire pour certaines tâches, de nombreux domaines d’application doivent résoudre des problèmes réels et difficiles spécifiques à leur tâche. Par exemple, les chaînes de montage automobile mettent en œuvre des modèles d’apprentissage automatique pour l’inspection des défauts. Ces modèles doivent lutter contre des images à très haute résolution qui sont nécessaires pour identifier de petits défauts sur une grande surface d’une voiture. Dans ce cas, l’application exige des performances élevées, mais le problème à résoudre est de savoir comment atteindre un faible taux d’images par seconde, mais une résolution élevée, modèle.

Évaluer les architectures de modèles pour stimuler l’innovation

Un bon jeu de données est la force motrice derrière toute avancée réussie de l’IA. Mais qu’est-ce qui fait qu’un jeu de données est « bon » pour un objectif particulier, alors ? Et lorsque l’on résout des problèmes qui n’ont jamais été résolus auparavant, comment peut-on faire confiance à ce que les données existantes seront pertinentes ? Nous ne pouvons pas supposer que les métriques qui sont bonnes pour certaines tâches d’apprentissage automatique se traduiront par des performances d’une tâche d’entreprise spécifique. C’est là que nous sommes appelés à aller à l’encontre des « vérités » couramment admises de l’apprentissage automatique et à explorer activement la façon dont nous étiquetons, nettoyons et appliquons à la fois des données simulées et du monde réel.

Par nature, notre domaine est difficile à évaluer et nécessite une assurance qualité manuelle – effectuée à la main. Nous ne regardons pas seulement les métriques de qualité de nos données. Nous itérons sur nos jeux de données et sources de données et les évaluons en fonction des qualités des modèles qu’ils produisent dans le monde réel. Lorsque nous réévaluons la façon dont nous notons et classifions nos données, nous trouvons souvent des jeux de données ou des tendances que nous aurions pu autrement négliger. Maintenant, avec ces jeux de données, et les innombrables expériences qui nous ont montré quels données ne pas s’appuyer, nous avons débloqué un nouvel axe que nous manquions auparavant.

La dernière plate-forme de suivi de la main d’Ultraleap, Hyperion, en est un excellent exemple. Les progrès de nos jeux de données nous ont permis de développer un suivi de la main plus sophistiqué capable de suivre avec précision les microgestes ainsi que les mouvements de la main, même lorsque l’utilisateur tient un objet.

 Un petit pas en arrière, un grand bond en avant

Alors que le rythme de l’innovation semble ne jamais ralentir, nous pouvons. Nous sommes dans le business de l’expérimentation, de l’apprentissage, du développement et, lorsque nous prenons le temps de le faire, nous créons souvent quelque chose de beaucoup plus de valeur que lorsque nous suivons le manuel et nous nous précipitons pour sortir la prochaine innovation technologique. Il n’y a pas de substitut aux avancées qui se produisent lorsque nous explorons nos annotations de données, remettons en question nos sources de données et redéfinissons les métriques de qualité elles-mêmes. Et la seule façon dont nous pouvons le faire est en expérimentant dans le domaine d’application réel avec des performances de modèle mesurées par rapport à la tâche. Plutôt que de voir les exigences et les contraintes inhabituelles comme limitantes, nous pouvons prendre ces défis et les transformer en opportunités d’innovation et, en fin de compte, en avantage concurrentiel.

Iain Wallace est le directeur de la recherche en apprentissage automatique et en suivi chez Ultraleap, un leader mondial de la vision par ordinateur et de l'apprentissage automatique. Il est un informaticien fasciné par la recherche et le développement de systèmes d'IA axés sur les applications. Chez Ultraleap, Iain dirige son équipe de recherche en suivi de mains pour permettre de nouvelles interactions en AR, VR, MR, hors domicile et partout ailleurs où vous interagissez avec le monde numérique. Il a obtenu son MEng en systèmes et logiciels informatiques à l'Université de York et son doctorat en informatique (intelligence artificielle) à l'Université d'Édimbourg.