AGI
Qui remporte la course à l’IA en 2024 ? La course des grandes entreprises technologiques vers l’AGI

L’intelligence artificielle (IA) est devenue le progrès technologique le plus discuté de cette décennie. Alors que nous poussons les limites de ce que les machines peuvent faire, l’objectif ultime pour de nombreuses entreprises technologiques est d’atteindre l’intelligence artificielle générale (AGI) – une forme hypothétique d’IA qui peut comprendre, apprendre et appliquer son intelligence pour résoudre tout problème, à l’image du cerveau humain.
La course à l’AGI ne concerne pas seulement la suprématie technologique ; c’est une quête qui pourrait remodeler le tissu même de notre société. Les applications potentielles de l’AGI sont vastes et transformatrices, allant de la résolution de problèmes mondiaux complexes à la révolution des industries dans leur ensemble. C’est pourquoi les principales entreprises technologiques du monde investissent des milliards de dollars et des heures innombrables dans la recherche et le développement de l’IA.
Dans cet article, nous allons explorer les efforts des principaux acteurs de la course à l’IA, notamment Google, NVIDIA, Microsoft, OpenAI, Meta et d’autres. Nous allons discuter de leurs stratégies, de leurs réalisations et des approches uniques qu’ils adoptent pour repousser les limites de la technologie de l’IA.
Comprendre l’AGI
Qu’est-ce que l’AGI ?
L’AGI, souvent décrite comme le « Graal » de l’intelligence artificielle, est envisagée comme un système capable d’effectuer toute tâche intellectuelle que peut effectuer un humain. Cependant, définir l’AGI s’est avéré être aussi insaisissable que de l’atteindre. Geoffrey Hinton, une figure pionnière de l’IA, note que même si l’AGI est un « concept sérieux, bien que mal défini », il n’y a pas de consensus sur ce qu’elle implique précisément. Hinton préfère le terme « superintelligence » pour décrire les systèmes AGI qui surpasseraient les capacités cognitives humaines.
La nature insaisissable de l’AGI
Les principales entreprises technologiques, notamment OpenAI, Google, Meta, Microsoft et Amazon, sont à la pointe de cette course. Chaque entreprise apporte ses forces et objectifs stratégiques uniques à la table. OpenAI, par exemple, est profondément engagée à garantir que l’AGI, une fois développée, profite à l’humanité tout entière. L’organisation a mis en place une structure de gouvernance où son conseil d’administration décidera si ses systèmes ont atteint l’AGI, un jalon qui aura un impact significatif sur son partenariat avec Microsoft.
Google a longtemps été à la pointe de la recherche et du développement de l’IA, avec deux principales divisions à la tête de ses efforts : DeepMind et Google Brain.
A. DeepMind et ses réalisations
DeepMind, acquis par Google en 2014, a été responsable de certaines des réalisations les plus révolutionnaires dans le domaine de l’IA. Son programme AlphaGo a fameusement battu le champion du monde dans le jeu complexe de Go en 2016, une prouesse que beaucoup pensaient être à des décennies de distance. Cela a été suivi d’AlphaZero, qui a atteint des performances supérieures à celles des humains dans les échecs, le shogi et le Go grâce à l’apprentissage par renforcement autonome.
Plus récemment, DeepMind a réalisé des progrès significatifs dans le pliage des protéines avec AlphaFold. Ce système d’IA peut prédire les structures des protéines avec une précision remarquable, ce qui pourrait potentiellement révolutionner la découverte de médicaments et notre compréhension des maladies.
B. Google Brain et TensorFlow
Google Brain, l’équipe de recherche en IA de l’entreprise, a joué un rôle instrumental dans le développement d’outils et de cadres qui ont accéléré la recherche en IA dans le monde entier. TensorFlow, une bibliothèque d’apprentissage automatique open source développée par Google Brain, est devenue l’un des outils les plus utilisés pour la construction de modèles d’IA.
Google Brain a également apporté des contributions significatives au traitement automatique des langues avec des modèles comme BERT (Bidirectional Encoder Representations from Transformers), qui a amélioré les résultats de recherche de Google et les capacités de compréhension du langage.
C. Développements récents et plans futurs
Google continue de repousser les limites de l’IA avec des projets comme LaMDA (Language Model for Dialogue Applications), qui vise à rendre l’IA conversationnelle plus naturelle et sensible au contexte. L’entreprise a également travaillé sur l’intégration de l’IA plus en profondeur dans ses produits, des Recherches Google à Gmail en passant par Google Photos.
En termes de matériel, Google a développé ses propres puces d’IA, appelées Tensor Processing Units (TPU), optimisées pour les charges de travail d’apprentissage automatique. Ces puces alimentent de nombreux services d’IA de Google et sont également disponibles aux clients via Google Cloud.
À l’avenir, la stratégie d’IA de Google semble axée sur le développement de systèmes d’IA plus généraux et polyvalents qui peuvent gérer une large gamme de tâches, s’approchant ainsi du concept d’AGI. L’entreprise est également fortement investie dans la recherche en informatique quantique.
Le rôle de NVIDIA dans l’écosystème de l’IA
Alors que NVIDIA peut ne pas être un nom connu comme Google ou Microsoft, elle joue un rôle crucial dans l’écosystème de l’IA en tant que principal fournisseur de matériel qui alimente les calculs d’IA.
A. La domination des GPU dans le matériel d’IA
Les unités de traitement graphique (GPU) de NVIDIA sont devenues la norme pour la formation et l’exécution de modèles d’IA. À l’origine conçues pour le rendu graphique dans les jeux vidéo, les GPU se sont avérées exceptionnellement bien adaptées au traitement parallèle requis dans les calculs d’IA.
Les revenus du centre de données de NVIDIA, en grande partie stimulés par les ventes liées à l’IA, ont augmenté rapidement. En 2022, l’entreprise a introduit son H100 GPU, basé sur la nouvelle architecture Hopper, qui promet d’améliorer considérablement les performances pour les charges de travail d’IA.
B. La pile logicielle d’IA de NVIDIA
Au-delà du matériel, NVIDIA a développé une pile logicielle complète pour le développement d’IA. Cela inclut CUDA, une plate-forme et un modèle de programmation de calcul parallèle qui permet aux développeurs d’exploiter la puissance des GPU NVIDIA pour le traitement général.
NVIDIA propose également des outils comme cuDNN (CUDA Deep Neural Network library) et TensorRT, qui optimisent les performances de l’apprentissage profond sur les GPU NVIDIA. Ces outils sont largement utilisés dans la communauté de l’IA et ont contribué à la position dominante de NVIDIA sur le marché du matériel d’IA.
C. Partenariats et collaborations
NVIDIA a formé des partenariats stratégiques avec de nombreuses entreprises technologiques de premier plan et institutions de recherche. Par exemple, elle travaille en étroite collaboration avec les fabricants de véhicules autonomes pour fournir des solutions d’IA pour les voitures sans conducteur. L’entreprise a également collaboré avec des établissements de santé pour appliquer l’IA à l’imagerie médicale et à la découverte de médicaments.
En 2022, NVIDIA a annoncé un partenariat avec Booz Allen Hamilton pour développer des solutions de cybersécurité alimentées par l’IA pour le gouvernement américain et les infrastructures critiques. Cela souligne l’importance croissante de l’IA dans la cybersécurité et la défense nationale.
La stratégie d’IA de Microsoft
Microsoft s’est positionnée comme un leader dans l’IA en exploitant les partenariats et en investissant dans des startups clés dans l’IA. L’investissement de 13 milliards de dollars de l’entreprise dans OpenAI lui a donné un accès exclusif aux modèles d’OpenAI, qui ont été intégrés dans les produits Microsoft tels que GitHub Copilot et la plate-forme Azure AI.
A. Azure AI et services cloud
La plate-forme cloud de Microsoft, Azure, propose une large gamme de services d’IA qui permettent aux entreprises d’intégrer l’IA dans leurs applications. Ces services couvrent des domaines tels que l’apprentissage automatique, la vision par ordinateur, le traitement automatique des langues et la reconnaissance vocale.
Azure Machine Learning, un environnement cloud pour la formation, le déploiement et la gestion de modèles d’apprentissage automatique, est devenu un choix populaire pour les entreprises qui cherchent à mettre en œuvre des solutions d’IA. La stratégie de Microsoft pour fournir des outils d’IA faciles à utiliser a contribué à démocratiser le développement d’IA et à accélérer son adoption dans diverses industries.
B. Intégration de l’IA dans les produits Microsoft
Microsoft a progressivement intégré des capacités d’IA dans sa gamme de produits. Dans Microsoft 365 (anciennement Office), l’IA alimente des fonctionnalités comme la composition intelligente dans Outlook, la conception automatique de diapositives dans PowerPoint et l’analyse de données dans Excel.
Windows 11 a vu une intégration accrue de l’IA avec des fonctionnalités comme Windows Studio Effects, qui utilise l’IA pour le flou d’arrière-plan, le contact visuel et le cadrage automatique lors des appels vidéo. L’entreprise a également introduit des fonctionnalités d’IA dans son navigateur Edge et le moteur de recherche Bing, en exploitant de grands modèles de langage pour offrir des expériences de recherche plus interactives et plus informatives.
Les progrès rapides d’OpenAI
OpenAI reste une figure centrale dans le paysage de l’IA, en particulier avec sa mission de développer l’AGI. L’entreprise a été pionnière dans la création de certains des modèles de langage les plus avancés, notamment GPT-4 et le futur GPT-5. Les modèles d’OpenAI ne sont pas seulement à la pointe en termes de capacités techniques, mais également en termes d’intégration commerciale, grâce à son profond partenariat avec Microsoft.
Les ambitions d’OpenAI en matière d’AGI sont bien documentées, avec le PDG Sam Altman déclarant que l’atteinte de l’AGI représenterait « la technologie la plus puissante que l’humanité ait jamais inventée ». L’approche d’OpenAI pour le développement de l’IA équilibre l’innovation de pointe avec un fort accent sur les considérations éthiques et l’impact sociétal. Cependant, les coûts élevés associés à la formation de grands modèles ont nécessité un financement externe important, notamment des discussions avec des investisseurs comme le gouvernement des Émirats arabes unis pour sécuriser jusqu’à $7 billions pour les futurs projets de fabrication de puces d’IA
A. La série GPT et son impact
La réalisation la plus notable d’OpenAI a été le développement de la série de modèles de langage GPT (Generative Pre-trained Transformer). GPT-3, publié en 2020, a été un changement de jeu dans le domaine du traitement automatique des langues, démontrant une capacité sans précédent à générer du texte similaire à celui des humains.
La sortie de GPT-4 en 2023 a encore repoussé les limites de ce qui est possible avec les modèles de langage. GPT-4 a démontré des capacités de raisonnement améliorées, une réduction des hallucinations et la capacité de gérer des entrées multimodales (texte et images). Ces modèles ont trouvé des applications dans divers domaines, allant de la création de contenu à la génération de code en passant par le service client automatisé.
B. DALL-E et l’IA multimodale
En plus de la génération de texte, OpenAI a réalisé des progrès significatifs dans la génération d’images avec DALL-E. Ce système d’IA peut créer des images uniques à partir de descriptions textuelles, mettant en évidence le potentiel de l’IA dans les domaines créatifs. La dernière itération, DALL-E 3, a amélioré la qualité et la précision des images générées, tout en introduisant des fonctionnalités comme le remplissage et le prolongement d’images.
Ces développements en matière d’IA multimodale – des systèmes capables de travailler avec différents types de données comme le texte et les images – représentent un pas de géant vers des systèmes d’IA plus généraux.
Les initiatives d’IA de Meta
Meta, sous la direction du PDG Mark Zuckerberg, a recentré son attention sur le développement de l’intelligence artificielle générale (AGI). La stratégie de Meta consiste à construire des systèmes AGI capables d’effectuer une large gamme de tâches complexes aussi bien que, ou mieux que, les humains. Cet objectif ambitieux reflète la vision plus large de Meta d’intégrer une IA avancée dans son vaste écosystème d’applications et de services.
Pour soutenir cet effort, Meta investit massivement dans la puissance de calcul, avec des plans pour accumuler plus de 340 000 des GPU H100 de Nvidia d’ici la fin de 2024. Cette capacité de calcul immense est cruciale pour la formation de grands modèles d’IA comme LLaMA 3, qui a été récemment lancé.
A. PyTorch et contributions open source
L’une des contributions les plus significatives de Meta à la communauté de l’IA est PyTorch, une bibliothèque d’apprentissage automatique open source. PyTorch a gagné une adoption généralisée dans la communauté de la recherche en raison de sa flexibilité et de sa facilité d’utilisation, en particulier pour les applications d’apprentissage profond.
Meta AI, la division de recherche en IA de l’entreprise, publie régulièrement ses recherches et met à disposition des outils open source, contribuant ainsi à l’écosystème de l’IA plus large. Cette approche ouverte a aidé Meta à attirer les meilleurs talents en IA et à rester à la pointe de la recherche en IA.
B. L’IA dans les médias sociaux et le métaverse
Meta utilise l’IA de manière intensive sur ses plateformes de médias sociaux (Facebook, Instagram, WhatsApp) pour la recommandation de contenu, la ciblage publicitaire et la modération de contenu. Les algorithmes de recommandation de l’entreprise traitent d’énormes quantités de données pour personnaliser les expériences des utilisateurs.
C. Réalisations récentes et défis
En 2024, Meta a annoncé plusieurs avancées en matière d’IA, notamment le Segment Anything Model (SAM), un nouveau modèle d’IA pour la segmentation d’images qui peut identifier et délimiter les objets dans les images et les vidéos avec une précision remarquable. Ils ont également introduit une série de modèles de langage à code source ouvert appelés LLaMA (Large Language Model Meta AI).
Cependant, Meta a rencontré des défis, en particulier dans la modération de contenu. L’entreprise a lutté pour utiliser efficacement l’IA pour lutter contre les informations erronées et les discours de haine sur ses plateformes, mettant en évidence les complexités de l’application de l’IA à des problèmes sociaux réels.
Autres acteurs notables
IBM continue d’être un acteur majeur dans l’IA avec sa plate-forme watsonx, qui a évolué considérablement depuis son lancement. L’accent d’IBM s’est déplacé vers le fait de rendre l’IA plus ouverte, accessible et évolutive pour les entreprises. La plate-forme watsonx comprend désormais une suite d’outils d’automatisation alimentés par l’IA et des capacités de gouvernance qui permettent aux entreprises d’intégrer et de gérer des solutions d’IA plus efficacement dans divers domaines tels que les opérations informatiques, la cybersécurité et le service client.
Récemment, IBM a introduit des capacités d’IA générative pour améliorer ses services de détection et de réponse aux menaces gérés. Cela inclut un nouvel assistant de cybersécurité alimenté par l’IA conçu pour rationaliser et accélérer l’enquête et la réponse aux menaces de sécurité, exploitant davantage les capacités d’IA plus larges construites sur la plate-forme watsonx (IBM Newsroom) (IBM Newsroom).
IBM favorise également des partenariats stratégiques avec des entreprises comme AWS, Adobe, Meta et Salesforce pour intégrer ses solutions d’IA dans des écosystèmes plus larges, garantissant que ses technologies d’IA soient à la fois polyvalentes et largement adoptées dans les industries (IBM TechXchange Community) (IBM – États-Unis).
B. Les services d’IA d’Amazon
Amazon reste une force dominante dans l’IA grâce à sa plate-forme Amazon Web Services (AWS), qui propose une gamme complète d’outils d’IA et d’apprentissage automatique. AWS SageMaker est une offre clé, permettant aux développeurs de construire, de former et de déployer des modèles d’apprentissage automatique à grande échelle.
En plus des services d’IA pour les entreprises, Amazon continue d’innover dans les produits d’IA grand public avec Alexa, son assistant virtuel, qui utilise un traitement avancé du langage naturel et l’apprentissage automatique pour interagir avec les utilisateurs. L’accent mis par l’entreprise sur l’intégration de l’IA de manière transparente dans ses services de commerce électronique et de cloud l’a positionnée comme un leader dans l’espace de l’IA.
C. L’approche d’Apple en matière d’IA sur appareil
L’approche unique d’Apple en matière d’IA met l’accent sur le traitement sur appareil pour donner la priorité à la vie privée des utilisateurs. Cela se reflète dans des fonctionnalités comme Face ID et l’utilisation plus large de modèles d’apprentissage automatique via son cadre Core ML. Le silicium personnalisé d’Apple, y compris les puces A et M, inclut des moteurs neuronaux dédiés qui alimentent les tâches d’IA de manière efficace sur les appareils.
L’entreprise a également amélioré ses offres d’IA avec des progrès dans le traitement automatique des langues via Siri et des avancées dans la vision par ordinateur avec des fonctionnalités comme Live Text.
Qu’est-ce qui vient ensuite ? Le chemin vers l’AGI
Le chemin vers l’AGI est semé d’obstacles techniques, éthiques et réglementaires. À mesure que les systèmes d’IA deviennent plus avancés, les préoccupations concernant leur impact sur l’emploi, la vie privée et même les droits de l’homme augmentent. Les entreprises ne sont pas seulement en course pour développer une IA plus puissante, mais elles luttent également pour déployer ces technologies de manière responsable.
Par exemple, le développement par Google de Med-PaLM, un système d’IA capable de passer les examens de licence médicale américains, met en évidence le potentiel de l’IA pour révolutionner des industries comme les soins de santé. Cependant, cela soulève également des questions de responsabilité et de confiance dans les décisions prises par l’IA.
L’intégration par Microsoft de l’IA dans sa gamme de produits reflète une tendance plus large consistant à intégrer l’IA dans des outils quotidiens. Cette approche pourrait démocratiser l’IA, rendant des capacités avancées accessibles à un public plus large.
Insights du podcast de Lex Fridman
Le podcast de Lex Fridman offre des insights inestimables provenant de certaines des voix les plus éminentes dans le domaine. Une discussion particulièrement éclairante implique Yann LeCun, scientifique en chef de l’IA chez Meta, qui parle longuement des défis liés au développement de l’AGI. LeCun souligne les limites des modèles d’IA actuels, en particulier les grands modèles de langage (LLM), pour comprendre et interagir avec le monde physique. Il met l’accent sur le fait que même si les LLM peuvent traiter le texte et générer des réponses, ils manquent la capacité de comprendre les complexités de la physique intuitive et le raisonnement basé sur le bon sens, essentielles pour une véritable AGI. Cette lacune met en évidence le besoin continu de progrès dans l’IA qui peuvent reproduire la compréhension et la prise de décision humaines (Lex Fridman).
Dans un autre épisode, Sam Altman, PDG d’OpenAI, discute des implications plus larges de l’AGI pour la société. Altman souligne l’importance de garantir que l’AGI est développée d’une manière qui s’aligne sur les valeurs et l’éthique humaines. Il reconnaît le potentiel immense de l’AGI pour révolutionner les industries et améliorer la vie humaine, mais souligne également les risques associés au développement non contrôlé de l’IA. Les réflexions d’Altman révèlent l’équilibre délicat qui doit être maintenu entre innovation et sécurité dans la poursuite de l’AGI (Lex Fridman).
Ces discussions illustrent que la course à l’AGI n’est pas seulement un défi technique, mais également philosophique et éthique. Cette perspective ajoute de la profondeur à la compréhension de la manière dont des entreprises comme Meta et OpenAI naviguent le développement de l’IA.

















