talon 6 meilleurs livres d'apprentissage automatique et d'IA de tous les temps (mai 2024)
Suivez nous sur

Série futuriste

6 meilleurs livres d'apprentissage automatique et d'IA de tous les temps (mai 2024)

mm
Le kit de préparation mis à jour on

Le monde de l’IA peut être intimidant en raison de la terminologie et des différents algorithmes d’apprentissage automatique disponibles. Après avoir lu plus de 50 des livres les plus recommandés sur l’apprentissage automatique, j’ai dressé ma liste personnelle de livres incontournables.

Les livres qui ont été choisis sont basés sur les types d'idées qui sont introduites et sur la qualité de la présentation de différents concepts tels que l'apprentissage en profondeur, l'apprentissage par renforcement et les algorithmes génétiques. Plus important encore, la liste est basée sur les livres qui ouvrent le mieux la voie aux futuristes et aux chercheurs vers la construction d'une IA responsable et explicable.

# 6. Comment fonctionne l'IA : de la sorcellerie à la science par Ronald T. Kneusel

« Comment fonctionne l'IA » est un livre succinct et clair conçu pour définir les principes fondamentaux de l'apprentissage automatique. Ce livre facilite l'apprentissage de la riche histoire de l'apprentissage automatique, depuis la création des systèmes d'IA existants jusqu'à l'avènement des méthodologies contemporaines.

L'histoire est multiple, à commencer par les systèmes d'IA bien fondés tels que les machines à vecteurs de support, les arbres de décision et les forêts aléatoires. Ces systèmes antérieurs ont ouvert la voie à des avancées révolutionnaires, conduisant au développement d’approches plus sophistiquées telles que les réseaux de neurones et les réseaux de neurones convolutifs. Le livre aborde les incroyables capacités offertes par les grands modèles linguistiques (LLM), qui constituent le moteur de l'IA générative de pointe actuelle.

Comprendre les bases, comme la façon dont la technologie de conversion du bruit en image peut reproduire des images existantes et même créer de nouvelles images sans précédent à partir de messages apparemment aléatoires, est essentiel pour comprendre les forces qui propulsent les générateurs d'images d'aujourd'hui. Ce livre explique magnifiquement ces aspects fondamentaux, permettant aux lecteurs de comprendre les subtilités et les mécanismes sous-jacents des technologies de génération d'images.

Ron Kneusel, l'auteur, fait preuve d'un effort louable pour expliquer ses perspectives sur les raisons pour lesquelles ChatGPT d'OpenAI et son modèle LLM signifient le début de la véritable IA. Il présente méticuleusement comment différents LLM présentent des propriétés émergentes capables de comprendre intuitivement la théorie de l'esprit. Ces propriétés émergentes semblent devenir plus prononcées et plus influentes en fonction de la taille du modèle de formation. Kneusel explique comment une plus grande quantité de paramètres aboutit généralement aux modèles LLM les plus compétents et les plus réussis, fournissant ainsi des informations plus approfondies sur la dynamique de mise à l'échelle et l'efficacité de ces modèles.

Ce livre est un phare pour ceux qui souhaitent en savoir plus sur le monde de l'IA, offrant un aperçu détaillé mais compréhensible de la trajectoire évolutive des technologies d'apprentissage automatique, depuis leurs formes rudimentaires jusqu'aux entités pionnières d'aujourd'hui. Que vous soyez novice ou quelqu'un maîtrisant bien le sujet, « Comment fonctionne l'IA » est conçu pour vous fournir une compréhension raffinée des technologies transformatrices qui continuent de façonner notre monde.

# 5. Vie 3.0 par Max Tegmark

"Vie 3.0” a un objectif ambitieux et c'est d'explorer les possibilités de coexistence avec l'IA à l'avenir. L'Intelligence Générale Artificielle (IAG) est la conséquence éventuelle et inévitable de la argument de l'explosion du renseignement faite par le mathématicien britannique Irving Good en 1965. Cet argument stipule que l'intelligence surhumaine sera le résultat d'une machine qui peut continuellement s'améliorer. La citation célèbre pour l'explosion de l'intelligence est la suivante :

« Définissons une machine ultra-intelligente comme une machine qui peut dépasser de loin toutes les activités intellectuelles de tout homme, aussi intelligent soit-il. Puisque la conception de machines fait partie de ces activités intellectuelles, une machine ultra-intelligente pourrait concevoir des machines encore meilleures ; il y aurait alors incontestablement une « explosion de l'intelligence », et l'intelligence de l'homme serait loin derrière. Ainsi, la première machine ultra-intelligente est la dernière invention que l'homme ait jamais besoin de faire.

Max Tegmark lance le livre dans un avenir théorique de vie dans un monde contrôlé par un AGI. A partir de ce moment, des questions explosives se posent telles qu'est-ce que l'intelligence ? Qu'est-ce que la mémoire ? Qu'est-ce que le calcul ? et, qu'est-ce qu'apprendre? Comment ces questions et réponses possibles mènent-elles finalement au paradigme d'une machine qui peut utiliser divers types d'apprentissage automatique pour réaliser les percées d'auto-amélioration nécessaires pour atteindre l'intelligence de niveau humain, et l'inévitable superintelligence qui en résulte ?

C'est le type de réflexion prospective et de questions importantes que Life 3.0 explore. La vie 1.0 est constituée de formes de vie simples telles que des bactéries qui ne peuvent changer que par une évolution qui modifie son ADN. Life 2.0 sont des formes de vie qui peuvent reconcevoir leur propre logiciel, par exemple en apprenant une nouvelle langue ou une nouvelle compétence. Life 3.0 est une IA qui peut non seulement modifier son propre comportement et ses propres compétences, mais peut également modifier son propre matériel, par exemple en améliorant son moi robotique.

Ce n'est que lorsque nous comprenons les avantages et les inconvénients d'une AGI que nous pouvons alors commencer à examiner les options pour nous assurer que nous construisons une IA conviviale qui peut s'aligner sur nos objectifs. Pour ce faire, nous pouvons également avoir besoin de comprendre ce qu'est la conscience ? Et en quoi la conscience de l'IA sera-t-elle différente de la nôtre ?

De nombreux sujets d'actualité sont explorés dans ce livre, et il devrait être une lecture obligatoire pour quiconque souhaite vraiment comprendre comment l'IAG est une menace potentielle, ainsi qu'une bouée de sauvetage potentielle pour l'avenir de la civilisation humaine.

# 4. Compatibilité humaine : l'intelligence artificielle et le problème du contrôle par Stuart Russel

Que se passe-t-il si nous réussissons à construire un agent intelligent, quelque chose qui perçoit, qui agit, et qui est plus intelligent que ses créateurs ? Comment allons-nous convaincre les machines d'atteindre nos objectifs plutôt que leurs propres objectifs ?

Ce qui précède est ce qui mène à l'un des concepts les plus importants du livre "Compatibilité humaine : l'intelligence artificielle et le problème du contrôle» est qu'il faut éviter de « mettre un but dans la machine », comme disait Norbert Wiener. Une machine intelligente qui est trop sûre de ses objectifs fixés est le type ultime d'IA dangereuse. En d'autres termes, si l'IA ne veut plus envisager la possibilité qu'elle se trompe dans l'exécution de son objectif et de sa fonction préprogrammés, il peut alors être impossible d'arrêter le système d'IA.

La difficulté, comme l'a souligné Stuart Russell, consiste à indiquer à l'IA/au robot qu'aucune commande n'est destinée à être réalisée à tout prix. Il n'est pas acceptable de sacrifier une vie humaine pour aller chercher un café ou de faire griller le chat pour fournir le déjeuner. Il faut comprendre que « conduisez-moi à l'aéroport le plus vite possible », n'implique pas que les lois sur la vitesse excessive puissent être enfreintes, même si cette consigne n'est pas explicite. Si l'IA se trompe sur ce qui précède, la sécurité intégrée correspond à un certain niveau d'incertitude préprogrammé. Avec une certaine incertitude, l'IA peut se remettre en question avant de terminer une tâche, pour peut-être demander une confirmation verbale.

Dans un article de 1965 intitulé «Spéculations concernant la première machine ultra-intelligence", IJ Good, un brillant mathématicien qui a travaillé aux côtés d'Alan Turing, a déclaré:" La survie de l'homme dépend de la construction précoce d'une machine ultra-intelligente ". Il est tout à fait possible que pour nous sauver d'une catastrophe écologique, biologique et humanitaire, nous devions construire l'IA la plus avancée possible.

Cet article fondateur explique l'explosion de l'intelligence, cette théorie étant qu'une machine ultra-intelligente peut concevoir des machines encore meilleures et supérieures à chaque itération, ce qui conduit inévitablement à la création d'un AGI. Bien que l'AGI puisse initialement être d'une intelligence égale à celle d'un humain, il dépasserait rapidement les humains dans un court laps de temps. En raison de cette conclusion anticipée, il est important pour les développeurs d'IA d'actualiser les principes de base partagés dans ce livre et d'apprendre à les appliquer en toute sécurité à la conception de systèmes d'IA capables non seulement de servir les humains, mais de les sauver d'eux-mêmes. .

Comme l'a souligné Stuart Russell, se retirer de la recherche sur l'IA n'est pas une option, nous devons aller de l'avant. Ce livre est une feuille de route pour nous guider vers la conception de systèmes d'IA sûrs, responsables et bénéfiques.

# 3. Comment créer un esprit par Ray Kurzweil

Ray Kurzweil est l'un des plus grands inventeurs, penseurs et futuristes au monde, il a été surnommé "le génie agité" par le Wall Street Journal et "la machine à penser ultime" par le magazine Forbes. Il est également co-fondateur de la Singularity University, et il est surtout connu pour son livre révolutionnaire "The Singularity is Near". "Comment créer un esprit” aborde moins les problèmes de croissance exponentielle qui caractérisent ses autres travaux, mais se concentre plutôt sur la façon dont nous devons comprendre le cerveau humain afin de le désosser pour créer la machine à penser ultime.

L'un des principes fondamentaux décrits dans ce travail fondateur est le fonctionnement de la reconnaissance des formes dans le cerveau humain. Comment les humains reconnaissent-ils les modèles dans la vie de tous les jours ? Comment ces connexions se forment-elles dans le cerveau ? Le livre commence par comprendre la pensée hiérarchique, c'est comprendre une structure composée de divers éléments qui sont disposés selon un motif, cet arrangement représente ensuite un symbole tel qu'une lettre ou un caractère, puis cela est ensuite arrangé en un motif plus avancé. comme un mot, et éventuellement une phrase. Finalement, ces modèles forment des idées, et ces idées sont transformées en produits que les humains sont responsables de la construction.

Puisqu'il s'agit d'un livre de Ray Kurzweil, il ne faut bien sûr pas longtemps avant que la pensée exponentielle soit introduite. Le "Loi des rendements accélérés' est la marque de fabrique de ce livre phare. Cette loi montre comment les technologies et le rythme d'accélération s'accélèrent en raison de la tendance des progrès à se nourrir d'eux-mêmes, augmentant encore le taux de progrès. Cette réflexion peut ensuite être appliquée à la vitesse à laquelle nous apprenons à comprendre et à désosser le cerveau humain. Cette compréhension accélérée des systèmes de reconnaissance de formes dans le cerveau humain peut ensuite être appliquée à la construction d'un système AGI.

Ce livre a tellement transformé l'avenir de l'IA qu'Eric Schmidt a recruté Ray Kurzweil pour travailler sur des projets d'IA après avoir terminé la lecture de ce livre fondateur. Il est impossible de décrire toutes les idées et les concepts qui sont discutés dans un court article, néanmoins c'est un livre indispensable pour mieux comprendre comment fonctionnent les réseaux de neurones humains afin de concevoir un système avancé. réseau neuronal artificiel.

La reconnaissance de formes est l'élément clé de l'apprentissage en profondeur, et ce livre illustre pourquoi.

# 2. L'algorithme maître par Pedro Domingos

L'hypothèse centrale de L'algorithme maître est que toutes les connaissances - passées, présentes et futures - peuvent être dérivées des données par un seul algorithme d'apprentissage universel qui est quantifié en tant qu'algorithme maître. Le livre détaille certaines des meilleures méthodologies d'apprentissage automatique, il donne des explications détaillées sur le fonctionnement des différents algorithmes, comment ils peuvent être optimisés et comment ils peuvent travailler en collaboration pour atteindre l'objectif ultime de créer l'algorithme Master. Il s'agit d'un algorithme capable de résoudre n'importe quel problème que nous alimentons, et cela inclut la guérison du cancer.

Le lecteur commencera par découvrir Bayes naïfs, un algorithme simple qui peut être expliqué en une simple équation. À partir de là, il accélère à pleine vitesse vers des techniques d'apprentissage automatique plus intéressantes. Afin de comprendre les technologies qui nous accélèrent vers cet algorithme maître, nous apprenons les fondamentaux convergents. Premièrement, grâce aux neurosciences, nous apprenons la plasticité cérébrale, les réseaux de neurones humains. Deuxièmement, nous passons à la sélection naturelle dans une leçon pour comprendre comment concevoir un algorithme génétique qui simule l'évolution et la sélection naturelle. Avec un algorithme génétique, une population d'hypothèses dans chaque génération se croise et mute, à partir de là, les algorithmes les plus adaptés produisent la génération suivante. Cette évolution offre le nec plus ultra en matière d'auto-amélioration.

D'autres arguments viennent de la physique, des statistiques, et bien sûr du meilleur de l'informatique. Il est impossible de passer en revue de manière exhaustive toutes les différentes facettes abordées par ce livre, en raison de la portée ambitieuse du livre consistant à définir le cadre de construction de l'algorithme maître. C'est ce cadre qui a poussé ce livre à la deuxième place, car tous les autres livres d'apprentissage automatique s'en inspirent sous une forme ou une autre.

# 1. Mille cerveaux par Jeff Hawkins

"Mille cerveaux» s'appuie sur les concepts abordés dans le livre précédent de Jeff Hawkins intitulé « On Intelligence ». "On Intelligence" a exploré le cadre permettant de comprendre le fonctionnement de l'intelligence humaine et la manière dont ces concepts peuvent ensuite être appliqués à la construction des systèmes ultimes d'IA et d'IAG. Il analyse fondamentalement la façon dont notre cerveau prédit ce que nous allons vivre avant de le vivre.

Bien que "A Thousand Brains" soit un excellent livre autonome, il sera mieux apprécié et apprécié si "Sur le renseignement» est lu en premier.

"A Thousand Brains" s'appuie sur les dernières recherches de Jeff Hawkins et de la société qu'il a fondée, appelée numenta. Numenta a pour objectif principal de développer une théorie sur le fonctionnement du néocortex, l'objectif secondaire est de savoir comment cette théorie du cerveau peut être appliquée à l'apprentissage automatique et à l'intelligence artificielle.

La première découverte majeure de Numenta en 2010 concerne la façon dont les neurones font des prédictions, et la deuxième découverte en 2016 a impliqué des cadres de référence de type carte dans le néocortex. Le livre détaille avant tout ce qu'est la "théorie des mille cerveaux", quels sont les cadres de référence et comment la théorie fonctionne dans le monde réel. L'un des éléments les plus fondamentaux derrière cette théorie est de comprendre comment le néocortex a évolué jusqu'à sa taille actuelle.

Le néocortex a commencé petit, comme d'autres mammifères, mais il s'est agrandi de façon exponentielle (seulement limité par la taille du canal de naissance) non pas en créant quelque chose de nouveau, mais en copiant un circuit de base à plusieurs reprises. En substance, ce qui différencie les humains n'est pas la matière organique du cerveau mais le nombre de copies des éléments identiques qui forment le néocortex.

La théorie évolue ensuite vers la formation du néocortex avec environ 150,000 XNUMX colonnes corticales qui ne sont pas visibles au microscope car il n'y a pas de frontières visibles entre elles. La façon dont ces colonnes corticales communiquent entre elles est la mise en œuvre d'un algorithme fondamental responsable de tous les aspects de la perception et de l'intelligence.

Plus important encore, le livre dévoile comment cette théorie peut être appliquée à la construction de machines intelligentes et les implications futures possibles pour la société. Par exemple, le cerveau apprend un modèle du monde en observant comment les entrées changent au fil du temps, en particulier lorsque le mouvement est appliqué. Les colonnes corticales nécessitent un cadre de référence qui est fixé à un objet, ces cadres de référence permettent à une colonne corticale d'apprendre les emplacements des caractéristiques qui définissent les réalités d'un objet. Par essence, les cadres de référence peuvent organiser n'importe quel type de connaissances. Cela conduit à la partie la plus importante de ce livre fondateur, les cadres de référence peuvent-ils potentiellement être le chaînon manquant vital vers la construction d'une IA plus avancée ou même d'un système AGI ? Jeff lui-même croit en un avenir inévitable lorsqu'un AGI apprendra des modèles du monde à l'aide de cadres de référence cartographiques similaires au néocortex, et il fait un travail remarquable pour illustrer pourquoi il croit cela.

Partenaire fondateur d'unite.AI et membre du Conseil technologique de Forbes, Antoine est un futuriste qui est passionné par l'avenir de l'IA et de la robotique.

Il est également le fondateur de Titres.io, un site Web axé sur l'investissement dans les technologies de rupture.