Sèrie futurista

6 millors llibres d'aprenentatge automàtic i IA de tots els temps (maig de 2024)

actualitzat on Abril 23, 2024

El món de la IA pot ser intimidant a causa de la terminologia i els diferents algorismes d'aprenentatge automàtic disponibles. Després d'haver llegit més de 50 dels llibres més recomanats sobre aprenentatge automàtic, he compilat la meva llista personal de llibres que cal llegir.

Els llibres escollits es basen en els tipus d'idees que s'introdueixen i en la presentació de diferents conceptes com ara l'aprenentatge profund, l'aprenentatge de reforç i els algorismes genètics. El més important, la llista es basa en els llibres que millor aplanen el camí per als futuristes i els investigadors cap a la creació d'una IA demostrablement responsable i explicable.

# 6. Com funciona la IA: de la bruixeria a la ciència per Ronald T. Kneusel

"Com funciona la IA" és un llibre concis i clar dissenyat per delinear els fonaments bàsics de l'aprenentatge automàtic. Aquest llibre facilita l'aprenentatge sobre la rica història de l'aprenentatge automàtic, des de l'inici dels sistemes d'IA heretats fins a l'arribada de les metodologies contemporànies.

La història està en capes, començant pels sistemes d'IA ben fonamentats, com ara màquines vectorials de suport, arbres de decisió i boscos aleatoris. Aquests sistemes anteriors van obrir el camí per a avenços innovadors, que van conduir al desenvolupament d'enfocaments més sofisticats com les xarxes neuronals i les xarxes neuronals convolucionals. El llibre parla de les increïbles capacitats que ofereixen els grans models de llenguatge (LLM), que són la potència darrere de la IA generativa d'última generació actual.

Comprendre els conceptes bàsics, com ara com la tecnologia de soroll a imatge pot replicar les imatges existents i fins i tot crear imatges noves i sense precedents a partir d'indicacions aparentment aleatòries, és fonamental per comprendre les forces que impulsen els generadors d'imatges actuals. Aquest llibre explica de manera meravellosa aquests aspectes fonamentals, permetent als lectors comprendre les complexitats i la mecànica subjacent de les tecnologies de generació d'imatges.

Ron Kneusel, l'autor, demostra un esforç lloable per dilucidar les seves perspectives sobre per què el ChatGPT d'OpenAI i el seu model LLM signifiquen l'inici de la veritable IA. Presenta meticulosament com els diferents LLM presenten propietats emergents capaços d'entendre de manera intuïtiva la teoria de la ment. Aquestes propietats emergents semblen ser més pronunciades i influents en funció de la mida del model d'entrenament. Kneusel parla de com una quantitat més gran de paràmetres normalment dóna com a resultat els models de LLM més competents i exitosos, proporcionant una visió més profunda de la dinàmica d'escala i l'eficàcia d'aquests models.

Aquest llibre és un far per a aquells que volen aprendre més sobre el món de la IA, oferint una visió general detallada però comprensible de la trajectòria evolutiva de les tecnologies d'aprenentatge automàtic, des de les seves formes rudimentàries fins a les entitats pioneres d'avui. Tant si sou un novell com si sou algú amb un coneixement substancial del tema, "Com funciona la IA" està dissenyat per oferir-vos una comprensió refinada de les tecnologies transformadores que continuen donant forma al nostre món.

# 5. Vida 3.0 de Max Tegmark

"Vida 3.0” té un objectiu ambiciós i és explorar les possibilitats de com coexistirem amb la IA en el futur. La Intel·ligència General Artificial (AGI) és l'eventual i inevitable conseqüència de la argument de l'explosió de la intel·ligència fet pel matemàtic britànic Irving Good l'any 1965. Aquest argument estipula que la intel·ligència sobrehumana serà el resultat d'una màquina que pugui millorar contínuament. La famosa cita de l'explosió de la intel·ligència és la següent:

"Que una màquina ultraintel·ligent es defineixi com una màquina que pot superar amb escreix totes les activitats intel·lectuals de qualsevol home per més intel·ligent. Com que el disseny de màquines és una d'aquestes activitats intel·lectuals, una màquina ultraintel·ligent podria dissenyar màquines encara millors; Llavors hi hauria, sens dubte, una "explosió d'intel·ligència", i la intel·ligència de l'home quedaria molt enrere. Així, la primera màquina ultraintel·ligent és l'últim invent que l'home ha de fer mai".

Max Tegmark llança el llibre a un futur teòric de viure en un món controlat per un AGI. A partir d'aquest moment es fan preguntes explosives com què és la intel·ligència? Què és la memòria? Què és la computació? i què és l'aprenentatge? Com aquestes preguntes i possibles respostes porten finalment al paradigma d'una màquina que pot utilitzar diversos tipus d'aprenentatge automàtic per aconseguir els avenços en la millora personal que es necessiten per aconseguir la intel·ligència a nivell humà i la superintel·ligència resultant inevitable?

Aquests són el tipus de pensament avançat i preguntes importants que explora Life 3.0. Life 1.0 són formes de vida simples com els bacteris que només poden canviar mitjançant l'evolució que modifica el seu ADN. Life 2.0 són formes de vida que poden redissenyar el seu propi programari, com ara l'aprenentatge d'un nou idioma o habilitat. Life 3.0 és una IA que no només pot modificar el seu propi comportament i habilitats, sinó que també pot modificar el seu propi maquinari, per exemple, actualitzant el seu jo robòtic.

Només quan entenem els avantatges i els inconvenients d'un AGI, podem començar a revisar les opcions per assegurar-nos que construïm una IA amigable que pugui alinear-se amb els nostres objectius. Per fer-ho potser també necessitem entendre què és la consciència? I en què diferirà la consciència de la IA de la nostra?

Hi ha molts temes candents que s'exploren en aquest llibre, i hauria de ser una lectura obligatòria per a qualsevol persona que realment vulgui entendre com l'AGI és una amenaça potencial, a més de ser una salvavida potencial per al futur de la civilització humana.

# 4. Human Compatible: la intel·ligència artificial i el problema del control per Stuart Russell

Què passa si aconseguim construir un agent intel·ligent, quelcom que percep, que actua i que és més intel·ligent que els seus creadors? Com convèncer les màquines perquè assoleixin els nostres objectius en comptes dels seus propis objectius?

L'anterior és el que porta a un dels conceptes més importants del llibre "Human Compatible: la intel·ligència artificial i el problema del control" és que hem d'evitar "posar un propòsit a la màquina", com va dir una vegada Norbert Wiener. Una màquina intel·ligent que està massa segura dels seus objectius fixos és el tipus definitiu d'IA perillosa. En altres paraules, si l'IA no està disposada a considerar la possibilitat que s'hagi equivocat a l'hora de realitzar el seu propòsit i funció preprogramats, llavors pot ser impossible que el sistema d'IA s'apagui.

La dificultat descrita per Stuart Russell és indicar a l'IA/robot que no es pretén aconseguir cap comandament instruït a qualsevol preu. No està bé sacrificar la vida humana per anar a buscar un cafè o fer a la planxa el gat per subministrar el dinar. S'ha d'entendre que “porta'm a l'aeroport el més ràpid possible”, no implica que es puguin incomplir les lleis d'excés de velocitat, encara que aquesta instrucció no sigui explícita. En cas que l'IA s'equivoqui, la seguretat contra errors és un cert nivell d'incertesa preprogramat. Amb certa incertesa, l'IA pot desafiar-se abans de completar una tasca, potser per buscar una confirmació verbal.

En un article de 1965 titulat "Especulacions sobre la primera màquina d'ultraintel·ligència", IJ Good, un matemàtic brillant que va treballar al costat d'Alan Turing, va declarar: "La supervivència de l'home depèn de la construcció primerenca d'una màquina ultraintel·ligent". És totalment possible que per salvar-nos d'un desastre ecològic, biològic i humanitari hem de construir la IA més avançada que puguem.

Aquest article fonamental explica l'explosió de la intel·ligència, aquesta teoria és que una màquina ultraintel·ligent pot dissenyar màquines encara millors i superiors amb cada iteració, i això condueix inevitablement a la creació d'un AGI. Tot i que l'AGI pot ser inicialment de la mateixa intel·ligència que un humà, superaria ràpidament els humans en un curt període de temps. A causa d'aquesta conclusió prèvia, és important que els desenvolupadors d'IA actualitzin els principis bàsics que es comparteixen en aquest llibre i aprenguin a aplicar-los de manera segura al disseny de sistemes d'IA que siguin capaços no només de servir els humans, sinó de salvar els humans d'ells mateixos. .

Tal com va assenyalar Stuart Russell, retirar-se de la investigació en IA no és una opció, hem d'avançar. Aquest llibre és un full de ruta per guiar-nos cap a dissenyar sistemes d'IA segurs, responsables i proveïbles.

# 3. Com crear una ment de Ray Kurzweil

Ray Kurzweil ho és un dels principals inventors, pensadors i futuristes del món, se li ha conegut "el geni inquiet" de The Wall Street Journal i "la màquina de pensar definitiva" de la revista Forbes. També és cofundador de Singularity University, i és més conegut pel seu llibre innovador "The Singularity is Near". “Com crear una ment"aborda menys els problemes del creixement exponencial que són els distintius del seu altre treball, sinó que se centra en com hem d'entendre el cervell humà per tal d'enginyar-lo inversament per crear la màquina de pensar definitiva.

Un dels principals principals esbossats en aquest treball fonamental és com funciona el reconeixement de patrons al cervell humà. Com reconeixen els humans els patrons de la vida quotidiana? Com es formen aquestes connexions al cervell? El llibre comença amb la comprensió del pensament jeràrquic, això és entendre una estructura que es compon de diversos elements que estan disposats en un patró, aquesta disposició representa un símbol com una lletra o un caràcter i, a continuació, s'organitza en un patró més avançat. com ara una paraula i, finalment, una frase. Finalment, aquests patrons formen idees, i aquestes idees es transformen en els productes que els humans són responsables de construir.

Com que és un llibre de Ray Kurzweil, per descomptat, no triga gaire a introduir el pensament exponencial. El "Llei de l'acceleració de la rendibilitat' és un segell distintiu d'aquest llibre seminal. Aquesta llei mostra com les tecnologies i el ritme d'acceleració s'acceleren a causa de la tendència que els avenços s'alimenten d'ells mateixos, augmentant encara més el ritme de progrés. Aquest pensament es pot aplicar després a la rapidesa amb què estem aprenent a entendre i fer enginyeria inversa del cervell humà. Aquesta comprensió accelerada dels sistemes de reconeixement de patrons al cervell humà es pot aplicar després per construir un sistema AGI.

Aquest llibre va ser tan transformador per al futur de la IA, que Eric Schmidt va reclutar Ray Kurzweil per treballar en projectes d'IA després d'acabar de llegir aquest llibre fonamental. És impossible esbossar totes les idees i conceptes que es comenten en un article breu, no obstant això, és un llibre instrumental que cal llegir per entendre millor com funcionen les xarxes neuronals humanes per dissenyar un sistema avançat. xarxa neuronal artificial.

El reconeixement de patrons és l'element clau per a l'aprenentatge profund, i aquest llibre il·lustra per què.

# 2. L'algoritme mestre per Pedro Domingos

La hipòtesi central de L'algoritme mestre és que tot el coneixement (passat, present i futur) es pot derivar de les dades mitjançant un únic algorisme d'aprenentatge universal que es quantifica com un algorisme mestre. El llibre detalla algunes de les principals metodologies d'aprenentatge automàtic, ofereix explicacions detallades sobre com funcionen els diferents algorismes, com es poden optimitzar i com poden treballar de manera col·laborativa per assolir l'objectiu final de crear l'algoritme mestre. Aquest és un algorisme que és capaç de resoldre qualsevol problema que l'alimentem, i això inclou curar el càncer.

El lector començarà aprenent sobre Bayes naïf, un algorisme senzill que es pot explicar en una equació senzilla. A partir d'aquí, accelera a tota velocitat en tècniques d'aprenentatge automàtic més interessants. Per entendre les tecnologies que ens estan accelerant cap a aquest algorisme mestre, aprenem sobre els fonaments convergents. En primer lloc, des de la neurociència aprenem sobre la plasticitat cerebral, les xarxes neuronals humanes. En segon lloc, passem a la selecció natural en una lliçó per entendre com dissenyar un algorisme genètic que simuli l'evolució i la selecció natural. Amb un algorisme genètic, una població d'hipòtesis de cada generació es creua i muta, a partir d'aquí els algorismes més aptes produeixen la següent generació. Aquesta evolució ofereix el màxim en autosuperació.

Altres arguments provenen de la física, l'estadística i, per descomptat, el millor de la informàtica. És impossible revisar de manera exhaustiva totes les diferents facetes que toca aquest llibre, a causa de l'ambiciós abast del llibre per establir el marc per construir l'algoritme mestre. Aquest marc és el que ha empès aquest llibre al segon lloc, ja que tots els altres llibres d'aprenentatge automàtic es basen en això d'alguna forma o forma.

# 1. Mil Cervells de Jeff Hawkins

"Mil Cervells” es basa en els conceptes que es discuteixen en el llibre anterior de Jeff Hawkins titulat “On Intelligence”. "Sobre la intel·ligència" va explorar el marc per entendre com funciona la intel·ligència humana i com aquests conceptes es poden aplicar per construir els sistemes d'IA i AGI definitius. Analitza fonamentalment com el nostre cervell prediu el que experimentarem abans de viure-ho.

Tot i que "A Thousand Brains" és un gran llibre autònom, serà millor gaudir i apreciar si "Sobre Intel·ligència” es llegeix primer.

"A Thousand Brains" es basa en l'última investigació de Jeff Hawkins i l'empresa que va fundar anomenada numenta. Numenta té com a objectiu principal desenvolupar una teoria sobre com funciona el neocòrtex, l'objectiu secundari és com aquesta teoria del cervell es pot aplicar a l'aprenentatge automàtic i a la intel·ligència automàtica.

El primer descobriment important de Numenta el 2010 implica com les neurones fan prediccions, i el segon descobriment el 2016 va implicar marcs de referència com a mapes al neocòrtex. El llibre detalla, en primer lloc, què és la "teoria dels mil cervells", quins són els marcs de referència i com funciona la teoria al món real. Un dels components més fonamentals darrere d'aquesta teoria és entendre com va evolucionar el neocòrtex fins a la seva mida actual.

El neocòrtex va començar petit, semblant a altres mamífers, però va créixer exponencialment (només està limitat per la mida del canal de part) no creant res nou, sinó copiant un circuit bàsic repetidament. En essència, el que diferencia els humans no és el material orgànic del cervell sinó el nombre de còpies dels elements idèntics que formen el neocòrtex.

La teoria evoluciona encara més cap a com es forma el neocòrtex amb aproximadament 150,000 columnes corticals que no són visibles al microscopi, ja que no hi ha límits visibles entre elles. Com es comuniquen aquestes columnes corticals entre si, és la implementació d'un algorisme fonamental que és responsable de tots els aspectes de la percepció i la intel·ligència.

Més important encara, el llibre revela com aquesta teoria es pot aplicar a la construcció de màquines intel·ligents i les possibles implicacions futures per a la societat. Per exemple, el cervell aprèn un model del món observant com canvien els inputs amb el temps, especialment quan s'aplica el moviment. Les columnes corticals requereixen un marc de referència que està fixat a un objecte, aquests marcs de referència permeten a una columna cortical conèixer les ubicacions de les característiques que defineixen la realitat d'un objecte. En essència, els marcs de referència poden organitzar qualsevol tipus de coneixement. Això condueix a la part més important d'aquest llibre fonamental, els marcs de referència poden ser potencialment l'enllaç vital que falta per construir una IA més avançada o fins i tot un sistema AGI? El mateix Jeff creu en un futur inevitable quan un AGI aprendrà models del món utilitzant marcs de referència de mapes similars al neocòrtex, i fa una feina notable il·lustrant per què creu això.