Série Futurista

6 melhores livros sobre aprendizado de máquina e IA de todos os tempos (maio de 2024)

Atualização do on 23 de abril de 2024

O mundo da IA pode ser intimidante devido à terminologia e aos diferentes algoritmos de aprendizado de máquina disponíveis. Depois de ler mais de 50 dos livros mais recomendados sobre aprendizado de máquina, compilei minha lista pessoal de livros de leitura obrigatória.

Os livros escolhidos são baseados nos tipos de ideias que são introduzidas e em quão bem diferentes conceitos, como aprendizado profundo, aprendizado por reforço e algoritmos genéticos, são apresentados. Mais importante ainda, a lista é baseada nos livros que melhor abrem o caminho para futuristas e pesquisadores para a construção de uma IA comprovadamente responsável e explicável.

# 6. Como funciona a IA: da feitiçaria à ciência por Ronald T. Kneusel

“How AI Works” é um livro sucinto e claro projetado para delinear os fundamentos básicos do aprendizado de máquina. Este livro facilita o aprendizado sobre a rica história do aprendizado de máquina, percorrendo desde o início dos sistemas legados de IA até o advento das metodologias contemporâneas.

A história é dividida em camadas, começando com sistemas de IA bem fundamentados, como máquinas de vetores de suporte, árvores de decisão e florestas aleatórias. Esses sistemas anteriores abriram caminho para avanços inovadores, levando ao desenvolvimento de abordagens mais sofisticadas, como redes neurais e redes neurais convolucionais. O livro discute os incríveis recursos oferecidos pelos Large Language Models (LLMs), que são a força motriz por trás da IA generativa de última geração da atualidade.

Compreender os princípios básicos, como a forma como a tecnologia de ruído para imagem pode replicar imagens existentes e até mesmo criar imagens novas e sem precedentes a partir de estímulos aparentemente aleatórios, é fundamental para compreender as forças que impulsionam os geradores de imagens atuais. Este livro explica lindamente esses aspectos fundamentais, permitindo aos leitores compreender as complexidades e a mecânica subjacente das tecnologias de geração de imagens.

Ron Kneusel, o autor, demonstra um esforço louvável ao elucidar suas perspectivas sobre por que o ChatGPT da OpenAI e seu modelo LLM significam o início da verdadeira IA. Ele apresenta meticulosamente como LLMs distintos exibem propriedades emergentes capazes de compreender intuitivamente a teoria da mente. Estas propriedades emergentes parecem tornar-se mais pronunciadas e influentes com base no tamanho do modelo de treinamento. Kneusel discute como uma quantidade maior de parâmetros normalmente resulta nos modelos LLM mais proficientes e bem-sucedidos, fornecendo insights mais profundos sobre a dinâmica de escalonamento e a eficácia desses modelos.

Este livro é um guia para aqueles que desejam aprender mais sobre o mundo da IA, oferecendo uma visão geral detalhada, porém compreensível, da trajetória evolutiva das tecnologias de aprendizado de máquina, desde suas formas rudimentares até as entidades pioneiras de hoje. Quer você seja um novato ou alguém com um conhecimento substancial do assunto, “Como funciona a IA” foi projetado para fornecer uma compreensão refinada das tecnologias transformadoras que continuam a moldar nosso mundo.

# 5. Vida 3.0 por Max Tegmark

"Vida 3.0” tem um objetivo ambicioso e é explorar as possibilidades de como coexistiremos com a IA no futuro. A Inteligência Geral Artificial (AGI) é a consequência eventual e inevitável da argumento de explosão de inteligência feito pelo matemático britânico Irving Good em 1965. Este argumento estipula que a inteligência sobre-humana será o resultado de uma máquina que pode melhorar continuamente. A famosa citação para a explosão de inteligência é a seguinte:

“Que uma máquina ultrainteligente seja definida como uma máquina que pode superar em muito todas as atividades intelectuais de qualquer homem, por mais inteligente que seja. Como o projeto de máquinas é uma dessas atividades intelectuais, uma máquina ultrainteligente poderia projetar máquinas ainda melhores; haveria então inquestionavelmente uma 'explosão de inteligência', e a inteligência do homem seria deixada para trás. Assim, a primeira máquina ultrainteligente é a última invenção que o homem precisa fazer.”

Max Tegmark lança o livro em um futuro teórico de viver em um mundo controlado por um AGI. A partir deste momento, perguntas explosivas são feitas, como o que é inteligência? O que é memória? O que é computação? e, o que é aprender? Como essas perguntas e possíveis respostas acabam levando ao paradigma de uma máquina que pode usar vários tipos de aprendizado de máquina para alcançar os avanços no autoaperfeiçoamento necessários para alcançar a inteligência de nível humano e a inevitável superinteligência resultante?

Esse é o tipo de pensamento avançado e questões importantes que o Life 3.0 explora. Life 1.0 são formas de vida simples, como bactérias, que só podem mudar por meio da evolução que modifica seu DNA. Life 2.0 são formas de vida que podem redesenhar seu próprio software, como aprender um novo idioma ou habilidade. O Life 3.0 é uma IA que pode não apenas modificar seu próprio comportamento e habilidades, mas também modificar seu próprio hardware, por exemplo, atualizando seu eu robótico.

Somente quando entendermos os benefícios e as armadilhas de uma AGI, poderemos começar a revisar as opções para garantir a construção de uma IA amigável que possa se alinhar aos nossos objetivos. Para fazer isso, também precisamos entender o que é consciência? E como a consciência da IA será diferente da nossa?

Existem muitos tópicos importantes que são explorados neste livro, e deve ser uma leitura obrigatória para qualquer pessoa que realmente deseje entender como a AGI é uma ameaça em potencial, além de ser uma linha de vida em potencial para o futuro da civilização humana.

# 4. Compatível com humanos: inteligência artificial e o problema do controle por Stuart Russel

O que acontece se conseguirmos construir um agente inteligente, algo que perceba, que atue e que seja mais inteligente que seus criadores? Como convenceremos as máquinas a atingir nossos objetivos em vez de seus próprios objetivos?

O exposto acima é o que leva a um dos conceitos mais importantes do livro “Compatível com humanos: inteligência artificial e o problema do controle” é que devemos evitar “colocar um propósito na máquina”, como disse certa vez Norbert Wiener. Uma máquina inteligente que está muito certa de seus objetivos fixos é o tipo definitivo de IA perigosa. Em outras palavras, se a IA não estiver disposta a considerar a possibilidade de estar errada ao executar seu propósito e função pré-programados, pode ser impossível desligar o sistema de IA.

A dificuldade descrita por Stuart Russell está em instruir o AI/robô de que nenhum comando instruído deve ser alcançado a qualquer custo. Não é certo sacrificar a vida humana para buscar um café ou grelhar o gato para fornecer o almoço. Deve-se entender que “leve-me ao aeroporto o mais rápido possível” não implica que as leis de excesso de velocidade possam ser infringidas, mesmo que essa instrução não seja explícita. Se a IA errar o que foi dito acima, o fail safe é um certo nível pré-programado de incerteza. Com alguma incerteza, a IA pode se desafiar antes de concluir uma tarefa, talvez para buscar confirmação verbal.

Em um artigo de 1965 intitulado “Especulações sobre a primeira máquina de ultrainteligência“, IJ Good, um matemático brilhante que trabalhou ao lado de Alan Turing, afirmou: “A sobrevivência do homem depende da construção precoce de uma máquina ultrainteligente”. É perfeitamente possível que, para nos salvarmos de desastres ecológicos, biológicos e humanitários, devamos construir a IA mais avançada que pudermos.

Este documento seminal explica a explosão da inteligência, sendo essa teoria que uma máquina ultrainteligente pode projetar máquinas ainda melhores e superiores a cada iteração, e isso inevitavelmente leva à criação de uma AGI. Embora o AGI possa inicialmente ser de inteligência igual a um humano, ele ultrapassaria rapidamente os humanos em um curto espaço de tempo. Devido a essa conclusão precipitada, é importante que os desenvolvedores de IA atualizem os princípios básicos compartilhados neste livro e aprendam como aplicá-los com segurança ao projetar sistemas de IA capazes não apenas de servir aos humanos, mas também de salvá-los de si mesmos. .

Conforme descrito por Stuart Russell, recuar da pesquisa de IA não é uma opção, devemos seguir em frente. Este livro é um roteiro para nos guiar no projeto de sistemas de IA seguros, responsáveis e comprovadamente benéficos.

# 3. Como criar uma mente por Ray Kurzweil

Ray Kurzweil é um dos principais inventores, pensadores e futuristas do mundo, ele é conhecido como “o gênio inquieto” do The Wall Street Journal e “a máquina de pensar definitiva” da revista Forbes. Ele também é co-fundador da Singularity University e é mais conhecido por seu livro inovador “The Singularity is Near”. “Como criar uma mente” aborda menos as questões de crescimento exponencial que são marcas registradas de seu outro trabalho, em vez disso, concentra-se em como precisamos entender o cérebro humano para fazer engenharia reversa para criar a máquina pensante definitiva.

Um dos principais princípios descritos neste trabalho seminal é como o reconhecimento de padrões funciona no cérebro humano. Como os humanos reconhecem padrões na vida cotidiana? Como essas conexões são formadas no cérebro? O livro começa com a compreensão do pensamento hierárquico, isto é, a compreensão de uma estrutura que é composta de diversos elementos que são organizados em um padrão, esse arranjo então representa um símbolo como uma letra ou caractere, e então isso é organizado em um padrão mais avançado. como uma palavra e, eventualmente, uma frase. Eventualmente, esses padrões formam ideias, e essas ideias são transformadas em produtos que os humanos são responsáveis por construir.

Como é um livro de Ray Kurzweil, é claro que não demora muito para que o pensamento exponencial seja introduzido. O "Lei dos Retornos Acelerados' é uma marca registrada deste livro seminal. Essa lei mostra como as tecnologias e o ritmo de aceleração estão se acelerando devido à tendência de os avanços se alimentarem de si mesmos, aumentando ainda mais a taxa de progresso. Esse pensamento pode então ser aplicado à rapidez com que estamos aprendendo a entender e fazer engenharia reversa do cérebro humano. Essa compreensão acelerada dos sistemas de reconhecimento de padrões no cérebro humano pode ser aplicada na construção de um sistema AGI.

Este livro foi tão transformador para o futuro da IA que Eric Schmidt recrutou Ray Kurzweil para trabalhar em projetos de IA depois que ele terminou de ler este livro seminal. É impossível delinear todas as ideias e conceitos que são discutidos em um pequeno artigo, no entanto, é um livro de leitura instrumental para entender melhor como as redes neurais humanas funcionam para projetar um avançado rede neural artificial.

O reconhecimento de padrões é o elemento-chave para o aprendizado profundo, e este livro ilustra o porquê.

# 2. O algoritmo mestre por Pedro Domingos

A hipótese central de O algoritmo mestre é que todo conhecimento – passado, presente e futuro – pode ser derivado de dados por um único algoritmo de aprendizado universal que é quantificado como um Algoritmo Mestre. O livro detalha algumas das principais metodologias de aprendizado de máquina, fornece explicações detalhadas sobre como diferentes algoritmos funcionam, como eles podem ser otimizados e como eles podem trabalhar de forma colaborativa para alcançar o objetivo final de criar o algoritmo Mestre. Este é um algoritmo capaz de resolver qualquer problema que o alimentemos, e isso inclui a cura do câncer.

O leitor começará aprendendo sobre Baías ingénuas, um algoritmo simples que pode ser explicado em uma equação simples. A partir daí, ele acelera a toda velocidade para técnicas de aprendizado de máquina mais interessantes. Para entender as tecnologias que estão nos acelerando em direção a esse algoritmo mestre, aprendemos sobre fundamentos convergentes. Primeiro, com a neurociência aprendemos sobre a plasticidade cerebral, as redes neurais humanas. Em segundo lugar, passamos para a seleção natural em uma aula para entender como projetar um algoritmo genético que simule a evolução e a seleção natural. Com um algoritmo genético, uma população de hipóteses em cada geração se cruza e sofre mutações, a partir daí os algoritmos mais aptos produzem a próxima geração. Esta evolução oferece o máximo em auto-aperfeiçoamento.

Outros argumentos vêm da física, estatística e, claro, do melhor da ciência da computação. É impossível revisar de forma abrangente todas as diferentes facetas abordadas neste livro, devido ao escopo ambicioso do livro de estabelecer a estrutura para a construção do Algoritmo Mestre. É essa estrutura que colocou este livro em segundo lugar, já que todos os outros livros de aprendizado de máquina se baseiam nisso de alguma forma.

# 1. Mil cérebros por Jeff Hawkins

"Mil cérebros” baseia-se nos conceitos discutidos no livro anterior de Jeff Hawkins intitulado “On Intelligence”. “On Intelligence” explorou a estrutura para entender como a inteligência humana funciona e como esses conceitos podem ser aplicados na construção dos sistemas definitivos de IA e AGI. Ele analisa fundamentalmente como nossos cérebros prevêem o que experimentaremos antes de experimentá-lo.

Embora “A Thousand Brains” seja um ótimo livro independente, será melhor aproveitado e apreciado se “Sobre Inteligência” é lido primeiro.

“A Thousand Brains” baseia-se nas pesquisas mais recentes de Jeff Hawkins e da empresa que ele fundou chamada numenta. Numenta tem como objetivo principal desenvolver uma teoria sobre como o neocórtex funciona, o objetivo secundário é como essa teoria do cérebro pode ser aplicada ao aprendizado de máquina e à inteligência de máquina.

A primeira grande descoberta de Numenta em 2010 envolve como os neurônios fazem previsões, e a segunda descoberta em 2016 envolveu quadros de referência semelhantes a mapas no neocórtex. O livro detalha em primeiro lugar o que é a “teoria dos Mil Cérebros”, quais são os quadros de referência e como a teoria funciona no mundo real. Um dos componentes mais fundamentais por trás dessa teoria é entender como o neocórtex evoluiu até seu tamanho atual.

O neocórtex começou pequeno, semelhante a outros mamíferos, mas cresceu exponencialmente (sendo limitado apenas pelo tamanho do canal do parto) não por criar algo novo, mas por copiar repetidamente um circuito básico. Em essência, o que diferencia os humanos não é o material orgânico do cérebro, mas o número de cópias dos elementos idênticos que formam o neocórtex.

A teoria evolui ainda mais para a forma como o neocórtex é formado com aproximadamente 150,000 colunas corticais que não são visíveis ao microscópio, pois não há limites visíveis entre elas. A forma como essas colunas corticais se comunicam entre si é a implementação de um algoritmo fundamental que é responsável por todos os aspectos da percepção e da inteligência.

Mais importante, o livro revela como essa teoria pode ser aplicada na construção de máquinas inteligentes e as possíveis implicações futuras para a sociedade. Por exemplo, o cérebro aprende um modelo do mundo observando como as entradas mudam ao longo do tempo, especialmente quando o movimento é aplicado. As colunas corticais requerem um quadro de referência fixo a um objeto, esses quadros de referência permitem que uma coluna cortical aprenda as localizações de recursos que definem as realidades de um objeto. Em essência, quadros de referência podem organizar qualquer tipo de conhecimento. Isso leva à parte mais importante deste livro seminal: os quadros de referência podem ser o elo perdido vital para a construção de uma IA mais avançada ou mesmo de um sistema AGI? O próprio Jeff acredita em um futuro inevitável, quando um AGI aprenderá modelos do mundo usando quadros de referência parecidos com mapas semelhantes ao neocórtex, e ele faz um trabalho notável ilustrando por que acredita nisso.