Série Futurista
6 Melhores Livros de Aprendizado de MĂĄquina e InteligĂȘncia Artificial de Todos os Tempos

O mundo da inteligência artificial pode ser intimidador devido à terminologia e aos diferentes algoritmos de aprendizado de máquina disponíveis. Após ter lido mais de 50 dos livros mais recomendados sobre aprendizado de máquina, compilei minha lista pessoal de livros que devem ser lidos.
Os livros escolhidos são baseados nos tipos de ideias que são introduzidas e como bem diferentes conceitos, como aprendizado profundo, aprendizado por reforço e algoritmos genéticos, são apresentados. O mais importante é que a lista é baseada nos livros que melhor pavimentam o caminho para futuristas e pesquisadores em direção à construção de inteligência artificial responsável e explicável.
#6. Como a Inteligência Artificial Funciona: Da Magia à Ciência por Ronald T. Kneusel
“Como a Inteligência Artificial Funciona” é um livro conciso e claro projetado para delinear os fundamentos básicos do aprendizado de máquina. Este livro facilita o aprendizado sobre a rica história do aprendizado de máquina, viajando desde a invenção de sistemas de inteligência artificial legados até o advento de metodologias contemporâneas.
A história é estratificada, começando com sistemas de inteligência artificial bem fundamentados, como máquinas de vetores de suporte, árvores de decisão e florestas aleatórias. Esses sistemas anteriores pavimentaram o caminho para avanços revolucionários, levando ao desenvolvimento de abordagens mais sofisticadas, como redes neurais e redes neurais convolucionais. O livro discute as incríveis capacidades oferecidas pelos Modelos de Linguagem Grande (LLMs), que são a força motriz por trás da inteligência artificial geradora de estado da arte de hoje.
Entender os básicos, como a tecnologia de imagem-ruído pode replicar imagens existentes e até criar novas imagens inéditas a partir de prompts aparentemente aleatórios, é fundamental para entender as forças que impulsionam os geradores de imagem de hoje. Este livro explica de forma clara esses aspectos fundamentais, permitindo que os leitores compreendam as complexidades e a mecânica subjacente das tecnologias de geração de imagem.
Ron Kneusel, o autor, demonstra um esforço notável ao explicar suas perspectivas sobre por que o ChatGPT da OpenAI e seu modelo LLM significam o início da verdadeira inteligência artificial. Ele apresenta de forma meticulosa como LLMs distintos exibem propriedades emergentes capazes de entender intuitivamente a teoria da mente. Essas propriedades emergentes parecem se tornar mais pronunciadas e influentes com base no tamanho do modelo de treinamento. Kneusel discute como uma maior quantidade de parâmetros geralmente resulta nos modelos LLM mais proficientes e bem-sucedidos, fornecendo insights mais profundos sobre a dinâmica de escalabilidade e eficácia desses modelos.
Este livro é um farol para aqueles que desejam aprender mais sobre o mundo da inteligência artificial, oferecendo uma visão geral detalhada e compreensível da trajetória evolutiva das tecnologias de aprendizado de máquina, desde suas formas rudimentares até as entidades pioneiras de hoje. Seja você um iniciante ou alguém com um conhecimento substancial do assunto, “Como a Inteligência Artificial Funciona” é projetado para fornecer uma compreensão refinada das tecnologias transformadoras que continuam a moldar nosso mundo.
#5. Vida 3.0 por Max Tegmark
“Vida 3.0” tem um objetivo ambicioso: explorar as possibilidades de como coexistiremos com a inteligência artificial no futuro. A Inteligência Artificial Geral (IAG) é a consequência eventual e inevitável do argumento da explosão de inteligência, apresentado pelo matemático britânico Irving Good em 1965. Este argumento estipula que a superinteligência será o resultado de uma máquina que possa se auto-aperfeiçoar continuamente. A famosa citação para a explosão de inteligência é a seguinte:
Deixe que uma máquina ultrainteligente seja definida como uma máquina que pode superar todas as atividades intelectuais de qualquer homem, por mais inteligente que seja. Como o design de máquinas é uma dessas atividades intelectuais, uma máquina ultrainteligente poderia projetar máquinas ainda melhores; haveria, então, sem dúvida, uma “explosão de inteligência” e a inteligência do homem seria deixada muito para trás. Portanto, a primeira máquina ultrainteligente é a última invenção que o homem precisará fazer.
Max Tegmark lança o livro em um futuro teórico de viver em um mundo controlado por uma IAG. A partir desse momento, surgem questões explosivas, como o que é inteligência? O que é memória? O que é computação? E o que é aprendizado? Como essas questões e possíveis respostas levam eventualmente ao paradigma de uma máquina que pode usar vários tipos de aprendizado de máquina para alcançar os avanços necessários para o auto-aperfeiçoamento e a superinteligência resultante?
Essas são as questões de pensamento prospectivo e importantes que “Vida 3.0” explora. A Vida 1.0 é formas de vida simples, como bactérias, que só podem mudar por meio da evolução que modifica seu DNA. A Vida 2.0 são formas de vida que podem redesenhar seu próprio software, como aprender um novo idioma ou habilidade. A Vida 3.0 é uma inteligência artificial que não apenas pode modificar seu próprio comportamento e habilidades, mas também pode modificar seu próprio hardware, por exemplo, atualizando seu eu robótico.
Somente quando entendermos os benefícios e armadilhas de uma IAG, podemos começar a revisar opções para garantir que construamos uma inteligência artificial amigável que possa alinhar-se com nossos objetivos. Para fazer isso, também podemos precisar entender o que é consciência? E como a consciência da inteligência artificial diferirá da nossa?
Existem muitos tópicos quentes explorados neste livro, e ele deve ser leitura obrigatória para qualquer um que realmente deseje entender como a IAG é uma ameaça potencial, bem como uma possível linha de vida para o futuro da civilização humana.
#4. Inteligência Artificial Compatível com Humanos: A Inteligência Artificial e o Problema do Controle por Stuart Russell
O que acontece se formos bem-sucedidos em construir um agente inteligente, algo que percebe, age e é mais inteligente do que seus criadores? Como convenceremos as máquinas a alcançar nossos objetivos em vez dos seus?
O que leva a um dos conceitos mais importantes do livro “Inteligência Artificial Compatível com Humanos: A Inteligência Artificial e o Problema do Controle” é que devemos evitar “colocar um propósito na máquina”, como disse Norbert Wiener. Uma máquina inteligente que é muito certa de seus objetivos fixos é o tipo mais perigoso de inteligência artificial. Em outras palavras, se a inteligência artificial se tornar relutante em considerar a possibilidade de que está errada em realizar sua função e propósito pré-programados, pode ser impossível fazer com que o sistema de inteligência artificial se desligue.
A dificuldade, como delineada por Stuart Russell, está em instruir a inteligência artificial/robô de que nenhum comando instruído é destinado a ser alcançado a qualquer custo. Não é aceitável sacrificar vidas humanas para buscar um café ou grelhar o gato para fornecer almoço. Deve ser entendido que “leve-me ao aeroporto o mais rápido possível” não implica que as leis de trânsito possam ser quebradas, mesmo que essa instrução não seja explícita. Se a inteligência artificial errar, então o fail-safe é um nível pré-programado de incerteza. Com alguma incerteza, a inteligência artificial pode questionar a si mesma antes de completar uma tarefa, para talvez buscar confirmação verbal.
Em um artigo de 1965 intitulado “Especulações sobre a Primeira Máquina Ultrainteligente”, I.J. Good, um matemático brilhante que trabalhou ao lado de Alan Turing, afirmou: “A sobrevivência do homem depende da construção precoce de uma máquina ultrainteligente”. É inteiramente possível que, para nos salvar de desastres ecológicos, biológicos e humanitários, devamos construir a inteligência artificial mais avançada que possamos.
Este artigo seminal explica a teoria da explosão de inteligência, que afirma que uma máquina ultrainteligente pode projetar máquinas ainda melhores com cada iteração, e isso inevitavelmente leva à criação de uma IAG. Embora a IAG possa inicialmente ter inteligência igual à humana, ela rapidamente ultrapassará os humanos em um curto período de tempo. Devido a essa conclusão pré-estabelecida, é importante que os desenvolvedores de inteligência artificial internalizem os princípios fundamentais compartilhados neste livro e aprendam a aplicá-los com segurança ao design de sistemas de inteligência artificial capazes não apenas de servir aos humanos, mas de salvar os humanos de si mesmos.
Como delineado por Stuart Russell, recuar da pesquisa de inteligência artificial não é uma opção; devemos avançar. Este livro é um mapa para guiar-nos no design de sistemas de inteligência artificial seguros, responsáveis e benéficos.
#3. Como Criar uma Mente por Ray Kurzweil
Ray Kurzweil é um dos principais inventores, pensadores e futuristas do mundo, tendo sido chamado de “o gênio inquieto” pelo The Wall Street Journal e “a máquina de pensar definitiva” pela Forbes. Ele também é co-fundador da Singularity University e é mais conhecido por seu livro revolucionário “A Singularidade está Próxima”. “Como Criar uma Mente” aborda menos os problemas de crescimento exponencial que são marcas de seu outro trabalho, em vez disso, se concentra em como precisamos entender o cérebro humano para reverse-engineerá-lo e criar a máquina de pensar definitiva.
Um dos principais conceitos apresentados nesta obra seminal é como o reconhecimento de padrões funciona no cérebro humano. Como os humanos reconhecem padrões na vida cotidiana? Como essas conexões são formadas no cérebro? O livro começa com a compreensão do pensamento hierárquico, que é a compreensão de uma estrutura composta por elementos diversos dispostos em um padrão, que representa um símbolo, como uma letra ou caractere, e então é disposto em um padrão mais avançado, como uma palavra, e eventualmente uma sentença. Eventualmente, esses padrões formam ideias, e essas ideias são transformadas nos produtos que os humanos são responsáveis por construir.
Como é um livro de Ray Kurzweil, não demora muito para que o pensamento exponencial seja introduzido. A “Lei do Aumento de Retornos” é uma marca registrada deste livro seminal. Esta lei mostra como as tecnologias e o ritmo de aceleração estão se acelerando devido à tendência de os avanços se alimentarem de si mesmos, aumentando ainda mais a taxa de progresso. Este pensamento pode ser aplicado à velocidade com que estamos aprendendo a entender e reverse-engineerar o cérebro humano. A compreensão acelerada dos sistemas de reconhecimento de padrões no cérebro humano pode ser aplicada ao desenvolvimento de um sistema de inteligência artificial geral.
Este livro foi tão transformacional para o futuro da inteligência artificial que Eric Schmidt recrutou Ray Kurzweil para trabalhar em projetos de inteligência artificial após terminar de ler este livro seminal. É impossível esboçar todas as ideias e conceitos discutidos em um artigo curto, mas é um livro instrumental que deve ser lido para entender melhor como as redes neurais humanas funcionam e como projetar uma rede neural artificial avançada.
O reconhecimento de padrões é o elemento-chave para o aprendizado profundo, e este livro ilustra por quê.
#2. O Algoritmo Mestre por Pedro Domingos
A hipótese central de “O Algoritmo Mestre” é que todo o conhecimento – passado, presente e futuro – pode ser derivado de dados por um único algoritmo de aprendizado universal, que é quantificado como o Algoritmo Mestre. O livro detalha algumas das principais metodologias de aprendizado de máquina, fornece explicações detalhadas de como diferentes algoritmos funcionam, como podem ser otimizados e como colaborativamente podem trabalhar para alcançar o objetivo final de criar o Algoritmo Mestre. Este é um algoritmo capaz de resolver qualquer problema que lhe for apresentado, incluindo a cura do câncer.
O leitor começará aprendendo sobre o teorema de Bayes, um algoritmo simples que pode ser explicado em uma única equação. A partir daí, acelera em direção a técnicas de aprendizado de máquina mais interessantes. Para entender as tecnologias que estão nos impulsionando em direção ao algoritmo mestre, aprendemos sobre fundamentos convergentes. Primeiro, a partir da neurociência, aprendemos sobre a plasticidade do cérebro, as redes neurais humanas. Em segundo lugar, passamos para a seleção natural, em uma lição para entender como projetar um algoritmo genético que simula a evolução e a seleção natural. Com um algoritmo genético, uma população de hipóteses em cada geração cruza e muta, e as hipóteses mais aptas produzem a próxima geração. Essa evolução oferece o auto-aperfeiçoamento definitivo.
Outros argumentos vêm da física, estatística e, claro, da melhor ciência da computação. É impossível revisar de forma abrangente as diferentes facetas que este livro toca, devido ao escopo ambicioso do livro em estabelecer a estrutura para construir o Algoritmo Mestre. É essa estrutura que impulsionou este livro para o segundo lugar, pois todos os outros livros de aprendizado de máquina se baseiam nisso de alguma forma.
#1. Um Mil Cérebros por Jeff Hawkins
“Um Mil Cérebros” constrói sobre os conceitos discutidos no livro anterior de Jeff Hawkins, intitulado “Sobre a Inteligência”. “Sobre a Inteligência” explorou a estrutura para entender como a inteligência humana funciona e como esses conceitos podem ser aplicados para construir a inteligência artificial e os sistemas de inteligência artificial geral. Ele analisa fundamentalmente como nosso cérebro prevê o que vamos experimentar antes de experimentá-lo.
Embora “Um Mil Cérebros” seja um livro autossuficiente, ele será mais apreciado se “Sobre a Inteligência” for lido primeiro.
“Um Mil Cérebros” constrói sobre as últimas pesquisas de Jeff Hawkins e da empresa que ele fundou, a Numenta. A Numenta tem como objetivo principal desenvolver uma teoria sobre como o neocórtex funciona, e o objetivo secundário é como essa teoria do cérebro pode ser aplicada ao aprendizado de máquina e à inteligência artificial.
A primeira grande descoberta da Numenta em 2010 envolve como os neurônios fazem previsões, e a segunda descoberta em 2016 envolveu quadros de referência semelhantes a mapas no neocórtex. O livro detalha, em primeiro lugar, o que é a teoria dos “Mil Cérebros”, o que são quadros de referência e como a teoria funciona no mundo real. Um dos componentes mais fundamentais por trás dessa teoria é entender como o neocórtex evoluiu para seu tamanho atual.
O neocórtex começou pequeno, semelhante a outros mamíferos, mas cresceu exponencialmente (apenas limitado pelo tamanho do canal de parto) não criando nada novo, mas copiando um circuito básico repetidamente. Em essência, o que diferencia os humanos não é o material orgânico do cérebro, mas o número de cópias dos elementos idênticos que formam o neocórtex.
A teoria evolui ainda mais para como o neocórtex é formado com aproximadamente 150.000 colunas corticais que não são visíveis sob um microscópio, pois não há fronteiras visíveis entre elas. Como essas colunas corticais se comunicam entre si é a implementação de um algoritmo fundamental que é responsável por todos os aspectos da percepção e inteligência.
Mais importante ainda, o livro revela como essa teoria pode ser aplicada para construir máquinas inteligentes e as possíveis implicações futuras para a sociedade. Por exemplo, o cérebro aprende um modelo do mundo observando como as entradas mudam ao longo do tempo, especialmente quando o movimento é aplicado. As colunas corticais requerem um quadro de referência que é fixo a um objeto; esses quadros de referência permitem que uma coluna cortical aprenda as localizações de recursos que definem as realidades de um objeto. Em essência, os quadros de referência podem organizar qualquer tipo de conhecimento. Isso leva à parte mais importante deste livro seminal: os quadros de referência podem ser o elo vital ausente para construir um sistema de inteligência artificial mais avançado ou até mesmo um sistema de inteligência artificial geral? Jeff Hawkins acredita em um futuro inevitável quando uma inteligência artificial geral aprenderá modelos do mundo usando quadros de referência semelhantes ao neocórtex, e ele faz um trabalho notável ao ilustrar por que ele acredita nisso.












