Inteligência artificial

Modelos de IA fornecem insights sobre como o cérebro processa a linguagem

Published November 5, 2021

Updated April 5, 2026

Alex McFarland

Nova pesquisa realizada no Massachusetts Institute of Technology sugere que a função subjacente dos modelos computacionais de ‘previsão da próxima palavra’ se assemelha à função dos centros de processamento de linguagem no cérebro humano.

Significado da Linguagem

Os novos modelos de linguagem preditivos podem estar aprendendo algo sobre o significado subjacente da linguagem, o que seria um grande avanço no campo. Os modelos predizem a palavra que vem a seguir, mas também estão realizando tarefas que exigem um grau de compreensão genuína. Essas tarefas incluem responder a perguntas, resumir documentos e completar histórias.
Os modelos foram projetados para otimizar o desempenho na previsão de texto sem tentar imitar nada relacionado à forma como o cérebro humano entende a linguagem. No entanto, a equipe de neurocientistas do MIT sugere que algo está acontecendo a esse respeito.
Uma das descobertas mais interessantes dessa pesquisa é que os modelos de computador que performam bem em outros tipos de tarefas de linguagem não mostram essa semelhança com o cérebro humano. Isso é visto como evidência de que o cérebro humano pode estar usando a previsão da próxima palavra para realizar o processamento de linguagem.
Nancy Kanwisher é professora de neurociência cognitiva Walter A. Rosenblith. Ela também é membra do McGovern Institute for Brain Research e do Center for Brains, Minds, and Machines (CBMM) do MIT, e autora do estudo.
“Quanto melhor o modelo é em prever a próxima palavra, mais próximo ele está do cérebro humano”, diz Kanwisher. “É incrível que os modelos se encaixem tão bem, e isso sugere indiretamente que talvez o que o sistema de linguagem humano esteja fazendo é prever o que vai acontecer em seguida.”
O estudo foi publicado no Proceedings of the National Academy of Sciences.
O estudo também incluiu os autores sêniores Joshue Tenenbaum, professor de ciência cognitiva do MIT e membro do CBMM e do CSAIL do MIT; e Eveline Fedorenko, professora associada de neurociência e membra do McGovern Institute. O primeiro autor do artigo foi Martin Schrimpf, um estudante de pós-graduação do MIT.

O Estudo

A equipe do MIT comparou os centros de processamento de linguagem no cérebro humano com os modelos de processamento de linguagem. Eles analisaram 43 diferentes modelos de linguagem, incluindo aqueles otimizados para previsão da próxima palavra, como o GPT-3. Outros modelos foram projetados para realizar tarefas de linguagem diferentes, como preencher um espaço em branco.
Cada modelo foi apresentado com uma sequência de palavras, e os pesquisadores mediram a atividade dos nodos que compõem a rede. Os padrões foram então comparados com a atividade no cérebro, que foram medidos em sujeitos que realizavam três tarefas de linguagem: ouvir histórias, ler frases uma a uma e ler frases em que uma palavra é revelada de cada vez.
Os conjuntos de dados humanos incluíam dados de ressonância magnética funcional (fMRI) e medidas eletrocorticográficas intracranianas que foram tiradas de pessoas submetidas a cirurgia cerebral para epilepsia.
Os pesquisadores descobriram que os modelos de previsão da próxima palavra com melhor desempenho tinham padrões de atividade que se assemelhavam muito àqueles vistos no cérebro humano. Esses mesmos modelos também demonstraram atividade que estava altamente correlacionada com medidas de respostas comportamentais humanas, como a velocidade com que as pessoas podem ler o texto.
“Descobrimos que os modelos que predizem bem as respostas neurais também tendem a prever melhor as respostas comportamentais humanas, na forma de tempos de leitura. E então, ambos são explicados pelo desempenho do modelo na previsão da próxima palavra. Esse triângulo realmente conecta tudo”, diz Schrimpf.
Os pesquisadores agora buscarão construir variantes dos modelos de processamento de linguagem, o que poderia permitir que eles vejam como pequenas alterações em sua arquitetura afetam o desempenho e a capacidade de se ajustar aos dados neurais humanos.

Related Topics:AI artificial intelligence Artificial Neural Networks

Alex McFarland

Alex McFarland é um jornalista e escritor de IA que explora os últimos desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups de IA e publicações em todo o mundo.

Unite.AI

Modelos de IA fornecem insights sobre como o cérebro processa a linguagem

Significado da Linguagem

O Estudo

You may like