Saúde

A Google DeepMind Lança AlphaGenome para Decifrar a Função do Genoma Humano

mm

A Google DeepMind lançou o AlphaGenome em 28 de janeiro, um modelo de IA que prevê como as sequências de DNA se traduzem em funções biológicas, processando até um milhão de pares de bases ao mesmo tempo e superando os modelos existentes em 25 de 26 benchmarks de previsão de efeitos de variantes.

O modelo, publicado na Nature e detalhado no blog da DeepMind, representa um avanço significativo na genômica computacional. Enquanto os modelos anteriores exigiam sistemas separados para tarefas de previsão diferentes, o AlphaGenome lida com tudo, desde a expressão gênica até a acessibilidade da cromatina, em uma arquitetura unificada.

“O AlphaGenome pode olhar ao longo de uma grande extensão de DNA e prever onde os elementos reguladores críticos estão e seus efeitos downstream na expressão gênica”, escreveu a equipe da DeepMind em seu anúncio. A janela de contexto de um milhão de tokens do modelo permite que ele capture interações de longo alcance entre regiões de DNA distantes que influenciam como os genes são ligados e desligados.

Como Funciona

O AlphaGenome combina duas arquiteturas de redes neurais: uma rede convolucional 1D do tipo Borzoi para processar sequências de DNA brutos e uma arquitetura U-Net adaptada da segmentação de imagens. Essa abordagem híbrida permite que o modelo lide com a natureza sequencial do DNA e as complexas relações espaciais entre os elementos reguladores.

Os dados de treinamento abrangem aproximadamente 7.000 faixas genômicas dos consórcios ENCODE e FANTOM – esforços colaborativos massivos que catalogaram elementos funcionais em todo o genoma humano. O modelo aprende a prever sinais de ensaios experimentais que medem a expressão gênica, a acessibilidade do DNA, a ligação de proteínas e as modificações da cromatina.

Para os pesquisadores, o valor prático está na previsão de efeitos de variantes. Quando o genoma de um paciente contém uma mutação, os clínicos precisam saber se essa variante é importante. O AlphaGenome pode prever como uma mudança de nucleotídeo único afeta todo o paisagem reguladora, potencialmente sinalizando variantes causadoras de doenças que os métodos atuais perdem.

O modelo alcançou resultados fortes nos benchmarks que testam sua capacidade de prever como as variantes genéticas afetam a expressão gênica e a atividade dos elementos reguladores. Em loci de traços quantitativos de expressão (eQTLs) – variantes conhecidas por afetar os níveis de expressão gênica – o AlphaGenome igualou ou superou modelos especializados treinados especificamente para essas tarefas.

Disponibilidade de Código Aberto

A DeepMind lançou o código-fonte do AlphaGenome no GitHub para uso não comercial, continuando o padrão do laboratório de tornar ferramentas fundamentais de biologia disponíveis publicamente. O repositório inclui pesos do modelo, código de inferência e documentação para executar previsões em sequências personalizadas.

O lançamento de código aberto segue o modelo estabelecido pelo AlphaFold, a ferramenta de previsão de estrutura de proteínas da DeepMind que foi usada por mais de 3 milhões de pesquisadores desde seu lançamento em 2021. O AlphaGenome aborda um problema complementar: enquanto o AlphaFold prevê como as proteínas parecem, o AlphaGenome prevê quando e onde os genes produzem essas proteínas.

O CEO da Google DeepMind, Demis Hassabis, posicionou a biologia como um domínio de aplicação principal para as capacidades de IA do laboratório. O trabalho em genômica estende as ambições da DeepMind além da IA conversacional e dos modelos de linguagem que alimentam produtos como o Gemini, aplicando inovações arquiteturais semelhantes a problemas científicos.

Por Que Isso Importa

O genoma humano contém aproximadamente 3 bilhões de pares de bases, mas apenas cerca de 1,5% codifica diretamente proteínas. Os 98,5% restantes – anteriormente descartados como “DNA lixo” – contêm elementos reguladores que controlam quando, onde e quanto os genes são expressos. As mutações nessas regiões não codificantes causam doenças, mas identificar quais variantes são importantes tem sido extraordinariamente difícil.

Métodos tradicionais exigem experimentos caros e demorados para testar variantes individuais. Modelos de aprendizado de máquina como o AlphaGenome podem selecionar milhares de variantes computacionalmente, priorizando quais delas merecem follow-up experimental. Para o diagnóstico de doenças raras, onde os pacientes frequentemente carregam variantes novas com efeitos desconhecidos, essa capacidade pode acelerar o caminho desde a sequenciação até o diagnóstico.

A capacidade do modelo de processar contextos de um milhão de pares de bases é particularmente significativa. Os elementos reguladores de genes podem estar localizados a centenas de milhares de pares de bases de distância dos genes que controlam, comunicando-se por meio de uma complexa estrutura tridimensional do DNA. Modelos anteriores com janelas de contexto mais curtas não podiam capturar essas dependências de longo alcance.

O AlphaGenome se junta a um ecossistema crescente de ferramentas de IA que transformam a pesquisa biológica. A previsão de estrutura de proteínas, a descoberta de drogas e agora a regulação gênica são problemas cada vez mais solucionáveis para o aprendizado de máquina. Para a comunidade de pesquisa genética, a disponibilidade aberta desses modelos democratiza o acesso a capacidades computacionais que antes estavam limitadas a laboratórios bem financiados.

As limitações do modelo também são claras a partir da apresentação da DeepMind. Embora o AlphaGenome seja excelente em prever medições experimentais, traduzir essas previsões em resultados clínicos requer validação adicional. A lacuna entre prever a acessibilidade da cromatina e prever o risco de doença permanece substancial.

Por enquanto, o AlphaGenome serve como uma ferramenta de pesquisa – uma que pode acelerar a compreensão de como o genoma funciona, mesmo que as aplicações clínicas permaneçam anos à frente. Os 3.000 cientistas em 160 países que já estão usando o modelo sugerem que a comunidade de pesquisa vê valor imediato no que a DeepMind construiu.

Alex McFarland é um jornalista e escritor de IA que explora os últimos desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups de IA e publicações em todo o mundo.