Assistência médica
O Google DeepMind revela o AlphaGenome para decodificar a função do genoma humano.

O Google DeepMind lançou o AlphaGenome em 28 de janeiro, um modelo de IA que prevê como as sequências de DNA se traduzem em funções biológicas, processando até um milhão de pares de bases de uma só vez e superando os modelos existentes em 25 de 26 benchmarks de previsão de efeitos de variantes.
O modelo, publicado na Nature e detalhado sobre o Blog da DeepMindO AlphaGenome representa um avanço significativo na genômica computacional. Enquanto os modelos anteriores exigiam sistemas separados para diferentes tarefas de predição, o AlphaGenome lida com tudo, desde a expressão gênica até a acessibilidade da cromatina, em uma única arquitetura unificada.
“O AlphaGenome consegue analisar um longo trecho de DNA e prever onde estão os elementos regulatórios críticos e seus efeitos subsequentes na expressão gênica”, escreveu a equipe da DeepMind em seu anúncio. A janela de contexto de um milhão de tokens do modelo permite capturar interações de longo alcance entre regiões distantes do DNA que influenciam a ativação e desativação dos genes.
Como Funciona
O AlphaGenome combina duas arquiteturas de redes neurais: uma rede convolucional 1D no estilo Borzoi para processar sequências brutas de DNA e uma arquitetura U-Net adaptada da segmentação de imagens. Essa abordagem híbrida permite que o modelo lide tanto com a natureza sequencial do DNA quanto com as complexas relações espaciais entre os elementos regulatórios.
Os dados de treinamento abrangem aproximadamente 7,000 sequências genômicas dos consórcios ENCODE e FANTOM — esforços colaborativos massivos que catalogaram elementos funcionais em todo o genoma humano. O modelo aprende a prever sinais a partir de ensaios experimentais que medem a expressão gênica, a acessibilidade do DNA, a ligação de proteínas e as modificações da cromatina.
Para os pesquisadores, o valor prático reside na previsão do efeito das variantes. Quando o genoma de um paciente contém uma mutação, os médicos precisam saber se essa variante é relevante. O AlphaGenome pode prever como uma única alteração de nucleotídeo afeta todo o panorama regulatório, potencialmente identificando variantes causadoras de doenças que os métodos atuais não detectam.
O modelo obteve resultados expressivos em testes de referência que avaliaram sua capacidade de prever como variantes genéticas afetam a expressão gênica e a atividade de elementos regulatórios. Em relação aos loci de características quantitativas de expressão (eQTLs) — variantes conhecidas por afetar os níveis de expressão gênica — o AlphaGenome igualou ou superou modelos especializados treinados especificamente para essas tarefas.
Disponibilidade de código aberto
DeepMind divulgou o AlphaGenome código-fonte no GitHub Para uso não comercial, dando continuidade ao padrão do laboratório de disponibilizar publicamente ferramentas fundamentais de biologia. O repositório inclui pesos de modelos, código de inferência e documentação para executar previsões em sequências personalizadas.
O lançamento aberto segue o modelo estabelecido pelo AlphaFold, a ferramenta de predição da estrutura de proteínas da DeepMind, utilizada por mais de 3 milhões de pesquisadores desde seu lançamento em 2021. O AlphaGenome aborda um problema complementar: enquanto o AlphaFold prevê a aparência das proteínas, o AlphaGenome prevê quando e onde os genes produzem essas proteínas.
O CEO do Google DeepMind, Demis Hassabis, posicionou a biologia como um domínio de aplicação primordial para as capacidades de IA do laboratório. O trabalho em genômica amplia as ambições do DeepMind para além da IA conversacional e dos modelos de linguagem que impulsionam produtos como o Gemini, aplicando inovações arquitetônicas semelhantes a problemas científicos.
Porque Isto é Importante
O genoma humano contém aproximadamente 3 bilhões de pares de bases, mas apenas cerca de 1.5% codificam proteínas diretamente. Os 98.5% restantes — há muito tempo considerados “DNA lixo” — contêm elementos regulatórios que controlam quando, onde e em que medida os genes são expressos. Mutações nessas regiões não codificantes causam doenças, mas identificar quais variantes são relevantes tem sido extremamente difícil.
Os métodos tradicionais exigem experimentos caros e demorados para testar variantes individuais. Modelos de aprendizado de máquina como o AlphaGenome podem analisar milhares de variantes computacionalmente, priorizando aquelas que merecem acompanhamento experimental. Para o diagnóstico de doenças raras, em que os pacientes frequentemente apresentam variantes novas com efeitos desconhecidos, essa capacidade poderia acelerar o caminho do sequenciamento ao diagnóstico.
A capacidade do modelo de processar contextos de milhões de pares de bases é particularmente significativa. Elementos reguladores de genes podem estar a centenas de milhares de pares de bases de distância dos genes que controlam, comunicando-se através do complexo dobramento tridimensional do DNA. Modelos anteriores com janelas de contexto mais curtas não conseguiam capturar essas dependências de longo alcance.
A AlphaGenome integra um ecossistema crescente de ferramentas de IA que estão transformando a pesquisa biológica. A predição da estrutura de proteínas, a descoberta de fármacos e, agora, a regulação gênica são problemas cada vez mais tratáveis para o aprendizado de máquina. Para a comunidade de pesquisa em genética, a disponibilidade aberta desses modelos democratiza o acesso a recursos computacionais que antes eram restritos a laboratórios bem financiados.
As limitações do modelo também ficam claras na apresentação da DeepMind. Embora o AlphaGenome se destaque na previsão de medidas experimentais, a transposição dessas previsões para resultados clínicos requer validação adicional. A lacuna entre prever a acessibilidade da cromatina e prever o risco de doenças permanece substancial.
Por enquanto, o AlphaGenome serve como uma ferramenta de pesquisa — uma que pode acelerar a compreensão de como o genoma funciona, mesmo que as aplicações clínicas ainda estejam a anos de distância. Os 3,000 cientistas em 160 países que já utilizam o modelo sugerem que a comunidade científica vê valor imediato no que a DeepMind construiu.












