Connect with us

Inteligência artificial

Pesquisadores de IA Desenvolvem Rede Neural Explicável para Descobrir Regras Genômicas

mm

Uma equipe de pesquisadores recentemente criou uma rede neural explicável destinada a ajudar biólogos a descobrir as regras misteriosas que governam o código do genoma humano. A equipe de pesquisa treinou uma rede neural em mapas de interações proteína-ADN, permitindo que a IA descobrisse como certas sequências de ADN regulam certos genes. Os pesquisadores também tornaram o modelo explicável, para que pudessem analisar as conclusões do modelo e determinar como os motivos de sequência regulam os genes.

Uma das grandes mistérios da biologia é o código regulatório do genoma. É conhecido que o ADN é composto por quatro bases nucleotídeas – Adenina, Guanina, Timina e Citosina – mas não se sabe como esses pares de bases são usados para regular a atividade. As quatro bases nucleotídeas codificam as instruções para construir proteínas, mas também controlam onde e como os genes são expressos, (como eles fazem proteínas em um organismo). Combinações e arranjos particulares das bases criam seções de código regulatório que se ligam a segmentos de ADN, e é desconhecido quais são essas combinações.

Uma equipe interdisciplinar de cientistas da computação e biólogos se propôs a resolver esse mistério criando uma rede neural explicável. A equipe de pesquisa criou uma rede neural que eles apelidaram de “Rede de Pares de Bases” ou “BPNet”. O modelo usado pelo BPNet para gerar previsões pode ser interpretado para identificar códigos regulatórios. Isso foi alcançado prevendo como as proteínas chamadas fatores de transcrição se ligam a sequências de ADN.

Os pesquisadores realizaram uma variedade de experimentos e modelagem computacional abrangente para determinar como os fatores de transcrição e o ADN estavam ligados, desenvolvendo um mapa detalhado até o nível de bases nucleotídeas individuais. As representações detalhadas de fator de transcrição-ADN permitiram que os pesquisadores criassem ferramentas capazes de interpretar tanto os padrões críticos de sequência de ADN quanto as regras que funcionam como código regulatório.

Julia Zeitlinger, PhD em biologia e pesquisadora computacional da Universidade de Stanford, explicou que os resultados coletados da rede neural explicável coincidiram com os resultados experimentais existentes, mas também contiveram insights surpreendentes sobre o código regulatório do genoma. Como exemplo, o modelo de IA permitiu que a equipe de pesquisa descobrisse uma regra que influencia como um fator de transcrição chamado Nanog opera. Quando múltiplas instâncias do motivo Nanog estão presentes no mesmo lado de uma hélice dupla de ADN, elas se ligam cooperativamente ao ADN. Como Zeitlinger explicou via ScienceDaily:

“Houve um longo rastreamento de evidências experimentais de que tal periodicidade de motivo às vezes existe no código regulatório. No entanto, as circunstâncias exatas eram elusivas, e Nanog não era um suspeito. Descobrir que Nanog tem tal padrão, e ver detalhes adicionais de suas interações, foi surpreendente porque não procuramos especificamente por esse padrão.”

O artigo de pesquisa recente está longe de ser o primeiro estudo a usar IA para analisar o ADN, mas é provavelmente o primeiro estudo a abrir a “caixa preta” da IA para discernir quais sequências de ADN regulam genes no genoma. Redes neurais são excelentes em encontrar padrões dentro dos dados, mas seus insights são difíceis de extrair dos modelos que criam. Ao criar um método de análise de quais recursos o modelo considera importantes para a previsão de regras genômicas, os pesquisadores puderam treinar modelos mais nuances que levam a descobertas novas.

A arquitetura do BPNet é semelhante às redes usadas para reconhecer faces em imagens. Quando sistemas de visão computacional reconhecem faces em imagens, a rede começa detectando bordos e, em seguida, une esses bordos. A diferença é que o BPNet aprende com sequências de ADN, detectando motivos de sequência e unindo esses motivos em regras de ordem superior que podem ser usadas para prever a ligação de dados na resolução de base.

Depois que o modelo atinge um limiar de precisão alto, os padrões aprendidos pelo modelo são rastreados de volta às sequências de entrada originais, revelando os motivos de sequência. Finalmente, o modelo é fornecido com consultas de sequência de ADN sistemáticas, permitindo que os pesquisadores entendam as regras pelas quais os motivos de sequência se combinam e funcionam. De acordo com Zeitlinger, o modelo é capaz de prever muitas mais sequências do que os pesquisadores poderiam esperar testar de forma tradicional, experimental. Além disso, prever o resultado de anomalias experimentais permitiu que os pesquisadores identificassem quais experimentos eram mais informativos ao validar o modelo.

Blogueiro e programador com especialidades em Machine Learning e Deep Learning tópicos. Daniel espera ajudar os outros a usar o poder da IA para o bem social.