Saúde
Algoritmo de IA Lê e Preve Dados de Pacientes a Partir de Registros Eletrônicos de Saúde

Cientistas da Escola de Medicina Icahn do Mount Sinai desenvolveram um novo algoritmo automatizado baseado em inteligência artificial (IA) que pode ler e prever dados de pacientes a partir de registros eletrônicos de saúde (EHRs).
O novo método é chamado de Phe2vec, e ele pode identificar com precisão pacientes com certas doenças. Foi demonstrado que é tão preciso quanto o método tradicional mais popular, que requer mais trabalho manual para ser realizado.
Benjamin S. Glicksberg, PhD, é Professor Assistente de Genética e Ciências Genômicas. Ele também é membro do Instituto Hasso Plattner para Saúde Digital do Mount Sinai (HPIMS) e autor sênior do estudo.
“Continua havendo uma explosão na quantidade e nos tipos de dados armazenados eletronicamente no prontuário médico de um paciente. Desembaraçar essa complexa teia de dados pode ser altamente trabalhoso, o que retarda os avanços na pesquisa clínica”, disse Glicksberg. “Neste estudo, criamos um novo método para minerar dados de registros eletrônicos de saúde com aprendizado de máquina que é mais rápido e menos trabalhoso do que o padrão da indústria. Esperamos que isso seja uma ferramenta valiosa que facilitará pesquisas adicionais e menos tendenciosas em informática clínica.”
O estudo, que foi publicado na revista Patterns, foi liderado por Jessica K. De Freitas, uma aluna de graduação no laboratório do Dr. Glicksberg.
Padrão Atual da Indústria
Os cientistas atualmente confiam em programas de computador estabelecidos e algoritmos para extrair registros médicos para obter novas informações. Um sistema chamado Phenotype Knowledgebase (PheKB) desenvolve e armazena esses algoritmos. O sistema é altamente eficaz na identificação correta do diagnóstico de um paciente, mas os pesquisadores são obrigados a examinar muitos registros médicos e procurar por pedaços de dados primeiro. Esses dados incluem coisas como exames de laboratório e prescrições.
O algoritmo é então programado para orientar o computador a procurar por pacientes que tenham peças de dados específicas de doenças, que é rotulada como um “fenótipo”. Isso permite que o sistema crie uma lista de pacientes, que então precisa ser verificada manualmente pelos pesquisadores. Se os pesquisadores quiserem estudar uma nova doença, eles são obrigados a começar o processo novamente.
O Novo Método
Com o novo método, os pesquisadores permitem que o computador aprenda a identificar fenótipos de doenças por conta própria, o que economiza tempo e trabalho para os pesquisadores. O método Phe2vec foi baseado em estudos anteriores realizados pela equipe.
Riccardo Miotto, PhD, é um ex-professor assistente do HPIMS e autor sênior do estudo.
“Anteriormente, demonstramos que o aprendizado de máquina não supervisionado pode ser uma estratégia altamente eficiente e eficaz para minerar registros eletrônicos de saúde”, disse Miotto. “A vantagem potencial de nossa abordagem é que ela aprende representações de doenças a partir dos próprios dados. Portanto, a máquina faz muito do trabalho que os especialistas normalmente fazem para definir a combinação de elementos de dados de registros de saúde que melhor descreve uma doença em particular.”
O computador foi programado para examinar milhões de registros eletrônicos de saúde e aprender a identificar conexões entre dados e doenças. A programação dependia de algoritmos de “incrustação”, que também foram desenvolvidos anteriormente pelos pesquisadores. Esses algoritmos foram usados para estudar redes de palavras em vários idiomas.
Um desses algoritmos foi chamado de word2vec, e foi especialmente eficaz. O computador foi então programado para identificar o diagnóstico de cerca de 2 milhões de pacientes cujos dados estavam armazenados no Sistema de Saúde do Mount Sinai.
Os pesquisadores então compararam a eficácia dos sistemas novo e antigo e descobriram que, para nove em cada dez doenças testadas, o novo sistema Phe2vec era tão eficaz ou ligeiramente melhor do que o atual “padrão de ouro” do processo de fenotipagem para identificar o diagnóstico a partir de EHRs. Essas doenças podem incluir demência, esclerose múltipla, anemia falciforme e mais.
“No geral, nossos resultados são encorajadores e sugerem que o Phe2vec é uma técnica promissora para a fenotipagem em larga escala de doenças em dados de registros eletrônicos de saúde”, disse o Dr. Glicksberg. “Com testes e aprimoramentos adicionais, esperamos que ele possa ser usado para automatizar muitos dos passos iniciais da pesquisa de informática clínica, permitindo que os cientistas concentrem seus esforços em análises posteriores, como modelagem preditiva.”












