Entre em contato

Leland Hyman, cientista-chefe de dados da Sherlock Biosciences – série de entrevistas

Entrevistas

Leland Hyman, cientista-chefe de dados da Sherlock Biosciences – série de entrevistas

mm

Leland Hyman é o principal cientista de dados da Sherlock Biociências. Ele é um experiente cientista da computação e pesquisador com experiência em aprendizado de máquina e diagnóstico molecular.

Sherlock Biosciences é uma empresa de biotecnologia com sede em Cambridge, Massachusetts, que desenvolve testes de diagnóstico usando CRISPR. O seu objectivo é perturbar o diagnóstico molecular com testes melhores, mais rápidos e acessíveis.

O que inicialmente o atraiu para a ciência da computação?

Comecei a programar muito jovem, mas meu interesse principal era fazer videogames com meus amigos. Meu interesse cresceu em outras aplicações da ciência da computação durante a faculdade e a pós-graduação, especialmente com todo o trabalho inovador de aprendizado de máquina que aconteceu no início da década de 2010. Todo o campo parecia uma nova fronteira tão excitante que poderia impactar diretamente a pesquisa científica e a nossa vida diária – não pude deixar de ficar fascinado por ele.

Você também fez doutorado. em Biologia Celular e Molecular, quando você percebeu pela primeira vez que os dois campos se cruzariam?

Comecei a fazer esse tipo de trabalho interseccional com ciência da computação e biologia ainda na pós-graduação. Meu laboratório se concentrou em resolver problemas de engenharia de proteínas por meio de colaborações entre bioquímicos radicais, cientistas da computação e todos os demais. Rapidamente reconheci que o aprendizado de máquina poderia fornecer informações valiosas sobre sistemas biológicos e tornar a experimentação muito mais fácil. Por outro lado, também apreciei o valor da intuição biológica na construção de modelos de aprendizado de máquina. Na minha opinião, enquadrar o problema com precisão é o elemento crucial no aprendizado de máquina. É por isso que acredito que os esforços colaborativos em diferentes campos podem ter um impacto profundo.

Desde 2022 você trabalha na Sherlock Biosciences. Você poderia compartilhar alguns detalhes sobre o que sua função envolve?

Atualmente lidero a equipe computacional da Sherlock Biosciences. Nosso grupo é responsável por projetar os componentes que compõem nossos ensaios de diagnóstico, fazer interface com os experimentalistas que testam esses projetos no laboratório úmido e construir novos recursos computacionais para melhorar os projetos. Além de coordenar essas atividades, trabalho nas partes de aprendizado de máquina de nossa base de código, experimentando novas arquiteturas de modelos e novas maneiras de simular a física do DNA e do RNA envolvidos em nossos ensaios.

O aprendizado de máquina está no centro da Sherlock Biosciences. Você poderia descrever o tipo e o volume de dados que estão sendo coletados e como o ML analisa esses dados?

Durante o desenvolvimento do ensaio, testamos dezenas a centenas de ensaios candidatos para cada novo patógeno. Embora a grande maioria desses candidatos não consiga passar em um teste comercial, nós os vemos como uma oportunidade de aprender com nossos erros. Nestes experimentos, medimos duas coisas principais: sensibilidade e velocidade. Nossos modelos pegam as sequências de DNA e RNA em cada ensaio como entrada e depois aprendem a prever a sensibilidade e a velocidade do ensaio.

Como o ML prevê quais componentes de diagnóstico molecular funcionarão com maior velocidade e precisão?

Quando pensamos em como um ser humano aprende, existem duas estratégias principais. Por um lado, uma pessoa poderia aprender como realizar uma tarefa por pura tentativa e erro. Eles poderiam repetir a tarefa e, depois de muitas falhas, acabariam descobrindo as regras da tarefa por conta própria. Essa estratégia era muito popular antes da internet. No entanto, poderíamos fornecer a essa pessoa um professor para lhe dizer imediatamente as regras da tarefa. O aluno com o professor poderia aprender muito mais rápido do que com a abordagem de tentativa e erro, mas apenas se tivesse um bom professor que entendesse perfeitamente a tarefa.

Nossa abordagem para treinar modelos de aprendizado de máquina está no meio do caminho entre essas duas estratégias. Embora não tenhamos um “professor” perfeito para nossos modelos de aprendizado de máquina, podemos iniciá-los com algum conhecimento sobre a física das cadeias de DNA e RNA em nossos ensaios. Isso os ajuda a aprender a fazer melhores previsões com menos dados. Para fazer isso, executamos várias simulações biofísicas nas sequências de DNA e RNA do nosso ensaio. Em seguida, inserimos os resultados no modelo e pedimos que ele preveja a velocidade e a sensibilidade do ensaio. Repetimos esse processo para todos os experimentos que realizamos no laboratório, e o modelo mostra a diferença entre suas previsões e o que realmente aconteceu. Através de repetição suficiente, ele eventualmente aprende como a física do DNA e do RNA se relaciona com a velocidade e a sensibilidade de cada ensaio.

Quais são algumas outras maneiras pelas quais os algoritmos de IA são usados ​​pela Sherlock Biosciences?

Usamos algoritmos de aprendizado de máquina para resolver uma ampla variedade de problemas. Alguns exemplos que vêm à mente estão relacionados à pesquisa de mercado e análise de imagem. Para pesquisas de mercado, conseguimos treinar modelos que aprendem sobre diferentes tipos de clientes e quantas pessoas podem ter necessidades não atendidas de testes de doenças. Também construímos modelos para analisar imagens de tiras de fluxo lateral (o tipo de teste comumente usado em testes de venda livre para COVID) e prever automaticamente se uma banda positiva está presente. Embora pareça uma tarefa trivial para um ser humano, posso dizer em primeira mão que é uma alternativa incrivelmente conveniente para anotar manualmente milhares de imagens.

Quais são alguns dos desafios por trás da construção de modelos de ML que funcionam em conjunto com tecnologias de ponta em biociências, como o CRISPR?

A disponibilidade de dados é o principal desafio na aplicação de modelos de aprendizado de máquina a qualquer tecnologia de biociências. As tecnologias CRISPR e baseadas em DNA ou RNA enfrentam um desafio distinto, principalmente devido aos conjuntos de dados estruturais significativamente menores disponíveis para ácidos nucleicos em comparação com proteínas. É por isso que vimos grandes avanços no ML de proteínas nos últimos anos (com AlphaFold2 e outros), mas os avanços no ML de DNA e RNA ainda estão atrasados.

Qual é a sua visão para o futuro de como a IA se integrará ao CRISPR e à biociência?

Estamos a assistir a um enorme boom de IA nos campos da engenharia de proteínas e da descoberta de medicamentos, e espero que isto continue a acelerar o desenvolvimento na indústria farmacêutica. Eu adoraria ver o mesmo acontecer com o CRISPR e outras tecnologias baseadas em DNA e RNA nos próximos anos. Isso poderia ter um impacto incrível em diagnósticos, medicina humana e biologia sintética. Já vimos os benefícios das ferramentas computacionais no nosso desenvolvimento de diagnósticos e tecnologias CRISPR aqui em Sherlock, e espero que este tipo de trabalho encoraje um efeito de “bola de neve” para impulsionar o campo.

Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar Sherlock Biociências.

Antoine é um líder visionário e sócio fundador da Unite.AI, movido por uma paixão inabalável por moldar e promover o futuro da IA ​​e da robótica. Um empreendedor em série, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego delirando sobre o potencial das tecnologias disruptivas e da AGI.

Como um futurista, ele se dedica a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Valores Mobiliários.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.