Inteligência artificial

Computador capaz de identificar 200 espécies de pássaros a partir de uma foto

Atualização do on 7 de novembro de 2019

Pesquisadores da Duke University usaram aprendizado de máquina para treinar um computador para identificar até 200 espécies diferentes de pássaros. O computador requer apenas uma foto para completar o processo de identificação. Para um ser humano, muitas vezes são necessários anos de observação de pássaros para poder identificar espécies diferentes umas das outras.

A pesquisa foi liderada por Duke ciência da computação Ph.D. estudante Chaofan Chen, junto com o graduando Oscar Li. Também foi trabalhado por outros membros da equipe do Laboratório de Análise de Previsão dirigido pela professora Cynthia Rudin da Duke.

IA mostrando seu pensamento

Embora o processo de identificação seja impressionante, há um aspecto mais importante dos desenvolvimentos. A IA é capaz de mostrar seu pensamento, permitindo que até mesmo um observador de pássaros inexperiente entenda o processo.

A rede neural profunda, ou algoritmos baseados no funcionamento do cérebro, foi treinada com 11,788 fotos. As fotos incluíam 200 espécies diferentes de pássaros, incluindo tudo, desde patos a beija-flores.

A equipe de pesquisadores não precisou treinar especificamente a rede para identificar bicos ou penas de asas. Em vez disso, a rede é capaz de tirar uma foto de um pássaro e identificar certos padrões na imagem. Ele pode então pegar esses padrões e identificar padrões anteriores que já encontrou em características típicas de espécies.

Segundo a equipe, a rede cria uma série de mapas de calor que identificam certas características. Por exemplo, pode dizer a diferença entre uma toutinegra comum e uma toutinegra encapuzada, juntamente com as diferentes características como uma cabeça mascarada e barriga amarela. Em seguida, mostra que essas características são o que levou à identificação.

Ao contrário de outros sistemas

A rede neural foi capaz de identificar as espécies corretas em até 84% das vezes. Isso é semelhante a alguns dos sistemas de melhor desempenho. A diferença é que esses sistemas não explicam o processo de pensamento como este.

De acordo com Rudin, o aspecto mais revolucionário deste projeto é que ele fornece visualização para o que as redes neurais profundas veem quando olham para uma imagem.

Essa tecnologia também é usada atualmente em sites de mídia social para identificar criminosos suspeitos em câmeras de vigilância e ajudar veículos autônomos a identificar semáforos e pedestres.

O software de aprendizado profundo geralmente não requer programação explícita para aprender com os dados, o que não é o caso do software tradicional. No entanto, nem sempre o processo é claro ou mostrado, por isso muitas vezes é difícil explicar como os algoritmos “pensam” ao classificar uma imagem.

No futuro

Rudin e outros estão atualmente trabalhando em novos modelos de aprendizado profundo para IA, impulsionando o campo. Os novos modelos podem explicar seu raciocínio e processo de identificação. Isso ajuda os pesquisadores a ver do início ao fim e facilita a identificação do motivo de um erro ou problema.

Rudin e sua equipe trabalharão no uso do algoritmo na área médica. Ele poderia identificar certas áreas problemáticas em imagens médicas, como mamografias. Isso ajudaria os profissionais médicos a detectar caroços, calcificações e outros sinais de câncer de mama.

Segundo Rudin, a rede imita a forma como os médicos fazem um diagnóstico.

“É um raciocínio baseado em casos”, disse Rudin. “Esperamos poder explicar melhor aos médicos ou pacientes por que sua imagem foi classificada pela rede como maligna ou benigna”.

A equipe apresentará um artigo incluindo sua pesquisa na Trigésima Terceira Conferência sobre Sistemas de Processamento de Informação Neural (NeurlIPS2019) em Vancouver em 12 de dezembro.

O estudo também inclui os autores Daniel Tao e Alina Barnerr, da Duke, e Jonathan Su, do Laboratório Lincoln do MIT.

A seguir

GPT-2, gerador de texto de inteligência artificial está sendo lançado na íntegra

Não Perca

Machine Learning faz incursões na intrincada arte da tradução

Alex McFarland

Alex McFarland é um jornalista e escritor de IA que explora os mais recentes desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups e publicações de IA em todo o mundo.