Inteligência artificial
Computador Capaz de Identificar 200 Espécies de Pássaros a Partir de uma Foto

Pesquisadores da Universidade de Duke usaram aprendizado de máquina para treinar um computador a identificar até 200 espécies diferentes de pássaros. O computador requer apenas uma foto para concluir o processo de identificação. Para um ser humano, anos de observação de pássaros são frequentemente necessários para ser capaz de identificar diferentes espécies umas das outras.
A pesquisa foi liderada pelo estudante de doutorado em ciência da computação da Universidade de Duke, Chaofan Chen, junto com o estudante de graduação Oscar Li. Também foi trabalhada por outros membros do Laboratório de Análise de Previsão dirigido pela professora da Universidade de Duke, Cynthia Rudin.
A.I. Mostrando seu Pensamento
Embora o processo de identificação seja impressionante, há um aspecto mais importante dos desenvolvimentos. O A.I. é capaz de mostrar seu pensamento, permitindo que até um observador de pássaros inexperiente entenda o processo.
A rede neural profunda, ou algoritmos baseados no funcionamento do cérebro, foram treinados com 11.788 fotos. As fotos incluíam 200 diferentes espécies de pássaros, incluindo tudo, desde patos até beija-flores.
A equipe de pesquisadores não teve que treinar especificamente a rede para identificar bicos ou penas de asa. Em vez disso, a rede é capaz de tomar uma foto de um pássaro e identificar certos padrões na imagem. Ela pode então pegar esses padrões e identificar padrões anteriores que já encontrou em traços típicos de espécies.
De acordo com a equipe, a rede cria então uma série de mapas de calor que identificam certos traços. Por exemplo, ela pode distinguir entre um cardeal comum e um cardeal encapuzado, juntamente com recursos diferentes, como uma cabeça encapuzada e uma barriga amarela. Ela então mostra que esses recursos são o que levou à identificação.
Diferente de Outros Sistemas
A rede neural foi capaz de identificar a espécie correta até 84% do tempo. Isso é semelhante a alguns dos sistemas de melhor desempenho. A diferença é que esses sistemas não explicam o processo de pensamento como este.
De acordo com Rudin, o aspecto mais revolucionário deste projeto é que ele fornece visualização do que as redes neurais profundas veem quando olham para uma imagem.
Essa tecnologia também é atualmente usada em sites de mídia social, para identificar suspeitos de crimes em câmeras de vigilância, e ajudar veículos autônomos a identificar semáforos e pedestres.
O software de aprendizado profundo frequentemente não requer ser explicitamente programado para aprender com dados, o que não é o caso do software tradicional. No entanto, o processo não é sempre claro ou mostrado, então é frequentemente difícil explicar como os algoritmos “pensam” ao classificar uma imagem.
No Futuro
Rudin e outros estão atualmente trabalhando em novos modelos de aprendizado profundo para A.I., impulsionando o campo para frente. Os novos modelos podem explicar seu raciocínio e processo de identificação. Isso ajuda os pesquisadores a ver do início ao fim, e torna mais fácil identificar a razão por trás de um erro ou problema.
Rudin e sua equipe trabalharão em usar o algoritmo no campo médico. Ele poderia identificar certas áreas problemáticas dentro de imagens médicas, como mamografias. Isso ajudaria os profissionais de saúde a detectar nódulos, calcificações e outros sinais de câncer de mama.
De acordo com Rudin, a rede imita a maneira como os médicos fazem um diagnóstico.
“É raciocínio baseado em casos”, disse Rudin. “Estamos esperando que possamos explicar melhor aos médicos ou pacientes por que sua imagem foi classificada pela rede como maligna ou benigna.”
A equipe apresentará um artigo que inclui sua pesquisa na Trigésima Terceira Conferência sobre Processamento de Informações Neurais (NeurlIPS2019) em Vancouver em 12 de dezembro.
O estudo também inclui os autores Daniel Tao e Alina Barnerr da Universidade de Duke e Jonathan Su no MIT Lincoln Laboratory.












