Inteligência artificial
Nova tecnologia de reconhecimento facial AI vai um passo além
Parece que o uso de inteligência artificial na tecnologia de reconhecimento facial é um dos que mais cresceu até agora. Como ZDNet notas, até agora empresas como Microsoft já desenvolveram tecnologia de reconhecimento facial que pode reconhecer expressões faciais (FR) com o uso de ferramentas de emoção. Mas o fator limitante até agora foi que essas ferramentas foram limitadas a oito, os chamados estados centrais – raiva, desprezo, medo, nojo, felicidade, tristeza, surpresa ou neutro.
Agora passos no desenvolvedor de tecnologia japonês Fujitsu, com tecnologia baseada em IA que leva o reconhecimento facial um passo adiante no rastreamento de emoções expressas.
A tecnologia FR existente é baseada, como explica o ZDNet, em “iidentificando várias unidades de ação (UAs) – isto é, certos movimentos musculares faciais que fazemos e que podem estar ligados a emoções específicas.” Em um determinado exemplo, “se tanto o AU 'aumentador de bochecha' quanto o AU 'puxador de canto labial' forem identificados juntos, a IA pode concluir que a pessoa que está analisando é feliz.
Como explicou um porta-voz da Fujitsu, “o problema com a tecnologia atual é que a IA precisa ser treinada em grandes conjuntos de dados para cada AU. Ele precisa saber reconhecer uma AU de todos os ângulos e posições possíveis. Mas não temos imagens suficientes para isso – então geralmente não é tão preciso.”
Uma grande quantidade de dados necessária para treinar a IA para ser eficaz na detecção de emoções, é muito difícil para o FR atualmente disponível realmente reconhecer o que a pessoa examinada está sentindo. E se a pessoa não estiver sentada em frente à câmera e olhando diretamente para ela, a tarefa se torna ainda mais difícil. Muitos especialistas confirmaram esses problemas em alguns pesquisas recentes.
A Fujitsu afirma ter encontrado uma solução para aumentar a qualidade dos resultados do reconhecimento facial na detecção de emoções. Em vez de usar um grande número de imagens para treinar a IA, sua ferramenta recém-criada tem a tarefa de “extrair mais dados de uma imagem.” A empresa chama isso de 'processo de normalização', que envolve a conversão de fotos “tiradas de um determinado ângulo em imagens que se assemelham a uma foto frontal”.
Conforme explicou o porta-voz, “Com o mesmo conjunto de dados limitado, podemos detectar melhor mais AUs, mesmo em fotos tiradas de um ângulo oblíquo, e com mais AUs, podemos identificar emoções complexas, que são mais sutis do que as expressões principais atualmente analisadas.”
A empresa afirma que agora pode “detectam mudanças emocionais tão elaboradas quanto o riso nervoso, com uma taxa de precisão de detecção de 81%, um número que foi determinado por meio de 'métodos de avaliação padrão'.” Em comparação, de acordo com pesquisa independente, as ferramentas da Microsoft têm uma taxa de precisão de 60% e também tiveram problemas para detectar emoções ao trabalhar com fotos tiradas de ângulos mais oblíquos.
Como potenciais aplicações, a Fujitsu refere que as suas novas ferramentas poderão ser, entre outras coisas, utilizadas para a segurança rodoviária “detectando até mesmo pequenas mudanças na concentração dos motoristas.”