Connect with us

Новая технология распознавания лиц с помощью ИИ делает еще один шаг вперед

Искусственный интеллект

Новая технология распознавания лиц с помощью ИИ делает еще один шаг вперед

mm

Похоже, что использование искусственного интеллекта в технологии распознавания лиц – это то, что продвинулось дальше всего на данный момент. Как отмечает ZDNet, компании như Microsoft уже разработали технологию распознавания лиц, которая может распознавать выражения лица (FR) с помощью инструментов эмоций. Но ограничивающим фактором до сих пор было то, что эти инструменты были ограничены восемью так называемыми основными состояниями – гнев, презрение, страх, отвращение, счастье, печаль, удивление или нейтральность.

Теперь на сцену выходит японский разработчик технологий Fujitsu, с технологией на основе ИИ, которая продвигает распознавание лиц на шаг вперед в отслеживании выражаемых эмоций.

Существующая технология FR основана, как объясняет ZDNet, на “идентификации различных действенных единиц (АУ) – то есть определенных движений лицевых мышц, которые мы делаем и которые могут быть связаны с конкретными эмоциями.” В данном примере, “если одновременно идентифицируются АУ ‘подъем щек’ и АУ ‘потягивание уголков губ’, ИИ может заключить, что человек, которого он анализирует, счастлив.

Как объяснил представитель Fujitsu, “проблема с текущей технологией заключается в том, что ИИ необходимо обучать на огромных наборах данных для каждой АУ. Ему необходимо знать, как распознавать АУ со всех возможных углов и положений. Но у нас нет достаточно изображений для этого – поэтому обычно это не так точно.”

Большое количество данных, необходимое для обучения ИИ для эффективного обнаружения эмоций, делает очень трудным для текущей технологии FR действительно распознавать, что чувствует человек. И если человек не сидит перед камерой и не смотрит прямо в нее, задача становится еще более сложной. Многие эксперты подтвердили эти проблемы в некоторых недавних исследованиях.

Fujitsu утверждает, что нашла решение для повышения качества результатов распознавания лиц при обнаружении эмоций. Вместо использования большого количества изображений для обучения ИИ, их новый инструмент имеет задачу “извлечь больше данных из одного изображения.” Компания называет это “процессом нормализации”, который включает в себя преобразование изображений “сделанных с определенного угла в изображения, похожие на фронтальный снимок.”

Как объяснил представитель Fujitsu, “с тем же ограниченным набором данных мы можем лучше обнаружить больше АУ, даже на изображениях, сделанных с косого угла, и с более АУ мы можем определить сложные эмоции, которые более тонкие, чем основные выражения, которые в настоящее время анализируются.”

Компания утверждает, что теперь она может “обнаружить изменения эмоций, такие как нервный смех, с точностью обнаружения 81%, число, которое было определено с помощью ‘стандартных методов оценки’.” По сравнению с этим, согласно независимым исследованиям, инструменты Microsoft имеют точность обнаружения 60%, и также имели проблемы с обнаружением эмоций, когда они работали с изображениями, сделанными с более косых углов.

Как потенциальные применения, Fujitsu упоминает, что их новые инструменты могут быть, среди прочего, использованы для безопасности дорожного движения “обнаруживая даже небольшие изменения в концентрации водителей.”

Бывший дипломат и переводчик для ООН, в настоящее время фрилансер-журналист/писатель/исследователь, фокусирующийся на современных технологиях, искусственном интеллекте и современной культуре.