заглушки Нова технологія штучного інтелекту розпізнавання облич йде на крок вперед - Unite.AI
Зв'язатися з нами

Штучний Інтелект

Нова технологія штучного інтелекту розпізнавання облич йде на крок далі

mm
оновлений on

Схоже, що використання штучного інтелекту в технології розпізнавання облич є одним з тих, що просунулися найдальше. як ZDNet нотатки, поки що компанії, як Microsoft вже розробили технологію розпізнавання обличчя, яка може розпізнавати вираз обличчя (FR) за допомогою інструментів емоцій. Але обмежуючим фактором досі було те, що ці інструменти були обмежені вісьмома, так званими основними станами –  гнів, презирство, страх, огида, щастя, смуток, здивування або нейтральність. 

Тепер японський технічний розробник Fujitsu, з технологією на основі штучного інтелекту, яка робить розпізнавання облич на один крок далі у відстеженні виражених емоцій.

Існуюча технологія FR базується, як пояснює ZDNet, на «iвизначення різних одиниць дії (AU) – тобто певних рухів м’язів обличчя, які ми робимо і які можна пов’язати з конкретними емоціями». У наведеному прикладі, «якщо і AU «піднімає щоку», і AU «підтягує куточки губ» ідентифікуються разом, ШІ може зробити висновок, що людина, яку він аналізує, щаслива.

Як пояснив представник Fujitsu, «Проблема з поточною технологією полягає в тому, що ШІ потрібно навчати на величезних наборах даних для кожної АС. Він повинен знати, як розпізнати АС з усіх можливих ракурсів і позицій. Але у нас недостатньо для цього зображень, тому зазвичай вони не такі точні».

Велика кількість даних, необхідна для навчання ШІ, щоб бути ефективним у виявленні емоцій, доступному на даний момент FR дуже важко дійсно розпізнати, що відчуває досліджувана людина. А якщо людина не сидить перед камерою і не дивиться прямо в неї, завдання стає ще складнішим. Багато експертів підтвердили ці проблеми в деяких Недавні дослідження.

Компанія Fujitsu стверджує, що знайшла рішення для підвищення якості результатів розпізнавання обличчя при виявленні емоцій. Замість того, щоб використовувати велику кількість зображень для навчання ШІ, їхній нещодавно створений інструмент має завдання «отримати більше даних з одного зображення». Компанія називає це «процесом нормалізації», який передбачає перетворення зображень, «знятих під певним кутом, на зображення, що нагадують фронтальний знімок».

Як пояснив речник, «З тим самим обмеженим набором даних ми можемо краще виявляти більше AU, навіть на знімках, зроблених під косим кутом, а з більшою кількістю AU ми можемо ідентифікувати складні емоції, які є більш тонкими, ніж основні експресії, які зараз аналізуються».

Компанія стверджує, що тепер вона може «виявляти емоційні зміни, такі складні, як нервовий сміх, з точністю виявлення 81%, кількість, яка була визначена за допомогою «стандартних методів оцінки». У порівнянні, згідно незалежні дослідженняІнструменти Microsoft мають точність 60%, а також були проблеми з виявленням емоцій під час роботи із зображеннями, зробленими під більш косими кутами.

Серед потенційних застосувань Fujitsu згадує, що її нові інструменти можуть використовуватися, серед іншого, для безпеки дорожнього руху.шляхом виявлення навіть невеликих змін у концентрації водіїв».

Колишній дипломат і перекладач в ООН, зараз незалежний журналіст/письменник/дослідник, який зосереджується на сучасних технологіях, штучному інтелекті та сучасній культурі.