Штучний інтелект
Нова технологія розпізнавання облич штучного інтелекту йде на крок далі

Судячи з усього, використання штучного інтелекту в технології розпізнавання облич є тим, що розвивалося найдалі на сьогодні. Як зазначає ZDNet , на сьогодні компанії, такі як Microsoft, вже розробили технологію розпізнавання облич, яка може розпізнавати вирази обличчя (FR) за допомогою інструментів емоцій. Але обмежувальним фактором на сьогодні було те, що ці інструменти були обмежені вісьмома так званими основними станами – гнів, зневага, страх, відраза, щастя, смуток, здивування або нейтральність.
Тепер вступає японський розробник технологій Fujitsu, з технологією на основі штучного інтелекту, яка веде розпізнавання облич на крок далі в відстеженні виражених емоцій.
Існуюча технологія FR базується, як пояснює ZDNet, на “ідентифікації різних діючих одиниць (AUs) – тобто певних рухів м’язів обличчя, які можна пов’язати з конкретними емоціями.” У даному прикладі, “якщо одночасно ідентифікуються AU “підіймач щік” і AU “тягач куточків губ”, штучний інтелект може зробити висновок, що людина, яку він аналізує, щаслива.
Як пояснив представник Fujitsu, “проблема з поточною технологією полягає в тому, що штучний інтелект потрібно тренувати на величезних наборах даних для кожної AU. Він повинен знати, як розпізнавати AU з усіх можливих кутів і позицій. Але у нас немає достатньої кількості зображень для цього – тому зазвичай це не дуже точне.”
Велика кількість даних, необхідна для навчання штучного інтелекту для ефективного виявлення емоцій, робить дуже важким для поточної FR дійсно розпізнавати, що людина відчуває. І якщо людина не сидить перед камерою і не дивиться прямо в неї, завдання стає ще складнішим. Багато експертів підтвердили ці проблеми в деяких недавніх дослідженнях.
Fujitsu стверджує, що знайшла рішення для підвищення якості результатів розпізнавання облич при виявленні емоцій. Замість використання великої кількості зображень для навчання штучного інтелекту, їх новостворений інструмент має завдання “вилучити більше даних з одного зображення.” Компанія називає це “процесом нормалізації”, який включає перетворення зображень “зроблених під певним кутом у зображення, що нагадують фронтальний знімок.”
Як пояснив представник, “з тим же обмеженим набором даних ми можемо краще виявити більше AU, навіть на зображеннях, зроблених під кутом, і з більшою кількістю AU ми можемо ідентифікувати складні емоції, які є більш тонкими, ніж основні вирази, які зараз аналізуються.”
Компанія стверджує, що тепер вона може “виявити зміни емоцій, такі складні, як нервове сміх, з точністю виявлення 81%, число, яке було визначено за допомогою ‘стандартних методів оцінки’.” На відміну від цього, згідно з незалежними дослідженнями, інструменти Microsoft мають точність виявлення 60%, і також мали проблеми з виявленням емоцій при роботі з зображеннями, зробленими під більш кутовими кутами.
Як потенційні застосування, Fujitsu згадує, що їх новий інструмент можна використовувати, серед іншого, для забезпечення безпеки дорожнього руху “виявляючи навіть малі зміни в концентрації водіїв.”












