Етика
Етичні аспекти при розробці штучного інтелекту для розпізнавання емоцій

Штучний інтелект для регулювання емоцій є одним з останніх технологічних досягнень у сфері машинного навчання. Хоча він демонструє великий потенціал, етичні питання готові вплинути на швидкість його впровадження та довговічність. Чи зможуть розробники ШІ подолати їх?
Що таке ШІ для розпізнавання емоцій?
ШІ для розпізнавання емоцій — це тип моделі машинного навчання. Він часто спирається на технологію комп’ютерного зору, яка захоплює та аналізує вираз обличчя для розшифрування настрою на зображеннях та відео. Однак він також може працювати з аудіофрагментами для визначення тону голосу або письмовим текстом для оцінки сентименту мови.
Такий алгоритм є захоплюючим прогресом у сфері ШІ, оскільки досі моделі не могли сприймати людські почуття. Хоча великі мовні моделі, такі як ChatGPT, можуть переконливо імітувати настрій та персоналії, вони можуть лише логічно з’єднувати слова — вони нічого не відчувають і не демонструють емоційного інтелекту. Хоча модель розпізнавання емоцій нездатна мати почуття, вона все ж може їх виявляти та каталогізувати. Цей розвиток є значним, оскільки вказує на те, що ШІ, можливо, скоро зможе справді розуміти та демонструвати радість, смуток чи злість. Такі технологічні стрибки свідчать про прискорений прогрес.
Сфери застосування ШІ для розпізнавання емоцій
Бізнеси, педагоги, консультанти та фахівці з психічного здоров’я є одними з груп, які можуть використовувати ШІ для розпізнавання емоцій.
Оцінка ризиків у офісі
Відділи кадрів можуть використовувати алгоритми для проведення сентимент-аналізу листування електронною поштою або чатів у додатках між членами команди. Або ж вони можуть інтегрувати свій алгоритм у свою систему спостереження чи комп’ютерного зору. Користувачі можуть відстежувати настрій для розрахунку таких показників, як ризик плинності кадрів, рівень вигорання та задоволеність співробітників.
Допомога агентам обслуговування клієнтів
Рітейлери можуть використовувати власних ШІ-агентів обслуговування клієнтів для кінцевих користувачів або віртуальних помічників для вирішення високостресових ситуацій. Оскільки їхня модель може розпізнавати настрій, вона може пропонувати методи деескалації або змінювати свій тон, коли розуміє, що споживач починає злитися. Такі контрзаходи можуть покращити задоволеність клієнтів та їхню утриманість.
Допомога учням у класі
Педагоги можуть використовувати цей ШІ, щоб учні, які навчаються віддалено, не відставали. Один стартап уже використав свій інструмент для вимірювання м’язових точок на обличчях учнів, одночасно каталогізуючи їхню швидкість та оцінки. Цей метод визначає їхній настрій, мотивацію, сильні та слабкі сторони. Засновник стартапу стверджує, що вони отримують на 10% вищі бали на тестах при використанні цього програмного забезпечення.
Проведення внутрішнього маркетингового дослідження
Бізнеси можуть проводити внутрішнє маркетингове дослідження за допомогою моделі розпізнавання емоцій. Вона може допомогти їм точно зрозуміти, як їхня цільова аудиторія реагує на їхній продукт, послугу чи маркетинговий матеріал, надаючи цінну інформацію на основі даних. Як наслідок, вони можуть прискорити виведення на ринок та збільшити дохід.
Проблема використання ШІ для виявлення емоцій
Дослідження свідчать, що точність сильно залежить від навчальної інформації. Одна дослідницька група — намагаючись розшифрувати почуття з зображень — анекдотично довела цю концепцію, коли їхня модель досягла точності 92,05% на наборі даних Japanese Female Facial Expression та точності 98,13% на наборі даних Extended Cohn-Kanade.
Хоча різниця між 92% та 98% може здаватися незначною, вона важлива — ця невелика розбіжність може мати суттєві наслідки. Для довідки, рівень отруєння набору даних лише 0,001% виявився ефективним для створення бекдорів моделі або навмисного спричинення помилкових класифікацій. Навіть частка відсотка є значущою.
Більше того, хоча дослідження видаються перспективними — показники точності вище 90% демонструють потенціал — дослідники проводять їх у контрольованих умовах. У реальному світі розмиті зображення, сфальшовані вирази обличчя, погані кути та тонкі почуття набагато поширеніші. Іншими словами, ШІ може не здатний працювати стабільно.
Сучасний стан ШІ для розпізнавання емоцій
Алгоритмічний сентимент-аналіз — це процес використання алгоритму для визначення того, чи є тон тексту позитивним, нейтральним чи негативним. Ця технологія, можна сказати, є основою для сучасних моделей виявлення емоцій, оскільки проклала шлях для алгоритмічних оцінок настрою. Схожі технології, такі як програмне забезпечення для розпізнавання обличчя, також сприяли прогресу.
Сьогоднішні алгоритми можуть переважно виявляти лише прості настрої, такі як радість, смуток, злість, страх і здивування, з різним ступенем точності. Ці вирази обличчя є вродженими та універсальними — тобто природними та зрозумілими у всьому світі — тому навчити ШІ їх розпізнавати відносно просто.
Більше того, базові вирази обличчя часто є перебільшеними. Люди насуплюють брови, коли зляться, хмуряться, коли сумують, посміхаються, коли щасливі, та розплющують очі, коли шоковані. Ці прості, драматичні вигляди легко відрізнити. Складніші емоції визначити складніше, оскільки вони або тонкі, або поєднують базові вирази.
Оскільки ця підкатегорія ШІ значною мірою залишається на стадії досліджень та розробок, вона ще не прогресувала до охоплення складних почуттів, таких як туга, сором, горе, ревнощі, полегшення чи плутанина. Хоча з часом вона, ймовірно, охопить більше, немає гарантії, що зможе інтерпретувати їх усі.
Насправді алгоритми, можливо, ніколи не зможуть конкурувати з людьми. Для довідки, хоча набір даних GPT-4 від OpenAI становить приблизно 1 петабайт, один кубічний міліметр людського мозку містить близько 1,4 петабайта даних. Нейробіологи не можуть повністю зрозуміти, як мозок сприймає емоції, незважаючи на десятиліття досліджень, тому створення високоточного ШІ може бути неможливим.
Хоча використання цієї технології для розпізнавання емоцій має прецедент, ця сфера технічно все ще перебуває в зародковому стані. Існує безліч досліджень цієї концепції, але існує мало реальних прикладів масштабного впровадження. Деякі ознаки вказують на те, що відставання у впровадженні може бути наслідком занепокоєння щодо нестабільної точності та етичних питань.
Етичні аспекти для розробників ШІ
Згідно з одним опитуванням, 67% респондентів погоджуються, що ШІ слід регулювати дещо або набагато більше. Щоб заспокоїти людей, розробники повинні мінімізувати упередження, забезпечити очікувану поведінку своїх моделей та покращити результати. Ці рішення можливі, якщо вони нададуть пріоритет етичним міркуванням під час розробки.
1. Згідний збір та використання даних
Згода — це все в епоху, коли регулювання ШІ посилюється. Що станеться, якщо співробітники дізнаються, що їхні вирази обличчя каталогізуються без їхнього відома? Чи потрібно, щоб батьки підтверджували сентимент-аналіз у освітніх цілях, чи студенти можуть вирішувати самостійно?
Розробники повинні чітко розкривати, яку інформацію модель збиратиме, коли вона працюватиме, для чого буде використовуватися аналіз і хто матиме доступ до цих деталей. Крім того, вони повинні включати функції відмови, щоб особи могли налаштовувати дозволи.
2. Анонімний результат сентимент-аналізу
Анонімізація даних є такою ж проблемою конфіденційності, як і проблемою безпеки. Розробники повинні анонімізувати інформацію про емоції, яку вони збирають, щоб захистити залучених осіб. Принаймні, їм слід серйозно розглянути можливість використання шифрування даних у спокої.
3. Прийняття рішень за участю людини
Єдина причина використовувати ШІ для визначення емоційного стану людини — це інформування прийняття рішень. Таким чином, незалежно від того, чи використовується він у сфері психічного здоров’я чи в роздрібній торгівлі, він впливатиме на людей. Розробники повинні використовувати засоби безпеки з участю людини, щоб мінімізувати неочікувану поведінку.
4. Людино-орієнтований зворотний зв’язок для виводу ШІ
Навіть якщо алгоритм має майже 100% точність, він все одно буде давати хибнопозитивні результати. Враховуючи, що не рідкість, коли моделі досягають 50% або 70% — і це не торкаючись питань упередженості чи галюцинацій — розробникам слід розгля












