Штучний інтелект

Виявлення ворожньої мови та боротьба зі стереотипами за допомогою штучного інтелекту

Опубліковано 13 серпня 2023

Оновлено 23 травня 2026

Haziqa Sajid

Featured Blog Image-AI Hate Speech Detection to Combat Stereotyping & Disinformation

Сьогодні інтернет є життєво важливим засобом глобальної комунікації та зв’язку. Однак разом з цією безпрецедентною онлайн-з’єднаністю ми також спостерігаємо темну сторону людської поведінки, тобто ворожню мову, стереотипи та шкідливий контент. Ці питання проникли в соціальні медіа, онлайн-форуми та інші віртуальні простори, завдаючи тривалої шкоди окремим особам і суспільству. Отже, існує потреба у виявленні ворожньої мови.

За даними Pew Research Center, 41% американських дорослих стверджують, що особисто зустрічалися з інтернет-знущаннями, а 25% стали жертвами серйозних переслідувань.

Для створення більш позитивної та поважливої онлайн-середовища необхідно приймати активні заходи та використовувати потенціал технологій. У цьому контексті штучний інтелект (ШІ) пропонує інноваційні рішення для виявлення та боротьби зі ворожньою мовою та стереотипами.

Обмеження поточних методів мінімізації та необхідність активних заходів

Поточні методи мінімізації ворожньої мови обмежені. Вони не можуть ефективно припинити поширення шкідливого контенту в Інтернеті. Ці обмеження включають:

Реактивні підходи, які в основному покладаються на модерацію людьми та статичні алгоритми, не можуть впоратися з швидким поширенням ворожньої мови.
Відносно великий обсяг онлайн-контенту перевантажує модераторів, що призводить до затримок у відповідях та пропущених випадках шкідливої риторики.
Також, контекстуальне розуміння та еволюція мовних нюансів становлять виклик для автоматизованих систем щодо точного виявлення та інтерпретації випадків ворожньої мови.

Для подолання цих обмежень і створення безпечнішої онлайн-середовища необхідно перейти до активних заходів. Прийомом ШІ-підтримуваних заходів ми можемо зміцнити наші цифрові спільноти, заохочуючи інклюзивність та єдність онлайн-суспільства.

Виявлення та позначення ворожньої мови за допомогою ШІ

У боротьбі з ворожньою мовою ШІ виступає як потужний союзник, з алгоритмами машинного навчання (МЛ) для швидкого та точного виявлення шкідливого контенту. Аналізуючи великі об’єми даних, моделі ШІ можуть вивчити розпізнавання закономірностей та мовних нюансів, пов’язаних з ворожньою мовою, що дозволяє їм ефективно категоризувати та реагувати на шкідливий контент.

Для навчання моделей ШІ для точного виявлення ворожньої мови використовуються методи нагляду та ненагляду. Нагляд включає надання позначених прикладів ворожньої мови та безпечного контенту, щоб навчити модель розрізняти ці дві категорії. Ненагляд та напівненаглядні методи використовують непозначені дані для розвитку розуміння моделлю ворожньої мови.

Використання технік контрмови ШІ для боротьби з ворожньою мовою

Контрмова стає потужною стратегією боротьби з ворожньою мовою шляхом прямого виклику та звернення до шкідливої риторики. Це включає генерацію переконливого та інформативного контенту для просування емпатії, розуміння та толерантності. Це дозволяє окремим особам та спільнотам активно брати участь у створенні позитивної цифрової середовищі.

Хоча конкретні деталі окремих моделей контрмови можуть варіюватися залежно від технології ШІ та підходів до розробки, деякі спільні риси та техніки включають:

Генерація природної мови (ГПМ): Моделі контрмови використовують ГПМ для створення людських відповідей у письмовій чи усній формі. Відповіді є узгодженими та контекстно-релевантними до конкретного випадку ворожньої мови, яку вони контрують.
Аналіз настрою: Моделі контрмови ШІ використовують аналіз настрою для оцінки емоційного тону ворожньої мови та підлаштовують свої відповіді відповідно. Це забезпечує, що контрмова є як впливаючою, так і емпатичною.
Контекстуальне розуміння: Аналізуючи контекст, що оточує ворожню мову, моделі контрмови можуть генерувати відповіді, які звертаються до конкретних питань або міфів, сприяючи більш ефективній та зосередженій контрмові.
Розмаїття даних: Для уникнення упереджень та забезпечення справедливості моделі контрмови тренуються на різноманітних наборах даних, що представляють різні точки зору та культурні нюанси. Це допомагає у генерації інклюзивних та культурно чутливих відповідей.
Навчання від зворотної зв’язності користувачів: Моделі контрмови можуть постійно покращуватися, навчаючись від зворотної зв’язності користувачів. Цей зворотний зв’язок дозволяє моделі уточнювати свої відповіді на основі реальних взаємодій, підвищуючи її ефективність з часом.

Приклади боротьби з ворожньою мовою за допомогою ШІ

Реальний приклад техніки контрмови ШІ – це “Метод перенаправлення“, розроблений Google’s Jigsaw та Moonshot CVE. Метод перенаправлення використовує націлену рекламу для досягнення осіб, які схильні до екстремістських ідеологій та ворожньої мови. Цей підхід ШІ спрямований на відраду осіб від взаємодії зі шкідливим контентом та просування емпатії, розуміння та відходу від екстремістських переконань.

Дослідники також розробили нову модель ШІ під назвою BiCapsHate, яка є потужним інструментом проти онлайн-ворожньої мови, як повідомляється в IEEE Transactions on Computational Social Systems. Вона підтримує двонаправлений аналіз мови, підвищуючи розуміння контексту для точного визначення шкідливого контенту. Це вдосконалення спрямоване на пом’якшення шкідливого впливу ворожньої мови на соціальні медіа, пропонуючи потенціал для безпечнішої онлайн-комунікації.

Аналогічно, дослідники в Університеті Мічигану використали ШІ для боротьби з онлайн-ворожньою мовою за допомогою підходу під назвою Правила за прикладом (RBE). Використовуючи глибоке навчання, цей підхід вивчає правила класифікації ворожньої мови з прикладів шкідливого контенту. Ці правила застосовуються до вхідного тексту для точного визначення та передбачення онлайн-ворожньої мови.

Етичні розгляди для моделей виявлення ворожньої мови

Для максимізації ефективності моделей контрмови ШІ етичні розгляди мають першорядне значення. Однак важливо балансувати свободу слова та заборону поширення шкідливого контенту, щоб уникнути цензури.

Прозорість у розробці та розгортанні моделей контрмови ШІ є важливою для створення довіри та підзвітності серед користувачів та зацікавлених сторін. Також важливо забезпечити справедливість, оскільки упередження в моделях ШІ можуть підтримувати дискримінацію та виключення.

Наприклад, ШІ, розроблений для виявлення ворожньої мови, може випадково посилювати расову упередженість. Дослідження показало, що провідні моделі ШІ для виявлення ворожньої мови були в 1,5 раза більш схильні позначати твіти афроамериканців як обурливі. Вони були в 2,2 раза більш схильні позначати твіти як ворожню мову, написані афроамериканською англійською. Аналогічний доказ виник з дослідження 155 800 твітів, пов’язаних з ворожньою мовою, підкреслюючи виклик щодо подолання расової упередженості в моделях ШІ для модерації контенту.

У іншому дослідженні дослідники протестували чотири системи ШІ для виявлення ворожньої мови та виявили, що всі вони мали труднощі з точним виявленням токсичних речень. Для діагностики точних проблем у цих моделях виявлення ворожньої мови вони створили taksonomію 18 типів ворожньої мови, включаючи лайку та загрозливу мову. Вони також підкреслили 11 сценаріїв, які заважають ШІ, таких як використання нецензурної лексики в неконтрольованих висловлюваннях. В результаті дослідження створило HateCheck, відкритий набір даних з майже 4 000 прикладів, спрямований на покращення розуміння нюансів ворожньої мови для моделей ШІ.

Свідомість та цифрова грамотність

Боротьба з ворожньою мовою та стереотипами вимагає активного та багатовимірного підходу. Отже, підвищення свідомості та просування цифрової грамотності є важливим у боротьбі з ворожньою мовою та стереотипами.

Освіта осіб про вплив шкідливого контенту сприяє культурі емпатії та відповідальної онлайн-поведінки. Стратегії, які заохочують критичне мислення, дозволяють користувачам розрізняти легітимну дискусію та ворожню мову, зменшуючи поширення шкідливої риторики. Також важливо забезпечити користувачів навичками для ідентифікації та ефективної відповіді на ворожню мову. Це дозволить їм викликати та контрувати шкідливу риторику, сприяючи безпечнішій та більш поважливій цифровій середовищі.

По мірі розвитку технологій ШІ потенціал для боротьби з ворожньою мовою та стереотипами з більшою точністю та впливом зростає експоненціально. Отже, важливо закріпити ШІ-підтримувану контрмову як потужний інструмент у просуванні емпатії та позитивної онлайн-взаємодії.

Для отримання більшої інформації щодо тенденцій та технологій ШІ відвідайте unite.ai.