Connect with us

Виявлення ворожньої мови за допомогою штучного інтелекту для боротьби зі стереотипами та дезінформацією

Штучний інтелект

Виявлення ворожньої мови за допомогою штучного інтелекту для боротьби зі стереотипами та дезінформацією

mm
Featured Blog Image-AI Hate Speech Detection to Combat Stereotyping & Disinformation

Сьогодні інтернет є життєво важливим засобом глобальної комунікації та зв’язку. Однак разом з цією безпрецедентною онлайн-з’єднаністю ми також спостерігаємо темну сторону людської поведінки, тобто ворожню мову, стереотипи та шкідливий контент. Ці питання проникли в соціальні медіа, онлайн-форуми та інші віртуальні простори, завдаючи тривалої шкоди окремим особам і суспільству. Тому існує потреба у виявленні ворожньої мови.

Згідно з даними Pew Research Center, 41% американських дорослих стверджують, що вони особисто зустрічалися з інтернет-знущаннями, а 25% стали жертвами серйозного переслідування.

Для створення більш позитивної та поважливої онлайн-атмосфери необхідно приймати активні заходи та використовувати силу технологій. У цьому контексті штучний інтелект (ШІ) пропонує інноваційні рішення для виявлення та боротьби з ворожньою мовою та стереотипами.

Обмеження поточних методів мінімізації та необхідність активних заходів

Поточні методи мінімізації ворожньої мови обмежені. Вони не можуть ефективно припинити поширення шкідливого контенту в інтернеті. До цих обмежень належать:

  • Реактивні підходи, які в основному спираються на модерацію людини та статичні алгоритми, не можуть впоратися з швидким поширенням ворожньої мови.
  • Відому кількість онлайн-контенту перевантажує модераторів, що призводить до затримок у реакції та пропущених випадках шкідливої риторики.
  • Також контекстуальне розуміння та еволюція мовних нюансів становлять виклик для автоматизованих систем щодо точного визначення випадків ворожньої мови.

Для подолання цих обмежень та створення безпечнішої онлайн-атмосфери необхідно перейти до активних заходів. Прийняття заходів, що ґрунтуються на штучному інтелекті, дозволить нам укріпити наші цифрові спільноти, заохочуючи інклюзивність та сплоченість у онлайн-світі.

Виявлення та прапорування ворожньої мови за допомогою ШІ

У боротьбі з ворожньою мовою ШІ стає потужним союзником, з алгоритмами машинного навчання (МЛ) для швидкого та точного визначення шкідливого контенту. Аналізуючи великі об’єми даних, моделі ШІ можуть навчиться розпізнавати закономірності та мовні нюанси, пов’язані з ворожньою мовою, що дозволяє їм ефективно категоризувати та реагувати на шкідливий контент.

Для навчання моделей ШІ для точного виявлення ворожньої мови використовуються методи нагляду та ненагляду. Навчання з наглядом передбачає надання прикладів ворожньої мови та безпечного контенту для навчання моделі розрізняти ці дві категорії. Натомість ненаглядні та напівненаглядні методи використовують неналежні дані для розвитку розуміння моделі щодо ворожньої мови.

Використання технік контрмови ШІ для боротьби з ворожньою мовою

Контрмова стає потужною стратегією боротьби з ворожньою мовою шляхом прямого виклику та звернення до шкідливих нарративів. Це передбачає створення переконливого та інформативного контенту для просування емпатії, розуміння та толерантності. Це дозволяє окремим особам та спільнотам активно брати участь у створенні позитивної цифрової атмосфери.

Хоча конкретні деталі окремих моделей контрмови можуть відрізнятися залежно від технології ШІ та підходів до розробки, деякі спільні особливості та техніки включають:

  • Генерація природної мови (NLG): Моделі контрмови використовують NLG для створення людських відповідей у письмовій чи усній формі. Відповіді є логічними та контекстно-відповідними до конкретного випадку ворожньої мови, яку вони суперечать.
  • Аналіз настрою: Моделі контрмови ШІ використовують аналіз настрою для оцінки емоційного тону ворожньої мови та підлаштовують свої відповіді відповідно. Це забезпечує, що контрмова є як впливаючою, так і емпатичною.
  • Контекстуальне розуміння: Аналізуючи контекст, що оточує ворожню мову, моделі контрмови можуть генерувати відповіді, які звертаються до конкретних питань або помилкових уявлень, що сприяє більш ефективній та зосередженій контрмові.
  • Різноманітність даних: Для уникнення упереджень та забезпечення справедливості моделі контрмови навчаються на різноманітних наборах даних, які представляють різні точки зору та культурні нюанси. Це допомагає у створенні інклюзивних та культурно-чутливих відповідей.
  • Навчання на зворотному зв’язку користувачів: Моделі контрмови можуть постійно покращуватися, навчаючись на зворотному зв’язку користувачів. Цей зворотний зв’язок дозволяє моделі уточнювати свої відповіді на основі реальних взаємодій, підвищуючи свою ефективність з часом.

Приклади боротьби з ворожньою мовою за допомогою ШІ

Реальний приклад техніки контрмови ШІ – це “Redirect Method“, розроблений Google’s Jigsaw та Moonshot CVE. Redirect Method використовує націлену рекламу для досягнення осіб, які схильні до екстремістських ідеологій та ворожньої мови. Цей підхід, що ґрунтується на ШІ, спрямований на відраду осіб від взаємодії зі шкідливим контентом та просування емпатії, розуміння та відходу від екстремістських переконань.

Дослідники також розробили нову модель ШІ під назвою BiCapsHate, яка є потужним інструментом проти онлайн-ворожньої мови, як повідомляється в IEEE Transactions on Computational Social Systems. Вона підтримує двонаправлений аналіз мови, покращуючи контекстуальне розуміння для точного визначення шкідливого контенту. Це вдосконалення спрямоване на пом’якшення шкідливого впливу ворожньої мови на соціальні медіа, пропонуючи потенціал для безпечнішої онлайн-атмосфери.

Аналогічно, дослідники в Університеті Мічигану використали ШІ для боротьби з онлайн-ворожньою мовою, використовуючи підхід під назвою Rule By Example (RBE). Використовуючи глибоке навчання, цей підхід навчає правила класифікації ворожньої мови на прикладах шкідливого контенту. Ці правила застосовуються до вхідного тексту для визначення та передбачення онлайн-ворожньої мови точно.

Етичні розгляди для моделей виявлення ворожньої мови

Для максимізації ефективності моделей контрмови ШІ етичні розгляди мають першочергове значення. Однак важливо балансувати свободу слова та заборону поширення шкідливого контенту, щоб уникнути цензури.

Прозорість у розробці та впровадженні моделей контрмови ШІ є необхідною для формування довіри та відповідальності серед користувачів та зацікавлених сторін. Також забезпечення справедливості є рівнозначним, оскільки упередження в моделях ШІ можуть підтримувати дискримінацію та виключення.

Наприклад, ШІ, розроблений для визначення ворожньої мови, може випадково посилювати расову упередженість. Дослідження показало, що провідні моделі виявлення ворожньої мови ШІ були в 1,5 раза більш схильні до прапорування твітів афроамериканців як обурливих. Вони також були в 2,2 раза більш схильні до прапорування твітів як ворожньої мови, написаних афроамериканською англійською. Аналогічний доказ виник з дослідження 155 800 постів у Твіттері, пов’язаних з ворожньою мовою, підкреслюючи виклик щодо подолання расової упередженості в моделях ШІ.

У іншому дослідженні дослідники протестували чотири системи ШІ для виявлення ворожньої мови та виявили, що всі вони боролися з точним визначення токсичних речень. Для діагностики точних проблем у цих моделях виявлення ворожньої мови вони створили таксономію 18 типів ворожньої мови, включаючи лайку та загрозливу мову. Вони також виділили 11 сценаріїв, які заважають ШІ, таких як використання нецензурної лексики у неворожній мові. У результаті дослідження створило HateCheck, відкритий набір даних з майже 4 000 прикладів, спрямований на покращення розуміння нюансів ворожньої мови для моделей ШІ.

Свідомість та цифрова грамотність

Боротьба з ворожньою мовою та стереотипами вимагає активного та багатовимірного підходу. Отже, підвищення свідомості та просування цифрової грамотності є важливим у боротьбі з ворожньою мовою та стереотипами.

Освіта осіб про вплив шкідливого контенту сприяє культурі емпатії та відповідальної онлайн-п поведінки. Стратегії, які заохочують критичне мислення, надають користувачам можливість розрізняти легітимну дискусію та ворожню мову, зменшуючи поширення шкідливих нарративів. Також надання користувачам навичок для визначення та ефективної реакції на ворожню мову є важливим. Це дозволить їм викликати та протидіяти шкідливій риториці, сприяючи безпечнішій та більш поважливій цифровій атмосфері.

Як технологія ШІ розвивається, потенціал для боротьби з ворожньою мовою та стереотипами з більшою точністю та впливом зростає експоненціально. Отже, важливо зміцнити ШІ-підтриману контрмову як потужний інструмент у просуванні емпатії та позитивної взаємодії в інтернеті.

Для отримання більшої інформації щодо тенденцій та технологій ШІ відвідайте unite.ai.

Haziqa є вченим-даними з великим досвідом написання технічного контенту для компаній AI та SaaS.