Connect with us

ШІ 101

Початкове керівництво до аналізу настроїв у 2023 році

mm
A collage of a girl showing multiple facial emotion.

Люди є істотами, які переживають емоції, відчуття та почуття 90% часу. Аналіз настроїв стає дедалі важливішим для дослідників, бізнесу та організацій, щоб зрозуміти відгуки клієнтів та визначити області для покращення. Він має різні застосування, проте також зустрічає деякі виклики.

Настрій відноситься до думок, поглядів та ставлення – триманих чи виражених – мотивованих емоціями. Наприклад, більшість людей сьогодні просто заходять у соціальні медіа, щоб виразити свої настрої у контенті, наприклад, у твіті. Тому дослідники текстової мінінгії працюють над аналізом настроїв у соціальних медіа, щоб зрозуміти громадську думку, передбачити тенденції та покращити досвід клієнтів.

Давайте обговоримо аналіз настроїв у деталях нижче.

Що таке аналіз настроїв?

Natural Language Processing (NLP) техніка для аналізу текстових даних, таких як відгуки клієнтів, щоб зрозуміти емоцію за текстом та класифікувати його як позитивний, негативний або нейтральний, називається аналізом настроїв.

Кількість текстових даних, що передаються в Інтернеті, величезна. Більше 500 мільйонів твітів передаються щодня з настроями та opinіями. Розробляючи можливість аналізу цих даних великого обсягу, різноманітності та швидкості, організації можуть приймати рішення, засновані на даних.

Є три основних типи аналізу настроїв:

1. Мультимодальний аналіз настроїв

Це тип аналізу настроїв, у якому ми розглядаємо декілька режимів даних, таких як відео, аудіо та текст, щоб проаналізувати емоції, виражені у контенті. Урахування візуальних та аудіо сигналів, таких як вирази обличчя, тон голосу, дає широкий спектр настроїв.

2. Аналіз настроїв на основі аспектів

Аналіз на основі аспектів включає методи NLP для аналізу та витягування емоцій та opinій, пов’язаних з конкретними аспектами або функціями продуктів та послуг. Наприклад, у відгуку про ресторан дослідники можуть витягувати настрої, пов’язані з їжею, сервісом, атмосферою тощо.

3. Мультимовний аналіз настроїв

Кожна мова має свою граматику, синтаксис та словниковий запас. Настрій виражається по-різному в кожній мові. У мультимовному аналізі настроїв кожна мова окремо тренується для витягування настрою тексту, який аналізується.

Які інструменти можна використовувати для аналізу настроїв?

У аналізі настроїв ми збираємо дані (відгуки клієнтів, пости у соціальних медіа, коментарі тощо), попередньо обробляємо їх (видаляємо нежаданий текст, токенізацію, позначення частин мови, стемінг/лемматизацію), витягуємо особливості (перетворення слів у числа для моделювання) та класифікуємо текст як позитивний, негативний або нейтральний.

Різні Python бібліотеки та комерційно доступні інструменти полегшують процес аналізу настроїв, який наступний:

1. Python бібліотеки

NLTK (Natural Language Toolkit) – це широко використовувана бібліотека обробки тексту для аналізу настроїв. Різні інші бібліотеки, такі як Vader (Valence Aware Dictionary and sEntiment Reasoner) та TextBlob, побудовані на основі NLTK.

BERT (Bidirectional Encoder Representations from Transformers) – це потужна модель представлення мови, яка показала найкращі результати на багатьох завданнях NLP.

2. Комерційно доступні інструменти

Розробники та бізнес можуть використовувати багато комерційно доступних інструментів для своїх застосунків. Ці інструменти налаштовуються, тому техніки попередньої обробки та моделювання можна адаптувати до конкретних потреб. Популярні інструменти:

IBM Watson NLU – це хмарний сервіс, який допомагає з текстовим аналізом, таким як аналіз настроїв. Він підтримує декілька мов та використовує глибоке навчання для визначення настроїв.

API природної мови Google може виконувати різні завдання NLP. API використовує машинне навчання та попередньо треновані моделі для надання оцінок настрою та величини.

Застосування аналізу настроїв

An illustration of different faces engaged in different social activities.

1. Управління клієнтським досвідом (CEM)

Витягування та аналіз настроїв клієнтів з відгуків та рецензій для покращення продуктів та послуг називається управлінням клієнтським досвідом. Просто кажучи, CEM – використання аналізу настроїв – може покращити задоволеність клієнтів, що у свою чергу збільшує дохід. І коли клієнти задоволені, 72% з них будуть ділитися своїм досвідом з іншими.

2. Аналіз соціальних медіа

Близько 65% населення світу використовує соціальні медіа. Сьогодні ми можемо знайти настрої та opinії людей про будь-яку значиму подію. Дослідники можуть оцінити громадську думку, збираючи дані про конкретні події.

Наприклад, було проведено дослідження, щоб порівняти, які погляди люди у західних країнах мають щодо ІДІЛ у порівнянні зі східними країнами. Дослідження показало, що люди розглядають ІДІЛ як загрозу, незалежно від того, звідки вони походять.

3. Політичний аналіз

Аналізуючи громадський настрій у соціальних медіа, політичні кампанії можуть зрозуміти свої сильні та слабкі сторони та відповісти на питання, які найбільш турбують громадськість. Крім того, дослідники можуть передбачити результати виборів, аналізуючи настрої щодо політичних партій та кандидатів.

Twitter має 94% кореляцію з даними опитування, що означає, що він високо консистентний у передбаченні виборів.

Виклики аналізу настроїв

1. Двозначність

Двозначність відноситься до випадків, коли слово чи вираз має декілька значень залежно від контексту. Наприклад, слово “хворий” може мати позитивні конотації (“Концерт був хворим”) або негативні конотації (“Я хворий”), залежно від контексту.

2. Сарказм

Виявлення сарказму у тексті може бути складним, оскільки люди з стимулом можуть використовувати позитивні слова для вираження негативних настроїв або навпаки. Наприклад, текст “О, велике, ще одне засідання” може бути саркастичним коментарем залежно від контексту.

3. Якість даних

Знаходження якісних даних певної галузі без проблем з приватністю та безпекою даних може бути складним. Збір даних з веб-сайтів соціальних медіа завжди знаходиться у сірій зоні. Meta подала позов проти двох компаній BrandTotal та Unimania за створення розширень для збору даних для Facebook проти умов та політики Facebook.

4. Емоції

Емоції все частіше використовуються для вираження емоцій у розмовах у соціальних медіа. Але інтерпретація емоцій суб’єктивна та залежить від контексту. Більшість практиків видаляють емоції з тексту, що може не бути найкращим варіантом у деяких випадках. Тому стає складним аналізувати настрій тексту у цілому.

Стан аналізу настроїв у 2023 році та далі!

Більші мови моделі, такі як BERT та GPT, досягли найкращих результатів на багатьох завданнях NLP. Дослідники використовують ембеддинг емоцій та архітектуру багатократної самоуваги для вирішення проблеми емоцій та сарказму у тексті. З часом такі техніки досягнуть кращої точності, масштабованості та швидкості.

Для більшої кількості контенту, пов’язаного з ІІ, відвідайте unite.ai.

Haziqa є вченим-даними з великим досвідом написання технічного контенту для компаній AI та SaaS.