Connect with us

Руководство для начинающих по анализу настроений в 2023 году

ИИ 101

Руководство для начинающих по анализу настроений в 2023 году

mm
A collage of a girl showing multiple facial emotion.

Люди являются чувствительными существами; мы испытываем эмоции, ощущения и чувства 90% времени. Анализ настроений становится все более важным для исследователей, бизнеса и организаций, чтобы понять обратную связь клиентов и выявить области для улучшения. У него есть различные применения, но он также сталкивается с некоторыми проблемами.

Настроение относится к мыслям, взглядам и отношениям – удерживаемым или выражаемым – мотивированным эмоциями. Например, большинство людей сегодня просто заходят в социальные сети, чтобы выразить свои настроения в контенте, таком как твит. Следовательно, исследователи по текстовой минералогии работают над анализом настроений в социальных сетях, чтобы понять общественное мнение, предсказать тенденции и улучшить опыт клиентов.

Давайте обсудим анализ настроений более подробно ниже.

Что такое анализ настроений?

Natural Language Processing (NLP) техника для анализа текстовых данных, таких как отзывы клиентов, чтобы понять эмоцию за текстом и классифицировать его как положительный, отрицательный или нейтральный, называется анализом настроений.

Количество текстовых данных, обмениваемых в Интернете, огромно. Более 500 миллионов твитов обмениваются ежедневно с настроениями и мнениями. Разрабатывая способность анализировать эти высокообъемные, высокоразнообразные и высокоскоростные данные, организации могут принимать обоснованные решения.

Существует три основных типа анализа настроений:

1. Мультимодальный анализ настроений

Это тип анализа настроений, при котором мы учитываем несколько режимов данных, таких как видео, аудио и текст, чтобы проанализировать эмоции, выраженные в контенте. Учитывая визуальные и слуховые подсказки, такие как выражения лица, тон голоса, дает широкий спектр настроений.

2. Анализ настроений на основе аспектов

Анализ на основе аспектов включает методы NLP для анализа и извлечения эмоций и мнений, связанных с конкретными аспектами или функциями продукта и услуг. Например, в отзыве о ресторане исследователи могут извлечь настроения, связанные с едой, сервисом, атмосферой и т. д.

3. Мультилингвальный анализ настроений

Каждый язык имеет свою грамматику, синтаксис и словарь. Настроение выражается по-разному на каждом языке. В мультилингвальном анализе настроений каждый язык специально обучен для извлечения настроения текста, который анализируется.

Какие инструменты можно использовать для анализа настроений?

В анализе настроений мы собираем данные (отзывы клиентов, посты в социальных сетях, комментарии и т. д.), предварительно обрабатываем их (удаляем нежелательный текст, токенизация, POS-тегирование, стемминг/лемматизация), извлекаем функции (преобразуем слова в числа для моделирования) и классифицируем текст как положительный, отрицательный или нейтральный.

Различные Python-библиотеки и коммерчески доступные инструменты облегчают процесс анализа настроений, который следующий:

1. Python-библиотеки

NLTK (Natural Language Toolkit) – это широко используемая библиотека текстовой обработки для анализа настроений. Различные другие библиотеки, такие как Vader (Valence Aware Dictionary and sEntiment Reasoner) и TextBlob, построены на основе NLTK.

BERT (Bidirectional Encoder Representations from Transformers) – это мощная модель представления языка, которая показала результаты на уровне состояния искусства во многих задачах NLP.

2. Коммерчески доступные инструменты

Разработчики и бизнес могут использовать многие коммерчески доступные инструменты для своих приложений. Эти инструменты настраиваемы, поэтому методы предварительной обработки и моделирования можно адаптировать к конкретным потребностям. Популярные инструменты:

IBM Watson NLU – это облачный сервис, который помогает с текстовым анализом, таким как анализ настроений. Он поддерживает несколько языков и использует глубокое обучение для выявления настроений.

API Google Cloud Natural Language может выполнять различные задачи NLP. API использует машинное обучение и предварительно обученные модели для предоставления оценок настроений и величины.

Применения анализа настроений

Иллюстрация разных лиц, занимающихся различными социальными активностями.

1. Управление опытом клиентов (CEM)

Извлечение и анализ настроений клиентов из обратной связи и отзывов для улучшения продуктов и услуг называется управлением опытом клиентов. Просто говоря, CEM – с помощью анализа настроений – может улучшить удовлетворенность клиентов, что, в свою очередь, увеличивает доход. И когда клиенты удовлетворены, 72% из них поделятся своим опытом с другими.

2. Анализ социальных сетей

Около 65% населения мира использует социальные сети. Сегодня мы можем найти настроения и мнения людей о любом значимом событии. Исследователи могут оценить общественное мнение, собирая данные о конкретных событиях.

Например, было проведено исследование, чтобы сравнить, какие взгляды люди в западных странах имеют на ИГИЛ по сравнению с восточными странами. Исследование показало, что люди рассматривают ИГИЛ как угрозу, независимо от того, откуда они.

3. Политический анализ

Анализируя общественное настроение в социальных сетях, политические кампании могут понять свои сильные и слабые стороны и ответить на вопросы, которые наиболее важны для общества. Кроме того, исследователи могут предсказать результаты выборов, анализируя настроения по отношению к политическим партиям и кандидатам.

Twitter имеет 94% корреляцию с данными опросов, что означает, что он очень последователен в предсказании выборов.

Проблемы анализа настроений

1. Двусмысленность

Двусмысленность относится к случаям, когда слово или выражение имеет несколько значений в зависимости от окружающего контекста. Например, слово “больной” может иметь положительные коннотации (“Этот концерт был больным”) или отрицательные коннотации (“Я больной”), в зависимости от контекста.

2. Сарказм

Обнаружение сарказма в тексте может быть сложной задачей, потому что люди с стимулом могут использовать положительные слова, чтобы выразить отрицательные настроения или наоборот. Например, текст “О, великолепно, еще одно совещание” может быть саркастическим комментарием в зависимости от контекста.

3. Качество данных

Поиск качественных доменных данных без проблем с конфиденциальностью и безопасностью данных может быть сложной задачей. Сбор данных из социальных сетей всегда является серой зоной. Meta подала в суд на две компании BrandTotal и Unimania за создание расширений для сбора данных для Facebook против условий и политики Facebook.

4. Эмоции

Эмоции все чаще используются для выражения эмоций в разговоре на социальных сетях. Но интерпретация эмоций является субъективной и контекстно-зависимой. Большинство практиков удаляют эмоции из текста, что может не быть лучшим вариантом в некоторых случаях. Следовательно, становится сложно проанализировать настроение текста в целом.

Состояние анализа настроений в 2023 году и далее!

Большие языковые модели, такие как BERT и GPT, показали результаты на уровне состояния искусства во многих задачах NLP. Исследователи используют встроенные эмоции и архитектуру Multi-Head Self-Attention, чтобы решить проблему эмоций и сарказма в тексте соответственно. Со временем такие методы будут достигать лучшей точности, масштабируемости и скорости.

Для получения дополнительного контента, связанного с ИИ, посетите unite.ai.

Haziqa является Data Scientist с обширным опытом написания технического контента для компаний AI и SaaS.