Штучний інтелект
6 кроків, щоб отримати інформацію з соціальних медіа за допомогою обробки природної мови

Аналіз настрою та обробка природної мови (NLP) соціальних медіа – це доведений спосіб отримання інформації від людей та суспільства. Замість того, щоб просити аналітика витратити тижні на читання коментарів у соціальних медіа та надання звіту, аналіз настрою може дати вам швидкий підсумок. Це означає, що ви можете приймати рішення швидше.
Чому вам потрібен аналіз настрою та NLP у соціальних медіа?
Ви живете в епоху великих даних. Взявши користувачів соціальних медіа як приклад, у 2019 році було 3,4 мільярда активних користувачів соціальних медіа у світі. На YouTube самому один мільярд годин відеоконтенту переглядається щодня. Кожний індикатор свідчить про те, що ми побачимо більше даних, згенерованих з часом, а не менше.
Є просто занадто багато даних, щоб їх можна було переглянути вручну. Навіть організації з великими бюджетами, такі як національні уряди та глобальні корпорації, використовують інструменти аналізу даних, алгоритми та обробку природної мови.
Використовуючи ці техніки, ви можете зрозуміти, про що люди говорять про ваш бренд зараз. Здатність мінімізувати вибірковий бIAS та уникнути сприйняття анекдотів означає, що ваші рішення будуть мати тверду основу. Це означає, що ви будете робити менше помилок, реагуючи на швидко змінюваний світ.
Аналіз настрою та NLP у дії: набір персоналу, громадське здоров’я та маркетинг
Ви, можливо, думаєте, чи ці інструменти аналізу даних корисні у реальному світі чи чи вони надійні для використання. Ці інструменти існують уже понад десяти років, і вони стають краще з кожним роком. З допомогою NLP та аналізу настрою ви можете вирішувати проблеми швидше.
Зекономіть час під час набору персоналу
Під час набору персоналу знаходження якісних кандидатів є складним завданням. Workopolis оцінює, що “до 75% заявок на певну посаду не мають необхідних кваліфікацій для виконання роботи”. Витрачання часу на цих кандидатів не є продуктивним. На щастя, обробка природної мови та аналіз можуть допомогти вам ідентифікувати кандидатів, які добре підходять для вашої компанії, щоб ви могли використовувати час продуктивно. Це чому Blue Orange Digital працював з гедж-фондом, щоб оптимізувати їхній процес управління персоналом. Використовуючи десять років даних про заявників та резюме, компанія тепер має розвинену модель оцінки для пошуку кандидатів, які добре підходять.
Громадське здоров’я та надзвичайні ситуації
У 2020 році ми всі почали вивчати цінність великомасштабного аналізу даних про громадське здоров’я через швидке поширення COVID. У цих кризах виявлення змін у соціальному поведінці швидко є важливим. З допомогою NLP ви можете аналізувати соціальні медіа, щоб оцінити настрій. Наприклад, недавній проект проаналізував понад 1 000 твітів, використовуючи ключове слово “маски”, щоб зрозуміти, про що люди думають і відчувають щодо масок.
Маркетинг
У маркетингу вам потрібно бути в курсі того, про що думає і відчуває ваша цільова аудиторія. Дослідження 2019 року використовувало аналіз настрою у Twitter, щоб краще зрозуміти бренди одягу: Nike та Adidas. Аналізуючи 30 895 англійських твітів, дослідники виявили, що “Adidas має більш позитивний настрій, ніж Nike”. Однак понад 50% твітів мали нейтральний настрій. Це означає, що все ще є значна можливість отримати більше позитивних відгуків від ринку.

Лайки – це нова валюта, NLP у соціальних медіа
Як працює аналіз настрою технічно?
Для того, щоб аналіз настрою працював ефективно, є кілька важливих технічних моментів, які слід мати на увазі.
1) Розробіть актуальне бізнес-питання
Визначте, які питання ви хочете відповісти, і чи ці методи аналізу даних підходять для цих питань. Розгляньмо два питання маркетингу
- Чи слід нам запустити маркетинговий партнерський проект з кредитною компанією, щоб збільшити продажі?
- Чи отримуємо ми повернення на наші кампанії з маркетингу інфлюенсерів?
Перше питання стосується стратегії та майбутніх можливостей, тому даних для аналізу буде небагато. Тому ми не рекомендуємо намагатися відповісти на це питання за допомогою аналізу настрою. Натомість друге питання є більш перспективним для обробки природної мови. Воно все ще потребує подальшого уточнення, але у вас є початок відповідного питання.
2) Знайдіть свій джерело даних
Ваш наступний крок – знайти відповідне джерело даних для аналізу. Ідеально шукайте джерела даних, які у вас вже є, а не створюйте щось нове. Для набору персоналу у вас, ймовірно, є база даних заявників та успішних кандидатів у вашій системі відстеження заявок. У маркетингу ви можете завантажити дані з соціальних медіа-платформ, використовуючи API.
Порада: Об’єм даних важливий для того, щоб аналіз настрою працював. Як правило, ваш набір даних повинен містити щонайменше 1 000 прикладів (наприклад, 1 000 твітів або 1 000 профілів заявників). Все, що менше цього, і ви менше ймовірно отримаєте статистично значимі результати.
Прочитайте більше про альтернативні джерела даних та доповнення вашого даних третьою стороною.
3) Передобробіть свої дані
Більшість джерел даних, особливо соціальні медіа та контент, створений користувачами, потребують передобробки, перш ніж ви зможете з ними працювати. Припускаючи, що ви аналізуєте текстовий ресурс, почніть з видалення зайвої пунктуації, символів та інших текстових даних. Приділення часу цьому кроку покращить якість отриманого аналізу.
Оскільки більш обширні набори даних tend дають кращі результати, використовуйте інструменти для подальшої очистки даних. Наприклад, алгоритм Porter Stemmer Algorithm є корисним способом очистити текстові дані. Цей алгоритм допомагає ідентифікувати кореневі слова та зменшити шум у ваших даних.
4) Проаналізуйте дані
Залежно від ваших цілей, існують різні програмні інструменти та алгоритми для аналізу даних. Припускаючи, що ви аналізуєте текст, алгоритм Naïve Bayes – це правильний вибір для проведення аналізу настрою.
5) Критично оцініть вивід
Ви не можете просто прийняти аналіз даних, згенерований машинами, безкритично. Дослідники виявили, що інструменти машинного навчання tend відображати людський бIAS. Наприклад, Amazon скасував алгоритм ресурсів людини, оскільки він дискримінував жінок-кандидатів. Після всього, історичні дані в цьому випадку були в основному засновані на чоловіків. Це місце, де ваші цінності – як зобов’язання щодо інклюзивності та різноманітності – повинні балансувати дані, отримані з допомогою інструментів.
Це також застосовується до виводу, отриманого пошуковими системами. CEO KISSPatent D’vorah Graeser надає приклад того, як NLP покращує їхні результати пошукових систем при аналізі інформації з Всесвітньої організації інтелектуальної власності
“Використання NLP особливо актуально та корисно, коли спробувати знайти патенти для нових технологій, таких як блокчейн чи штучний інтелект, які не мають визначених категорій у Всесвітній організації інтелектуальної власності, наприклад. Здатність шукати та знаходити патенти важлива для всіх інноваторів, оскільки вони можуть дізнатися, хто працює над певними інноваціями та чи їхні інновації такі унікальні та нові, як вони думають.”
CEO KISSPatent, D’vorah Graeser
6) Визначте наступні кроки
Сам по собі аналіз настрою не змінить вашу компанію. Вам потрібно переглянути ці висновки та прийняти рішення. Наприклад, ви можете виявити, що у вас зростаюча кількість негативного настрою щодо вашого бренду в Інтернеті. У цьому випадку ви можете розпочати дослідницький проект, щоб ідентифікувати проблеми клієнтів, а потім випустити покращену версію вашого продукту.
Не впевнені, з чого почати з NLP у соціальних медіа?
Знаходження правильних даних, застосування алгоритмів до цих даних та отримання корисних бізнес-інсайтів не легко. Після всього великі компанії з великими ресурсами зробили помилки у своїх проектах з обробкою природної мови. Це чому варто отримати зовнішню перспективу на ваші дані. Зв’яжіться з Blue Orange Digital сьогодні, щоб дізнатися, як ви можете отримати швидші інсайти з соціальних медіа та інших даних у вашій організації.
Для отримання更多 інформації про тенденції штучного інтелекту та технологій дивіться дані, отримані CEO Blue Orange Digital Джошем Мірамантом, щодо рішень для ланцюжків постачання, автоматизації документів у сфері охорони здоров’я та інших кейс-стадій.












