škrbina Vodnik za začetnike po analizi razpoloženja v letu 2023 – Unite.AI
Povežite se z nami

AI 101

Vodnik za začetnike po analizi razpoloženja leta 2023

mm

objavljeno

 on

Kolaž dekleta, ki prikazuje več obraznih čustev.

Ljudje smo čuteča bitja; doživljamo čustva, občutke in občutke 90% časa. Analiza razpoloženja postaja vse bolj pomembna za raziskovalce, podjetja in organizacije, da razumejo povratne informacije strank in prepoznajo področja izboljšav. Ima različne aplikacije, vendar se sooča tudi z nekaterimi izzivi.

Sentiment se nanaša na misli, poglede in stališča – ki jih držimo ali izražamo – ki jih motivirajo čustva. Na primer, večina ljudi danes preprosto vstopi na družbene medije, da izrazi svoja čustva v vsebini, kot je tvit. Zato raziskovalci rudarjenja besedil delajo na analizi razpoloženja družbenih medijev, da bi razumeli javno mnenje, napovedali trende in izboljšali uporabniško izkušnjo.

O analizi sentimenta se podrobneje pogovorimo spodaj.

Kaj je analiza sentimenta?

Obdelava Natural Language (NLP) tehnika za analizo besedilnih podatkov, kot so ocene strank, da bi razumeli čustva v ozadju besedila in jih razvrstili kot pozitivne, negativne ali nevtralne, se imenuje analiza čustev.

Količina besedilnih podatkov, ki se delijo na spletu, je ogromna. Več kot 500 milijonov tviti se dnevno delijo z občutki in mnenji. Z razvojem zmogljivosti za analizo teh obsežnih, raznolikih in hitrih podatkov lahko organizacije sprejemajo odločitve, ki temeljijo na podatkih.

Obstajajo tri glavne vrste analize razpoloženja:

1. Multimodalna analiza razpoloženja

To je vrsta analize čustev, pri kateri upoštevamo več podatkovnih načinov, kot so video, zvok in besedilo, da analiziramo čustva, izražena v vsebini. Glede na vidne in slušne znake, kot je obrazna mimika, ton glasu daje širok spekter čustev.

2. Analiza razpoloženja na podlagi vidika

Analiza na podlagi vidikov vključuje metode NLP za analizo in izločanje čustev in mnenj, povezanih s posebnimi vidiki ali lastnostmi izdelkov in storitev. Na primer, v pregledu restavracije lahko raziskovalci izluščijo občutke, povezane s hrano, postrežbo, ambientom itd.

3. Večjezična analiza razpoloženja

Vsak jezik ima drugačno slovnico, sintakso in besedišče. Občutek se v vsakem jeziku izraža drugače. Pri večjezični analizi razpoloženja je vsak jezik posebej usposobljen za izločanje razpoloženja besedila, ki ga analiziramo.

Katera orodja lahko uporabite za analizo razpoloženja?

Pri analizi razpoloženja zbiramo podatke (ocene strank, objave v družabnih omrežjih, komentarje itd.), jih predhodno obdelamo (odstranjujemo neželeno besedilo, tokenizacijo, označevanje POS, izvor/lematizacijo), ekstrahiramo funkcije (pretvarjanje besed v številke za modeliranje), in razvrstite besedilo kot pozitivno, negativno ali nevtralno.

Različne Knjižnice Python in komercialno dostopna orodja olajšajo postopek analize razpoloženja, ki je naslednji:

1. Knjižnice Python

NLTK (Natural Language Toolkit) je pogosto uporabljena knjižnica za obdelavo besedila za analizo razpoloženja. Različne druge knjižnice, kot sta Vader (Valence Aware Dictionary in sEntiment Reasoner) in TextBlob, so zgrajene na vrhu NLTK.

BERTI (Bidirectional Encoder Representations from Transformers) je zmogljiv jezikovni reprezentacijski model, ki je pokazal vrhunske rezultate pri številnih nalogah NLP.

2. Komercialno dostopna orodja

Razvijalci in podjetja lahko za svoje aplikacije uporabljajo številna komercialno dostopna orodja. Ta orodja so prilagodljiva, tako da je mogoče tehnike predprocesiranja in modeliranja prilagoditi posebnim potrebam. Priljubljena orodja so:

IBM Watson NLU je storitev v oblaku, ki pomaga pri analitiki besedila, kot je analiza razpoloženja. Podpira več jezikov in uporablja globoko učenje za prepoznavanje občutkov.

Googlov API za naravni jezik lahko izvaja različne naloge NLP. API uporablja strojno učenje in vnaprej usposobljene modele za zagotavljanje rezultatov razpoloženja in velikosti.

Uporaba analize razpoloženja

Ilustracija različnih obrazov, vključenih v različne družbene dejavnosti.

1. Upravljanje uporabniške izkušnje (CEM)

Izločanje in analiziranje čustev strank iz povratnih informacij in ocen za izboljšanje izdelkov in storitev se imenuje upravljanje uporabniške izkušnje. Preprosto povedano, CEM – z uporabo analize razpoloženja – lahko poveča zadovoljstvo strank, kar posledično poveča prihodke. In ko so stranke zadovoljne, 72% od njih bo svoje izkušnje delil z drugimi.

2. Analiza družbenih medijev

O meni 65% svetovnega prebivalstva uporablja družbene medije. Danes lahko najdemo čustva in mnenja ljudi o katerem koli pomembnem dogodku. Raziskovalci lahko ocenijo javno mnenje z zbiranjem podatkov o določenih dogodkih.

Izvedena je bila na primer študija, da bi primerjali poglede ljudi v zahodnih državah na ISIS v primerjavi z vzhodnimi državami. Raziskava je pokazala, da ljudje vidijo ISIS kot grožnjo, ne glede na to, od kod prihajajo.

3. Politična analiza

Z analizo razpoloženja javnosti na družbenih medijih lahko politične kampanje razumejo svoje prednosti in slabosti ter se odzovejo na vprašanja, ki so za javnost najpomembnejša. Poleg tega lahko raziskovalci napovejo rezultate volitev z analizo čustev do političnih strank in kandidatov.

Twitter ima 94-odstotno korelacijo s podatki anket, kar pomeni, da je zelo dosleden pri napovedovanju volitev.

Izzivi analize sentimenta

1. Dvoumnost

Dvoumnost se nanaša na primere, ko ima beseda ali izraz več pomenov glede na okoliški kontekst. Na primer, beseda bolan ima lahko pozitivne konotacije (»Ta koncert je bil bolan«) ali negativne konotacije (»sem bolan«), odvisno od konteksta.

2. Sarkazem

Odkrivanje sarkazma v besedilu je lahko izziv, saj lahko ljudje s spodbudo uporabijo pozitivne besede za izražanje negativnih čustev ali obratno. Na primer, besedilo »O super, še eno srečanje« je lahko sarkastičen komentar, odvisno od konteksta.

3. Kakovost podatkov

Iskanje kakovostnih podatkov, specifičnih za domeno, brez skrbi glede zasebnosti in varnosti podatkov je lahko izziv. Brisanje podatkov s spletnih mest družbenih medijev je vedno siva cona. Meta je vložil tožbo proti dvema podjetjema BrandTotal in Unimania, ker sta izdelali razširitve za strganje za Facebook v nasprotju s Facebookovimi pogoji in pravilniki.

4. Emodžiji

Emojiji se vse pogosteje uporabljajo za izražanje čustev v pogovorih v aplikacijah družbenih medijev. Toda razlaga emojijev je subjektivna in odvisna od konteksta. Večina strokovnjakov odstrani emojije iz besedila, kar v nekaterih primerih morda ni najboljša možnost. Zato postane težko celostno analizirati občutke besedila.

Analiza razpoloženja leta 2023 in naprej!

Veliki jezikovni modeli, kot sta BERT in GPT, so dosegli najsodobnejše rezultate pri številnih NLP nalogah. Raziskovalci uporabljajo vdelavo emojijev in Arhitektura samopozornosti z več glavami obravnavati izziv emojijev oziroma sarkazma v besedilu. Sčasoma bodo takšne tehnike dosegle večjo natančnost, razširljivost in hitrost.

Za več vsebin, povezanih z umetno inteligenco, obiščite združiti.ai.