AI 101

Een beginnershandleiding voor sentimentanalyse in 2023

gepubliceerd

1 jaar geleden

22 april 2023

Een collage van een meisje met meerdere gezichtsemoties.

Mensen zijn wezens met gevoel; we ervaren emoties, sensaties en gevoelens 90% van de tijd. Sentimentanalyse wordt steeds belangrijker voor onderzoekers, bedrijven en organisaties om feedback van klanten te begrijpen en verbeterpunten te identificeren. Het heeft verschillende toepassingen, maar het staat ook voor enkele uitdagingen.

Sentiment verwijst naar gedachten, opvattingen en attitudes - vastgehouden of uitgedrukt - gemotiveerd door emoties. De meeste mensen gaan tegenwoordig bijvoorbeeld gewoon naar sociale media om hun gevoelens te uiten in inhoud zoals een tweet. Daarom werken tekstmining-onderzoekers aan sentimentanalyse van sociale media om de publieke opinie te begrijpen, trends te voorspellen en de klantervaring te verbeteren.

Laten we de sentimentanalyse hieronder in detail bespreken.

Wat is sentimentanalyse?

Natural Language Processing (NLP) techniek om tekstuele gegevens, zoals klantrecensies, te analyseren om de emotie achter de tekst te begrijpen en deze te classificeren als positief, negatief of neutraal, wordt sentimentanalyse genoemd.

De hoeveelheid tekstuele gegevens die online wordt gedeeld, is enorm. Meer dan 500 miljoen tweets worden dagelijks gedeeld met sentimenten en meningen. Door het vermogen te ontwikkelen om deze grote hoeveelheden, zeer gevarieerde en snelle gegevens te analyseren, kunnen organisaties gegevensgestuurde beslissingen nemen.

Er zijn drie hoofdtypen sentimentanalyse:

1. Multimodale sentimentanalyse

Het is een type sentimentanalyse waarbij we rekening houden met meerdere gegevensmodi, zoals video, audio en tekst, om de emoties te analyseren die in de inhoud worden uitgedrukt. Rekening houdend met visuele en auditieve signalen zoals gezichtsuitdrukkingen, geeft de toon van de stem een breed spectrum aan gevoelens.

2. Op aspecten gebaseerde sentimentanalyse

De aspectgebaseerde analyse omvat NLP-methoden om emoties en meningen met betrekking tot specifieke aspecten of kenmerken van producten en diensten te analyseren en te extraheren. In een restaurantrecensie kunnen onderzoekers bijvoorbeeld sentimenten extraheren met betrekking tot eten, service, ambiance, enz.

3. Meertalige sentimentanalyse

Elke taal heeft een andere grammatica, syntaxis en woordenschat. Het sentiment wordt in elke taal anders uitgedrukt. Bij meertalige sentimentanalyse wordt elke taal specifiek getraind om het sentiment van de te analyseren tekst te extraheren.

Welke hulpmiddelen kunt u gebruiken voor sentimentanalyse?

Bij sentimentanalyse verzamelen we de gegevens (klantrecensies, berichten op sociale media, opmerkingen, enz.), verwerken deze voor (verwijderen van ongewenste tekst, tokenisatie, POS-tagging, stam/lemmatisering), extraheren van kenmerken (woorden omzetten in cijfers voor modellering), en classificeer de tekst als positief, negatief of neutraal.

Diverse Python-bibliotheken en in de handel verkrijgbare tools vereenvoudigen het proces van sentimentanalyse, dat als volgt is:

1. Python-bibliotheken

NLTK (Natural Language Toolkit) is de veelgebruikte tekstverwerkingsbibliotheek voor sentimentanalyse. Verschillende andere bibliotheken zoals Vader (Valence Aware Dictionary en sEntiment Reasoner) en TextBlob zijn bovenop NLTK gebouwd.

BERT (Bidirectional Encoder Representations from Transformers) is een krachtig taalrepresentatiemodel dat state-of-the-art resultaten heeft opgeleverd voor veel NLP-taken.

2. In de handel verkrijgbare hulpmiddelen

Ontwikkelaars en bedrijven kunnen veel commercieel verkrijgbare tools gebruiken voor hun applicaties. Deze tools kunnen worden aangepast, zodat voorbewerkings- en modelleringstechnieken kunnen worden aangepast aan specifieke behoeften. Populaire hulpmiddelen zijn:

IBM Watson-begrip van natuurlijke taal

IBM Watson NLU is een cloudgebaseerde service die helpt bij tekstanalyse, zoals sentimentanalyse. Het ondersteunt meerdere talen en maakt gebruik van deep learning om sentimenten te identificeren.

Google Cloud Natural Language API

De Natural Language API van Google kan verschillende NLP-taken uitvoeren. De API maakt gebruik van machine learning en vooraf getrainde modellen om sentiment- en magnitudescores te geven.

Toepassingen van sentimentanalyse

1. Klantervaringsbeheer (CEM)

Het extraheren en analyseren van de gevoelens van klanten uit feedback en beoordelingen om producten en diensten te verbeteren, wordt klantervaringsbeheer genoemd. Eenvoudig gezegd kan CEM – door gebruik te maken van sentimentanalyse – de klanttevredenheid verhogen, wat op zijn beurt de omzet verhoogt. En als klanten tevreden zijn, 72% van hen zullen hun ervaring met anderen delen.

2. Analyse van sociale media

Over 65% van de wereldbevolking gebruikt sociale media. Tegenwoordig kunnen we gevoelens en meningen van mensen vinden over elke belangrijke gebeurtenis. Onderzoekers kunnen de publieke opinie beoordelen door gegevens over specifieke gebeurtenissen te verzamelen.

Er is bijvoorbeeld een onderzoek uitgevoerd om de opvattingen van mensen in westerse landen over ISIS te vergelijken met die in oosterse landen. Het onderzoek concludeerde dat mensen ISIS als een bedreiging beschouwen, ongeacht waar ze vandaan komen.

3. Politieke analyse

Door het publieke sentiment op sociale media te analyseren, kunnen politieke campagnes hun sterke en zwakke punten begrijpen en reageren op de kwesties die het publiek het belangrijkst vinden. Bovendien kunnen onderzoekers verkiezingsuitslagen voorspellen door sentimenten ten aanzien van politieke partijen en kandidaten te analyseren.

Twitter heeft een correlatie van 94% met opiniepeilingsgegevens, wat betekent dat het zeer consistent is in het voorspellen van verkiezingen.

Uitdagingen van sentimentanalyse

1. Dubbelzinnigheid

Dubbelzinnigheid verwijst naar gevallen waarin een woord of uitdrukking meerdere betekenissen heeft op basis van de omringende context. Het woord ziek kan bijvoorbeeld een positieve connotatie hebben ("Dat concert was ziek") of een negatieve connotatie ("Ik ben ziek"), afhankelijk van de context.

2. Sarcasme

Het detecteren van sarcasme in een tekst kan een uitdaging zijn, omdat mensen met de stimulus positieve woorden kunnen gebruiken om negatieve gevoelens uit te drukken of vice versa. De tekst "Oh geweldig, weer een ontmoeting" kan bijvoorbeeld een sarcastische opmerking zijn, afhankelijk van de context.

3. Gegevenskwaliteit

Het kan een uitdaging zijn om domeinspecifieke gegevens van hoge kwaliteit te vinden zonder zorgen over gegevensprivacy en beveiliging. Het verwijderen van gegevens van sociale-mediawebsites is altijd een grijze zone. meta heeft een rechtszaak aangespannen tegen twee bedrijven BrandTotal en Unimania, voor het maken van schrapende extensies voor Facebook tegen de voorwaarden en het beleid van Facebook.

4. emoji

Emoji's worden steeds vaker gebruikt om emoties uit te drukken in gesprekken op sociale media-apps. Maar de interpretatie van emoji's is subjectief en contextafhankelijk. De meeste beoefenaars verwijderen emoji's uit de tekst, wat in sommige gevallen misschien niet de beste optie is. Daarom wordt het moeilijk om het sentiment van de tekst holistisch te analyseren.

State of Sentiment Analyse in 2023 & daarna!

Grote taalmodellen zoals BERT en GPT hebben bij veel NLP-taken state-of-the-art resultaten bereikt. Onderzoekers gebruiken emoji-inbedding en Multi-Head zelfaandachtsarchitectuur om de uitdaging van respectievelijk emoji's en sarcasme in de tekst aan te pakken. Na verloop van tijd zullen dergelijke technieken een betere nauwkeurigheid, schaalbaarheid en snelheid opleveren.

Ga voor meer AI-gerelateerde inhoud naar verenigen.ai.