Connect with us

AI 101

En begynderguide til sentimentanalyse i 2023

mm
A collage of a girl showing multiple facial emotion.

Mennesker er følsomme væsener; vi oplever emotioner, sansninger og følelser 90% af tiden. Sentimentanalyse bliver mere og mere vigtig for forskere, virksomheder og organisationer for at forstå kundefeedback og identificere områder for forbedring. Det har forskellige anvendelser, men det står også over for nogle udfordringer.

Sentiment henviser til tanker, synspunkter og holdninger – som holdes eller udtrykkes – motiveret af emotioner. For eksempel går de fleste mennesker i dag bare på sociale medier for at udtrykke deres sentiment i indhold som en tweet. Derfor arbejder tekstminingforskere med sociale medier-sentimentanalyse for at forstå offentlighedens mening, forudsige tendenser og forbedre kundeoplevelsen.

Lad os diskutere sentimentanalyse i detaljer nedenfor.

Hvad er Sentimentanalyse?

Natural Language Processing (NLP) teknik til at analysere tekstdata, såsom kunde anmeldelser, for at forstå emotionen bag teksten og klassificere den som positiv, negativ eller neutral kaldes sentimentanalyse.

Mængden af tekstdata, der deles online, er enorm. Over 500 million tweets deles dagligt med sentiment og meninger. Ved at udvikle evnen til at analysere denne store mængde data med høj variation og hastighed kan organisationer træffe datadrevene beslutninger.

Der er tre hovedtyper af sentimentanalyse:

1. Multimodal Sentimentanalyse

Det er en type sentimentanalyse, hvor vi overvejer multiple dataformer, såsom video, lyd og tekst, for at analysere emotionerne, der udtrykkes i indholdet. Overvejelse af visuelle og auditive signaler såsom ansigtsudtryk, tone af stemme giver en bred spektrum af sentiment.

2. Aspect-baseret Sentimentanalyse

Aspect-baseret analyse indebærer NLP-metoder til at analysere og udtrække emotioner og meninger relateret til bestemte aspekter eller funktioner af produkter og tjenester. For eksempel kan forskere i en restaurantanmeldelse udtrække sentiment relateret til mad, service, atmosfære osv.

3. Multilingual Sentimentanalyse

Hver sprog har sin egen grammatik, syntaks og ordforråd. Sentiment udtrykkes forskelligt i hvert sprog. I multilingual sentimentanalyse trænes hvert sprog specifikt til at udtrække sentiment af den tekst, der analyseres.

Hvilke Værktøjer Kan Du Bruge til Sentimentanalyse?

I sentimentanalyse indsamler vi data (kunde anmeldelser, sociale medieindlæg, kommentarer osv.), forarbejder den (fjerner uønsket tekst, tokenisering, POS-tagging, stemming/lemmatisering), udtrækker funktioner (omdanner ord til tal for modellering) og klassificerer teksten som enten positiv, negativ eller neutral.

Forskellige Python-biblioteker og kommercielt tilgængelige værktøjer lettelser processen med at analysere sentiment, som følger:

1. Python-biblioteker

NLTK (Natural Language Toolkit) er det mest brugte tekstbehandlingsbibliotek til sentimentanalyse. Forskellige andre biblioteker såsom Vader (Valence Aware Dictionary and sEntiment Reasoner) og TextBlob er bygget oven på NLTK.

BERT (Bidirectional Encoder Representations from Transformers) er en kraftfuld sprogrepræsentationsmodel, der har vist state-of-the-art resultater på mange NLP-opgaver.

2. Kommercielt Tilgængelige Værktøjer

Udviklere og virksomheder kan bruge mange kommercielt tilgængelige værktøjer til deres anvendelser. Disse værktøjer er tilpasselige, så forarbejdning og modelleringsteknikker kan tilpasses til bestemte behov. Populære værktøjer er:

IBM Watson NLU er en cloud-baseret tjeneste, der hjælper med tekstanalyse, såsom sentimentanalyse. Det understøtter multiple sprog og bruger dyb læring til at identificere sentiment.

Google’s Natural Language API kan udføre forskellige NLP-opgaver. API’et bruger maskinlæring og forudindlærte modeller til at give sentiment og størrelsesklasser.

Anvendelser af Sentimentanalyse

En illustration af forskellige ansigter, der er engageret i forskellige sociale aktiviteter.

1. Kundeoplevelsesledelse (CEM)

At udtrække og analysere kunders sentiment fra feedback og anmeldelser for at forbedre produkter og tjenester kaldes kundeoplevelsesledelse. Det kan forkortes til, at CEM – ved hjælp af sentimentanalyse – kan forbedre kundetilfredshed, hvilket igen øger omsætningen. Og når kunder er tilfredse, 72% af dem vil dele deres oplevelse med andre.

2. Sociale Medieanalyse

Omkring 65% af verdens befolkning bruger sociale medier. I dag kan vi finde sentiment og meninger om enhver betydelig begivenhed. Forskere kan vurderere offentlighedens mening ved at indsamle data om bestemte begivenheder.

For eksempel blev der gennemført en undersøgelse for at sammenligne, hvilke synspunkter mennesker i vestlige lande har om ISIS i forhold til østlige lande. Undersøgelsen konkluderede, at mennesker ser ISIS som en trussel uanset, hvor de kommer fra.

3. Politisk Analyse

Ved at analysere offentlighedens sentiment på sociale medier kan politiske kampagner forstå deres styrker og svagheder og reagere på de problemer, der betyder mest for offentligheden. Desuden kan forskere forudsige valgresultater ved at analysere sentiment over for politiske partier og kandidater.

Twitter har en 94% korrelation med meningsmålinger, hvilket betyder, at det er meget konsekvent i forhold til at forudsige valg.

Udfordringer ved Sentimentanalyse

1. Tvetydighed

Tvetydighed henviser til tilfælde, hvor et ord eller udtryk har multiple betydninger afhængigt af den omgivende kontekst. For eksempel kan ordet syg have positive konnotationer (“Den koncert var syg”) eller negative konnotationer (“Jeg er syg”), afhængigt af konteksten.

2. Sarcasme

At opdage sarcasme i en tekst kan være udfordrende, fordi mennesker med stimulus kan bruge positive ord til at udtrykke negative sentiment eller vice versa. For eksempel kan teksten “Oh, det er fantastisk, endnu et møde” være en sarkastisk kommentar afhængigt af konteksten.

3. Datakvalitet

At finde kvalitetsdomænespecifik data uden dataprivatlivs- og sikkerhedsproblemer kan være udfordrende. At skrabe data fra sociale medier er altid en grå zone. Meta anlagde en sag mod to virksomheder, BrandTotal og Unimania, for at lave skrabe-udvidelser til Facebook imod Facebooks vilkår og politik.

4. Emojier

Emojier bruges mere og mere til at udtrykke emotioner i samtale på sociale medier. Men fortolkningen af emojier er subjektiv og kontekstafhængig. De fleste praktikere fjerner emojier fra teksten, hvilket måske ikke er den bedste løsning i nogle tilfælde. Derfor kan det være svært at analysere sentimentet af teksten holistisk.

Status for Sentimentanalyse i 2023 og Fremover!

Store sprogmodeller som BERT og GPT har opnået state-of-the-art resultater på mange NLP-opgaver. Forskere bruger emoji-embedding og Multi-Head Self-Attention Architecture til at løse udfordringen med emojier og sarcasme i teksten. Over tid vil sådanne teknikker opnå bedre nøjagtighed, skalerbarhed og hastighed.

Til mere AI-relateret indhold, besøg unite.ai.

Haziqa er en Data Scientist med omfattende erfaring i at skrive teknisk indhold til AI- og SaaS-virksomheder.