AI 101

En begyndervejledning til sentimentanalyse i 2023

Udgivet

1 år siden

April 22, 2023

En collage af en pige, der viser flere ansigtsfølelser.

Mennesker er følende væsener; vi oplever følelser, fornemmelser og følelser 90 % af tiden. Følelsesanalyse bliver stadig vigtigere for forskere, virksomheder og organisationer for at forstå kundefeedback og identificere forbedringsområder. Det har forskellige applikationer, men det står også over for nogle udfordringer.

Følelser refererer til tanker, synspunkter og holdninger – holdt eller udtrykt – motiveret af følelser. For eksempel kommer de fleste mennesker i dag bare ind på sociale medier for at udtrykke deres følelser i indhold som et tweet. Derfor arbejder tekstmineforskere på følelsesanalyse på sociale medier for at forstå den offentlige mening, forudsige tendenser og forbedre kundeoplevelsen.

Lad os diskutere sentimentanalyse i detaljer nedenfor.

Hvad er sentimentanalyse?

Natural Language Processing (NLP) teknik til at analysere tekstdata, såsom kundeanmeldelser, for at forstå følelsen bag teksten og klassificere den som positiv, negativ eller neutral kaldes sentimentanalyse.

Mængden af tekstdata, der deles online, er enorm. Mere end 500 millioner Tweets deles dagligt med følelser og meninger. Ved at udvikle kapaciteten til at analysere disse data med store mængder, høj variation og høj hastighed, kan organisationer træffe datadrevne beslutninger.

Der er tre hovedtyper af sentimentanalyse:

1. Multimodal sentimentanalyse

Det er en type sentimentanalyse, hvor vi overvejer flere datatilstande, såsom video, lyd og tekst, for at analysere de følelser, der udtrykkes i indholdet. I betragtning af visuelle og auditive signaler såsom ansigtsudtryk, giver tonefald et bredt spektrum af følelser.

2. Aspekt-baseret stemningsanalyse

Den aspektbaserede analyse involverer NLP-metoder til at analysere og udtrække følelser og meninger relateret til specifikke aspekter eller funktioner ved produkter og tjenester. For eksempel kan forskere i en restaurantanmeldelse uddrage følelser relateret til mad, service, stemning osv.

3. Flersproget følelsesanalyse

Hvert sprog har sin egen grammatik, syntaks og ordforråd. Følelsen udtrykkes forskelligt på hvert sprog. I flersproget stemningsanalyse er hvert sprog specifikt trænet til at udtrække stemningen i den tekst, der analyseres.

Hvilke værktøjer kan du bruge til sentimentanalyse?

I sentimentanalyse indsamler vi data (kundeanmeldelser, indlæg på sociale medier, kommentarer osv.), forbehandler dem (fjerner uønsket tekst, tokenisering, POS-tagging, stemming/lemmatisering), udtrækker funktioner (konverterer ord til tal til modellering), og klassificere teksten som enten positiv, negativ eller neutral.

Various Python-biblioteker og kommercielt tilgængelige værktøjer letter processen med at analysere følelser, som er som følger:

1. Python-biblioteker

NLTK (Natural Language Toolkit) er det meget brugte tekstbehandlingsbibliotek til sentimentanalyse. Forskellige andre biblioteker såsom Vader (Valence Aware Dictionary and sEntiment Reasoner) og TextBlob er bygget oven på NLTK.

BERTI (Bidirectional Encoder Representations from Transformers) er en kraftfuld sprogrepræsentationsmodel, der har vist state-of-the-art resultater på mange NLP-opgaver.

2. Kommercielt tilgængelige værktøjer

Udviklere og virksomheder kan bruge mange kommercielt tilgængelige værktøjer til deres applikationer. Disse værktøjer kan tilpasses, så forbehandlings- og modelleringsteknikker kan skræddersyes til specifikke behov. Populære værktøjer er:

IBM Watson Natural Language Understanding

IBM Watson NLU er en cloud-baseret tjeneste, der hjælper med tekstanalyse, såsom sentimentanalyse. Det understøtter flere sprog og bruger dyb læring til at identificere følelser.

Google Cloud Natural Language API

Googles Natural Language API kan udføre forskellige NLP-opgaver. API'en bruger maskinlæring og forudtrænede modeller til at give sentiment og størrelsesscore.

Anvendelser af sentimentanalyse

1. Customer Experience Management (CEM)

At uddrage og analysere kundernes følelser fra feedback og anmeldelser for at forbedre produkter og tjenester kaldes kundeoplevelsesstyring. Forenklet sagt kan CEM – ved hjælp af sentimentanalyse – øge kundetilfredsheden, hvilket igen øger omsætningen. Og når kunderne er tilfredse, 72 % af dem vil dele deres erfaringer med andre.

2. Social Media Analyse

Om 65 % af verdens befolkning bruger sociale medier. I dag kan vi finde følelser og meninger fra mennesker om enhver væsentlig begivenhed. Forskere kan vurdere den offentlige mening ved at indsamle data om specifikke begivenheder.

For eksempel blev der udført en undersøgelse for at sammenligne, hvilke holdninger folk i vestlige lande har om ISIS sammenlignet med østlige lande. Forskningen konkluderede, at folk betragter ISIS som en trussel, uanset hvor de kommer fra.

3. Politisk analyse

Ved at analysere offentlighedens følelser på sociale medier kan politiske kampagner forstå deres styrker og svagheder og reagere på de spørgsmål, der betyder mest for offentligheden. Desuden kan forskere forudsige valgresultater ved at analysere følelser over for politiske partier og kandidater.

Twitter har en 94% korrelation med meningsmålingsdata, hvilket betyder, at det er meget konsekvent i at forudsige valg.

Udfordringer ved sentimentanalyse

1. Tvetydighed

Tvetydighed refererer til tilfælde, hvor et ord eller udtryk har flere betydninger baseret på den omgivende kontekst. For eksempel kan ordet syg have positive konnotationer ("Den koncert var syg") eller negative konnotationer ("jeg er syg"), afhængigt af konteksten.

2. Sarkasme

At opdage sarkasme i en tekst kan være udfordrende, fordi personer med stimulus kan bruge positive ord til at udtrykke negative følelser eller omvendt. For eksempel kan teksten "Oh great, another meeting" være en sarkastisk kommentar afhængigt af konteksten.

3. Datakvalitet

Det kan være en udfordring at finde domænespecifikke data af høj kvalitet uden bekymringer om databeskyttelse og sikkerhed. Skrotning af data fra sociale medier-websteder er altid en gråzone. Meta anlagde en retssag mod to virksomheder BrandTotal og Unimania, for at lave skrabeudvidelser til Facebook mod Facebooks vilkår og politikker.

4. Emoji

Emojis bliver i stigende grad brugt til at udtrykke følelser i samtaler på sociale medier apps. Men fortolkningen af emojis er subjektiv og kontekstafhængig. De fleste behandlere fjerner emojis fra teksten, hvilket måske ikke er den bedste mulighed i nogle tilfælde. Derfor bliver det vanskeligt at analysere tekstens følelse holistisk.

Tilstandsanalyse i 2023 og frem!

Store sprogmodeller som BERT og GPT har opnået state-of-the-art resultater på mange NLP-opgaver. Forskere bruger emoji-indlejring og Multi-Head Self Attention Architecture at adressere udfordringen med henholdsvis emojis og sarkasme i teksten. Over tid vil sådanne teknikker opnå bedre nøjagtighed, skalerbarhed og hastighed.

For mere AI-relateret indhold, besøg forene.ai.