Kontakt med oss

AI 101

En nybegynnerveiledning til sentimentanalyse i 2023

mm
En collage av en jente som viser flere ansiktsfølelser.

Mennesker er sansende vesener; vi opplever følelser, sensasjoner og følelser 90% av tiden. Sentimentanalyse blir stadig viktigere for forskere, bedrifter og organisasjoner for å forstå tilbakemeldinger fra kunder og identifisere forbedringsområder. Den har ulike applikasjoner, men den har også noen utfordringer.

Sentiment refererer til tanker, synspunkter og holdninger – holdt eller uttrykt – motivert av følelser. For eksempel går de fleste i dag bare inn på sosiale medier for å uttrykke sine følelser i innhold som en tweet. Derfor jobber tekstgruveforskere med sentimentanalyse i sosiale medier for å forstå opinionen, forutsi trender og forbedre kundeopplevelsen.

La oss diskutere sentimentanalyse i detalj nedenfor.

Hva er sentimentanalyse?

Natural Language Processing (NLP) teknikk for å analysere tekstdata, for eksempel kundeanmeldelser, for å forstå følelsene bak teksten og klassifisere den som positiv, negativ eller nøytral kalles sentimentanalyse.

Mengden tekstdata som deles på nettet er enorm. Mer enn 500 millioner Tweets deles daglig med følelser og meninger. Ved å utvikle kapasiteten til å analysere disse dataene med høyt volum, høy variasjon og høy hastighet, kan organisasjoner ta datadrevne beslutninger.

Det er tre hovedtyper av sentimentanalyse:

1. Multimodal sentimentanalyse

Det er en type sentimentanalyse der vi vurderer flere datamoduser, som video, lyd og tekst, for å analysere følelsene som uttrykkes i innholdet. Med tanke på visuelle og auditive signaler som ansiktsuttrykk, gir stemmen et bredt spekter av følelser.

2. Aspektbasert sentimentanalyse

Den aspektbaserte analysen involverer NLP-metoder for å analysere og trekke ut følelser og meninger knyttet til spesifikke aspekter eller funksjoner ved produkter og tjenester. For eksempel, i en restaurantanmeldelse, kan forskere trekke ut følelser knyttet til mat, service, atmosfære osv.

3. Flerspråklig sentimentanalyse

Hvert språk har sin egen grammatikk, syntaks og ordforråd. Følelsen uttrykkes forskjellig på hvert språk. I flerspråklig sentimentanalyse er hvert språk spesielt opplært til å trekke ut følelsen til teksten som analyseres.

Hvilke verktøy kan du bruke for sentimentanalyse?

I sentimentanalyse samler vi dataene (kundeanmeldelser, innlegg på sosiale medier, kommentarer osv.), forhåndsbehandler dem (fjerner uønsket tekst, tokenisering, POS-tagging, stemming/lemmatisering), trekker ut funksjoner (konverterer ord til tall for modellering), og klassifisere teksten som enten positiv, negativ eller nøytral.

Diverse Python-biblioteker og kommersielt tilgjengelige verktøy letter prosessen med å analysere sentiment, som er som følger:

1. Python-biblioteker

NLTK (Natural Language Toolkit) er det mye brukte tekstbehandlingsbiblioteket for sentimentanalyse. Ulike andre biblioteker som Vader (Valence Aware Dictionary and sEntiment Reasoner) og TextBlob er bygget på toppen av NLTK.

BERTI (Bidirectional Encoder Representations from Transformers) er en kraftig språkrepresentasjonsmodell som har vist toppmoderne resultater på mange NLP-oppgaver.

2. Kommersielt tilgjengelige verktøy

Utviklere og bedrifter kan bruke mange kommersielt tilgjengelige verktøy for sine applikasjoner. Disse verktøyene kan tilpasses, slik at forbehandlings- og modelleringsteknikker kan skreddersys til spesifikke behov. Populære verktøy er:

IBM Watson NLU er en skybasert tjeneste som hjelper til med tekstanalyse, for eksempel sentimentanalyse. Den støtter flere språk og bruker dyp læring for å identifisere følelser.

Googles Natural Language API kan utføre ulike NLP-oppgaver. API-en bruker maskinlæring og forhåndstrente modeller for å gi sentiment og størrelsesscore.

Anvendelser av sentimentanalyse

En illustrasjon av forskjellige ansikter som er engasjert i forskjellige sosiale aktiviteter.

1. Customer Experience Management (CEM)

Å trekke ut og analysere kundenes følelser fra tilbakemeldinger og anmeldelser for å forbedre produkter og tjenester kalles kundeopplevelsesstyring. Enkelt sagt kan CEM – ved hjelp av sentimentanalyse – øke kundetilfredsheten som igjen øker inntektene. Og når kundene er fornøyde, 72% av dem vil dele sine erfaringer med andre.

2. Analyse av sosiale medier

Om oss 65% av verdens befolkning bruker sosiale medier. I dag kan vi finne følelser og meninger fra mennesker om enhver viktig hendelse. Forskere kan vurdere opinionen ved å samle inn data om spesifikke hendelser.

For eksempel ble det utført en studie for å sammenligne hva folk i vestlige land har om ISIS sammenlignet med østlige land. Forskningen konkluderte med at folk ser på ISIS som en trussel uavhengig av hvor de kommer fra.

3. Politisk analyse

Ved å analysere offentlige følelser på sosiale medier, kan politiske kampanjer forstå deres styrker og svakheter og svare på problemene som betyr mest for publikum. Dessuten kan forskere forutsi valgresultater ved å analysere følelser overfor politiske partier og kandidater.

Twitter har en 94% korrelasjon med meningsmålingsdata, noe som betyr at den er svært konsistent når det gjelder å forutsi valg.

Utfordringer ved sentimentanalyse

1. Tvetydighet

Tvetydighet refererer til tilfeller der et ord eller uttrykk har flere betydninger basert på den omgivende konteksten. For eksempel kan ordet syk ha positive konnotasjoner ("Den konserten var syk") eller negative konnotasjoner ("Jeg er syk"), avhengig av konteksten.

2. Sarkasme

Å oppdage sarkasme i en tekst kan være utfordrende fordi personer med stimulans kan bruke positive ord for å uttrykke negative følelser eller omvendt. For eksempel kan teksten «Å flott, nok et møte» være en sarkastisk kommentar avhengig av konteksten.

3. Datakvalitet

Det kan være utfordrende å finne domenespesifikke data av høy kvalitet uten bekymringer om personvern og sikkerhet. Å kassere data fra sosiale medier-nettsteder er alltid en gråsone. Meta anla søksmål mot to selskaper BrandTotal og Unimania, for å lage skraping-utvidelser for Facebook mot Facebooks vilkår og retningslinjer.

4. Emoji

Emojis blir i økende grad brukt til å uttrykke følelser i samtaler på sosiale medier-apper. Men tolkningen av emojis er subjektiv og kontekstavhengig. De fleste utøvere fjerner emojis fra teksten, som kanskje ikke er det beste alternativet i noen tilfeller. Derfor blir det vanskelig å analysere følelsen av teksten helhetlig.

Sentimentanalyse i 2023 og utover!

Store språkmodeller som BERT og GPT har oppnådd toppmoderne resultater på mange NLP-oppgaver. Forskere bruker emoji-innbygging og Flerhodes selvoppmerksomhetsarkitektur å ta opp utfordringen med henholdsvis emojier og sarkasme i teksten. Over tid vil slike teknikker oppnå bedre nøyaktighet, skalerbarhet og hastighet.

For mer AI-relatert innhold, besøk unite.ai.