Kunstig intelligens
Google’s nye Meena Chatbot Kan Holde Fornuftige, Spesifikke Samtaler Om Nesten Alt

Så imponerende og nyttig som virtuelle assistenter som Siri, Alexa og Google Assistant er, er deres konversasjonsferdigheter vanligvis begrenset til å motta bestemte kommandoer og levere forhåndsdefinerte svar. Selskaper som Google og Amazon har vært opptatt av metoder for AI-trening og utvikling som kan gjøre AI-chatboter mer robuste og fleksible, i stand til å føre samtaler med brukerne på en mye mer naturlig måte. Som rapportert av DigitalTrends, har Google nylig publisert en rapport som demonstrerer evnene til sin nye chatbot, kalt “Meena”. Ifølge en blogginnlegg fra forskerne, kan Meena engasjere i samtale med brukerne om nesten hvilket som helst emne.
Meena er en åpen-domene chatbot, noe som betyr at den responderer til samtalekonteksten så langt og tilpasser seg inndata for å levere mer naturlige svar. De fleste andre chatboter er lukkede-domene, noe som betyr at deres svar er temaatiske rundt bestemte ideer og begrensede til å utføre bestemte oppgaver.
Ifølge Google-rapporten var Meenas fleksibilitet resultatet av en massiv treningsdataset. Meena ble trent på rundt 40 milliarder ord hentet fra sosiale medier og filtrert for de mest relevante og representative ordene. Google hadde som mål å håndtere noen av problemene som finnes i de fleste taleassistenter, som evnen til å håndtere emner og kommandoer som utvikler seg over flere omganger i samtalen, med brukeren som gir ytterligere inndata etter at boten har svart på ett inndata. Dette betyr at mange chatboter ikke kan be brukeren om klargjøring og når det er et spørsmål som ikke kan tolkes, så defaulter de ofte bare til websøk.
For å håndtere dette spesielle problemet, aktiverte Google-forskerne algoritmene sine for å holde spor av samtalekonteksten, noe som betyr at den kan generere spesifikke svar. Modellen brukte en encoder som prosesserer hva som allerede er sagt i samtalen og en decoder som lager et svar basert på konteksten. Modellen ble trent på spesifikke og ikke-spesifikke data. Spesifikke data er ord som er nært relatert til den foregående uttalelsen. Som Google-innlegget forklarer:
“For eksempel, hvis A sier, ‘Jeg elsker tennis,’ og B svarer, ‘Det er fint,’ så skal uttalelsen markeres som ‘ikke spesifik’. Det svaret kunne brukes i dusinvis av forskjellige kontekster. Men hvis B svarer, ‘Meg også, jeg kan ikke få nok av Roger Federer!’, så er det markert som ‘spesifik’ siden det relaterer nært til hva som diskuteres.
Datamaterialet som ble brukt til å trene modellen bestod av syv “omgang” i samtalen. Under trening hadde modellen 2,6 milliarder parametre som undersøkte 341 GB tekstdata for mønster, en datasett rundt 8,5 ganger større enn datasettene som ble brukt til å trene GPT-2-modellen skapt av OpenAI.
Google rapporterte hvordan Meena fungerte ved Sensibleness og Spesifisitet Gjennomsnitt (SSA) måling. SSA er en måling designet av Google-forskere og det er ment å kvantifisere evnen til en konversasjonsentitet til å svare med spesifikke, relevante svar mens samtalen pågår.
SSA-poeng blir beregnet ved å teste en modell mot et fast antall prompter, og antallet fornuftige svar som modellen gir, blir sporet. Modellens poeng blir avledet basert på prosenten av fornuftige/spesifikke svar modellen var i stand til å gi med hensyn til promptene. Generiske svar blir straffet. Ifølge Google, scorer en gjennomsnittsperson rundt 86% på SSA, mens Meena var i stand til å score 79%. En annen berømt AI-modell, en agent skapt av Pandora Bots, vant Loebner-prisen i anerkjennelse av det faktum at deres AI-boter oppnådde sofistikert menneske-lignende kommunikasjon. Pandora Bots-agenten oppnådde omtrent 56% i SSA-testen.
Microsoft og Amazon prøver også å lage mer fleksible og naturlige chatboter. Microsoft har forsøkt å skape multiturn-dialog i chatboter i to år, ved å kjøpe opp Semantic Machines, en AI-startup, for å forbedre Cortana. Amazon har nylig kjørt Alexa Prize-utfordringen, som oppmuntret deltakerne til å designe en bot i stand til å konversere i omtrent 20 minutter.












