Connect with us

Tankeledere

Hvordan Tastry “lærte en computer at smage.”

mm

Hvordan Tastry bruger ny kemiteknologi og AI til at forudsige forbrugerpræferencer.

Fra starten var spørgsmålet, vi ville besvare: “Kan vi afkode de unikke smagsmatricer af sensoriske produkter og de unikke biologiske præferencer hos forbrugerne for at nøjagtigt forudsige omgang?” Det korte svar er ja.

Men tidligt i vores forskning fandt vi, at eksisterende kemiske analysemetoder og eksisterende forbrugerpræferencedata gav statistisk insignifikante korrelationer eller forudsigelser. Vi vidste, at vi ville være nødt til at oprette vores eget data for at kunne gøre fremskridt.

Først skulle vi oprette en analytisk kemiteknik, der ville give så megen gennemsigtighed til kemi som muligt (herunder flygtige, ikke-flygtige, opløste, spektrale data osv.). Vi skulle også afkode smagsmatricen på en måde, der kunne oversættes til at hjælpe med at approksimere, hvordan mennesker oplever den kemi på deres gane.

Anden skulle vi oprette en metode til at konstant og nøjagtigt indsamle, udvide og spore de biologiske sensoriske præferencer hos en stor, divers og voksende gruppe af virkelige forbrugere for at fungere som vores grundsandhed.

Hvorfor nuværende metoder ikke kan forudsige forbrugerpræferencer for sensoriske produkter

Da vi startede vores forskning i 2015, havde vi hypotesen, at alt, hvad man skal vide om smagen af vin, det vil sige smag, aroma, tekstur og farve – findes i kemin. Men hvad der manglede, var en mere omfattende metode til analyse.

For at forklare denne begrænsning er det vigtigt at forstå, at kemin af sensoriske produkter i høj grad er fokuseret på kvalitetskontrol, dvs. hvor meget af denne analyt er i denne blanding? Fokus er ikke typisk på at evaluere alle analyter, deres relative forhold eller hvordan de kombinerer på den menneskelige gane for at skabe smag. Dette er det blinde punkt, vi skulle belyse, fordi der er dynamiske interaktioner, der finder sted mellem hundredvis af forbindelser på en menneskelig gane. En menneskelig gane oplever en “kemisk suppe” af smagsstoffer på samme tid, ikke ét stof ad gangen som en maskine gør. Interaktionerne mellem disse multiple forbindelser i kombination med den unikke biologi hos hver forbruger giver kritisk kontekst til, hvilke funktioner af kemin, der udtrykkes til den person.

Hvis sensoriske aspekter på en eller anden måde tages i betragtning, kan den typiske tilgang sammenfattes således:

  • Undersøgelsesdata viser, at mennesker kan lide smør.
  • Diacetyl er en forbindelse, der typisk er forbundet med smagen af smør.
  • Hvis vi laver en chardonnay med mere diacetyl, vil flere mennesker kunne lide den.

Centrale problemer med denne tilgang.

  1. Smag kan ikke forudsiges ved kvantificering af forbindelser alene. En given koncentration af diacetyl kan opfattes som smør i en vin eller årgang, men ikke i en anden. Dette skyldes, at der er hundredvis af andre forbindelser i vinen, og afhængigt af deres koncentrationer og forhold, kan diacetyl enten være maskeret eller udtrykt. I modsætning til en maskine oplever mennesker alle forbindelser på samme tid, deres sanser analyserer ikke hver forbindelse individuelt, derfor er enhver given kvantificering ikke nødvendigvis forudsigelig.

 

  1. Mennesker opfatter og kommunikerer smagsoplevelser forskelligt. Selv blandt en panel af eksperter kan halvdelen af eksperterne beskrive noget som smagende af æble, og den anden halvdel kan beskrive det som pære. Og den gennemsnitlige forbruger er endnu mindre forudsigelig. Fra vores forskning tror vi ikke, at menneskers smag er tilstrækkeligt konkrete til at kunne kommunikeres nøjagtigt gennem sprog fra person til person. Vores beskrivelser er for vagt, og vores definitioner varierer afhængigt af individuel biologi og kulturelle oplevelser. For eksempel beskriver de fleste forbrugere i USA oplevelsen af benzaldehyd som “kirsebær”, men de fleste forbrugere i Europa beskriver det som “marzipan”… selv i samme vin.

 

  1. De smagsoplevelser, forbrugere opfatter, har ingen korrelation med, om de faktisk kan lide det eller ej. I vores forskning er det observeret, at forbrugere ikke beslutter at købe en vin, fordi den smager af kirsebær. De dømmer simpelthen, at de kan lide vinen, og de er sandsynligvis til at kunne lide den igen.

Eksempel: Dette mangel på forståelse er ikke unikt for vinsegmentet. Vi har mødt direktører og forskere fra nogle af de største flavor- og parfumefirmaer i verden. En direktør beskrev sin frustration over et nyligt projekt for at skabe en ny lavendel-chokolade. Det firma brugte millioner af dollars på at samle og afholde fokusgrupper med forbrugere, der specifikt elskede chokolade, elskede lavendel og elskede lavendel-chokolade. Til sidst var resultaterne, at respondenternes enighed var, at det var lavendel-chokolade, men at de også enedes om, at de ikke kunne lide den specifikke lavendel-chokolade.

Som følge af disse indsighter konkluderede vi, at vi skulle fokusere vores forskning på at forudsige, hvilke kemiske matricer forbrugere kunne lide, og i hvilken udstrækning, i stedet for hvilke smagsoplevelser de opfatter.

Hvorfor vores tilgang er anderledes

Skrald-ind, skrald-ud. Når det kommer til datakvalitet, indså vi, at en gyldig træningssæt ikke kunne genereres fra eksisterende kommercielle eller crowdsourced-data. Vi ville være nødt til at oprette vores eget, internt.

Først skulle vi have en kemiteknik, der ville give indsigt i den ømme balance af de flygtige, ikke-flygtige, opløste faste stoffer, spektrale data osv. af en vin i ét snapshot, for at være mere relateret til den menneskelige gane.

Års eksperimenter resulterede i en metode, der genererer over 1 million data punkter pr. prøve. Denne detaljerede og overvældende mængde data behandles derefter af maskinlæringsalgoritmer, der er designet af vores data science-team til at afkode afhængighederne, der informerer om menneskelig perception baseret på forholdet mellem analyserne og grupper af analyser.

Når vi først havde bevist effikaciteten af denne metode, begyndte vi at analysere og afkode smagsmatricen af mange tusinde vine verden over og har herefter udviklet en omfattende smagsmatrixdatabase for vinverdenen.

At relatere forbrugerpræferencer til kemi

Herefter skulle vi forstå, hvilke smagsmatricer forskellige forbrugere foretrækker ved at lade dem smage og bedømme vinen, vi havde analyseret. Over årene har vi afholdt regelmæssige dobbelt-blindede smagspaneler med tusinder af forbrugere, hvor hver respondent har smagt mange dusin eller hundredvis af vine over tid. Respondenterne inkluderer nye vinelskere, typiske vindrikkere, eksperter, vinproducenter og sommelierer.

Crowd-sourced-systemer ignorerer typisk kritisk data. For eksempel på Parker-skalaen vil de fleste mennesker ikke score en vin under midten af 80-point-skalaen. Men vi har lært, at forbrugere hader, hvad de hader, mere end de kan lide, hvad de kan lide. Derfor er det kritisk at have et fuldt billede af præferencer – især negative præferencer.

Vi brugte vores ny maskinlæring til at forstå forbrugernes unikke præferencer for forskellige typer smagsmatricer i vinen. Over tid gjorde dette os i stand til nøjagtigt at forudsige deres præferencer for vine, de endnu ikke havde smagt. Under denne proces lærte vi også, at enkeltvine samt enkeltpræferencer er næsten fingeraftryks-lignende i deres unikhed. Vi konkluderede, at modsat sædvanlige brancheprojekter kan forbrugere og vine ikke nøjagtigt grupperes eller filtreres i generaliseringer.

Eksempel: To kvinder kan dele samme geografi, kultur, etnicitet, uddannelse, indtægt, bil, telefon og begge elsker Kim Crawford Sauvignon Blanc; men den ene kan elske Morning Fog Chardonnay, og den anden kan hade det. Den eneste pålidelige forudsigelige indsigt ligger i deres biologiske gane.

Hvordan skal vi skalaere denne innovation?

Hvad vi havde skabt, var godt, men smagspaneler er dyre og tidskrævende. Det ville være umuligt at afholde en årlig smagspanel af alle 248 millioner amerikanere over 21 år for at forstå, hvilke vine de kan lide.

Vi ville designe et skalerbart værktøj, der havde samme effikaciteten i forudsigelse af en forbrugers præferencer uden at kræve deltagelse i smagspaneler eller udtryk af deres præferencer for en stor mængde tidligere smagte vine.

Vores løsning var at lade AI vælge simple madvarer, der delte aspekter af deres kemi med vine i en samling. Respondenter i vores smagspaneler besvarede flere hundrede sådanne spørgsmål om deres præferencer for mad og smag, der ikke direkte relaterer til vin; såsom “Hvordan føler du om grøn peber?”, eller “Hvordan føler du om svampe?”.

Disse spørgsmål blev brugt af TastryAI som analoger til typer og forhold af forbindelser, der typisk findes i den underliggende kemi af vin. Som mennesker kan vi ikke afkode eller forstå disse komplekse korrelationer og mønstre, men det viser sig, at at løse disse komplekse relationer er et godt problem for maskinlæring at løse.

Med denne data lærte TastryAI, hvordan man kan forudsige en forbrugers præferencer for vin baseret på deres svar på Madpræferencen.

Hvad der resulterede, var vores evne til at eliminere behovet for nogen vinspecifik data fra en forbruger for at forudsige deres præferencer for vin.

Hvor meget data har vi brug for for at forstå forbrugerpræferencer?

Selvom vi startede med hundredvis af madpræferensspørgsmål, bliver resultaterne mere nøjagtige, jo flere der besvares, men der er aftagende afkast efter 9-12. Med Pareto-princippet i arbejde giver de bedst fungerende madpræferensspørgsmål ca. 80% forståelse af en forbrugers gane.

I dag er der typisk en 10-12 spørgsmål undersøgelse for rødvin, og en anden 10-12 spørgsmål undersøgelse for hvidvin, rosé og bobler vin.

Dette tillod en skalerbar løsning. Siden vi lancerede i forskellige pilotprojekter for år siden, er der nu mange lignende quizzes på e-handelssteder. En forbruger tager en 30-sekunders quiz om, hvorvidt de kan lide sorte bær eller kaffe, og de belønnes med vinanbefalinger. Forskellen er, at disse quizzes på det højeste er smagsnotefiltre, dvs. hvis du kan lide sorte bær, vil du kunne lide en vin, der er beskrevet af nogen som smagende af mørke frugter, eller hvis du kan lide kaffe, vil du kunne lide en vin, der er beskrevet af nogen som værende astringerende. Men vi har lært, at hvis disse beskrivelser er nøjagtige for den persons gane, har det ingen forudsigelsesmagt for, om de vil kunne lide vinen; men det er engagerende, forbrugere kan lide quizzes.

Tastry’s anbefalinger er knyttet til smagsmatricen af vinen. TastryAI er ikke et smagsnotefilter, det spørger ikke, om du kan lide aroma eller smag af svampe i din vin, det forsøger at forstå forholdet af forbindelser, du kan lide eller ikke kan lide baseret på din biologiske ganepreferencer. Hvert spørgsmål giver mange lag af indsigt, fordi hvert spørgsmål overlapper og føder ind i andre spørgsmål. Så efter at spørge om svampe, kan det næste spørgsmål være “Hvordan føler du om smagen af grøn peber?” AI’en kan vide, at der er f.eks. 33 forbindelser i et bestemt forhold, der generelt er ansvarlige for oplevelsen af svampe, og 22 forbindelser, der generelt er ansvarlige for smagen af grøn peber – men vigtigt er, at nogle af disse forbindelser findes i begge. Hvis du siger, du elsker svampe, men hader grøn peber, er AI’en mere sikker på, du kan lide nogle forbindelser, mere sikker på, du had andre forbindelser, og de, der overlapper, er sandsynligvis kontekstuelle.

Så du kan forestille dig en multidimensionel Venn-diagram, hvor AI’en afkoder, hvilke forbindelser du kan lide eller ikke kan lide i kombination med andre forbindelser.

Og med denne smagspræferencen og forbrugerfeedback indsamler vi anonymiseret ganedata fra hele verden. Et e-handelssted eller en stor butik kan lancere Tastry-quizzen på appen og have tusinder af svar inden for timer fra forbrugere på tværs af USA. Den eneste anden data, vi indsamler, er en postnummer. Vi bruger postnummeret til at anvende en afledning af en Bayesian ridge, der tager den geografiske distribution af de kendte forbrugerganer, vi indsamler, og andre data, og forudser resten af de 200M+ væsentlige forbrugerganer i USA. Vi bruger denne forbedrede dataset som kilden til sandheden og til at give forudsigelser om, hvordan vine vil fungere på et marked på et lokale, regionale eller nationale niveau.

Tastry Virtual Focus Group

Ved at analysere en vin, afkode dens smagsmatrix og evaluere dens smagbarhed i forhold til kombinationen af faktiske og virtuelle ganer er AI’en i øjeblikket 92,8% nøjagtig i forudsigelse af den samlede amerikanske forbrugerbedømmelse af vinen. Med andre ord kan AI’en forudsige den gennemsnitlige 5-stjernet bedømmelse af en vin inden for +/- 1/10te af en stjerne.

Det er lettest at tænke på AI’en som en “Virtual Focus Group” af forbrugerpræferencer.

Vingårde bruger TastryAI til at køre simulationer på, hvordan forbrugere vil opfatter deres vin, selv før de investerer år og millioner af dollars i at lave den. Grossister bruger TastryAI til at bestemme, i hvilke regioner forskellige vine vil fungere bedst. Detailhandlere bruger TastryAI til at optimere deres udvalg på hylderne og online. Og forbrugere bruger TastryAI til at undgå risikoen for at købe en vin, de ikke kan lide.

Katerina Axelsson er grundlægger og administrerende direktør for Tastry, et selskab inden for sensoriske videnskaber, der bruger avanceret kemi, machine learning og kunstig intelligens til at matche forbrugere med produkter, de vil elske. Siden Tastry's oprettelse i 2016, har hun og hendes team implementeret løsninger for over 200 vingårde, distributører og detailhandlere på tværs af USA. Katerina er blevet anerkendt som en af Forbes' bedste navne i fremtidens gastronomi i 2021 og er blevet fremhævet i Pacific Coast Business Times' 2020 40 under 40 serie.