Лідери думок
Як Tastry “навчила комп’ютер смакувати”

Як Tastry використовує нову хімію та штучний інтелект для прогнозування споживчих уподобань.
Від самого початку питання, на яке ми хотіли відповісти, було: “Чи можемо ми розшифрувати унікальні матриці смаку сенсорних продуктів та унікальні біологічні уподобання споживачів, щоб точно прогнозувати їхню подобу?” Коротка відповідь – так.
Однак на початку наших досліджень ми виявили, що існуючі методи хімічного аналізу та існуючі дані про уподобання споживачів надавали статистично незначимі кореляції або прогнози. Ми знали, що нам потрібно створити自己的 дані, щоб зробити прогрес.
По-перше, нам потрібно було створити метод аналітичної хімії, який би надавав якомога більше прозорості хімії (включаючи летючі, нелетючі, розчинені, спектральні дані тощо). Ми також потрібно було розшифрувати матрицю смаку таким чином, щоб її можна було перекласти, щоб приблизно оцінити, як люди переживають цю хімію на своєму смаку.
По-друге, нам потрібно було створити метод постійного та точного отримання, доповнення та відстеження біологічних сенсорних уподобань великої, різноманітної та зростаючої групи реальних споживачів, щоб служити нашим основним фактом.
Чому поточні методи не можуть прогнозувати уподобання споживачів сенсорних продуктів
Коли ми почали наші дослідження у 2015 році, у нас була гіпотеза, що все, що потрібно знати про смак вина, тобто смак, аромат, текстуру та колір – існує в хімії. Однак що було відсутнє, то це більш повний метод аналізу.

Щоб пояснити цю обмеженість, важливо зрозуміти, що хімія сенсорних продуктів у великому ступені зосереджена на контролі якості, тобто скільки цього аналіту міститься в цій суміші? Фокус не зазвичай спрямований на оцінку всіх аналітів, їхніх відносних відношень або того, як вони поєднуються на людському смаку, щоб створити смак. Це сліпа пляма, яку нам потрібно було освітити, оскільки відбуваються динамічні взаємодії серед сотень сполук на людському смаку. Людський смак переживає “хімічну юшку” смакових сполук одночасно, а не одну сполуку за раз, як це робить машина. Взаємодії між цими多 сполуками в поєднанні з унікальною біологією кожного споживача надають критичний контекст щодо того, які особливості хімії виражаються цій людині.
Якщо сенсорика враховується, то типовий підхід виглядає так:
- Дані опитування показують, що люди люблять масло.
- Діацетил – це сполука, зазвичай пов’язана з смаком масла.
- Якщо ми виготовимо шардоне з більшим вмістом діацетилу, більше людей будуть йому подобатися.
Основні проблеми з цим підходом.
- Смак не можна прогнозувати лише кількісним вмістом сполук. Визначена концентрація діацетилу може бути сприйнята як масло в одному вині або винтажі, але не в іншому. Це відбувається тому, що в вині є сотні інших сполук, і залежно від їхніх концентрацій та відношень, діацетил може бути маскованим або вираженим. На відміну від машини, люди переживають усі сполуки одночасно, їхні відчуття не аналізують кожну сполуку окремо, тому жодна окрема кількісна величина не є передбачуваною.
- Люди сприймають і комунікують смаки по-різному. Навіть серед панелі експертів половина експертів може описати щось як смак яблука, а інша половина може описати його як грушу. А середній споживач ще менше передбачуваний. З наших досліджень ми не вважаємо, що людський смак достатньо осяжний, щоб його можна було точно передати через мову від однієї людини до іншої. Наші описи занадто невизначені, а наші визначення різняться залежно від індивідуальної біології та культурного досвіду. Наприклад, у США більшість споживачів описують сприйняття бензальдегіду як “вишню”, але більшість споживачів у Європі описують його як “марципан”… навіть у одному й тому ж вині.
- Смаки, які споживачі сприймають, не мають кореляції з тим, чи вони їм подобаються. У наших дослідженнях ми спостерігали, що споживачі не вирішують купувати вино, тому що воно має смак вишні. Вони просто роблять висновок, що їм подобається вино, і вони, ймовірно, будуть йому подобатися знову.
Приклад: Ця відсутність розуміння не є унікальною для сегмента вина. Ми зустрічалися з виконавцями та дослідниками деяких найбільших компаній з ароматів і парфумів у світі. Один виконавець описав свою розчарування щодо недавнього проекту створення нового лавандового шоколаду. Ця компанія витратила мільйони доларів на проведення фокус-груп з споживачами, які конкретно любили шоколад, любили лаванду та любили лавандовий шоколад. В підсумку результати були такими, що респонденти погодилися, що це лавандовий шоколад, але вони також погодилися, що їм не подобається цей конкретний лавандовий шоколад.
В результаті цих висновків ми дійшли висновку, що нам потрібно зосередитися свої дослідження на прогнозуванні того, які хімічні матриці споживачі люблять, і в якій мірі, а не на тому, які смаки вони сприймають.
Як наш підхід відрізняється
Відходи у відходи. Коли мова йде про якість даних, ми зрозуміли, що дійсний навчальний набір не може бути сформований з існуючих комерційних або крауд-сорсингових даних. Нам потрібно було створити свої власні, внутрішні.
По-перше, нам потрібно було хімічний метод, який би надавав видимість на деликатний баланс летючих, нелетючих, розчинених твердих речовин, спектральних даних тощо вина в одному знімку, щоб зробити його більш спорідненим до людського смаку.
Роки експериментів призвели до розробки методології, яка генерує понад 1 мільйон даних за зразок. Ця детальна та надмірна кількість даних потім обробляється алгоритмами машинного навчання, розробленими нашою командою даних, щоб розшифрувати взаємозалежності, які інформують людське сприйняття на основі відношень аналітів та груп аналітів.
Як тільки ми довели ефективність цього методу, ми почали аналізувати та розшифровувати матрицю смаку багатьох тисяч вин у світі та створили повну базу даних матриці смаку світу вина.
Зв’язування споживчих уподобань з хімією
Далі, нам потрібно було зрозуміти, які матриці смаку різні споживачі віддають перевагу, роблячи їм смакування та оцінку вина, яке ми проаналізували. За роки ми провели регулярні подвійні сліпі дегустації з тисячами споживачів, кожний з яких смакував багато десятків або сотень вин за час. Респонденти включають новачків у світі вина, типових споживачів вина, експертів, виноробів та сомельє.
Системи крауд-сорсингу зазвичай пропускають або ігнорують критичні дані. Наприклад, за шкалою Паркера більшість людей навіть не оцінять вино нижче середнього рівня 80 балів. Але ми дізналися, що споживачі не люблять те, чого вони не люблять, більше, ніж люблять те, що їм подобається. Тому важливо мати повну картину уподобань – особливо негативних уподобань.
Ми використали свій новий машинний інтелект, щоб зрозуміти унікальні уподобання споживачів щодо різних типів матриць смаку у вині. За час ми змогли точно прогнозувати їхні уподобання щодо вин, яких вони ще не смакували. Під час цього процесу ми також дізналися, що окремі вина, а також окремі уподобання, майже унікальні, як відбитки пальців. Ми дійшли висновку, що, на відміну від звичайної практики галузі, споживачів та вин не можна точно згрупувати або колаборативно фільтрувати у загальнізації.
Приклад: Дві жінки можуть поділитися однією й тією ж географією, культурою, етнічністю, освітою, доходом, машиною, телефоном, і обидві люблять Кім Кроуфорд Совіньйон Блан; але одна може любити Морнінг Фог Шардоне, а інша може ненавидіти його. Єдиний надійний прогнозний огляд залишається з їхнім біологічним смаком.
Як масштабувати цю інновацію?
Що ми створили, було великим, але дегустаційні панелі дорогі та тривалі. Було б неможливо проводити щорічні дегустаційні панелі всіх 248 мільйонів американців старше 21 року, щоб зрозуміти, яке вино їм сподобається.
Ми хотіли розробити масштабований інструмент, який мав би ту саму ефективність у прогнозуванні уподобань споживача, без потреби участі в дегустаційних панелях або вираження їхніх уподобань щодо великої кількості раніше смакованих вин.
Наше рішення полягало в тому, щоб зробити так, щоб штучний інтелект вибрав прості продукти харчування, які мали спільні аспекти їхньої хімії з винами в асортименті. Респонденти в наших дегустаційних панелях відповіли на кілька сотень таких питань про їхні уподобання щодо продуктів харчування та смаків, які не були безпосередньо пов’язані з вином; наприклад, “Як ви ставитеся до зеленого перцю?”, або “Як ви ставитеся до грибів?”
Ці питання використовувалися TastryAI як аналоги типів та відношень сполук, зазвичай знайдених у підлягаючій хімії вина. Як люди, ми не можемо розібрати або зрозуміти ці складні кореляції та закономірності, але, як виявилося, витягування цих складних відносин є чудовим завданням для машинного навчання.
З цими даними TastryAI навчився прогнозувати уподобання споживача щодо вина на основі їхніх відповідей на опитування про смаки продуктів харчування. Що вийшло в результаті, так це нашу можливість ліквідувати необхідність будь-яких даних про вино від споживача, щоб прогнозувати його уподобання щодо вина.
Як багато даних нам потрібно, щоб зрозуміти споживчі уподобання?
Хоча ми почали з сотень питань про смаки продуктів харчування, чим більше їх відповідають, тим точніше результати, але є зменшення доходів після 9-12. З принципом Парето на роботі, найкраще виконані питання про смаки продуктів харчування надали приблизно 80% розуміння смаку споживача.
На сьогодні існує типово опитування з 10-12 питань для червоного вина, і ще 10-12 питань для білого, рожевого та ігристого вина.
Це дозволило масштабоване рішення. Від часу нашого запуску в різних пілотних проектах років тому зараз існує багато подібних опитувань на електронних комерційних сайтах. Споживач проводить 30-секундне опитування про те, чи йому подобаються чорниці чи кава, і він отримує винні рекомендації. Різниця полягає в тому, що ці опитування є не більше ніж фільтрами смакових нот, тобто якщо вам подобаються чорниці, вам сподобається вино, описане кимось як темний фрукт, або якщо вам подобається кава, вам сподобається вино, описане кимось як астрингове. Але ми дізналися, що якщо ці описи точні для смаку цієї людини, вони не мають передбачуваної сили щодо того, чи сподобається їм вино; але це цікаво, споживачі люблять опитування.
Рекомендації Tastry пов’язані з матрицею смаку вина. TastryAI не є фільтром смакових нот, він не питає, чи вам подобається аромат або смак грибів у вашому вині, він намагається розуміти відношення сполук, які вам подобаються або не подобаються, на основі біологічних уподобань вашого смаку. Кожне питання надає багато шарів розуміння, оскільки кожне питання перекривається та живиться іншими питаннями. Отже, після питання про гриби, можливо, наступне питання буде “Як ви ставитеся до смаку зеленого перцю?” Штучний інтелект може знати, що існує, наприклад, 33 сполуки у певному відношенні, які зазвичай відповідають за сприйняття грибів, і 22 сполуки, які зазвичай відповідають за смак зеленого перцю – але важливо, що деякі з цих сполук існують у обох. Якщо ви кажете, що вам подобаються гриби, але вам не подобається зелений перець, то штучний інтелект більш впевнений, що вам подобаються деякі сполуки, більш впевнений, що вам не подобаються інші сполуки, і ті, які перекриваються, ймовірно, контекстні.
Отже, ви можете собі уявити багатовимірний діаграму Венна, де штучний інтелект витягує, які сполуки вам подобаються або не подобаються в поєднанні з іншими сполуками.
І з цим опитуванням про смаки продуктів харчування та відгуками споживачів ми збираємо анонімізовані дані про смак з усього світу. Електронний комерційний сайт або великий рітейлер може запустити опитування Tastry на додатку та отримати тисячі відповідей за години від споживачів по всій території США. Єдині інші дані, які ми отримуємо, – це поштовий індекс. Ми використовуємо поштовий індекс для застосування похідної від Баєса, яка приймає географічний розподіл відомих смаків споживачів, які ми збираємо та контролюємо, та інші дані, і прогнозує решту понад 200 мільйонів дієт смаку споживачів у США. Ми використовуємо цей покращений набір даних як джерело правди та для прогнозування того, як вина будуть виконуватися на ринку на рівні магазину, місцевому або регіональному рівні.
Віртуальна фокус-група Tastry
Після аналізу вина, розшифрування його матриці смаку та оцінки його смакових якостей проти поєднання реальних та віртуальних смаків, штучний інтелект зараз на 92,8% точний у прогнозуванні середньої оцінки споживача у США для цього вина. Іншими словами, штучний інтелект може прогнозувати середню 5-зіркову оцінку для вина з точністю +/- 1/10 тієї зірки.
Найлегше уявити собі штучний інтелект як “Віртуальну фокус-групу” споживчих уподобань.
Виноробні підприємства використовують TastryAI для проведення симуляцій того, як споживачі сприйматимуть їхнє вино, навіть до того, як вони вкладуть роки та мільйони доларів у його виготовлення. Оптовики використовують TastryAI для визначення регіонів, у яких різні вина будуть виконуватися найкраще. Рітейлери використовують TastryAI для оптимізації свого асортименту на полицях та онлайн. А споживачі використовують TastryAI, щоб уникнути ризику купівлі вина, яке їм не сподобається.












