Connect with us

Andrea Vattani, Co-Fondator & Șef Științific la Spiketrap – Seria de Interviuri

Interviuri

Andrea Vattani, Co-Fondator & Șef Științific la Spiketrap – Seria de Interviuri

mm

Andrea Vattani, este Co-Fondator & Șef Științific la Spiketrap, o companie de contextualizare care alimentează inteligența audienței și performanța media pentru creatori, platforme și mărci. Tehnologia proprietară Clair AI extrage semnalul din zgomotul seturilor de date nestructurate, oferind o claritate și un context fără precedent, în special în medii online cu viteză ridicată.

Ce v-a atras inițial spre știința computerelor și IA?

A fost o combinație de circumstanțe favorabile, am ajuns la Universitatea din Roma pentru a susține testul de admitere la specializarea Statistică, și s-a dovedit că am fost o zi întârziat! Mi s-a sfătuit să aplic pentru Știința computerelor în schimb și să mă mut înapoi la departamentul de Statistică un an mai târziu. Am mers la testul de admitere la Știința computerelor (care a fost în acea zi!) și am promovat… niciodată nu m-am mutat înapoi la Statistică! Interesul meu pentru IA a început cu realizarea modului în care calculatoarele pot ajuta la automatizarea lucrurilor, și IA este mașinaria de automatizare supremă. De asemenea, limbajul natural și modul în care oamenii îl folosesc a fost întotdeauna un interes al meu: am studiat în liceu studii clasice, studiind greaca veche și latina, ceea ce este probabil similar cu modul în care se simte o mașină atunci când este alimentată cu un flux de cuvinte.

Ați lucrat anterior ca Inginer de software principal la Amazon Goodreads, ce proiecte ați lucrat și ce au fost câteva dintre concluziile cheie din această experiență?

În timp ce eram la Goodreads, am lucrat la multiple proiecte de învățare automată care au inclus detectarea spam-ului și scalarea motorului de recomandare a cărților. Concluziile mele din perioada petrecută acolo au fost învățarea importanței definirii metricilor de învățare automată care se potrivesc cu obiectivele de afaceri și ale clienților. Pentru a da un exemplu, motoarele de recomandare au existat de foarte mult timp. Îți amintești de concursul “Netflix Prize” din 2009 pentru a găsi recomandări de filme mai bune? Câteva insight-uri din soluțiile câștigătoare au sugerat că șansele de a urmări un film nu sunt determinate în mare măsură de faptul că îți place sau nu, ci mai mult de faptul că este similar cu interesele tale. Acest lucru poate funcționa pentru filme, deoarece este un angajament scurt de 90 de minute, dar pentru cărți nu este cazul. Integrarea obiectivului corect în metrici este cheia.

O altă învățare pe care am aplicat-o la Spiketrap este să construiesc echipe de IA care sunt orientate spre livrare și integrate cu planul de produs, mai degrabă decât o echipă izolată care se concentrează doar pe explorări și cercetare. Acest lucru duce la o definire mai bună a obiectivelor, termenelor limită și a înțelegerii ROI-ului. De asemenea, favorizează în mod natural ca echipa să se concentreze pe viteza și practicitatea unui model, mai degrabă decât să se uite doar la acuratețe. Revenind la exemplul concursului Netflix, modelele echipelor câștigătoare nu au fost niciodată integrate din cauza lipsei de practicitate, în ciuda acurateței îmbunătățite.

Cercetarea dvs. a fost publicată în numeroase reviste, ce considerați că a fost cel mai important articol până acum?

În timpul doctoratului meu, am avut norocul de a colabora cu mai mulți cercetători din diferite domenii, inclusiv învățare automată, “big data”, analiza datelor sociale și teoria jocurilor. Un articol pe care îl apreciez pentru simplitatea și aplicabilitatea sa este “Scalable K-Means++“: K-means++ este o metodă de clusterizare nesusupervizată utilizată pe scară largă pentru a împărți un set de date în grupuri coerente K. Acesta face acest lucru prin adăugarea unui grup la un moment dat, astfel încât, atunci când aveți tone de date și grupuri, devine prea lent. În acel articol, arătăm cum puteți obține aceeași acuratețe, dacă nu și mai bună, prin paralelizarea metodei. Metodologia noastră este extrem de simplă și a fost implementată în mai multe biblioteci de învățare automată.

Puteți împărtăși povestea de origine din spatele Spiketrap?

După ce am lucrat la Goodreads, eu și co-fondatorii Spiketrap, Kieran și Virgilio, am înțeles că există o lacună în industrie pentru accesarea insight-urilor avansate de marcă de pe platformele sociale de nișă. Prin aplicarea tehnologiilor de IA, am putut aborda problema în mod eficient.

În economia de astăzi, este imperativ ca companiile să asculte clienții și industriile lor respective în ansamblu. Cu toate acestea, multe dintre ceea ce clienții au de spus despre mărci rămân neauzite. Milioane de oameni își exprimă părerile deschis în fiecare zi, pe platforme precum Twitter, Reddit, Twitch și altele. Acesta s-a dovedit a fi o resursă extrem de valoroasă pentru orice cercetător de piață, cu condiția ca conținutul să poată fi contextualizat la scară. Problema este că industria insight-urilor nu a ținut pasul cu evoluția comportamentelor digitale și a limbajului.

Uneltele de ascultare rămân dependente de cuvintele cheie și de căutările booleane, pierzând multe dintre conversațiile care ar putea și ar trebui să fie atribuite unei anumite mărci. Între timp, firmele de cercetare de piață au fost prinse într-un joc din ce în ce mai dificil de a obține insight-uri calitative din metode cantitative și limitate din punct de vedere al costurilor.

În scurt, oamenii au lipsit uneltele necesare pentru a înțelege audiența lor la scară. Numărul de vânzări și numărul de vizualizări răspund la “ce” în comportamentul audienței, dar nu și la “de ce”. Fără context, stabilirea a ceea ce este corelație versus cauzalitate este un joc de ghicit. Recunoscând acest vid, am săpat în ceea ce ar arăta o soluție pentru înțelegerea contextuală, și astfel s-a născut Spiketrap.

Care sunt unele dintre tehnologiile de învățare automată utilizate la Spiketrap?

Utilizăm o multitudine de tehnologii, de la Scikit-learn obișnuit la biblioteci de învățare profundă, cum ar fi Pytorch. În afara bibliotecilor, metodologiile, modelele și seturile de date pe care le utilizăm sunt în mare parte proprietare. Am învățat că metodele și modelele standard nu vă duc prea departe, dar pentru a rezolva cu adevărat o problemă, trebuie să puneți propriul dvs. efort, începând de la obiective și ajungând la arhitectura modelului și seturile de date. Pentru a da un exemplu, modelarea tematică este sarcina de a extrage teme dintr-o colecție de texte. “Spiketrap Convos” oferă clienților noștri insight-uri cruciale despre audiența lor și utilizează modelarea tematică ca unul dintre semnalele sale. Metoda dvs. obișnuită de modelare a tematicii este LDA (Latent Dirichlet Allocation), dar, din nefericire, este prea inconsistentă și imprevizibilă și pur și simplu nu este suficient de puternică. Pe de altă parte, puteți încerca un model preantrenat modern, cum ar fi Bert-Topics, care, deși puternic și cuprinzător, este, de asemenea, rigid și lent. NLP și IA de limbaj au făcut salturi și urcări în ultimul deceniu, dar transformarea modelelor existente în produse este încă departe de a fi optimă și o miză riscantă.

Puteți elabora cum Spiketrap oferă o înțelegere instantanee a audienței pentru creatori, platforme și mărci?

Anunțătorii și agențiile utilizează tabelele noastre de lideri de influență și uneltele de afinitate de marcă pentru a identifica creatori ale căror comunități sunt sigure pentru marcă într-o serie de categorii, inclusiv note pentru conținut toxic, profan și sexual, precum și siguranța generală a comunității.

Creatorii pot utiliza instrumentul pentru a se scufunda în fluxuri individuale și pentru a vedea care conversații au fost cele mai sigure sau mai puțin sigure, care au condus la angajamentul pozitiv pentru sponsorii lor și unde ar putea îmbunătăți eforturile de moderare.

O lucrare recentă intitulată ‘FeelsGoodMan: Inferarea semantică a neologismelor Twitch‘ a fost publicată de Spiketrap. Puteți descrie pe scurt ce este această lucrare?

Modul în care oamenii comunică și se exprimă online a devenit din ce în ce mai complex și mai dificil de descifrat. Mai întâi au apărut emoticoanele :-). Apoi au apărut emoji-urile 🤔. Apoi au apărut meme-urile… și acum “emote”-urile, o nouă formă de comunicare bazată pe icone care a devenit extrem de populară pe platforma de streaming Twitch. Într-un mod oarecum asemănător cu emoji-urile, datorită utilizării lor amestecate cu textul regulat, acestea prezintă provocări similare cu cele ale meme-urilor, deoarece sunt create de utilizatori și au un sens criptic care nu are nicio legătură evidentă cu imaginea reală prezentată. Există peste 8 milioane de emote distincte până în prezent, cu peste 400.000 utilizate săptămânal. Încă, oamenii comunică eficient utilizându-le pentru a-și exprima orice fel de sentiment, cum ar fi bucurie, plictiseală, entuziasm sau sarcasm. Lucrarea noastră recentă este un ghid de IA pentru a infera sensul semantic al emote-urilor. Abordarea noastră nu necesită întreținerea și actualizarea unui set de date curat manual, și este capabilă să se adapteze la introducerea continuă de emote noi, dar și la evoluția sensului emote-urilor populare. Acest lucru este deosebit de important atunci când un emote devine încărcat politic sau rasial, ceea ce am văzut că se întâmplă cu emote-uri extrem de populare, cum ar fi “TriHard”, “PogChamp” și “FeelsGoodMan”. Utilizarea dinamică a limbajului și schimbările de sens ridică probleme uriașe pentru sistemele de moderare sau cadrele de analiză a sentimentului, așa că suntem mândri să abordăm această problemă în mod corect la Spiketrap.

Există altceva pe care ați dori să îl împărtășiți despre Spiketrap?

Pe măsură ce ne uităm spre noul an, Spiketrap lucrează la dezvoltarea și perfecționarea unui nou instrument care va oferi o înțelegere mai profundă a sentimentului mărcii pentru clienții noștri. Noul instrument de afinitate Spiketrap oferă o modalitate interactivă și intuitivă de a identifica și cuantifica afinitățile audienței între creatori, mărci, jocuri și multe altele. Pentru orice întrebare dată, instrumentul generează scoruri de indice de afinitate care indică cât de bine este corelat pozitiv un anumit entitate cu alta. Numeroase semnale contextuale compun scorul, inclusiv frecvența și sentimentul mențiunilor legate. Stiva tehnologică Spiketrap este poziționată în mod unic pentru a indexa afinitățile între jocuri, mărci și creatori. Clair, IA de NLP proprietară, procesează milioane de mesaje generate de utilizatori postate public în fiecare zi, atribuind conținutul altfel ambiguu la entități din graficul de cunoștințe extins al Spiketrap, identificând subiecte de conversație, determinând sentimentul și monitorizând siguranța. Adăugarea noului instrument de afinitate împuternicește dezvoltatorii, creatorii, mărcile și multe altele să înțeleagă mai bine audiența și impactul mărcii.

Mulțumim pentru acest interviu minunat, cititorii care doresc să afle mai multe ar trebui să viziteze Spiketrap.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.