Connect with us

Dr. Neil Yager, Co-Fondator și Șef Scientist al Phrasee – Seria de Interviu

Inteligență artificială

Dr. Neil Yager, Co-Fondator și Șef Scientist al Phrasee – Seria de Interviu

mm

Dr. Neil Yager este Șef Scientist al Phrasee, și arhitectul metodei Phrasee, un instrument de copywriting bazat pe inteligență artificială care a ajutat la optimizarea conținutului de marketing pentru unele dintre cele mai recunoscute mărci ale lumii, inclusiv eBay, Groupon și Virgin – plus multe altele, de la Australia la America, în peste 20 de limbi, de la engleză la japoneză.

Dr. Yager a scris peste o duzină de publicații academice, a scris o carte despre minerit de date și deține mai multe brevete. Ca unul dintre cei mai importanți experți din lume în comercializarea inteligenței artificiale, el deține un doctorat în științe computaționale de la Universitatea din New South Wales, Australia.

Sunteți un veteran de 20 de ani în industria tehnologiei, ce au fost unele dintre rolurile dvs. anterioare legate de inteligență artificială?

Am fost implicat în lucrări legate de inteligență artificială de la doctoratul meu din mijlocul anilor 2000. Cu toate acestea, domeniul a trecut prin mai multe rebrandări de atunci. De exemplu, acum 15 ani am studiat “recunoașterea pattern-ului statistic”. Câteva ani mai târziu, acesta a fost mai cunoscut sub numele de “învățare automată”, care este un nume mult mai captivant. Mai recent, învățarea automată (și “învățarea profundă” în special) a devenit sinonimă cu “inteligența artificială” în general. Am sentimente amestecate despre acest lucru. Pe de o parte, lucrul meu cu Phrasee mi-a învățat importanța branding-ului. Pe de altă parte, termenul “inteligență artificială” aduce bagaj și poate duce la concepții greșite despre tehnologie. Mă întreb unde am fi fost dacă am fi continuat să o numim “recunoașterea pattern-ului statistic”.

Cea mai mare parte a lucrărilor mele anterioare a fost în domeniile prelucrării semnalelor și viziunii computaționale. Nu am avut multă expunere la prelucrarea limbajului natural înainte de Phrasee. Am învățat de atunci că limba este probabil cea mai dificilă problemă în inteligența artificială.

 

În 2008 ați co-scris o carte intitulată ‘Biometric System and Data Analysis: Design, Evaluation, and Data Mining‘, care combină aspecte ale statisticii și învățării automate pentru a oferi un ghid cuprinzător pentru evaluarea, interpretarea și înțelegerea datelor biometrice. În afara resurselor de calcul suplimentare, credeți că acest domeniu a evoluat de la publicarea cărții? Puteți descrie cum?

Învățarea profundă a schimbat domeniile viziunii computaționale, prelucrării limbajului și învățării automate de la publicarea cărții mele. Nu ar fi fost posibil să scriu acea carte astăzi fără o secțiune despre învățarea profundă.

Revolutionarea învățării profunde a început cu adevărat în 2012, când un model de învățare profundă a câștigat un concurs numit ImageNet. ImageNet este un set de date de recunoaștere a obiectelor vizuale în care computerul determină ce este într-o imagine (de exemplu “câine” sau “balon”). Pentru decenii, cercetătorii au făcut progrese incrementale pe seturile de date de referință precum acesta. Fiecare subdomeniu a operat independent și s-a bazat puternic pe expertiza specifică domeniului. Practic peste noapte, toate modelele construite cu atenție de-a lungul multor ani au devenit învechite. Algoritmii de învățare profundă proiectați de persoane din afara domeniului au câștigat concursuri cu marje semnificative. Acest lucru a transformat industria inteligenței artificiale.

Domeniul este încă în mișcare rapidă și a evoluat chiar și de la începerea Phrasee, cu câțiva ani în urmă. De exemplu, uneltele de învățare profundă pe care le folosim acum nu existau când am fondat compania. Ritmul inovației aduce provocări ale sale.

 

Puteți împărtăși cu noi ce este capabil Phrasee să facă pentru afaceri?

Phrasee rezolvă două probleme pentru afaceri. În primul rând, există problema scrierii de conținut de marketing. Sunt mai multe canale publicitare decât oricând (de exemplu, e-mail, AdWords, social, imprimare, podcast-uri, etc.). Este greu să scrii conținut pentru toate acestea care să fie de calitate și să se conformeze stilului și tonului vocii mărcii. Phrasee abordează problema scalabilității prin generarea automată a conținutului. În al doilea rând, este important ca tot limbajul utilizat să fie eficient. Nu numai că Phrasee generează limbaj, dar folosește și învățarea automată pentru a prevedea impactul mesajului și a-l optimiza în consecință.

 

Ce v-a atras la ideea de a utiliza Prelucrarea Limbajului Natural (NLP), și Învățarea Profundă pentru a îmbunătăți puterea conținutului publicitar?

Utilizarea inteligenței artificiale pentru a maximiza impactul campaniilor de marketing digital nu este o idee nouă. Sunt echipe de oameni cu doctorate în fizică care au fost recrutați pentru a lucra la optimizarea publicității. Cu toate acestea, în majoritatea cazurilor, ei se concentrează pe aspecte precum segmentarea audienței, personalizarea, momentul livrării, plasarea anunțurilor, fonturile, etc. Când am început să discutăm idei pentru Phrasee, am observat că aproape totul despre anunțuri este optimizat, cu excepția limbajului utilizat! Am identificat acest lucru ca o lacună pe piață și o oportunitate uriașă.

 

Phrasee este capabil să îmbunătățească conținutul de marketing în peste 20 de limbi, inclusiv japoneză. Puteți discuta despre unele dintre problemele unice de Prelucrare a Limbajului Natural cu care se confruntă limbile străine?

Ultima adăugare la setul nostru de limbi suportate este rusa. Acesta este o limbă slavă și este destul de distinctă de alte limbi indo-europene. În acest caz a fost necesar să construim reguli noi în sistemul nostru de generare a limbajului, astfel încât ieșirea să fie fluentă și gramatical corectă. Acesta nu este doar un problemă de limbă. Este și o problemă de dezvoltare software. Când ieșirea sistemului nostru este în limba maternă a dezvoltatorului, este relativ ușor să detectăm erorile și să verificăm că totul funcționează corect. Cu toate acestea, atunci când lucrăm la rusă sau japoneză, putem să producem nonsens și să nu știm. Este important să avem un vorbitor nativ implicat în procesul de asigurare a calității.

Provocarea nu este doar cu limbile străine. Sunt și unele diferențe regionale interesante. De exemplu, engleza are variante de ortografie pentru SUA, Marea Britanie, Australia, Canada, etc. Mai mult, există diferențe gramaticale. În engleza britanică “ați arunca o privire”, în timp ce în engleza americană “ați lua o privire”. Înțelesul cuvintelor poate varia de la un loc la altul. Un “cauciuc” este un ștergător în Marea Britanie, dar un prezervativ în America de Nord! Pentru ca sistemele de generare a limbajului să fie utilizate pentru aplicații comerciale, acestea trebuie să gestioneze toate aceste subtilități.

 

Puteți împărtăși cu noi detalii despre modul în care învățarea profundă este utilizată în Phrasee?

Există două componente principale de inteligență artificială în tehnologia Phrasee. Primul este Generarea Limbajului Natural (NLG), care produce efectiv limbajul. Al doilea este învățarea profundă, și aici se concentrează pe performanță. Performanța poate însemna lucruri diferite în funcție de context. De exemplu, scopul unui subiect de e-mail este să încurajeze destinatarul să deschidă e-mailul și să vadă conținutul din interior. Pentru Facebook, scopul ar putea fi să maximizeze aprecierile sau distribuirile. Având volume mari de date istorice, este posibil să găsim tendințe și modele subtile care nu ar fi niciodată observate de un om. Acesta este un problemă standard de învățare automată.

Învățarea profundă oferă câteva avantaje față de abordarea tradițională de învățare automată. Cu învățarea automată tradițională, există un accent puternic pe “proiectarea caracteristicilor”. Acest lucru înseamnă că dezvoltatorul trebuie să decidă ce cred că sunt cele mai importante caracteristici ale limbajului. de exemplu, cuvinte, lungime, utilizarea emoticon-urilor, etc. Problema este că aceasta este limitată de abilitatea și imaginația inginerului. Cu învățarea profundă, textul brut este alimentat în model, și acesta construiește propria reprezentare mașină a limbajului (cunoscută sub numele de învățare de la capăt). Prin urmare, este liber de prejudecățile umane și este o abordare puternică. Cu toate acestea, partea negativă este că poate fi greu de înțeles de ce modelul se comportă într-un anumit fel. “Explicabilitatea” este o zonă activă de cercetare în comunitatea de învățare profundă. Cu toate acestea, există un compromis fundamental între complexitatea unui sistem și capacitatea noastră de a-l înțelege. Limbajul uman este haotic, deci soluțiile de prelucrare a limbajului natural de succes au, de obicei, un nivel ridicat de complexitate.

 

Una dintre funcționalitățile Phrasee este capacitatea de a scrie în tonul unic al unei mărci, puteți explica cum se realizează acest lucru?

Când semnăm un nou client, primul lucru pe care îl facem este să colectăm informații despre stilul de comunicare al mărcii sale. Acesta include orice linii directoare formale ale mărcii, campanii de marketing istorice și o serie de chestionare pe care le-am dezvoltat în acest scop. Toate aceste informații sunt utilizate de o echipă internă de tehnicieni de limbă pentru a construi un model de limbă specific clientului. Modelele noastre de limbă sunt generative, ceea ce înseamnă că pot produce limbaj nou, niciodată văzut, în stilul unic al clientului.

Modelele de limbă pot fi actualizate în orice moment. De exemplu, în acest moment suntem în mijlocul crizei COVID-19. Echipa noastră de limbă verifică modelele noastre pentru a ne asigura că nu putem crea limbaj inadecvat. O frază precum “Aceste oferte sunt virale!” ar fi fost inofensivă cu câteva luni în urmă, dar este clar inadecvată în mijlocul unei pandemii globale. Acest lucru demonstrează flexibilitatea sistemului nostru.

 

Ce tip de date sunt necesare unei companii care dorește să înceapă să utilizeze Phrasee?

Să fiu sincer, nu sunt necesare prea multe date pentru a începe cu noi. Primul pas este să identificăm o zonă de proiect potrivită. De exemplu, acesta ar putea fi subiectele pentru e-mailurile de promovare săptămânale. Ideal, acesta va avea o audiență relativ mare și comunicările vor fi regulate. Odată identificat proiectul, avem nevoie de informații despre subiectul și vocea mărcii pentru a construi modelul de limbă. Phrasee are nevoie de rezultate de performanță pe o bază continuă. Deoarece soluția noastră utilizează învățarea automată, este important să măsurăm și să urmărim metricele cheie în timp. Aceste informații sunt introduse în sistemul nostru, astfel încât acesta să poată optimiza în mod continuu pentru implicare.

 

Există altceva pe care ați dori să îl împărtășiți despre Phrasee?

Când Parry, Victoria și eu am început Phrasee, acum cinci ani, eram siguri că va fi doar o chestiune de timp până când multe alte startup-uri vor apărea cu produse similare. Planul nostru a fost să ne asigurăm un avans față de concurență și să rămânem cu un pas înainte. Cu toate acestea, am fost surprinși de lipsa de intrări în acest spațiu. Unde este toată lumea? Cred că există câteva motive pentru acest lucru, dar unul dintre principalele este că limba este atât de dificilă. Bănuiesc că alții au încercat să creeze produse similare, dar au eșuat devreme în etapele de cercetare și dezvoltare. Acest lucru este un testament pentru unicitatea tehnologiei noastre.

Mulțumim pentru interviul informativ despre Prelucrarea Limbajului Natural, Generarea Limbajului Natural și Învățarea Profundă. Pentru a afla mai multe, vizitatorii pot vizita Phrasee.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.