intervistat

Dr. Neil Yager, bashkë-themelues dhe shkencëtar kryesor i Phrasee – Seria e Intervistave

Përditësuar on Dhjetor 9, 2022

Dr. Neil Yager është Shkencëtari kryesor i Phrasee, dhe arkitekti i metodës Phrasee, një mjet shkrimi i autorizuar me AI që ka ndihmuar në optimizimin e kopjeve të marketingut për disa nga markat më të njohura në botë, duke përfshirë eBay, Groupon dhe Virgin – plus shumë të tjera, nga Australia në Amerikë, në më shumë se 20 gjuhë, nga anglishtja në japonisht.

Dr. Yager ka shkruar mbi një duzinë botime akademike, autori i një libri mbi nxjerrjen e të dhënave, dhe mban disa patenta. Si një nga ekspertët kryesorë në botë në komercializimin e inteligjencës artificiale, ai mban një doktoraturë në Shkenca Kompjuterike nga Universiteti i Uellsit të Ri Jugor në Australi.

Ju jeni një veteran 20-vjeçar i industrisë së teknologjisë, cilat ishin disa nga rolet tuaja të mëparshme në lidhje me AI?

Unë kam qenë i përfshirë në punë në lidhje me AI që nga doktorata ime në mesin e viteve 2000. Megjithatë, fusha ka kaluar nëpër disa riemërtime që atëherë. Për shembull, 15 vjet më parë kam studiuar "njohjen statistikore të modelit". Disa vite më vonë, kjo u bë më e njohur si "mësimi i makinës", që është një emër shumë më tërheqës. Kohët e fundit, mësimi i makinerive (dhe "të mësuarit e thellë" në veçanti) është bërë sinonim i "inteligjencës artificiale" në përgjithësi. Kam ndjenja të përziera për këtë. Nga njëra anë, puna ime me Phrasee më kishte mësuar rëndësinë e markës. Nga ana tjetër, termi "inteligjencë artificiale" sjell bagazhe me vete dhe mund të çojë në keqkuptime rreth teknologjisë. Pyes veten se ku do të ishim nëse të gjithë do ta quajmë ende "njohje statistikore të modelit".

Pjesa më e madhe e punës sime të mëparshme ishte në fushën e përpunimit të sinjalit dhe vizionit kompjuterik. Nuk kam pasur shumë ekspozim ndaj përpunimit të gjuhës natyrore përpara frazës. Që atëherë kam mësuar se gjuha është ndoshta problemi më i vështirë në AI.

Në vitin 2008 ju bashkë-shkruat një libër të quajtur 'Sistemi Biometrik dhe Analiza e të Dhënave: Projektimi, Vlerësimi dhe Minimi i të Dhënave', i cili lidh aspektet e statistikave dhe të mësimit të makinerive për të ofruar një udhëzues gjithëpërfshirës për vlerësimin, interpretimin dhe kuptimin e të dhënave biometrike. Jashtë më shumë burimeve kompjuterike, a besoni se kjo fushë ka evoluar që nga botimi i këtij libri? A mund të përshkruani si?

Mësimi i thellë ka tronditur fushat e vizionit kompjuterik, përpunimit të gjuhës dhe mësimit të makinerive që kur shkrova atë libër. Nuk do të ishte e mundur të shkruhej ai libër sot pa një seksion mbi mësimin e thellë.

Revolucioni i të mësuarit të thellë filloi me të vërtetë në vitin 2012 kur një model i të mësuarit të thellë fitoi një konkurs të quajtur ImageNet. ImageNet është një grup të dhënash për njohjen e objekteve vizuale ku kompjuteri përcakton se çfarë është në një imazh (p.sh. "qen" ose "tullumbace"). Për dekada, studiuesit kishin bërë përfitime në rritje në grupet e të dhënave standarde si kjo. Çdo nënfushë funksiononte në mënyrë të pavarur dhe mbështetej shumë në ekspertizën specifike të fushës. Pothuajse brenda natës, të gjitha modelet e ndërtuara me kujdes gjatë shumë viteve u vjetëruan. Algoritmet e mësimit të thellë të dizajnuara nga të huajt po fitonin garat me diferencë të konsiderueshme. Kjo transformoi industrinë e AI.

Fusha është ende në lëvizje të shpejtë dhe ka evoluar edhe që nga fillimi i Phrasee vetëm pak vite më parë. Për shembull, mjetet e të mësuarit të thellë ku mbështetemi tani nuk ekzistonin as kur themeluam kompaninë. Ritmi i inovacionit sjell sfidat e veta.

A mund të ndani me ne se çfarë është në gjendje të bëjë Phrasee për bizneset?

Fraza zgjidh dy probleme për biznesin. Së pari, ekziston problemi i shkrimit të kopjes së marketingut. Tani ka më shumë kanale reklamimi se kurrë më parë (p.sh. email, AdWords, social, print, podkaste, etj). Është e vështirë të shkruhet një kopje për të gjitha këto që të jetë me cilësi të lartë dhe të përputhet me stilin dhe tonin e zërit të markës. Phrasee trajton problemin e shkallës duke gjeneruar automatikisht kopje. Së dyti, është e rëndësishme që e gjithë gjuha që përdoret të jetë efektive. Jo vetëm që Phrasee gjeneron gjuhë, por përdor gjithashtu mësimin e makinerive për të parashikuar ndikimin e mesazheve dhe për të optimizuar në përputhje me rrethanat.

Çfarë ishte ajo që ju tërhoqi në idenë e përdorimit të Përpunimit të Gjuhës Natyrore (NLP) dhe të Mësimit të Thellë për të përmirësuar fuqinë e kopjes së reklamave?

Përdorimi i AI për të maksimizuar ndikimin e fushatave të marketingut dixhital nuk është një ide e re. Ka ekipe njerëzish me doktoraturë në fizikë, të cilët janë rekrutuar për të punuar në optimizimin e reklamave. Megjithatë, në shumicën e rasteve ata po i përqendrojnë përpjekjet e tyre për Kërkim dhe Zhvillim në gjëra të tilla si segmentimi i audiencës, personalizimi, koha e dorëzimit, vendosja e reklamave, shkronjat, etj. Kur ne po hidhnim idetë e para për Phrasee, vumë re se pothuajse gjithçka rreth reklamave po optimizohet, përveç gjuha aktuale që përdoret! Ne e identifikuam këtë si një boshllëk në treg dhe një mundësi të madhe.

Phrasee është në gjendje të përmirësojë kopjen e marketingut në mbi 20 gjuhë, duke përfshirë japonisht. A mund të diskutoni disa nga çështjet unike të Përpunimit të Gjuhëve Natyrore që ndeshen me gjuhët e huaja?

Shtesa më e fundit në grupin tonë të gjuhëve të mbështetura është rusishtja. Kjo është një gjuhë sllave dhe është mjaft e dallueshme nga gjuhët e tjera indo-evropiane. Në këtë rast ishte e nevojshme të ndërtoheshin rregulla të reja në sistemin tonë të gjenerimit të gjuhës, në mënyrë që rezultati të ishte i rrjedhshëm dhe gramatikisht i saktë. Kjo nuk është vetëm një çështje gjuhësore. Është gjithashtu një çështje e zhvillimit të softuerit. Kur prodhimi i sistemit tonë është në gjuhën amtare të zhvilluesit, është relativisht e lehtë të dallosh gabimet dhe të verifikosh që gjithçka po funksionon siç duhet. Sidoqoftë, kur punojmë në rusisht ose japonisht, mund të nxjerrim marrëzi dhe nuk e kemi idenë. Është e rëndësishme që të ketë një folës amtare të përfshirë nga afër në procesin e SC.

Sfida nuk është vetëm me gjuhët e huaja. Ka edhe disa dallime interesante rajonale. Për shembull, anglishtja ka ndryshime drejtshkrimore për SHBA, MB, Australi, Kanada, etj. Për më tepër, ka dallime gramatikore. Në anglishten britanike “have a look”, ndërsa në anglishten amerikane “take a look”. Kuptimi i fjalëve gjithashtu mund të ndryshojë nga vendi në vend. Një "gome" është një gomë në MB, por një prezervativ në Amerikën e Veriut! Në mënyrë që sistemet NLG të përdoren për aplikacione biznesi, ata duhet të trajtojnë të gjitha këto hollësi.

A mund të ndani gjithashtu disa detaje se si përdoret mësimi i thellë në frazë?

Ekzistojnë 2 komponentë kryesorë të AI në teknologjinë e Phrasee. E para është Gjenerimi i Gjuhëve Natyrore (NLG), i cili në fakt prodhon gjuhën. E dyta është të mësuarit e thellë, dhe fokusi këtu është te performanca. Performanca mund të nënkuptojë gjëra të ndryshme në varësi të kontekstit. Për shembull, qëllimi i një linje subjekti të emailit është të joshë marrësin që të hapë emailin dhe të shohë përmbajtjen brenda. Për Facebook, qëllimi mund të jetë maksimizimi i pëlqimeve ose ndarjeve. Duke pasur parasysh vëllime të mëdha të të dhënave historike, është e mundur të gjesh tendenca dhe modele delikate që nuk do të viheshin re kurrë nga një njeri. Ky është një problem standard i mësimit të makinerive.

Mësimi i thellë ofron disa avantazhe mbi qasjen tradicionale të mësimit të makinerive. Me mësimin tradicional të makinerive ka një fokus të fortë në "inxhinierinë e veçorive". Kjo do të thotë që zhvilluesi duhet të vendosë se cilat janë tiparet më të rëndësishme të gjuhës. p.sh. fjalët, gjatësia, përdorimi i emoji-ve, etj. Problemi është se kjo është e kufizuar nga aftësia dhe imagjinata e inxhinierit. Megjithatë, me mësimin e thellë, teksti i papërpunuar futet në model dhe ai ndërton përfaqësimin e tij makinerie të gjuhës (kjo njihet si mësimi nga fundi në fund). Prandaj, është i lirë nga paragjykimet njerëzore dhe është një qasje e fuqishme. Megjithatë, e keqja është se mund të jetë e vështirë të kuptohet pse modeli sillet ashtu siç sillet. "Shpjegueshmëria" është një fushë aktive e kërkimit brenda komunitetit të të mësuarit të thellë. Megjithatë, ekziston një shkëmbim themelor midis kompleksitetit të një sistemi dhe aftësisë sonë për ta kuptuar atë. Gjuha njerëzore është e çrregullt, kështu që zgjidhjet e suksesshme NLP zakonisht kanë një shkallë të lartë kompleksiteti.

Një nga funksionalitetet e Phrasee është aftësia për të shkruar me tonin unik të një marke, a mund të elaboroni se si kryhet kjo?

Kur regjistrojmë një klient të ri, gjëja e parë që bëjmë është të mbledhim informacione rreth stilit të komunikimit të markës së tyre. Kjo përfshin çdo udhëzues formal të markës, fushata historike të marketingut dhe një seri pyetësorësh që kemi zhvilluar për këtë qëllim. I gjithë ky informacion përdoret nga një ekip i brendshëm i teknikëve të gjuhës për të ndërtuar një "model gjuhësor" specifik për klientët. Modelet tona gjuhësore janë gjeneruese, që do të thotë se ato janë në gjendje të prodhojnë gjuhë të paparë më parë në stilin unik të klientit.

Modelet gjuhësore mund të përditësohen në çdo kohë. Për shembull, për momentin jemi në kulmin e krizës COVID-19. Ekipi ynë gjuhësor po shqyrton modelet tona për t'u siguruar që nuk mund të krijohet një gjuhë e papërshtatshme. Një frazë si "Këto marrëveshje po bëhen virale!" mund të ketë qenë i padëmshëm disa muaj më parë, por është qartësisht i papërshtatshëm në mes të një pandemie globale. Kjo tregon fleksibilitetin e sistemit tonë.

Çfarë lloji të të dhënave i nevojiten një kompanie që dëshiron të fillojë me Phrasee?

Për të qenë i sinqertë, nuk nevojiten shumë të dhëna për të filluar me ne. Hapi i parë është identifikimi i një zone të përshtatshme të projektit. Për shembull, kjo mund të jetë tema për emailet javore të promovimit. Idealisht, kjo do të ketë një audiencë relativisht të madhe dhe komunikimet do të jenë të rregullta. Pasi të jetë identifikuar projekti, ne kemi nevojë për informacion rreth temës së synuar dhe zërit të markës për të ndërtuar modelin gjuhësor. Phrasee ka nevojë për rezultate të performancës në mënyrë të vazhdueshme. Meqenëse zgjidhja jonë përdor mësimin e makinerive, është e rëndësishme që të masim dhe gjurmojmë metrikat kryesore me kalimin e kohës. Ky informacion kthehet në sistemin tonë në mënyrë që të mund të optimizohet vazhdimisht për angazhim.

A ka ndonjë gjë tjetër që dëshironi të ndani në lidhje me Phrasee?

Kur Parry, Victoria dhe unë filluam Phrasee pesë vjet më parë, ishim të sigurt se do të ishte thjesht çështje kohe para se shumë startup të tjerë të dilnin me produkte të ngjashme. Plani ynë ishte të merrnim një kërcim në garë dhe të qëndronim një hap përpara. Megjithatë, ne kemi mbetur të befasuar me mungesën e hyrjeve në këtë hapësirë. Ku janë të gjithë të tjerët? Mendoj se ka disa arsye për këtë, por një nga më kryesoret është se gjuha është një problem kaq i vështirë. Dyshoj se të tjerët janë përpjekur të krijojnë produkte të ngjashme, por kanë dështuar në fillim të fazave të R&D. Kjo është një dëshmi se sa unike është teknologjia jonë.

Faleminderit për intervistën informuese mbi Përpunimin e Gjuhës Natyrore, Gjenerimin e Gjuhëve Natyrore dhe Mësimin e Thellë. Për të mësuar më shumë vizitorët mund të vizitojnë Phrasee.

E rradhes

Prezantimi i niveleve të reja të transparencës me AI - Udhëheqësit e Mendimit

Mos e humbas

Inteligjenca artificiale e Google i mëson robotët se si të lëvizin duke vëzhguar qentë

Antoine Tardif

Një partner themelues i unite.AI dhe një anëtar i Këshilli i Teknologjisë i Forbes, Antoine është një futurist i cili është i apasionuar pas të ardhmes së AI dhe robotikës.

Ai është gjithashtu Themeluesi i Letrat me vlerë.io, një faqe interneti që fokusohet në investimin në teknologjinë përçarëse.