stuacach Andrea Vattani, Comhbhunaitheoir & Príomheolaí ag Spiketrap - Sraith Agallaimh - Unite.AI
Ceangail le linn

agallaimh

Andrea Vattani, Comhbhunaitheoir & Príomh-Eolaí ag Spiketrap – Sraith Agallaimh

mm

foilsithe

 on

Is í Andrea Vattani, Comhbhunaitheoir & Príomh-Eolaí ag spiketrap, cuideachta comhthéacsaithe a chumhachtaíonn faisnéis lucht féachana agus feidhmíocht meán do chruthaitheoirí, ardáin agus brandaí. Baineann an Clair AI dílseánaigh an comhartha ó thorann na dtacar sonraí neamhstruchtúrtha, ag soláthar soiléireachta agus comhthéacs gan sárú, go háirithe laistigh de thimpeallachtaí ar líne ardluais.

Cad a mheall tú chuig ríomheolaíocht agus AI ar dtús?

Meascán de chúinsí fortuitous a bhí ann, léirigh mé suas ag Ollscoil na Róimhe chun an mór-thástáil iontrála Staitisticí a dhéanamh, agus d'éirigh sé amach go raibh mé lá déanach! Moladh dom iarratas a dhéanamh ar Eolaíocht Ríomhaireachta ina ionad sin agus bogadh ar ais go dtí an Roinn Staitisticí bliain ina dhiaidh sin. Chuaigh mé go dtí an scrúdú iontrála Ríomheolaíocht (a bhí an lá sin!) agus d'éirigh liom é… níor bhog mé ar ais go Staitisticí! Thosaigh mo spéis in AI i ndáiríre nuair a thuig mé conas is féidir le ríomhairí cabhrú leat rudaí a uathoibriú, agus is é AI an t-innealra uathoibrithe deiridh. Chomh maith leis sin, bhí an teanga nádúrtha agus an chaoi a n-úsáideann daoine í i gcónaí ina ábhar spéise domsa: dhírigh mé ar staidéir chlasaiceacha sa scoil ard, ag déanamh staidéir ar an Sean-Ghréigis agus Laidin, rud atá cosúil leis an dóigh a mothaíonn meaisín nuair a chothaítear sruth focal.

D’oibrigh tú roimhe seo mar Innealtóir Sinsearach Ceannais Bogearraí ag Amazon Goodreads, cad iad cuid de na tionscadail ar oibrigh tú orthu agus cad iad na príomhbhealaí beir leat ón taithí seo?

Le linn dom a bheith ag Goodreads, d'oibrigh mé ar thionscadail mheaisínfhoghlama iolracha lena n-áirítear aimsiú turscair agus scálú an innill mholta leabhar. Bhí mé ag foghlaim faoin tábhacht a bhaineann le méadracht ML a shainiú a mheaitseálann spriocanna gnó agus custaiméirí. Mar shampla, tá innill mholta ann le fada an lá. An cuimhin leat an comórtas “Duais Netflix” siar in 2009 chun moltaí scannáin níos fearr a dhéanamh amach? Thug roinnt léargais ó na réitigh is fearr le fios nach bhfuil an seans go bhféachfaidh tú ar scannán i bhfad ag brath ar cé acu an dtaitneoidh sé leat nó nach dtaitníonn sé leat, ach go príomha má tá sé cosúil le do chuid spéise. B’fhéidir go n-oibreodh sin do scannáin, ós rud é gur gealltanas gearr 90 nóiméad é, ach ní mar sin atá an scéal do leabhair. Tá sé ríthábhachtach an sprioc ceart a chomhtháthú le do mhéadracht.

Foghlaim eile a chuir mé i bhfeidhm ag Spiketrap ná foirne AI a thógáil atá dírithe ar sheachadadh agus atá comhtháite le treochlár an táirge seachas foireann iargúlta atá dírithe ar thaiscéalaíocht agus ar thaighde. Mar thoradh air seo déantar sainmhíniú níos fearr ar spriocanna, ar línte ama agus ar thuiscint ar an PÉ. Tá sé i bhfabhar leis an bhfoireann go nádúrtha díriú ar luas agus praiticiúlacht mhúnla seachas breathnú ar chruinneas amháin. Ag dul ar ais go dtí sampla an chomórtais Netflix, níor comhtháthaíodh samhlacha na bhfoirne a bhuaigh riamh mar gheall nach raibh siad praiticiúil go leor in ainneoin a gcruinneas feabhsaithe.

Tá do chuid taighde foilsithe i go leor irisleabhair, cad é an páipéar is tábhachtaí go dtí seo i do thuairim?

Le linn mo Ph.D. Bhí an t-ádh orm comhoibriú le roinnt taighdeoirí ó réimsí éagsúla, lena n-áirítear foghlaim meaisín, “sonraí móra”, anailís ar shonraí sóisialta, agus teoiric cluichí. Páipéar is maith liom mar gheall ar a simplíocht agus a infheidhmeacht ná “K-Meáin Inscálaithe++”: Is modh braislithe gan mhaoirseacht é K-means++ a úsáidtear go uileláithreach chun tacar sonraí a roinnt i ngrúpaí comhleanúnacha K. Déanann sé é sin trí ghrúpa amháin a chur leis ag an am, mar sin nuair a bhíonn an iliomad sonraí agus grúpaí agat, éiríonn sé ró-mhall. Sa pháipéar sin léirímid duit conas is féidir leat an cruinneas céanna, más rud é nach bhfuil sé níos fearr, a bhaint amach tríd an modh a chomhthreomharú. Tá ár modheolaíocht thar a bheith simplí agus tá sí curtha i bhfeidhm i roinnt leabharlann meaisínfhoghlama.

An bhféadfá an scéal genesis taobh thiar de Spiketrap a roinnt?

Tar éis dom a bheith ag obair ag Goodreads, thuig mé féin agus comhbhunaitheoirí Spiketrap, Kieran agus Virgilio go raibh bearna sa tionscal maidir le rochtain a fháil ar ard-léargais branda ó ardáin shóisialta nideoige. Trí theicneolaíochtaí AI a chur i bhfeidhm, d’fhéadfaimis aghaidh a thabhairt ar an tsaincheist ar bhealach éifeachtach.

I ngeilleagar an lae inniu, tá sé ríthábhachtach do chuideachtaí éisteacht lena gcustaiméirí agus lena dtionscail faoi seach ina n-iomláine. Mar sin féin, ní chloistear go leor dá bhfuil le rá ag custaiméirí faoi bhrandaí. Cuireann na milliúin daoine a dtuairimí in iúl go hoscailte gach lá, thar ardáin mar Twitter, Reddit, Twitch, agus a leithéidí. Tá sé cruthaithe gur acmhainn thar a bheith luachmhar é d’aon taighdeoir margaidh, ar choinníoll gur féidir an t-ábhar a chur i gcomhthéacs ar scála. Is í an tsaincheist ná nár choinnigh tionscal na léargais suas le hiompraíocht agus teanga dhigiteach atá ag teacht chun cinn.

Tá uirlisí éisteachta fós ag brath ar eochairfhocail agus cuardaigh Boole, in easnamh ar go leor den chomhrá a d'fhéadfadh agus ba chóir a chur i leith branda ar leith. Idir an dá linn, tá gnólachtaí taighde margaidh gafa i mbeart comhardaithe atá ag éirí níos deacra, agus iad ag iarraidh léargais cháilíochtúla a fháil ó mhodheolaíochtaí cainníochtúla agus srianta ó thaobh costais de.

I mbeagán focal, ní raibh na huirlisí is gá ag daoine chun a lucht éisteachta a thuiscint ar scála. Freagraíonn uimhreacha díolacháin agus comhaireamh lucht féachana “cad” iompraíochtaí an lucht féachana, ach ní “cén fáth”. Gan comhthéacs, is cluiche buille faoi thuairim é a fháil amach cad is comhghaol ann i gcoinne cúisíochta. Agus an neamhní seo á aithint againn, rinneamar féachaint ar an gcuma a bheadh ​​ar réiteach comhthéacsúla, agus rugadh Spiketrap.

Cad iad cuid de na teicneolaíochtaí meaisínfhoghlama a úsáidtear ag Spiketrap?

Bainimid úsáid as an iliomad teicneolaíochtaí, ó do ghnáthleabharlanna Scikit-learn go leabharlanna domhainfhoghlama ar nós Pytorch. Seachas na leabharlanna, is modheolaíochtaí, samhlacha agus tacair shonraí a úsáidimid dílseánaigh den chuid is mó. Tá sé foghlamtha againn nach dtógann modhanna agus samhlacha as an tseilf ach tú go dtí seo, ach chun fadhb a réiteach i ndáiríre ní mór duit do chuid oibre féin a chur isteach ag tosú ó spriocanna agus ag dul síos go dtí ailtireacht mhúnla agus tacair shonraí. Chun sampla a thabhairt duit, is é atá i gceist le samhaltú topaicí ná an tasc téamaí a bhaint as bailiúchán de phíosaí téacs. Soláthraíonn ár “Spiketrap Convos” léargais ríthábhachtacha dár gcustaiméirí ar a lucht éisteachta, agus úsáideann sé samhaltú topaicí mar cheann de na comharthaí. Is é LDA (Leithdháileadh Dirichlet Folaigh) an gnáthmhodh a úsáidtear chun múnlú topaicí a dhéanamh, ach ar an drochuair tá sé ró-neamhsheasmhach agus neamh-intuartha agus go simplí níl sé cumhachtach go leor. Ar an taobh eile den speictream, is féidir leat triail a bhaint as samhail réamh-oilte nua-aimseartha ar nós Bert-Topics, atá - cé go cumhachtach agus a chuimsíonn - - freisin i ndáiríre docht agus mall. Tá dul chun cinn déanta ag NLP agus teanga AI le deich mbliana anuas, ach tá sé fós i bhfad ó bheith optamach agus contúirteach ag glacadh samhlacha atá ann cheana féin chun iad a thiontú ina dtáirgí.

An bhféadfá mionsaothrú a dhéanamh ar conas a chumhachtaíonn Spiketrap tuiscint an lucht féachana ar an toirt do chruthaitheoirí, ardáin agus brandaí?

Úsáideann fógróirí agus gníomhaireachtaí ár gclár ceannairí tionchair agus ár n-uirlisí cleamhnais branda chun cruthaitheoirí a bhfuil a bpobail sábháilte ó thaobh branda de a aithint thar roinnt catagóirí, lena n-áirítear gráid le haghaidh ábhar tocsaineach, bradán agus gnéasach - chomh maith le sábháilteacht branda pobail iomlán.

Tá cruthaitheoirí in ann an uirlis a úsáid chun tumadóireacht a dhéanamh i sruthanna aonair agus féachaint cé na comhráite a bhí an chuid is mó nó is lú sábháilte, a spreag rannpháirtíocht dhearfach dá n-urraitheoirí, agus cén áit ar féidir leo a gcuid iarrachtaí measarthachta a fheabhsú níos fearr.

Páipéar le déanaí dar teideal 'FeelsGoodMan: Séimeantaic na Neologisms Twitch a Bhaint as' foilsithe ag Spiketrap. An bhféadfá cur síos gairid a dhéanamh ar a bhfuil sa pháipéar seo?

Tá an bealach a chuireann daoine in iúl agus iad féin a chur in iúl ar líne ag éirí níos casta agus níos dúshlánaí de réir a chéile a dhéanamh amach. straoiseoga a tháinig ar dtús :-). Ansin tháinig emojis . Ansin memes… agus anois “emotes”, foirm nua cumarsáide bunaithe ar dheilbhín a bhfuil an-tóir air ar ardán sruthú Twitch. Rud a chuireann i gcuimhne do emojis dá n-úsáid mheasctha le gnáth-théacs, cuireann siad dúshláin chosúla os comhair memes sa mhéid is go bhfuil siad ginte ag an úsáideoir agus níl aon bhaint soiléir ag a gciall cripteach leis an íomhá iarbhír a léirítear. Tá os cionn 8 milliún mothúcháin ar leith ann go dtí seo agus úsáidtear breis is 400 míle in aghaidh na seachtaine. Fós féin, déanann daoine cumarsáid éifeachtach agus iad á n-úsáid chun mothú de chineál ar bith a chur in iúl mar áthas, leadrán, sceitimíní nó searbhas. Is leabhar cócaireachta AI é ár bpáipéar le déanaí chun brí shéimeantach na mothúcháin a thuiscint. Ní éilíonn ár gcur chuige tacar sonraí arna choimeád de láimh a chothabháil agus a nuashonrú, agus tá sé in ann féin-oiriúnú a dhéanamh do thabhairt isteach leanúnach mothúcháin nua ach freisin d'éabhlóid bhrí na mothúcháin mhóréilimh. Tá sé seo thar a bheith tábhachtach nuair a bhíonn straoiseog luchtaithe go polaitiúil nó go ciníoch, rud atá feicthe againn ag tarlú le mothúcháin mhóréilimh, mar “TriHard”, “PogChamp”, agus “FeelsGoodMan”. Cruthaíonn úsáid dhinimiciúil teanga agus aistrithe brí fadhbanna ollmhóra do chórais mhodhnóireachta nó creataí anailíse meon, agus mar sin táimid bródúil as dul i ngleic leis an bhfadhb seo ar an mbealach ceart ag Spiketrap.

An bhfuil aon rud eile ar mhaith leat a roinnt faoi Spiketrap?

Agus muid ag tnúth leis an mbliain nua, tá Spiketrap ag obair ar uirlis nua a fhorbairt agus a chur i gcrích a sholáthróidh tuiscint níos doimhne ar mheon an bhranda dár gcustaiméirí. Soláthraíonn Uirlis Affinity nua Spiketrap bealach idirghníomhach agus iomasach chun cleamhnais lucht féachana ar fud cruthaitheoirí, brandaí, cluichí agus go leor eile a aithint agus a chainníochtú. I gcás aon cheist ar leith, gineann an uirlis scóir innéacs cleamhnais a thugann le fios cé chomh maith is atá aonán ar leith comhghaolaithe go dearfach le haonán eile. Cuimsíonn an iliomad comharthaí comhthéacsúla an scór, lena n-áirítear minicíocht agus meon na tagairtí gaolmhara. Tá stack teicniúil Spiketrap suite go uathúil chun cleamhnais a innéacsú idir cluichí, brandaí agus cruthaitheoirí. Próiseálann Clair, a NLP AI dílseánaigh, na milliúin teachtaireachtaí a ghintear go poiblí gach lá, ag cur ábhar débhríoch ar shlí eile i leith aonáin laistigh de ghraf eolais fhairsing Spiketrap, ag aithint topaicí comhrá, ag cinneadh meon agus ag monatóireacht sábháilteachta. Trí bhíthin an Uirlis Affinity nua a chur leis, tugtar cumhacht d’fhorbróirí, do chruthaitheoirí, do bhrandaí agus do níos mó tuiscint bhreise a fháil ar a lucht éisteachta agus ar a dtionchar branda.

Go raibh maith agat as an agallamh iontach, ba chóir do léitheoirí ar mian leo níos mó a fhoghlaim cuairt a thabhairt spiketrap.

Comhpháirtí de bhunaitheoirí unite.AI & ball den Comhairle Teicneolaíochta Forbes, Tá Antaine a futurist atá paiseanta faoi thodhchaí AI & róbataic.

Tá sé ina Bunaitheoir ar Urrúis.io, suíomh Gréasáin a dhíríonn ar infheistiú i dteicneolaíocht shuaiteach.