Interviu

Ricky Costa, „Quantum Stat – Interviu“ serijos generalinis direktorius

Atnaujinta on Gruodis 9, 2022

Ricky Costa yra įmonės Quantum Stat, kuri siūlo verslo sprendimus, generalinis direktorius NLP ir AI iniciatyvos

Kas iš pradžių paskatino jus domėtis dirbtiniu intelektu?

Atsitiktinumas. Skaičiau knygą apie tikimybę, kai aptikau garsiąją teoremą. Tuo metu naiviai galvojau, ar galėčiau pritaikyti šią teoremą natūralios kalbos problemai, kurią bandau išspręsti darbe. Kaip paaiškėjo, algoritmas jau egzistavo man nežinant, jis buvo vadinamas Naive Bayes, labai garsus ir paprastas generacinis modelis, naudojamas klasikiniame mašininiame mokyme. Ta teorema buvo Bayeso teorema. Jaučiau, kad šis sutapimas buvo užuomina, ir pasėjau smalsumo sėklą, kad mokyčiau daugiau.

Esate „Quantum Stat“ įmonės, siūlančios natūralios kalbos apdorojimo sprendimus, generalinis direktorius. Kaip atsidūrėte šioje pozicijoje?

Kai vyksta naujos technologijos revoliucija, kai kurios įmonės labiausiai dvejoja nei kitos, kai susiduria su nežinomybe. Įkūriau savo įmonę, nes vaikytis nežinomybės man smagu. Taip pat jaučiau, kad atėjo tinkamas laikas žengti į NLP sritį, atsižvelgiant į visus nuostabius tyrimus, kurie buvo atlikti per pastaruosius 2 metus. NLP bendruomenė dabar turi galimybių pasiekti daug daugiau su daug mažiau, atsižvelgiant į naujų NLP metodų, kuriems reikia mažiau duomenų, kad būtų galima padidinti našumą, atsiradimą.

Skaitytojai, kurie galbūt nėra susipažinę su šia sritimi, ar galėtumėte pasidalinti su mumis, ką veikia natūralios kalbos apdorojimas?

NLP yra dirbtinio intelekto ir analitikos polaukis, kuriuo bandoma suprasti natūralią kalbą teksto, kalbos arba daugiarūšio mokymosi (teksto ir vaizdų / vaizdo įrašų) metu ir ją apskaičiuoti iki taško, kuriame jūs gaunate įžvalgą ir (arba) teikiate vertingą paslaugą. Vertė gali būti gaunama iš kelių pusių, pradedant informacijos gavimu įmonės vidinėje failų sistemoje, baigiant nuotaikų klasifikavimu naujienose arba naudojant GPT-2 twitter robotą, kuris padeda jūsų rinkodarai socialinėje žiniasklaidoje (kaip tas, kurį sukūrėme prieš kelias savaites).

Jūs turite menų bakalauro laipsnį iš Hanterio koledžo eksperimentinės psichologijos srityje. Ar manote, kad žmogaus smegenų ir žmogaus psichologijos supratimas yra privalumas, kai reikia suprasti ir išplėsti natūralios kalbos apdorojimo sritį?

Tai prieštarauja, bet, deja, ne. Neuronų ir giliųjų neuroninių tinklų analogija skirta tik iliustracijai ir intuicijos įteigimui. Tikriausiai galima daug daugiau išmokti iš sudėtingų mokslų ir inžinerijos. Sunku suprasti, kaip veikia smegenys, yra tai, kad susiduriame su sudėtinga sistema. „Intelektas“ yra reiškinys, atsirandantis dėl smegenų sudėtingumo, sąveikaujančio su aplinka, ir jį labai sunku nustatyti. Psichologija ir kiti socialiniai mokslai, kurie priklauso nuo „redukcionizmo“ (iš viršaus į apačią), neveikia pagal šią sudėtingą paradigmą. Štai intuicija: įsivaizduokite, kad kažkas bando sumažinti „The Beatle“ dainą „Let it Be“ iki C-dur skalės. Šioje skalėje nėra nieko, kas prognozuotų, kad iš jos atsiras „Tebūnie“. Tas pats pasakytina apie žmogų, kuris bando sumažinti elgesį iki nervų veiklos smegenyse.

Ar galėtumėte pasidalyti su mumis, kodėl dideli duomenys yra tokie svarbūs, kai kalbama apie gilųjį mokymąsi ir, konkrečiau, natūralios kalbos apdorojimą?

Kadangi gilaus mokymosi modeliai interpoliuoja duomenis, kuo daugiau duomenų įvedate į modelį, tuo mažiau kraštinių atvejų jis matys darydamas išvadas gamtoje. Ši architektūra „skatina“ didelius duomenų rinkinius skaičiuoti pagal modelius, kad būtų padidintas išvesties tikslumas. Tačiau, jei norime, kad dirbtinio intelekto modeliai elgtųsi protingiau, turime žiūrėti ne tik į tai, kiek duomenų turime, bet į tai, kaip galėtume pagerinti modelio gebėjimą veiksmingiau mąstyti, o tam intuityviai neturėtų prireikti daug duomenis. Žvelgiant iš sudėtingumo perspektyvos, praėjusį šimtmetį fizikų Johno von Neumanno ir Stepheno Wolframo atlikti ląstelių automatų eksperimentai rodo, kad sudėtingumas gali atsirasti dėl paprastų pradinių sąlygų ir taisyklių. Kokios turėtų būti šios sąlygos / taisyklės, susijusios su AI, yra tai, ką medžioja visi.

Neseniai paleidote „Big Bad NLP duomenų bazę“. Kas yra ši duomenų bazė ir kodėl ji svarbi AI pramonės atstovams?

Ši duomenų bazė buvo sukurta tam, kad NLP kūrėjai galėtų sklandžiai pasiekti visus susijusius duomenų rinkinius pramonėje. Ši duomenų bazė padeda indeksuoti duomenų rinkinius, o tai turi gerą antrinį poveikį, nes vartotojai gali užklausti. Išankstinis duomenų apdorojimas užtrunka didžiąją dalį diegimo proceso laiko, todėl ši duomenų bazė bando kiek įmanoma sumažinti šią problemą. Be to, tai nemokama platforma visiems, nesvarbu, ar esate akademinis tyrėjas, praktikas, ar nepriklausomas dirbtinio intelekto guru, norintis naudotis NLP duomenimis. ryšys

Šiuo metu „Quantum Stat“ siūlo galutinius sprendimus. Kokie yra kai kurie iš šių sprendimų?

Mes padedame įmonėms palengvinti jų NLP modeliavimo vamzdyną, siūlydami plėtrą bet kuriame etape. Galime apimti platų paslaugų spektrą nuo duomenų valymo išankstinio apdorojimo stadijoje iki modelio serverio diegimo gamyboje (šios paslaugos taip pat paryškintos mūsų pagrindiniame puslapyje). Ne visi AI projektai įgyvendinami dėl nežinomo pobūdžio, kaip jūsų konkreti duomenų / projekto architektūra veikia naudojant naujausią modelį. Atsižvelgdami į šį neapibrėžtumą, mūsų paslaugos suteikia įmonėms galimybę kartoti savo projektą už mažesnę kainą, kai samdomas visą darbo dieną dirbantis ML inžinierius.

Kokie pastarojo meto AI pažanga jums atrodo įdomiausia?

Svarbiausias pastarojo meto pasiekimas yra transformatoriaus modelis, apie kurį galbūt girdėjote: BERT, RoBERTa, ALBERT, T5 ir pan. Šie transformatorių modeliai yra labai patrauklūs, nes leidžia tyrėjui pasiekti pažangiausią našumą naudojant mažesnius duomenų rinkinius. Prieš pradedant transformatorius, kūrėjui reikės labai didelio duomenų rinkinio, kad galėtų parengti modelį nuo nulio. Kadangi šie transformatoriai yra iš anksto išmokyti naudoti milijardus žodžių, tai leidžia greičiau iteruoti AI projektus, ir šiuo metu su tuo daugiausia užsiimame.

Ar yra dar kuo nors, kuo norėtumėte pasidalinti apie „Quantum Stat“?

Dirbame su nauju projektu, susijusiu su finansų rinkos nuotaikų analize, kuris netrukus pasirodys. Mes panaudojome kelis transformatorius, kad suteiktume precedento neturinčią įžvalgą, kaip finansinės naujienos sklinda realiuoju laiku. Sekite naujienas!

Norėdami sužinoti daugiau, apsilankykite Quantum Stat arba skaitykite mūsų straipsnį apie Didelė bloga NLP duomenų bazė.