Tekoäly
Ricky Costa, Quantum Statin CEO – Haastattelusarja

Ricky Costa on Quantum Statin CEO, joka tarjoaa liiketoimintaratkaisuja NLP:lle ja tekoälyohjelmille
Mikä alun perin herätti sinussa kiinnostuksen tekoälyä kohtaan?
Sattuma. Luin kirjaa todennäköisyydestä, kun törmäsin kuuluisaan teoreemaan. Silloin tulin ajatelleeksi, voinko soveltaa tätä teoreemaa luonnollisen kielen ongelmaan, jota yritin ratkaista työssäni. Ilmeni, että algoritmi oli jo olemassa, ja se oli nimeltään Naïve Bayes, hyvin tunnettu ja yksinkertainen generatiivinen malli, jota käytetään klassisessa koneoppimisessa. Tuo teoreema oli Bayesin teoreema. Tunsin, että tämä sattuma oli vihje, ja se istutti uteliaisuuden siemenen, joka sai minut jatkamaan oppimista.
Olet Quantum Statin CEO, joka tarjoaa ratkaisuja luonnollisen kielen prosessoinnille. Miten päädyit tähän asemaan?
Kun uudessa teknologiassa tapahtuu vallankumous, jotkut yritykset ovat epäröivämpiä kuin toiset, kun ne kohtaavat tuntemattoman. Perustin yritykseni, koska tuntemattoman seuraaminen on minulle hauskaa. Tunsin myös, että se oli oikea aika siirtyä luonnollisen kielen prosessoinnin alalle, kun otetaan huomioon kaikki upea tutkimus, joka on saatu viimeisten kahden vuoden aikana. Luonnollisen kielen prosessoinnin yhteisöllä on nyt mahdollisuus saavuttaa paljon enemmän vähemmällä, kun otetaan huomioon uudet luonnollisen kielen prosessoinnin tekniikat, jotka vaativat vähemmän dataa suorituskyvyn skaalaukseen.
Luetteloille, jotka eivät ole tuttuja tälle alalle, voitko kertoa meille, mitä luonnollisen kielen prosessointi tekee?
Luonnollisen kielen prosessointi on tekoälyn ja analytiikan ala, joka yrittää ymmärtää luonnollista kieltä tekstin, puheen tai monimuotoisen oppimisen (teksti ja kuvat/video) ja laskea sitä siihen pisteeseen, jossa ajat siirrät tietoa ja/tai tarjoat arvokkaan palvelun. Arvo voi tulla useista kulmista, yrityksen sisäisen tiedostojärjestelmän tiedon hakemisesta uutisten mielipiteen luokitteluun tai GPT-2 Twitter-bottiin, joka auttaa sosiaalisen median markkinoinnissa (kuten me rakensimme viikkoja sitten).
Sinulla on taiteen kandidaatin tutkinto Hunter Collegesta kokeellisesta psykologiasta. Koetko, että ihmisaivojen ja ihmisen psykologian ymmärtäminen on etu, kun on kyse luonnollisen kielen prosessoinnin alaan tutustumisesta ja laajentamisesta?
Tämä on vastakkainen, mutta valitettavasti ei. Neuroneja ja syvän neuroverkoston analogia on vain havainnollistamiseen ja intuitiiviseen tietoon. Voit ehkä oppia paljon enemmän kompleksisuuden tieteestä ja insinööritieteestä. Ihmisaivojen toimintatavan ymmärtäminen on vaikeaa, koska meillä on kompleksinen järjestelmä. “Älykkyys” on emergentti ilmiö, joka syntyy aivojen kompleksisuudesta ja sen vuorovaikutuksesta ympäristönsä kanssa, ja se on hyvin vaikea määritellä. Psykologia ja muut sosiaalitieteet, jotka perustuvat “reduktionismiin” (ylhäältä alas), eivät toimi tässä kompleksisessa paradigmassa. Tässä on intuitio: kuvittele joku yrittää reduzoida The Beatlesin kappaleen “Let it Be” C-duuriin. Ei ole mitään kyseisessä asteikossa, joka ennustaa, että “Let it Be” tulee syntymään siitä.
Voitko kertoa meille, miksi Big Data on niin tärkeää tekoälyä ja erityisesti luonnollisen kielen prosessointia koskien?
Koska syvät oppimismallit interpoloivat dataa, mitä enemmän dataa syötät malliin, sitä vähemmän reunatapauksia se näkee, kun se tekee johtopäätöksiä luonnossa. Tämä arkkitehtuuri “kannustaa” suuria tietoja käsiteltäväksi malleilla, jotta tulosteen tarkkuutta voidaan lisätä. Kuitenkin, jos haluamme saavuttaa älykkämpää käyttäytymistä tekoälymallien kanssa, meidän on katsoja pidemmälle kuin kuinka paljon dataa meillä on ja enemmän siihen, miten voimme parantaa mallin kykyä päättää tehokkaammin, mikä ei intuitiivisesti vaadi paljon dataa. Kompleksisuuden näkökulmasta solumaattisten automaattien kokeet, jotka fyysikot John von Neumann ja Stephen Wolfram suorittivat viime vuosisadalla, osoittavat, että kompleksisuus voi syntyä yksinkertaisista alkutilanteista ja säännöistä. Mitkä nämä olisi pitäisi olla tekoälyä koskien, on se, mitä kaikki metsästävät.
Viimeksi lanseerasit “Big Bad NLP Database” -tietokannan. Mitä tämä tietokanta on ja miksi se on tärkeää tekoälyteollisuudelle?
Tämä tietokanta luotiin NLP-kehittäjille, jotta heillä olisi helppo pääsy kaikkiin alan tärkeimpiin tietokantoihin. Tämä tietokanta auttaa indeksoimaan tietokantoja, jolla on mukava sivuvaikutus, joka mahdollistaa käyttäjien kyselyt. Datatiedostojen esikäsittely vie enemmän aikaa käyttöönottoon, ja tämä tietokanta yrittää lieventää tätä ongelmaa niin paljon kuin mahdollista. Lisäksi se on ilmainen alusta kelle tahansa, olit sitten akateeminen tutkija, käytännön asiantuntija tai itsenäinen tekoäly-guru, joka haluaa päästä alkuun luonnollisen kielen prosessoinnin datalla. Linkki
Quantum Stat tarjoaa tällä hetkellä lopusta loppuun ratkaisuja. Mitkä nämä ratkaisut ovat?
Autamme yrityksiä helpottamaan heidän NLP-mallinkehitysputkia tarjoamalla kehitystä missä tahansa vaiheessa. Voimme kattaa laajan valikoiman palveluita datan puhdistuksesta esikäsittelyvaiheessa aina mallipalvelimen käyttöönottoon tuotannossa (nämä palvelut on korostettu myös kotisivullamme). Kaikki tekoälyprojektit eivät toteudu, koska on epävarmuutta siitä, miten yrityksen tietty data/arkkitehtuuri toimii valmiiden mallien kanssa. Tämän epävarmuuden vuoksi palvelumme antavat yrityksille mahdollisuuden iteroida projektejaan murto-osaan siitä, mitä täysipäiväisen koneoppimisen insinöörin palkkaaminen maksaisi.
Mikä on viimeaikaisista tekoälykeksinnöistä sinun mielestäsi kiinnostavin?
Viimeaikaisista keksinnöistä tärkein on transformer-malli, josta saatat olla kuullut: BERT, RoBERTa, ALBERT, T5 jne. Nämä transformer-mallit ovat hyvin mielenkiintoisia, koska ne mahdollistavat tutkijoille saavuttaa huipputason suorituskyvyn pienemmällä datamäärällä. Ennen transformer-malleja kehittäjän olisi pitänyt vaatia hyvin suurta tietomäärää koulutettaessa mallia alusta alkaen. Koska nämä transformer-mallit on koulutettu etukäteen miljardeilla sanoilla, se mahdollistaa nopeamman iteroinnin tekoälyprojekteissa, ja se on se, mihin meillä on tällä hetkellä eniten osallistumista.
Onko mitään muuta, mitä haluaisit jakaa Quantum Statista?
Työstämme uutta projekti, joka liittyy rahoitusmarkkinoiden mielipideanalyysiin, ja se tullaan julkaisemaan pian. Olemme hyödyntäneet useita transformer-malleja, jotta voimme antaa ennenkokemattoman näyn siihen, miten rahoitusuutiset kehittyvät reaaliajassa. Odota!
Lue lisää Quantum Statista tai lue artikkelimme Big Bad NLP Database:sta.










