intervjuud

Sarah Nagy, Seek AI asutaja ja tegevjuht – intervjuuseeria

avaldatud

1 aasta tagasi

November 10, 2022

Sarah Nagy on ettevõtte asutaja ja tegevjuht Otsige AI-d, platvorm, mis võimaldab ärilistel lõppkasutajatel küsida Slackis, Teamsis ja meilis täpselt samu küsimusi, mida nad praegu andmemeeskonnale esitavad. Ei mingit küsimuse kirjutamise "viimistlemist" ega uue platvormi õppimist.

Algselt alustasite Hubble'i kosmoseteleskoobi andmetega uurijana. Mille kallal sa töötasid?

Tegin uurimistööd UCLA-s ja Caltechis, vaatlesin mõningaid kõige kaugemaid galaktikaid, mida oli võimalik teleskoobiga vaadelda, ning analüüsisin mõningaid nende omadusi, nagu nende mass ja suurus. Selle uurimistöö eesmärk oli aidata meil mõista erinevust väga kaugete galaktikate ja meie omadele lähemal asuvate galaktikate vahel ning töötada välja mudelid nende galaktikate kujunemiseks aja jooksul.

Seejärel töötasite erinevates idufirmades andmeteadlasena. Millised olid huvitavamad projektid?

Üks silmapaistev projekt hõlmas loomuliku keele töötlemise (NLP) kasutamist jaemüügikaupadega seotud struktureerimata tekstide klassifitseerimiseks. Näiteks toorteksti (nt „air jordans green“) ja märgistuse võtmine hinnangulise kaubamärgina („Nike“). Mul oli NLP-le spetsialiseerunud kolleeg, kes oli hõivatud mõne teise projektiga, nii et ma ei pidanud algselt selle projekti kallal töötama. Lõpuks anti see mulle, kuna nad olid hõivatud. Ma ei teadnud tol ajal isegi NLP-st midagi, seega läbisin oma teadmiste täiendamiseks mõned tasuta kursused Stanfordist ja Fast.ai-st. Mulle meeldis väga NLP tundmaõppimine ja hakkasin mõistma, miks see nii oluline on ja miks tehisintellekti (AI) keele mõistmine on suur samm nn üldise tehisintellekti suunas. See kogemus ajendas mind kindlasti kiiresti mõistma GPT-3 tähtsust, kui see esmakordselt välja tuli.

Kas saaksite jagada Seek AI tekkelugu?

Kui OpenAI GPT-3 mudel välja tuli, mõistsin kohe, kui uskumatu edasiminek see on, ja olin eriti põnevil rakendustest, mis hõlmavad GPT-3 koodi kirjutamist. Lõppude lõpuks kirjutasin ma andmeteadlasena terve päeva koodi ja näha tehisintellekti seda tegemas – ja koodi suurepäraselt genereerimas – oli lausa piinav. Võrdleksin oma reaktsiooni GPT-3-le sellega, et sain 2013. aastal esimest korda VR-i kohta teada, mis oli minu jaoks järjekordne lõualuu tõmbav kogemus. Otsustasin, et selle tehnoloogia peale panustamiseks pean looma idufirma. Ma ei teadnud täpselt, mida ma ehitama hakkan, kuid mul oli sisetunne, et kui ma nende mudelite kohta rohkem teada saan, loksub midagi väärtuslikku paika.

Kui olin mudelitest tõeliselt teada saanud, mõistsin, et suudan lahendada valupunkti, millega kohtasin kõikjal, kus olin töötanud kvant- või andmeteadlasena. Kõnealune valupunkt oli see, et ärimeestel ei olnud õigeid tööriistu oma andmetega seotud küsimustele vastamiseks. Andmeteadlasena tegelesin sageli probleemidega, mis nõudsid palju keskendumist, kuid sageli segasid mind äripoole kolleegid, kellel oli andmete kohta küsimusi, sundides mind oma tegemiste pooleli jätma. Protsess tundus arhailine ja ebaefektiivne. Sain aru, et kui keskendun sellele uuele tehnoloogiale, mis probleemi lahendab, oleks see kategooriat määrav lahendus sellele väga olulisele ja üldlevinud probleemile.

Seek AI kasutab generatiivset AI-d. Kas saaksite meie lugejatele selgitada, mis see on?

"Generatiivne AI" on väga reklaamitud moesõna, kuid erinevalt teistest moesõnadest ei usu ma, et hüpe on põhjendamatu. See termin viitab sadade miljardite parameetritega suurtele masinõppemudelitele, näiteks avatud AI-dele DALL-E ja GPT-3. Nende mudelite uuendus seisneb selles, et nad saavad aru loomulikust keelest ja genereerivad teksti, pilte, koodi ja palju muud. Kui mängite kunagi näiteks DALL-E või Stable Diffusioniga, saate kiiresti aru, miks need mudelid on nii populaarsed; neil on uskumatult inimlik võime mõista loomuliku keele käske ja nad suudavad luua kunsti, mis konkureerib parimate inimkunstnikega.

Koodi genereerimine on generatiivse AI üks nišisemaid, kuid kõige olulisemaid rakendusi. Andmed muutuvad aina suuremaks ja keerukamaks ning seetõttu on inimestel raskem neid käsitsi analüüsida ja korraldada. Ometi on nendesse andmetesse kodeeritud nii palju teavet. See teave ei ole võimas ainult organisatsioonide jaoks, vaid võib viia ka uskumatute teaduslike läbimurdeni akadeemilise poole pealt. Tehisintellekti ehitamine andmetest väärtuse eraldamiseks avab kasuliku teabe näol uskumatu väärtuse.

Seek AI loob liidest, mis võimaldab kasutajatel andmetega suhelda loomulikus keeles. Teadmistega töötajad pääsevad juurde Seek AI loomulikule keeleliidesele e-posti, Slacki, teksti ja mitmesuguste kliendisuhete halduse (CRM) süsteemide kaudu.

Milliseid muid masinõppe tüüpe Seek AI-s kasutatakse?

Kuigi generatiivne AI on osa meie masinõppe arhitektuurist, sisaldab meie arhitektuur ka mitmeid avatud lähtekoodiga süvaõppe mudeleid. Trafomudelid (mille variant on generatiivne AI) sisaldavad paljusid (kuid mitte kõiki) mudeleid, mida Seek kasutab.

Miks on nii oluline, et mittetehnilised kasutajad saaksid andmetele kiiresti juurde pääseda?

Mis kasu on andmetest, kui need ei tooda ROI-d, ja kuidas saab ettevõte seda ROI-d saavutada, kui ettevõttega seotud kasutajad ei pääse sellele isegi juurde? Seetõttu on ülimalt oluline anda juurdepääs võimalikult paljudele inimestele, ilma et see kahjustaks täpsust.

Andmeteadlasena sain mõnikord tegevjuhilt taotlusi analüüsida andmeid, mis aitaksid meie ettevõtte toodet või turule mineku strateegiat. Need projektid võivad kesta nädalaid või kauem. Praegu tegevjuhina mõistan kindlasti nende projektide tähtsust sügavamal tasemel kui siis, kui olin andmete poolel. Taban end sageli soovimas, et saaksin andmed lihtsalt käeulatuses, et saaksin oma otsuseid kiiremini teha. See on näide sellest, mida me Seekis lahendame.

Kuidas seek AI muudab need andmed nii lihtsaks hankimiseks?

Huvitav on mõelda sellele, et andmeid saab analüüsida ainult koodi abil. On tõsi, et on platvorme, mis on selle koodi abstraktsioonid (nt andmete armatuurlauad), kuid kapoti all on andmeanalüütikute käsitsi kirjutatud kood, mis võimaldab andmeid ettevõtte lõppkasutajatele esitada.

Enamik teadmustöötajaid ei tea, kuidas kodeerida, ei taha kodeerida või lihtsalt ei pääse andmetele ligi isegi siis, kui nad tahavad nende analüüsimiseks koodi kirjutada. Seega, kui nad vajavad andmeid, peavad nad leidma need armatuurlaual või küsima andmemeeskonnalt, kui nad neid ei leia. Mida suuremaks andmekogumid muutuvad, seda rohkem seda juhtub.

Seetõttu peavad andmerühmad olema neile suunatud loomuliku keele küsimuste ja andmete enda tõlkijad, mida nad koodi abil pärivad. Selle "tõlkija" vahendaja eemaldamine on Seeki tegevuse tuum.

Kuidas tagavad ettevõtted kasutatavate andmete täpsuse?

Andmete täpsuse ja juurdepääsetavuse vahelise kompromissi haldamine on suur väljakutse. Nagu ühes hiljutises intervjuus ütlesin, ühest küljest võimaldab juurdepääsetavus vähem tehnilistel inimestel hakata suhtlema teadmiste allikaga, mis on ettevõtte andmed. Teisest küljest, milleks kasu on saastunud vee kaevuallikast (st halvad andmed)?

Parimad andmemeeskonnad on need, kes haldavad seda kompromissi võimalikult optimaalsel viisil ning suur osa sellest on kõigi tööriistade hoolikas kalibreerimine ja kontrollimine, millega mittetehnilised kasutajad saavad suhelda.

Millised on mõned näited Seek AI platvormi kasutusjuhtudest?

Pakume juba väärtust klientidele ja disainipartneritele B2B SaaS-i, Fintechi, tarbekaupade (CPG) ja B2C e-kaubanduse vertikaalturgudel.

BattlefinNäiteks on alternatiivsete finantsandmete kogumite juhtiv turg. Nad usuvad, et kiirete ja kvaliteetsete vastuste andmine oma klientide küsimustele on erinevus konkurentide võitmise ja kaotuse vahel. Ettevõtte tegevjuht Tim Harrington märkis: „Seek AI mängis meie ettevõtte 2023. aasta strateegias olulist rolli, kuna see annab meile juurdepääsu meie 2,400+ andmekogumile ja seda analüüsides vastuseks klientide küsimustele. Arvan, et meie Seek AI investeeringutasuvus on umbes 10 korda suurem, arvestades seda, kui palju oleksime kulutanud selle tõhususe saavutamiseks ilma platvormita.

Kas soovite Seek AI kohta veel midagi jagada?

See võib olla õige koht häbitu pistiku jaoks. Seek pakub praegu meie platvormi tasuta prooviversioone, millele pääseb juurde seek.ai. Meil on hea meel olla teerajaja generatiivse tehisintellekti toomisel andmemeeskondadele ja ootan põnevusega, et saaksime koos klientidega sellele teekonnale minna.

Täname suurepärase intervjuu eest, lugejad, kes soovivad rohkem teada saada, peaksid külastama Otsige AI-d.