stomp Sarah Nagy, stigter en uitvoerende hoof van Seek AI - Interview Series - Unite.AI
Verbinding met ons

onderhoude

Sarah Nagy, stigter en uitvoerende hoof van Seek AI – Interview Series

mm

Gepubliseer

 on

Sarah Nagy is die stigter en uitvoerende hoof van Soek AI, 'n platform wat sake-eindgebruikers in staat stel om te vra Soek presies dieselfde vrae as wat hulle tans aan die dataspan vra, direk in Slack, Teams en e-pos. Geen "finishing" van hoe hulle hul vraag skryf nie, en geen leer van 'n nuwe platform nie.

Jy het aanvanklik as navorser begin met data van die Hubble-ruimteteleskoop. Waaraan het jy gewerk?

Ek het navorsing by UCLA en Caltech gedoen, na sommige van die verste sterrestelsels gekyk wat met 'n teleskoop waargeneem kon word, en was besig om van hul eienskappe soos hul massa en grootte te ontleed. Die doel van hierdie navorsing was om ons te help om die verskil te verstaan ​​tussen baie verre sterrestelsels teenoor sterrestelsels wat nader aan ons eie is, en om modelle te ontwikkel vir hoe hierdie sterrestelsels oor tyd vorm.

Jy het toe as 'n data-wetenskaplike by verskeie begin-ups gewerk. Wat was van die interessanter projekte?

Een projek wat uitstaan ​​behels die gebruik van natuurlike taalverwerking (NLP) om ongestruktureerde teks wat met kleinhandelitems verband hou, te klassifiseer. Neem byvoorbeeld rou teks (bv. “air jordans green”) en etikettering as die geskatte handelsmerk (“Nike”). Ek het 'n kollega gehad wat in NLP gespesialiseer het wat besig was met 'n ander projek, so ek was eintlik nie oorspronklik veronderstel om aan hierdie een te werk nie. Dit is uiteindelik aan my oorhandig aangesien hulle besig was. Ek het destyds niks van NLP geweet nie, so ek het deur 'n paar gratis kursusse van Stanford en Fast.ai gegaan om my kennis op te skerp. Ek het dit baie geniet om oor NLP te leer en het begin verstaan ​​hoekom dit so belangrik is, en hoekom kunsmatige intelligensie (KI) om taal te kan verstaan ​​'n groot stap is in die rigting van sogenaamde "algemene KI." Hierdie ervaring het my beslis voorberei om vinnig te wees om die belangrikheid van GPT-3 te verstaan ​​toe dit die eerste keer uitgekom het.

Kan jy die ontstaansverhaal agter Seek AI deel?

Toe OpenAI se GPT-3-model uitkom, het ek dadelik besef watter ongelooflike vooruitgang dit was en het veral opgewonde geraak oor toepassings wat GPT-3-skryfkode behels. Ek het immers die hele dag kode geskryf as 'n datawetenskaplike, en om te sien dat KI dit doen - en die kode perfek genereer - was bek. Ek sou my reaksie op GPT-3 vergelyk met die eerste keer dat ek in 2013 oor VR geleer het, wat vir my nog 'n onverstoorbare ervaring was. Ek het uiteindelik besluit dat ek 'n begin moet vorm om 'n weddenskap op hierdie tegnologie te maak. Ek het nie presies geweet wat ek gaan bou nie, maar ek het 'n gevoel gehad dat as ek meer van hierdie modelle leer, iets waardevols in plek sal val.

Sodra ek regtig van die modelle geleer het, het ek besef dat ek 'n pynpunt kon oplos wat ek teëgekom het oral waar ek as 'n kwant of as 'n datawetenskaplike gewerk het. Die pynpunt ter sprake was sakelui wat nie die regte gereedskap gehad het om hul eie datavrae te beantwoord nie. As 'n datawetenskaplike het ek gereeld aan probleme gewerk wat baie fokus verg, maar ek is dikwels onderbreek deur kollegas aan die sakekant wat vrae oor die data gehad het, wat my gedwing het om op te hou waarmee ek besig was. Die proses het argaïes en ondoeltreffend gelyk. Ek het besef dat as ek op hierdie nuwe tegnologie fokus om die probleem op te los, dit 'n kategorie-definiërende oplossing vir hierdie baie belangrike en alomteenwoordige probleem sou wees.

Soek KI gebruik generatiewe KI. Kan jy aan ons lesers verduidelik wat dit is?

"Generatiewe KI" is 'n baie gehyped gonswoord, maar anders as ander gonswoorde, glo ek nie die hype is ongeregverdig nie. Die term verwys na groot masjienleermodelle met honderde miljarde parameters, soos oop KI's BLAAT en GPT-3. Die innovasie van hierdie modelle is dat hulle natuurlike taal kan verstaan ​​en teks, beelde, kode en meer kan genereer. As jy byvoorbeeld ooit met DALL-E of Stable Diffusion rondspeel, sal jy vinnig verstaan ​​hoekom hierdie modelle so ophef is; hulle het 'n ongelooflike mensagtige vermoë om natuurlike taalopdragte te verstaan ​​en kan kuns genereer wat die beste menslike kunstenaars meeding.

Kodegenerering is een van die mees nis, maar belangrikste toepassings van generatiewe KI. Data word groter en meer kompleks, en daarom moeiliker om met die hand deur mense te ontleed en te organiseer. Tog is daar soveel inligting wat in hierdie data geënkodeer is. Hierdie inligting is nie net kragtig vir organisasies nie, dit kan ook lei tot ongelooflike wetenskaplike deurbrake aan die akademiese kant. Om KI te bou om waarde uit data te onttrek, sal ongelooflike waarde ontsluit in die vorm van nuttige inligting.

Seek AI bou 'n koppelvlak wat gebruikers in staat stel om met data te kommunikeer deur natuurlike taal te gebruik. Kenniswerkers kan toegang verkry tot Seek KI se natuurlike taalkoppelvlak deur middel van e-pos, Slack, teks en 'n reeks kliënteverhoudingsbestuurstelsels (CRM).

Watter ander tipes masjienleer word by Seek AI gebruik?

Terwyl generatiewe KI 'n deel van ons masjienleer-argitektuur is, bevat ons argitektuur ook verskeie vurke van oopbron-dieplermodelle. Transformatormodelle (waarvan "generatiewe KI" 'n variant is) bestaan ​​uit baie (maar nie almal nie) van die modelle wat Seek gebruik.

Hoekom is dit so belangrik vir nie-tegniese gebruikers om vinnig toegang tot data te kry?

Wat help data as dit nie 'n ROI genereer nie, en hoe kan 'n besigheid hierdie ROI kry as gebruikers wat na die besigheid gerig is nie eers toegang daartoe het nie? Dit is hoekom dit absoluut noodsaaklik is om toegang te gee aan soveel mense as moontlik, sonder om akkuraatheid in te boet.

Toe ek 'n datawetenskaplike was, het ek soms versoeke van die HUB gekry om sommige data te ontleed om te help met ons maatskappy se produk- of gaan-na-mark-strategie. Hierdie projekte kan weke of langer duur. As 'n uitvoerende hoof nou verstaan ​​ek beslis die belangrikheid van daardie projekte op 'n dieper vlak as wat ek gedoen het toe ek aan die datakant was. Ek vind myself dikwels dat ek wens dat ek eenvoudig die data by my vingers kan kry sodat ek my besluite vinniger kan neem. Dit is 'n voorbeeld van wat ons by Seek oplos.

Hoe maak Seek AI hierdie data so maklik om te herwin?

Iets wat interessant is om oor na te dink, is dat data eintlik net met kode ontleed kan word. Dit is waar dat daar platforms is wat abstraksies oor hierdie kode is (bv. data-dashboards), maar onder die kap is daar kode wat met die hand deur data-ontleders geskryf is wat dit moontlik maak om die data aan die besigheidseindgebruikers voor te stel.

Die meeste kenniswerkers weet nie hoe om te kodeer nie, wil nie kodeer nie, of kan eenvoudig nie eers toegang tot die data kry nie, al wil hulle wel kode skryf om dit te ontleed. Daarom, wanneer hulle data benodig, moet hulle dit óf in 'n dashboard opspoor óf die dataspan vra of hulle dit nie kan vind nie. Hoe groter die datastelle word, hoe meer sal dit gebeur.

Dataspanne moet dus "vertalers" wees van natuurlike taalvrae wat aan hulle gerig word, en die data self, wat hulle met behulp van kode navraag doen. Die verwydering van hierdie “vertaler”-tussenganger is die hart van wat Seek doen.

Hoe verseker ondernemings dat die data wat hulle gebruik akkuraat is?

Die bestuur van die afweging tussen dataakkuraatheid en toeganklikheid is 'n groot uitdaging. Soos ek in 'n onlangse onderhoud gesê het, aan die een kant, laat toeganklikheid minder tegniese mense toe om te begin interaksie met die kennisbron wat 'n maatskappy se data is. Aan die ander kant, wat baat 'n fontein van besoedelde water (dws slegte data)?

Die beste dataspanne is dié wat hierdie kompromis op die mees optimale manier moontlik bestuur, en 'n groot deel daarvan is om enige gereedskap waarmee nie-tegniese gebruikers kan kommunikeer, noukeurig te kalibreer en te kontroleer.

Wat is 'n paar voorbeelde van gebruiksgevalle vir die Seek AI-platform?

Ons lewer reeds waarde aan kliënte en ontwerpvennote in die B2B SaaS, Fintech, Verbruikersprodukgoedere (CPG), en B2C e-handel vertikale markte.

Slagvin, byvoorbeeld, is die voorste mark van alternatiewe finansiële datastelle. Hulle glo dat om vinnige antwoorde van hoë gehalte op hul eie kliënte se vrae te gee, die verskil is tussen wen en verloor oor hul mededingers. Die maatskappy se uitvoerende hoof, Tim Harrington, het opgemerk: "Seek KI het 'n kritieke rol gespeel in ons maatskappy se 2023-strategie vanweë die voorsprong wat dit ons gee om toegang tot ons 2,400 10+ datastelle te verkry in antwoord op klantvrae. Ek sou skat dat ons ROI op Seek AI ongeveer XNUMXx is gegrond op wat ons sou bestee het om hierdie vlak van doeltreffendheid sonder die platform te bereik.”

Is daar enigiets anders wat jy oor Seek AI wil deel?

Dit is dalk die regte plek vir 'n skaamtelose prop. Seek bied tans gratis proeflopies van ons platform aan, waartoe toegang verkry kan word soek.ai. Ons is opgewonde om 'n pionier te wees om generatiewe KI na dataspanne te bring, en ek sien uit daarna om saam met ons kliënte op hierdie reis te gaan.

Dankie vir die puik onderhoud, lesers wat meer wil leer moet besoek aflê Soek AI.

'n Stigtersvennoot van unite.AI & 'n lid van die Forbes Tegnologieraad, Antoine is 'n futuris wat passievol is oor die toekoms van KI en robotika.

Hy is ook die stigter van Sekuriteite.io, 'n webwerf wat fokus op belegging in ontwrigtende tegnologie.