Haastattelut
Eric Landau, Encordin Co-Perustaja & CEO – Haastattelu Sarja

Eric Landau on Encordin CEO & Co-Perustaja, joka on aktiivinen oppimisalusta kone näölle. Eric oli johtava kvantitatiivinen tutkija globaalissa osake delta-yksikössä, jossa hän laittoi tuotantoon tuhansia malleja. Ennen Encordia hän vietti lähes vuosikymmenen korkean taajuisen kaupankäynnin parissa DRW: ssä. Hänellä on S.M. sovellettu fysiikka Harvardin yliopistosta, M.S. sähkötekniikkaa ja B.S. fysiikkaa Stanfordin yliopistosta.
Vapaa-ajallaan Eric nauttii ChatGPT: n ja suurten kielen mallien kanssa leikkimisestä ja craft-cocktailien valmistamisesta.
Mikä inspiroi sinua perustamaan Encord, ja miten kokemuksesi hiukkasfysiikasta ja kvantitatiivisesta rahoituksesta muovasi lähestymistapaasi ”datan ongelmaan” tekoälyssä?
Aloin ensin miettiä koneoppimista työskennellessäni hiukkasfysiikassa ja käsitellessäni erittäin suuria tietoja Stanfordin Lineaarisessa Kiihdytin keskuksessa (SLAC). Käytin ohjelmistoa, joka oli suunniteltu fyysikkojen toimesta, mikä tarkoitti sitä, että siinä oli paljon toivomista sen suhteen, miten miellyttävästi sitä voisi käyttää. Helpommin käytettävissä olevilla työkaluilla olisin voinut suorittaa analyysiä paljon nopeammin.
Myöhemmin kvantitatiivisessa rahoituksessa DRW: ssä olin vastuussa tuhansien mallien luomisesta, jotka otettiin tuotantoon. Samoin kuin fysiikan aikana, löysin, että laadukas data oli kriittinen tekijä luotaessa tarkkoja malleja, ja että monimutkaisten, suurten tietojen hallinta on vaikeaa. Ulrikilla oli samanlainen kokemus suurten kuvatietojen visualisoinnista kone näölle.
Kun kuulin hänen alkuperäisestä ideastaan Encordista, olin välittömästi mukana ja ymmärsin sen merkityksen. Yhdessä Ulrikin ja minun kanssa näimme valtavan mahdollisuuden rakentaa alusta, joka automatisoi ja suoristaisi tekoälyn datan kehitysprosessin, tehdessään siitä helpompaa tiimien saada parasta dataa malleihin ja luodaan luotettavia tekoälyjärjestelmiä.
Voi luonnehtia tarkemmin Encordin visiota ja miten se vertautuu tietokoneen tai internetin varhaisiin päiviin potentiaalin ja haasteiden suhteen?
Encordin visio on olla perusrakenteinen alusta, johon yritykset luottavat muuttaakseen datansa toimiviksi tekoälymalliksi. Olemme kerros yrityksen datan ja heidän tekoälynsä välillä.
Monilla tavoin tekoäly heijastaa aiempia paradigmamuutoksia, kuten henkilökohtaista tietokonetta ja internetiä, jotka tulevat olemaan olennainen osa työvirtoja jokaiselle yksilölle, liiketoiminnalle, valtiolle ja teollisuudelle. Toisin kuin aiemmat teknologiset vallankumoukset, jotka ovat olleet pääosin pullonkaulana Mooren laki yhdistetyn laskennallisen kasvun 30-kertaista joka 10 vuotta, tekoälyn kehitys on hyötynyt samanaikaisista innovaatioista. Se etenee siten paljon nopeammin. NVIDIA: n Jensen Huangin sanoissa: ”Ensimmäistä kertaa näemme yhdistettyjä eksponenttejä… Me yhdistämme miljoonan kertaa joka kymmenen vuoden ajan. Ei sata kertaa, ei tuhat kertaa, vaan miljoona kertaa.” Ilman liioittelua olemme todistamassa nopeimmin liikkuvaa teknologiaa ihmisen historiassa.
Potentiaali tässä on valtava: automatisoimalla ja skaalauttamalla laadukkaiden datan hallintaa tekoälylle, olemme ratkaisemassa pullonkaulaa, joka estää laajempaa tekoälyn omaksumista. Haasteet muistuttavat varhaispäivien esteitä aiemmissa teknologisissa aikakausissa: siloja, parhaiden käytäntöjen puutetta, rajoituksia ei-tekniikan käyttäjille ja puutetta hyvin määritellyistä abstraktioista.
Encord Index on asetettu avain työkaluksi tekoälyn datan hallintaan ja kuratointiin. Miten se erottuu muista saatavilla olevista datan hallinta-alustoista?
On muutamia tapoja, joilla Encord Index erottuu:
Index on skaalautuva: Sallii käyttäjien hallita miljardeja, ei miljoonia, datakohtia. Muut työkalut kohtaavat skaalautuvuuden ongelmat rakenteettomalle datalle ja ovat rajoitettuja konsolidoimalla kaikki asiaankuuluvat tiedot organisaatiossa.
Index on joustava: Integroi suoraan yksityisen data tallennuksen ja pilvitallennuspalveluiden kanssa, kuten AWS, GCP ja Azure. Toisin kuin muut työkalut, jotka ovat rajoitettuja yhteen pilvipalveluntarjoajaan tai sisäiseen tallennusjärjestelmään, Index on agnostinen siitä, missä data sijaitsee. Se antaa sinun hallita dataa useista lähteistä asianmukaisilla hallinnollisilla ja pääsyoikeuksilla, jotka mahdollistavat turvallisten ja mukautuvien tekoälysovellusten kehittämisen.
Index on monitieteinen: Tukee monitieteistä tekoälyä, hallitsemalla dataa muodossa, kuten kuvat, videot, ääni, teksti, asiakirjat ja enemmän. Index ei ole rajoitettu yhteen tietomuotoon, kuten monet LLM-työkalut tänään. Inhimillinen kognitio on monitieteinen, ja uskomme, että monitieteinen tekoäly on sydämessä seuraavan aallon tekoäly-edistys, joka korvaa chatbotit ja LLM: t.
Miten Encord Index parantaa prosessia oikean datan valinnassa tekoälymallien kanssa, ja mikä on tämän vaikutus mallin suorituskykyyn?
Encord Index parantaa datan valintaa automatisoimalla suurten tietojoukkojen kuratointia, auttaen tiimejä tunnistamaan ja säilyttämään vain tärkeimmän datan ja poistamaan tietämättömän tai vinoutuneen datan. Tämä prosessi ei ainoastaan vähennä tietojoukkojen kokoa, vaan parantaa myös merkittävästi datan laatua, jota käytetään tekoälymallien koulutukseen. Asiakkaidemme on havaittu parantuneen jopa 20 %: n mallin suorituskyvyssä saavutettaessa 35 %: n vähennys tietojoukon koossa ja säästettyä satoja tuhansia dollareita laskennan ja ihmisen annotaatiokustannuksissa.
Miten Encord pysyy edellä nopeasti kehittyvällä tekoälymaisemalla, kuten Meta:n Segment Anything Modelin kaltaisten älykkäiden teknologioiden nopealla integroinnilla?
Rakensimme tarkoituksella alustan, joka pystyy sopeutumaan nopeasti uusiin teknologioihin. Keskitymme tarjoamaan skaalautuvan, ohjelmisto-ensin -lähestymistavan, joka ottaa helposti sisään edistysten kaltaisia SAM, varmistaen, että käyttäjämme ovat aina varustettu viimeisimmillä työkaluilla pysyäkseen kilpailukykyisinä.
Aiomme pysyä edellä keskittymällä monitieteiseen tekoälyyn. Encordin alusta pystyy jo hallitsemaan monimutkaisia tietotyyppejä, kuten kuvia, videoita ja tekstiä, joten kun enemmän edistystä monitieteisessä tekoälyssä tulee tiemme, olemme valmiit.
Mitkä ovat yleisimpiä haasteita, joita yritykset kohtaavat tekoälyn datan hallinnassa, ja miten Encord auttaa ratkaisemaan nämä?
On kolme pääasiallista haastetta, joita yritykset kohtaavat:
- Huono datajärjestelmä ja -ohjaus: Kun yritykset valmistautuvat toteuttamaan tekoälyratkaisuja, he usein kohtaavat todellisuuden, jossa data on siloitu ja järjestämätöntä eikä se ole valmis tekoälylle. Tässä datassa on usein puutteellinen hallinto, joka rajoittaa suurta osaa siitä käytettäväksi tekoälyjärjestelmissä.
- Puute ihmisen asiantuntijoista: Kun tekoälymallit ratkaisevat yhä monimutkaisempia ongelmia, niitä ei voida pian käsitellä ihmisen toimesta. Kun yrityksen tekoälyn vaatimukset kasvavat, on haastavaa ja kallista skaalata ihmisen työvoimaa.
- Laajennettavuuden puute: Suorituskykyiset tekoälymallit ovat erittäin tietohungryja datan suhteen, jota tarvitaan hienosäätöä, validointia, RAG: ia ja muita työvirtoja varten. Edellinen sukupolvi työkaluja ei ole varustettu hallitsemaan datan määrää ja tietotyyppejä, joita nykyisten tuotantokelpoisten mallien vaatimukset edellyttävät.
Encord ratkaisee nämä ongelmat automatisoimalla datan kuratointiprosessin suuressa mittakaavassa, tehdessään helpoksi tiimien tunnistaa vaikuttavat data ja erottaa ongelmallinen data ja varmistaa tehokkaiden koulutus- ja validointitietojoukkojen luominen. Se käyttää ohjelmisto-ensin -lähestymistapaa, joka on helppo skaalata ylös tai alas, kun datan hallintatarpeet muuttuvat. Meidän tekoälyavusteiset annotaatiotyökalumme mahdollistavat ihmisen osallistumisen tehokkaasti tiimien työvirtoihin. Tämä prosessi on erityisen tärkeä aloilla, kuten rahoituspalveluissa ja terveydenhuollossa, joissa tekoälykouluttajat ovat kalliita. Me teemme helpoksi hallita ja ymmärtää kaikkia organisaation rakenteettomia tietoja, vähentäen manuaalisen työn tarvetta.
Miten Encord ratkaisee datan vinoutumisen ongelman ja aliedustettujen alueiden sisällä tietojoukoissa, jotta voidaan varmistaa reilut ja tasapuoliset tekoälymallit?
Datan vinoutumisen ratkaiseminen on meille Encordissa kriittinen asia. Meidän alustamme tunnistaa automaattisesti ja tuo esiin alueet, joissa data voi olla vinoutunut, jotta tekoälytiimit voivat ratkaista nämä ongelmat ennen kuin ne vaikuttavat mallin suorituskykyyn. Me myös varmistamme, että aliedustetut alueet tietojoukoissa sisällytetään oikein, mikä auttaa kehittämään reilumpia ja tasapuolisempia tekoälymalleja. Käyttämällä meidän kuratointityökaluja tiimit voivat olla varmoja, että heidän mallinsa on koulutettu monipuolisilla ja edustavilla tiedoilla.
Encord on vastikään saanut 30 miljoonan dollarin Series B -rahoitusta. Miten tämä rahoitus kiihdyttää tuotekehitys- ja laajentamissuunnitelmianne?
30 miljoonan dollarin Series B -rahoitus käytetään radikaalisti kasvattamaan tuote-, insinööri- ja tekoälytutkimustiimien kokoa seuraavien kuuden kuukauden aikana ja kiihdyttämään Encord Indexin ja muiden uusien ominaisuuksien kehitystä. Laajennamme myös toimintaamme San Franciscoon uudella toimistolla, ja tämä rahoitus auttaa meitä skaalautumaan toimintaa tukeaksemme kasvavaa asiakaskuntaamme.
Kun olet nuorin tekoälyyritys Y Combinatorilta, joka on kerännyt Series B -rahoitusta, mitä ominaisuuksia Encordin nopeaan kasvuun ja menestykseen?
Yksi syy, miksi olemme pystyneet kasvamaan nopeasti, on se, että olemme omaksuneet äärimmäisen asiakaslähtöisen fokuskaavan koko yrityksessä. Olemme jatkuvasti vuorovaikutuksessa asiakkaiden kanssa, kuuntelemme heidän ongelmiaan tarkkaan ja ”bear hug” heidät ratkaisuihin. Keskittymällä asiakkaiden tarpeisiin eikä hypeen, olemme luoneet alustan, joka resonoi parhaiden tekoälytiimien kanssa eri aloilla. Asiakkaamme ovat olleet instrumentalisia saadaksemme meidät siihen, missä olemme tänään.
Me velkaamme myös suuren osan menestyksestämme tiimiläisille, kumppaneille ja sijoittajille, jotka ovat kaikki työskennelleet ahkerasti Encordin edistämiseksi. Työskenteleminen maailmanluokan tuote-, insinööri- ja markkinointitiimien kanssa on ollut valtavan vaikuttavaa kasvuumme.
Miten näet tekoälyn datan alustojen, kuten Encordin, roolin kehittyvän seuraavien viiden vuoden aikana, kun datasta tulee yhä tärkeämpää tekoälylle?
Kun tekoälysovellukset kasvavat monimutkaisuudessa, tarve tehokkaille ja skaalautuville datan hallintaratkaisuille kasvaa vain. Uskon, että jokaisella yrityksellä on lopulta tekoälyosasto, samoin kuin IT-osastot nykyään. Encord on ainoa alusta, jota he tarvitsevat hallinnoimaan valtavia määriä dataa, joita tekoäly vaatii, ja saamaan mallit nopeasti tuotantoon.
Kiitos haastattelusta, lukijat, jotka haluavat oppia lisää, kannattaa vierailla Encord: ssä.












