Haastattelut
Etan Ginsberg, Martianin Co-Founder – Haastattelusarja

Etan Ginsberg on Martianin Co-Founder, joka on alusta, joka reitittää dynaamisesti jokaisen kehotteen parhaaseen LLM:ään. Reitittämisen kautta Martian saavuttaa korkeamman suorituskyvyn ja alhaisemman kustannuksen kuin yksikin yksittäinen tarjoaja, mukaan lukien GPT-4. Järjestelmä on rakennettu yhtiön ainutlaatuisen Model Mapping -teknologian varaan, joka purkaa LLM:t monimutkaisista mustista laatikoista tulkittavampaan arkkitehtuuriin, mikä tekee siitä ensimmäisen kaupallisen sovelluksen mekaanisesta tulkittavuudesta.
Etan on koodannut, suunnitellut verkkosivuja ja rakentanut asiakkaiden verkkoliiketoimintaa jo keskiasteelta lähtien. Monitaituri Etan on Maailman Muisti mestaruuskilpailujen kilpailija ja sijoittui toiseksi Maailman Nopein Lukemisen mestaruuskilpailuissa Shenzhenissä, Kiinassa.
Hän on vid hackathon -kilpailija. Aikaisemmat palkinnot ovat olleet 3. palkinto Tech Crunch SZ: ssä, 7 parhaan finalistin joukossa Princeton Hackathonissa ja 3 teollisuuspalkintoa Yale Hackathonissa.
Olet aiemmin kaksinkertainen startup -perustaja, mitkä nämä yritykset olivat ja mitä opit tästä kokemuksesta?
Ensimmäinen yritykseni oli ensimmäinen alusta American Ninja Warrior -urheilun edistämiseksi ja kehittämiseksi. Vuonna 2012 näin American Ninja Warriorin underground-urheiluna (samankaltaisena kuin MMA 1990-luvulla) ja tein ensimmäisen alustan, jossa ihmiset voivat ostaa piirustuksia, tilata esteitä ja löytää saleja harjoittelemaan. Konsultoin yrityksiä, jotka halusivat aloittaa oman salin, mukaan lukien Yhdysvaltain erikoisjoukkojen koulutuskurssin ja laajentamalla tilaa muistikirjasta 300 000 dollarin liikevaihtoon ensimmäisen 3 kuukauden aikana. Vaikka olin high schoolissa, minulla oli ensimmäinen kokemukseni joukkueiden johtamisesta yli 20 työntekijän kanssa ja opin tehokkaasta johtamisesta ja vuorovaikutussuhteista.
Toinen yritykseni oli vaihtoehtoinen sijoitusrahasto, jonka perustin vuonna 2017 ennen ICO-aaltoa kryptossa. Tämä oli ensimmäinen altani NLP:hen, jossa käytimme sosiaalisen median tietojen mielipidemittausta sijoitusratkaisuna.
Opin paljon kovia ja pehmeitä taitoja, jotka kuuluvat startupin pyörittämiseen – joukkueen johtamisesta NLP:n teknisiin näkökohtiin. Samalla opin myös paljon itsestäni ja siitä, mihin halusin työskennellä. Uskon, että menestyneimmät yritykset perustetaan perustajilla, joilla on laajempi visio tai tavoite, joka ajaa heitä. Lähdin kryptosta vuonna 2017 keskittyäkseni NLP:hen, koska inhimillisen älymystön täydentäminen ja ymmärtäminen on asia, joka todella motivoi minua. Olin iloinen, kun löysin sen.
Kun kävit Pennsylvanian yliopistossa, teit joitain AI-tutkimuksia, mitä tutkimuksia teit tarkalleen?
Tutkimuksemme keskittyi alun perin LLM-sovellusten rakentamiseen. Erityisesti työskentelimme LLM:n koulutussovelluksiin ja rakensimme ensimmäisen LLM-pohjaisen kognitiivisen opettajan. Tulokset olivat melko hyviä – näimme 0,3 standardipoikkeaman parantumisen oppimistuloksissa alkuvaiheen kokeilussa – ja järjestelmämme on käytetty Pennsylvanian yliopistosta Bhutanin yliopistoon.
Voitko keskustella siitä, miten tämä tutkimus johti sinut Martianin Co-Perustajaksi?
Koska olimme yksi ensimmäisistä ihmisistä, jotka rakensivat sovelluksia LLM:ien päälle, olimme myös yksi ensimmäisistä ihmisistä, jotka kohtasivat ongelmia, joita ihmiset kohtaavat, kun he rakentavat sovelluksia LLM:ien päälle. Se ohjasi tutkimustamme infrastruktuuritasolle. Esimerkiksi hyvin varhain meitä kiinnostivat pienempien mallien hienosäätö suurempien mallien tuloksilla, kuten GPT-3, ja mallien hienosäätö erikoistuneilla tietolähteillä tehtävien, kuten ohjelmoinnin ja matematiikan ongelmanratkaisun, osalta. Se lopulta johti meidät ongelmiin mallin käyttäytymisen ja mallin reitittämisen ympärillä.
Martianin nimen alkuperä ja sen suhde älymystön kanssa on myös mielenkiintoinen, voitko kertoa tarinan siitä, miten tämä nimi valittiin?
Yhtiömme on nimetty ryhmän mukaan unkarilaista-amerikkalaisia tutkijoita, jotka tunnetaan nimellä “The Martians“. Tämä ryhmä, joka eli 1900-luvulla, koostui joistakin historian älykkäimmistä ihmisistä:
- Tunnetuin heistä oli John Von Neumann; hän keksi peliteorian, modernin tietokoneen arkkitehtuurin, automaattisen teorian ja teki perustavanlaatuisia töitä kymmenissä muissa aloissa.
- Paul Erdos oli kaikkien aikojen tuotteliain matemaatikko, joka julkaisi yli 1500 tutkimusta.
- Theodore Von Karman perusti aerodynaamisen teorian ja auttoi perustamaan American avaruusohjelman. Ihmisen määrittelemä raja Maan ja avaruuden välillä on nimetty “Karman-linjaksi” hänen työnsä kunniaksi.
- Leo Szilard keksi atomipommin, sädehoidon ja hiukkaskiihdyttimet.
Nämä tutkijat ja 14 muuta heidän kaltaistaan (mukaan lukien vetypommin keksijä, modernin fysiikan ryhmäteorian esittäjä ja perustavat avustajat aloilla, kuten kombinatoriikka, lukuteoria, numeerinen analyysi ja todennäköisyysteoria) jakoivat hämmästyttävän samankaltaisuuden – he kaikki syntyivät samassa osassa Budapestissa. Se sai ihmiset kyseenalaistamaan: mikä oli niin suuren älymystön lähde?
Vastauksena Szilard vitsaili, että “Marssilaiset ovat jo täällä, ja he kutsuvat itseään unkarilaisiksi!” Todellisuudessa… kukaan ei tiedä.
Ihmiset löytävät itsensä samassa tilanteessa tänään uuden joukon potentiaalisesti yliälymystön älykkyyden kanssa: Tekoäly. Ihmiset tietävät, että mallit voivat olla älykkäitä, mutta heillä ei ole aavistustakaan, miten ne toimivat.
Meidän tehtävämme on vastata siihen kysymykseen – ymmärtää ja hyödyntää modernia yliälymystöä.
Sinulla on historia uskomattomista muistisaavutuksista, miten päädyit näihin muistihäiriöihin ja miten tämä tietämys auttoi sinua Martianin käsitteessä?
Useimmissa urheilulajeissa ammattilaisurheilija voi suorittaa noin 2-3 kertaa paremmin kuin keskivertourheilija (vertaa, kuinka pitkälle keskivertourheilija voi potkaista kenttämaalia tai kuinka nopeasti he heittävät nopean pallon ammattilaisurheilijaan verrattuna). Muistipelit ovat mielenkiintoisia, koska parhaimmat urheilijat voivat muistaa 100-kertaa tai jopa 1000-kertaa enemmän kuin keskivertourheilija vähemmällä harjoittelulla kuin useimmissa urheilulajeissa. Lisäksi nämä ovat usein ihmisiä, joilla on keskivertaiset luontaiset muisti, jotka kiittävät suorituksiaan tiettyjen tekniikoiden opettelusta, joita kuka tahansa voi opetella. Haluan maksimoida ihmiskunnan tietämyksen, ja näin maailman muistinmestaruuskilpailut ymmärryksenä siitä, miten voimme tuottaa poikkeuksellisia tuloksia lisäämällä inhimillistä älymystöä.
Halusin ottaa muistitekniikat koko koulutusjärjestelmään, joten aloin tutkia, miten NLP ja LLM:t voivat auttaa vähentämään asetuskustannuksia, jotka estävät useimmat tehokkaat koulutusmenetelmät pääsemästä valtavirtakoulutukseen. Yash ja minä loimme ensimmäisen LLM-pohjaisen kognitiivisen opettajan, ja se johti meidät LLM-käyttöön liittyviin ongelmiin, joita ratkaistaan tänään.
Martian on käytännössä abstrahoi kehotteen parhaan Large Language Model (LLM) -päätöksen, miksi tämä on tällä hetkellä kehittäjille niin suuri päänvaiva?
On tullut helpommaksi luoda kielimalleja – laskennan kustannukset laskevat, algoritmit ovat tehokkaampia ja enemmän avoimia työkaluja on saatavilla näiden mallien luomiseen. Tämän seurauksena enemmän yrityksiä ja kehittäjiä luo mukautettuja malleja, jotka on koulutettu mukautettuihin tietoihin. Koska näillä malleilla on erilaiset kustannukset ja ominaisuudet, voit saada paremman suorituskyvyn käyttämällä useita malleja, mutta on vaikea testata niitä kaikkia ja löytää oikeat mallit käyttää. Me huolehdimme siitä kehittäjien puolesta.
Voitko keskustella siitä, miten järjestelmä ymmärtää, mikä LLM on parasta käytettäväksi kussakin tiettyyn tehtävään?
Reitittäminen on perustavanlaatuisesti ongelma mallien ymmärtämisestä. Reitittääksesi mallien välillä tehokkaasti haluat ymmärtää, mitä aiheuttaa niiden epäonnistumisen tai onnistumisen. Model-mappingin avulla voimme määrittää, miten hyvin kunkin mallin suorituskyky toimii pyynnössä ilman, että tarvitsee ajaa kyseistä mallia. Tämän seurauksena voimme lähettää pyynnön malliin, joka tuottaa parhaimman tuloksen.
Voitko keskustella siitä, mitä kustannussäästöjä voidaan nähdä LLM:n optimoinnista?
Sallimme käyttäjien määritellä, miten he tasapainottavat kustannuksia ja suorituskykyä. Jos huolehdit vain suorituskyvystä, voimme ylittää GPT-4:n suorituskyvyn openai/evalsissa. Jos etsit tiettyä kustannusta, jotta voit tehdä yksikkötaloudellisen toimintatapasi toimivaksi, voimme antaa sinun määritellä maksimikustannuksen pyynnölle, sitten löytää parhaimman mallin suorittamaan pyynnön. Ja jos haluat jotain dynaamisempaa, voimme antaa sinun määritellä, kuinka paljon olet valmis maksamaan paremmasta vastauksesta – siten, että jos kaksi mallia ovat samanlaisia suorituskyvyltään, mutta suurella eroolla kustannuksissa, voimme antaa sinun käyttää vähemmän kallista mallia. Jotkut asiakkaistamme ovat nähneet jopa 12-kertaisen laskun kustannuksissa.
Mikä on visiosi Martianin tulevaisuudesta?
Jokainen kerta, kun parannamme perustavanlaatuisen ymmärryksen malleista, se johtaa paradigmamuutokseen tekoälyssä. Hienosäätö oli paradigmaksi, joka perustui tulosten ymmärtämiseen. Ohjaus on paradigmaksi, joka perustuu syötteiden ymmärtämiseen. Se yksinkertainen ero ymmärryksessämme malleista on suurin osa eroa perinteisen ML:n (“rakennetaan regressori”) ja modernin generatiivisen AI:n (“ohjataan vauvaa AGI:a”) välillä.
Tavoitteemme on toimittaa jatkuvasti läpimurtoja tulkittavuudessa, kunnes tekoäly on täysin ymmärrettävissä ja meillä on yhtä vankka teoria älystä kuin logiikan tai laskennan teoriasta.
Se tarkoittaa rakentamista. Se tarkoittaa upean AI-työkalujen luomista ja asettamista ihmisten käsiin. Se tarkoittaa julkaisemista asioita, jotka rikkovat muotia, joita kukaan ei ole aiemmin tehnyt, ja jotka – ennen kaikkea – ovat mielenkiintoisia ja hyödyllisiä.
Sir Francis Baconin sanoissa “Tieto on valta”. Vastaaavasti, paras tapa varmistaa, että ymmärrämme tekoälyä, on julkaisemalla voimakkaita työkaluja. Meidän mielestämme mallin reititin on sellainen työkalu. Olemme innoissamme rakentamaan sen, kasvattamaan sitä ja asettamaan sen ihmisten käsiin.
Tämä on vain yksi monista työkaluista, jotka julkaisemme tulevina kuukausina. Löytääksesi kauniin teorian tekoälystä, mahdollistaaksesi täysin uusia työkaluja tekoälyinfrastruktuurissa, auttaaksesi rakentamaan kirkkaamman tulevaisuuden sekä ihmisille että koneille – emme voi odottaa jakaa näitä työkaluja kanssanne.
Kiitos haastattelusta, lukijat, jotka haluavat oppia lisää, kannattaa vierailla Martian-sivustolla.












