Connect with us

Etan Ginsberg, Co-Fondator al Martian – Seria de Interviuri

Interviuri

Etan Ginsberg, Co-Fondator al Martian – Seria de Interviuri

mm

Etan Ginsberg este Co-Fondator al Martian, o platformă care direcționează dinamic fiecare prompt către cel mai bun LLM. Prin direcționare, Martian obține o performanță mai ridicată și un cost mai scăzut decât orice furnizor individual, inclusiv GPT-4. Sistemul este construit pe tehnologia unică de cartografiere a modelului companiei, care desface LLM-urile din cutii negre complexe într-o arhitectură mai interpretabilă, făcând-o prima aplicație comercială a interpretabilității mecanistice.

Etan a codat, a proiectat site-uri web și a construit afaceri electronice pentru clienți de când era la școala generală. Un polimat, Etan este un concurent la Campionatul Mondial de Memorare și s-a clasat pe locul 2 la Campionatul Mondial de Citire Rapidă de la Shenzhen, China.

El este un competitor la hackathon-uri video. Premii anterioare includ locul 3 la Tech Crunch SZ, finalist în top 7 la Hackathonul Princeton și 3 premii industriale la Hackathonul Yale.

Sunteți un fost fondator de două ori de startup, care au fost aceste companii și ce ați învățat din această experiență?

Prima mea companie a fost prima platformă pentru promovarea și avansarea sportului American Ninja Warrior. În 2012, am văzut American Ninja Warrior ca un sport subteran (similar cu MMA în anii ’90) și am creat prima platformă unde oamenii puteau cumpăra planuri, comanda obstacole și găsi săli de antrenament. Am consultat companii care doreau să-și deschidă propriile săli, inclusiv să asist companiile Forțelor Speciale ale SUA cu un curs de antrenament și să scalez o facilitate de la schiță la 300.000 de dolari venituri în primele 3 luni. Deși eram în liceu, am avut prima mea experiență de management al unor echipe de peste 20 de lucrători și am învățat despre managementul eficient și relațiile interpersonale.

A doua mea companie a fost o companie de gestionare a activelor alternative pe care am co-fondat-o în 2017, înainte de valul ICO în crypto. Acesta a fost primul meu contact cu NLP, unde am folosit analiza sentimentului datelor de social media ca strategie de investiții.

Am învățat multe dintre abilitățile grele și moi care intră în gestionarea unui startup – de la cum să gestionezi o echipă la aspectele tehnice ale NLP. În același timp, am învățat și multe despre mine și despre ce voiam să lucrez. Cred că cele mai de succes companii sunt fondate de fondatori care au o viziune mai largă sau un obiectiv care îi împinge. Am părăsit crypto în 2017 pentru a mă concentra pe NLP, deoarece îmbunătățirea și înțelegerea inteligenței umane este ceva care mă motivează cu adevărat. Am fost bucuros să descopăr asta.

În timp ce frecventați Universitatea din Pennsylvania, ați făcut o cercetare legată de IA, ce anume ați cercetat?

Cercetarea noastră s-a axat inițial pe construirea de aplicații pentru LLM-urile. În special, am lucrat la aplicații educaționale ale LLM-urilor și am construit primul tutor cognitiv LLM-powder. Rezultatele au fost destul de bune – am văzut o îmbunătățire cu 0,3 deviații standard a rezultatelor elevilor în experimentarea inițială – și sistemul nostru a fost utilizat de la Universitatea din Pennsylvania la Universitatea din Bhutan.

Puteți discuta cum această cercetare v-a condus la co-fondarea Martian?

Deoarece am fost printre primii oameni care au construit aplicații pe baza LLM-urilor, am fost și printre primii oameni care au întâmpinat problemele cu care se confruntă oamenii atunci când construiesc aplicații pe baza LLM-urilor. Acest lucru ne-a îndreptat cercetarea spre stratul de infrastructură. De exemplu, foarte devreme, am făcut fine-tuning pe modele mai mici pe ieșirile unor modele mai mari, cum ar fi GPT-3, și am făcut fine-tuning pe modele specializate pentru sarcini cum ar fi programarea și rezolvarea problemelor de matematică. Acest lucru ne-a condus în cele din urmă la probleme legate de înțelegerea comportamentului modelului și de direcționarea modelului.

Originea numelui Martian și relația sa cu inteligența este, de asemenea, interesantă, puteți împărtăși povestea alegerii acestui nume?

Compania noastră a fost numită după un grup de oameni de știință unguro-americani cunoscuți sub numele de “The Martians“. Acest grup, care a trăit în secolul al XX-lea, a fost format din unele dintre cele mai inteligente persoane care au trăit vreodată:

  • Cel mai faimos dintre ei a fost John Von Neumann; el a inventat teoria jocurilor, arhitectura calculatorului modern, teoria automatelor și a făcut contribuții fundamentale în zeci de alte domenii.
  • Paul Erdos a fost cel mai prolific matematician din toate timpurile, publicând peste 1500 de articole.
  • Theodore Von Karman a stabilit teoriile fundamentale ale aerodinamicii și a ajutat la fondarea programului spațial american. Limita definită de oameni între Pământ și spațiul exterior este numită “linia Kármán” în onoarea lucrării sale.
  • Leo Szilard a inventat bomba atomică, terapia cu radiații și acceleratoarele de particule.

Acești oameni de știință și alți 14 ca ei (inclusiv inventatorul bombei cu hidrogen, omul care a introdus teoria grupurilor în fizica modernă și contribuitori fundamentali în domenii cum ar fi combinatorica, teoria numerelor, analiza numerică și teoria probabilităților) au împărtășit o asemănare remarcabilă – toți s-au născut în aceeași parte a Budapestei. Acest lucru a determinat oamenii să se întrebe: ce a fost sursa atâta inteligență?

Ca răspuns, Szilard a glumit că, “Martienii sunt deja aici, și se numesc pe ei înșiși unguri!” În realitate… nimeni nu știe.

Omenirea se află într-o poziție similară astăzi, cu privire la o nouă serie de minți potențial superintelligente: Inteligența Artificială. Oamenii știu că modelele pot fi incredibil de inteligente, dar nu au nici o idee cum funcționează.

Misiunea noastră este să răspundă la această întrebare – să înțelegem și să valorificăm superinteligența modernă.

Aveți o istorie de realizări memoriale incredibile, cum ați fost atras în aceste provocări de memorie și cum v-a ajutat această cunoaștere la conceptul de Martian?

În majoritatea sporturilor, un atlet profesionist poate performa de aproximativ 2-3 ori mai bine decât o persoană medie (comparați cât de departe poate lovi un gol o persoană medie sau cât de repede aruncă o minge un profesionist față de un amator). Sporturile de memorie sunt fascinante pentru că cei mai buni atleți pot memora de 100 de ori sau chiar 1000 de ori mai mult decât o persoană medie, cu mai puțin antrenament decât majoritatea sporturilor. Mai mult, aceștia sunt adesea oameni cu o memorie naturală medie, care atribuie performanța lor unor tehnici specifice pe care oricine le poate învăța. Vreau să maximizez cunoașterea umană și am văzut campionatul mondial de memorie ca o perspectivă subapreciată asupra modului în care putem obține randamente extraordinare prin creșterea inteligenței umane.

Am vrut să implementez tehnici de memorare în întregul sistem de învățământ, așa că am început să explorez cum NLP și LLM-urile pot ajuta la reducerea costurilor de configurare care împiedică majoritatea metodelor educaționale eficiente să fie utilizate în sistemul de învățământ mainstream. Yash și cu mine am creat primul tutor cognitiv LLM-powder și acest lucru ne-a condus la descoperirea problemelor cu implementarea LLM-urilor pe care le rezolvăm astăzi.

Martian abstractizează în esență decizia cu privire la ce Model de Limbaj Mare (LLM) să se utilizeze, de ce este acesta în prezent un punct dureros pentru dezvoltatori?

Devine din ce în ce mai ușor să se creeze modele de limbaj – costul calculului scade, algoritmii devin mai eficienți și mai multe unelte cu sursă deschisă sunt disponibile pentru a crea aceste modele. Ca urmare, mai multe companii și dezvoltatori creează modele personalizate antrenate pe date personalizate. Deoarece aceste modele au costuri și capacități diferite, puteți obține o performanță mai bună utilizând mai multe modele, dar este dificil să le testați pe toate și să găsiți cele potrivite pentru a le utiliza. Noi ne ocupăm de asta pentru dezvoltatori.

Puteți discuta cum sistemul înțelege care LLM este cel mai bine utilizat pentru fiecare sarcină specifică?

Direcționarea eficientă este fundamental o problemă de înțelegere a modelelor. Pentru a direcționa eficient între modele, doriți să puteți înțelege ce cauzează eșecul sau succesul lor. A fi capabil să înțelegeți aceste caracteristici cu cartografierea modelului ne permite să determinăm cât de bine va performa orice model dat pe o solicitare fără a fi nevoie să ruleze acel model. Ca urmare, putem trimite acea solicitare la modelul care va produce cel mai bun rezultat.

Puteți discuta despre tipul de economii de cost care pot fi văzute prin optimizarea LLM-ului utilizat?

Ne permitem utilizatorilor să specifice cum echilibrează costul și performanța. Dacă vă interesează doar performanța, putem depăși GPT-4 pe openai/evals. Dacă căutați un anumit cost pentru a face ca economia dvs. să funcționeze, vă permitem să specificați costul maxim pentru solicitarea dvs., apoi găsim cel mai bun model pentru a completa acea solicitare. Și dacă doriți ceva mai dinamic, vă permitem să specificați cât sunteți dispus să plătiți pentru un răspuns mai bun – astfel, dacă două modele au performanțe similare, dar o mare diferență de cost, putem să vă permitem să utilizați modelele mai ieftine. Unii dintre clienții noștri au văzut o scădere de până la 12 ori a costurilor.

Care este viziunea dvs. pentru viitorul Martian?

De fiecare dată când îmbunătățim înțelegerea noastră fundamentală a modelelor, acest lucru duce la o schimbare de paradigmă pentru IA. Fine-tuningul a fost paradigma condusă de înțelegerea ieșirilor. Promptingul este paradigma condusă de înțelegerea intrărilor. Acea singură diferență în înțelegerea noastră a modelelor este mult din ceea ce diferențiază ML-ul tradițional (“să construim un regresor”) și IA generativă modernă (“să promptăm un baby AGI”).

Scopul nostru este să livrăm în mod constant descoperiri în interpretabilitate până când IA va fi pe deplin înțeleasă și vom avea o teorie a inteligenței la fel de robustă ca teoriile noastre de logică sau calcul.

Acest lucru înseamnă pentru noi construirea. Înseamnă crearea unor unelte AI fantastice și introducerea lor în mâinile oamenilor. Înseamnă lansarea unor lucruri care sparg tiparele, care nimeni nu a făcut înainte și care – mai mult decât orice altceva – sunt interesante și utile.

În cuvintele lui Sir Francis Bacon, “Cunoașterea este putere”. Prin urmare, cel mai bun mod de a fi siguri că înțelegem IA este să lansăm unelte puternice. În opinia noastră, un router de modele este un instrument de acest fel. Suntem încântați să-l construim, să-l creștem și să-l punem în mâinile oamenilor.

Acesta este primul dintre multe unelte pe care le vom lansa în următoarele luni. Pentru a descoperi o frumoasă teorie a inteligenței artificiale, pentru a permite infrastructuri de IA complet noi, pentru a ajuta la construirea unui viitor mai strălucit pentru om și mașină – nu putem aștepta să împărtășim aceste unelte cu dvs.

Mulțumim pentru acest interviu minunat, cititorii care doresc să afle mai multe ar trebui să viziteze Martian.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.