stub Lin Qiao, fejerverkų AI generalinis direktorius ir vienas iš įkūrėjų – interviu serija – Unite.AI
Susisiekti su mumis

Interviu

Lin Qiao, „Fireworks AI“ interviu serijos generalinis direktorius ir vienas iš įkūrėjų

mm

paskelbta

 on

Lin Qiao, anksčiau buvo „Meta's PyTorch“ vadovas ir yra „Fireworks AI“ įkūrėjas ir generalinis direktorius. Fejerverkų AI yra gamybinė AI platforma, sukurta kūrėjams, fejerverkų partneriams su pirmaujančiais pasaulyje generuojančiais dirbtinio intelekto tyrėjais, kad jie galėtų aptarnauti geriausius modelius ir didžiausiu greičiu. Fejerverkų AI neseniai iškėlė a 25 mln. USD A serija.

Mano tėtis buvo labai vyresnysis mechanikas laivų statykloje, kur nuo nulio statė krovininius laivus. Nuo mažens išmokau skaityti tikslius laivų brėžinių kampus ir matmenis, ir man tai patiko.

Nuo vidurinės mokyklos man labai patiko STEM – viskas, ką valgiau matematiką, fiziką ir chemiją. Viena iš mano vidurinės mokyklos užduočių buvo išmokti BASIC programavimo ir aš užkodavau žaidimą apie gyvatę, ėdančią uodegą. Po to žinojau, kad informatika yra mano ateitis.

Didelės technologijų įmonės, tokios kaip „Meta“, visada yra penkeriais ar daugiau metų priekyje. Kai prisijungiau prie „Meta“ 2015 m., buvome savo AI kelionės pradžioje – perėjome nuo procesorių prie GPU. Turėjome kurti AI infrastruktūrą nuo pat pradžių. Tokie modeliai kaip Caffe2 buvo novatoriški, kai buvo sukurti, tačiau dirbtinis intelektas vystėsi taip greitai, kad greitai paseno. Sukūrėme PyTorch ir visą aplink ją esančią sistemą kaip sprendimą.

„PyTorch“ yra vieta, kur sužinojau apie didžiausias kliūtis, su kuriomis susiduria kūrėjai, lenktyniaudami kuriant AI. Pirmasis iššūkis yra rasti stabilią ir patikimą modelio architektūrą, kuri būtų mažai delsiama ir lanksti, kad modeliai galėtų keistis. Antrasis iššūkis yra bendros nuosavybės išlaidos, todėl įmonės nebankrutuoja bandydamos plėsti savo modelius.

Mano laikas „Meta“ parodė, kaip svarbu išlaikyti atvirojo kodo modelius ir sistemas, tokias kaip „PyTorch“. Tai skatina naujoves. Be atvirojo kodo iteracijos galimybių nebūtume išaugę tiek daug, kiek turėjome „PyTorch“. Be to, be bendradarbiavimo neįmanoma neatsilikti nuo naujausių tyrimų.

Technologijų pramonėje dirbu daugiau nei 20 metų ir mačiau bangą po bangos permainų pramonės lygiu – nuo ​​debesies iki mobiliųjų programų. Tačiau šis AI poslinkis yra visiškas tektoninis pertvarkymas. Mačiau daug įmonių, kurios kovoja su šiuo pokyčiu. Visi norėjo judėti greitai ir pirmenybę teikti AI, tačiau jiems trūko infrastruktūros, išteklių ir talento, kad tai įvyktų. Kuo daugiau kalbėjausi su šiomis įmonėmis, tuo labiau supratau, kad galiu išspręsti šią rinkos spragą.

Paleidau fejerverkų AI, kad išspręsčiau šią problemą ir pratęsčiau neįtikėtiną darbą, kurį pasiekėme PyTorch. Tai netgi įkvėpė mūsų vardą! PyTorch yra deglas, laikantis ugnį, bet mes norime, kad ugnis pasklistų visur. Taigi: fejerverkai.

Man visada buvo aistringa technologijų demokratizacija ir tai, kad kūrėjams būtų prieinamos ir paprastos naujovės, nepaisant jų išteklių. Štai kodėl turime tokią patogią vartotojo sąsają ir stiprias palaikymo sistemas, kurios leidžia statybininkams įgyvendinti savo vizijas.

Tai paprasta: „į kūrėją orientuotas“ reiškia, kad pirmenybė teikiama AI kūrėjų poreikiams. Pavyzdžiui: įrankių, bendruomenių ir procesų kūrimas, kurie daro kūrėjus efektyvesnius ir savarankiškesnius.

Į kūrėjus orientuotos AI platformos, pvz., „Fireworks“, turėtų būti integruotos į esamas darbo eigas ir technologijų rinkinius. Jie turėtų padėti kūrėjams eksperimentuoti, daryti klaidas ir tobulinti savo darbą. Jie turėtų skatinti grįžtamąjį ryšį, nes patys jų kūrėjai supranta, ko jiems reikia, kad būtų sėkmingi. Galiausiai, tai daugiau nei vien tik platforma. Tai yra bendruomenė, kurioje bendradarbiaujantys kūrėjai gali peržengti AI galimybes.

Visas mūsų, kaip AI gamybos platformos, požiūris yra unikalus, tačiau kai kurios iš geriausių mūsų savybių yra šios:

Veiksmingos išvados – sukūrėme fejerverkų AI siekdami efektyvumo ir greičio. Kūrėjai, naudojantys mūsų platformą, gali paleisti savo LLM programas už mažiausią galimą delsą ir kainą. Tai pasiekiame naudodami naujausius modelių ir paslaugų optimizavimo metodus, įskaitant greitą talpyklą, pritaikomą skaidymą, kvantavimą, nuolatinį paketų tvarkymą, „FireAttention“ ir kt.

Įperkamas LoRA suderintų modelių palaikymas – siūlome įperkamą žemo rango pritaikymo (LoRA) tiksliai suderintų modelių paslaugą, taikant daugialypę bazinių modelių nuomą. Tai reiškia, kad kūrėjai gali eksperimentuoti su daugybe skirtingų naudojimo atvejų ar to paties modelio variantų nepažeisdami banko.

Paprastos sąsajos ir API – mūsų sąsajos ir API yra paprastos ir kūrėjams lengvai integruojamos į savo programas. Mūsų API taip pat yra suderinamos su OpenAI, kad būtų lengviau perkelti.

Parduodami modeliai ir sureguliuoti modeliai – siūlome daugiau nei 100 iš anksto paruoštų modelių, kuriuos kūrėjai gali naudoti jau paruošti. Aptariame geriausius LLM, vaizdų generavimo modelius, įterpimo modelius ir kt. Tačiau kūrėjai taip pat gali pasirinkti priglobti ir aptarnauti savo pasirinktinius modelius. Taip pat siūlome savitarnos koregavimo paslaugas, kad padėtume kūrėjams pritaikyti šiuos tinkintus modelius pagal jų patentuotus duomenis.

Bendradarbiavimas bendruomenėje: tikime atvirojo kodo bendruomenės bendradarbiavimo etosu. Mūsų platforma skatina (bet nereikalauja) kūrėjus dalytis savo tiksliais modeliais ir prisidėti prie augančio AI turto ir žinių banko. Visiems naudinga plėsti mūsų kolektyvinę patirtį.

Mašininio mokymosi modelių lygiagrečiai padidina modelių mokymo efektyvumą ir greitį bei padeda kūrėjams valdyti didesnius modelius, kurių negali apdoroti vienas GPU.

Modelio lygiagretumas apima modelio padalijimą į kelias dalis ir kiekvienos dalies mokymą atskiruose procesoriuose. Kita vertus, duomenų lygiagretumas padalija duomenų rinkinius į poaibius ir kiekviename poaibyje modeliuoja tuo pačiu metu atskiruose procesoriuose. Mišrus metodas sujungia šiuos du metodus. Modeliai yra suskirstyti į atskiras dalis, kurių kiekviena apmokoma naudojant skirtingus duomenų pogrupius, pagerinant efektyvumą, mastelį ir lankstumą.

Būsiu atviras, nuo tada, kai 2022 m. įkūrėme Fireworks AI, teko įveikti daug aukštų kalnų.

Mūsų klientai pirmiausia kreipėsi į mus ieškodami labai mažo delsos palaikymo, nes jie kuria programas vartotojams, gamintojams ar kitiems kūrėjams – visoms auditorijoms, kurioms reikia greitų sprendimų. Tada, kai mūsų klientų programos pradėjo sparčiai didėti, jie suprato, kad negali sau leisti įprastų išlaidų, susijusių su tuo mastu. Tada jie paprašė mūsų padėti sumažinti bendrąsias nuosavybės išlaidas (TCO), ką mes padarėme. Tada mūsų klientai norėjo pereiti nuo „OpenAI“ prie OSS modelių ir paprašė mūsų teikti tokią pat ar net geresnę kokybę nei „OpenAI“. Mes taip pat padarėme tai.

Kiekvienas mūsų gaminio evoliucijos žingsnis buvo sudėtinga problema, kurią reikia išspręsti, tačiau tai reiškė, kad mūsų klientų poreikiai iš tikrųjų pavertė fejerverkais tokiais, kokie jie yra šiandien: žaibišką išvadų variklį su mažu TCO. Be to, siūlome tiek aukštos kokybės, jau paruoštų modelių asortimentą, iš kurių galima rinktis, tiek tobulinimo paslaugas, kurias kūrėjai gali sukurti patys.

Turiu dvi paaugles dukras, kurios dažnai naudoja tokias genAI programas kaip ChatGPT. Kaip mama, nerimauju, kad jie randa klaidinančio ar netinkamo turinio, nes pramonė tik pradeda spręsti kritinę turinio saugos problemą. „Meta“ daug dirba su „Purple Llama“ projektu, o nauji „Stability AI“ SD3 režimai yra puikūs. Abi bendrovės sunkiai dirba, siekdamos užtikrinti saugumą savo naujiems Llama3 ir SD3 modeliams su keliais sluoksniais filtrais. Įvesties-išvesties apsaugos modelis „Llama Guard“ mūsų platformoje yra plačiai naudojamas, tačiau jo pritaikymas dar neprilygsta kitiems LLM. Visa pramonė dar turi nuveikti ilgą kelią, kad turinio saugumas ir AI etika būtų svarbiausia.

Mums, Fireworks, labai rūpi privatumas ir saugumas. Esame suderinami su HIPAA ir SOC2 ir siūlome saugų VPC ir VPN ryšį. Įmonės pasitiki fejerverkais savo patentuotais duomenimis ir modeliais, kad sukurtų savo verslo griovį.

Lygiai taip pat, kaip AlphaGo pademonstravo savarankiškumą mokydamasis žaisti šachmatais pats, manau, pamatysime, kad genAI programos taps vis savarankiškesnės. Programos automatiškai nukreips ir nukreips užklausas į tinkamą agentą arba API, kad būtų galima apdoroti ir taisyti kursą, kol gaus reikiamą išvestį. Ir vietoj vieno funkcijų iškvietimo modelio, kuris apklaustų iš kitų, kaip valdiklis, pamatysime daugiau savarankiškai organizuotų, savarankiškai koordinuojančių agentų, kurie vieningai spręs problemas.

Fejerverkų žaibiškos išvados, funkcijų iškvietimo modeliai ir koregavimo paslauga atvėrė kelią šiai realybei. Dabar novatoriški kūrėjai turi tai padaryti.

Dėkojame už puikų interviu, skaitytojai, norintys sužinoti daugiau, turėtų apsilankyti Fejerverkų AI.

Unite.AI įkūrėjas ir narys „Forbes“ technologijų taryba, Antuanas yra a futuristas kuris aistringai domisi AI ir robotikos ateitimi.

Jis taip pat yra įkūrėjas Vertybiniai popieriai.io, svetainė, kurioje pagrindinis dėmesys skiriamas investicijoms į trikdančias technologijas.