Connect with us

Interviews

Lin Qiao, CEO & Co-Founder van Fireworks AI – Interview Series

mm

Lin Qiao was voorheen hoofd van Meta’s PyTorch en is de mede-oprichter en CEO van Fireworks AI. Fireworks AI is een productie-AI-platform dat is gebouwd voor ontwikkelaars, Fireworks werkt samen met ‘s werelds toonaangevende generatieve AI-onderzoekers om de beste modellen te serveren op de snelste snelheden. Fireworks AI heeft onlangs een $25M Series A.

Wat trok je aanvankelijk aan tot informatica?

Mijn vader was een heel senior mechanisch ingenieur op een scheepswerf, waar hij cargoschepen van scratch bouwde. Van jongs af aan leerde ik de precieze hoeken en maten van scheepsblauwdrukken lezen, en ik vond het geweldig.

Ik was al vanaf de middelbare school geïnteresseerd in STEM – alles over wiskunde, natuurkunde en scheikunde – en ik verslond het. Een van mijn opdrachten op de middelbare school was om BASIC-programmering te leren, en ik programmeerde een spel over een slang die zijn eigen staart at. Daarna wist ik dat informatica mijn toekomst was.

Toen je bij Meta werkte, leidde je 300+ wereldklasse-ingenieurs in AI-frames en -platforms waar je Caffe2 bouwde en later PyTorch. Wat waren enkele van je belangrijkste conclusies uit deze ervaring?

Grote technologiebedrijven zoals Meta zijn altijd vijf jaar of meer voorop de curve. Toen ik in 2015 bij Meta kwam, stonden we aan het begin van onze AI-reis – we maakten de overstap van CPUs naar GPUs. We moesten de AI-infrastructuur van scratch ontwerpen. Modellen zoals Caffe2 waren baanbrekend toen ze werden gemaakt, maar AI evolueerde zo snel dat ze snel verouderd raakten. We ontwikkelden PyTorch en het hele systeem eromheen als oplossing.

PyTorch is waar ik leerde over de grootste obstakels waar ontwikkelaars mee te maken krijgen in de race om AI te bouwen. De eerste uitdaging is het vinden van een stabiele en betrouwbare modelarchitectuur die laag latentie en flexibel is, zodat modellen kunnen schalen. De tweede uitdaging is de totale kosten van eigendom, zodat bedrijven niet failliet gaan bij het groeien van hun modellen.

Mijn tijd bij Meta liet me zien hoe belangrijk het is om modellen en kaders zoals PyTorch open-source te houden. Het moedigt innovatie aan. We zouden niet zo veel gegroeid zijn bij PyTorch zonder open-source-mogelijkheden voor iteratie. Bovendien is het onmogelijk om bij te blijven met alle laatste onderzoek zonder samenwerking.

Kun je bespreken wat je ertoe bracht om Fireworks AI te lanceren?

Ik ben al meer dan 20 jaar in de technologie-industrie en ik heb golf na golf van industrie-brede verschuivingen gezien – van de cloud naar mobiele apps. Maar deze AI-verschuiving is een complete tectonische herorientatie. Ik zag veel bedrijven worstelen met deze verandering. Iedereen wilde snel bewegen en AI op de eerste plaats zetten, maar ze hadden geen infrastructuur, middelen en talent om het te laten gebeuren. Hoe meer ik met deze bedrijven sprak, hoe meer ik besefte dat ik deze marktkloof kon opvullen.

Ik lanceerde Fireworks AI om dit probleem op te lossen en als een uitbreiding van het geweldige werk dat we bij PyTorch hebben bereikt. Het inspireerde zelfs onze naam! PyTorch is de toorts die het vuur vasthoudt – maar we willen dat vuur overal laten verspreiden. Vandaar: Fireworks.

Ik ben altijd gepassioneerd over het democratiseren van technologie en het maken ervan betaalbaar en eenvoudig voor ontwikkelaars om te innoveren, ongeacht hun middelen. Daarom hebben we zo’n gebruikersvriendelijke interface en sterke ondersteuningssystemen om bouwers in staat te stellen hun visie tot leven te brengen.

Kun je bespreken wat ontwikkelaar-georiënteerde AI is en waarom dit zo belangrijk is?

Het is simpel: “ontwikkelaar-georiënteerd” betekent dat de behoeften van AI-ontwikkelaars worden geprioriteerd. Bijvoorbeeld: het creëren van tools, gemeenschappen en processen die ontwikkelaars efficiënter en autonomer maken.

Ontwikkelaar-georiënteerde AI-platforms zoals Fireworks moeten integreren in bestaande workflows en technische stacks. Ze moeten het voor ontwikkelaars eenvoudig maken om te experimenteren, fouten te maken en hun werk te verbeteren. Ze moeten feedback aanmoedigen, omdat het de ontwikkelaars zelf zijn die weten wat ze nodig hebben om succesvol te zijn. Ten slotte gaat het er niet alleen om een platform te zijn. Het gaat erom een gemeenschap te zijn – een waarin samenwerkende ontwikkelaars de grenzen van wat mogelijk is met AI kunnen verleggen.

Het GenAI-platform dat je hebt ontwikkeld is een significante vooruitgang voor ontwikkelaars die werken met grote taalmodellen (LLM’s). Kun je de unieke functies en voordelen van je platform toelichten, vooral in vergelijking met bestaande oplossingen?

Onze hele aanpak als AI-productieplatform is uniek, maar enkele van onze beste functies zijn:

Efficiënte inferentie – We hebben Fireworks AI ontworpen voor efficiëntie en snelheid. Ontwikkelaars die ons platform gebruiken, kunnen hun LLM-toepassingen uitvoeren met de laagste mogelijke latentie en kosten. We bereiken dit met de nieuwste model- en servicesoptimalisatietechnieken, waaronder promptcaching, adaptief sharding, quantisatie, continue batching, FireAttention en meer.

Betaalbare ondersteuning voor LoRA-gefineerde modellen – We bieden een betaalbare service voor low-rank adaptation (LoRA) gefineerde modellen via multi-tenancy op basismodellen. Dit betekent dat ontwikkelaars veel verschillende use-cases of variaties op hetzelfde model kunnen experimenteren zonder failliet te gaan.

Eenvoudige interfaces en API’s – Onze interfaces en API’s zijn rechttoe rechtaan en eenvoudig voor ontwikkelaars om in hun toepassingen te integreren. Onze API’s zijn ook OpenAI-compatibel voor een gemakkelijke migratie.

Kant-en-klare modellen en gefineerde modellen – We bieden meer dan 100 vooraf getrainde modellen die ontwikkelaars out-of-the-box kunnen gebruiken. We dekken de beste LLM’s, beeldgeneratiemodellen, embeddingmodellen, enz. Maar ontwikkelaars kunnen ook kiezen om hun eigen aangepaste modellen te hosten en te serveren. We bieden ook self-service fine-tuningservices om ontwikkelaars te helpen deze aangepaste modellen aan te passen met hun eigen gegevens.

Gemeenschapssamenwerking: We geloven in de open-source-ethos van gemeenschapssamenwerking. Ons platform moedigt (maar vereist niet) ontwikkelaars aan om hun gefineerde modellen te delen en bij te dragen aan een groeiende bank van AI-middelen en -kennis. Iedereen profiteert van het vergroten van onze collectieve expertise.

Kun je de hybride aanpak bespreken die wordt aangeboden tussen modelparallelisme en dataparallelisme?

Het paralleliseren van machine learning-modellen verbetert de efficiëntie en snelheid van modeltraining en helpt ontwikkelaars omgaan met grotere modellen die een enkele GPU niet kan verwerken.

Modelparallelisme houdt in dat een model in meerdere delen wordt verdeeld en elk deel op een aparte processor wordt getraind. Aan de andere kant houdt dataparallelisme in dat datasets in subsets worden verdeeld en een model op elk subset op hetzelfde moment over meerdere processors wordt getraind. Een hybride aanpak combineert deze twee methoden. Modellen worden in afzonderlijke delen verdeeld, die elk op verschillende subsets van gegevens worden getraind, waardoor de efficiëntie, schaalbaarheid en flexibiliteit worden verbeterd.

Fireworks AI wordt gebruikt door meer dan 20.000 ontwikkelaars en serveert momenteel meer dan 60 miljard tokens per dag. Wat waren enkele van de uitdagingen die je hebt ondervonden bij het opschalen van je operaties naar dit niveau, en hoe heb je ze overwonnen?

Ik zal eerlijk zijn, er waren veel hoge bergen om te beklimmen sinds we Fireworks AI in 2022 hebben opgericht.

Onze klanten kwamen eerst naar ons toe op zoek naar zeer lage latentie-ondersteuning, omdat ze toepassingen voor consumenten, prosumers of andere ontwikkelaars bouwen – allemaal publiek dat snelle oplossingen nodig heeft. Toen de toepassingen van onze klanten snel begonnen te groeien, realiseerden ze zich dat ze de typische kosten die gepaard gaan met die schaal niet konden betalen. Ze vroegen ons vervolgens om te helpen bij het verlagen van de totale kosten van eigendom (TCO), wat we deden. Toen wilden onze klanten migreren van OpenAI naar OSS-modellen en vroegen ze ons om een kwaliteit te bieden die gelijkwaardig was aan of zelfs beter was dan die van OpenAI. We maakten dat ook mogelijk.

Elke stap in de evolutie van ons product was een moeilijk probleem om aan te pakken, maar het betekende dat de behoeften van onze klanten Fireworks echt vorm gaven tot wat het vandaag is: een bliksemsnelle inferentie-engine met lage TCO. Bovendien bieden we zowel een assortiment van hoogwaardige, kant-en-klare modellen om uit te kiezen, als fine-tuningservices voor ontwikkelaars om hun eigen modellen te maken.

Met de snelle vooruitgang in AI en machine learning zijn ethische overwegingen belangrijker dan ooit. Hoe gaat Fireworks AI om met zorgen over vooroordelen, privacy en het ethische gebruik van AI?

Ik heb twee tienerdochters die genAI-apps zoals ChatGPT vaak gebruiken. Als moeder maak ik me zorgen over het vinden van misleidende of ongepaste inhoud, omdat de industrie nog maar net begint met het kritieke probleem van inhoudsveiligheid. Meta doet veel met het Purple Llama-project en Stability AI’s nieuwe SD3-modi zijn geweldig. Beide bedrijven werken hard om veiligheid naar hun nieuwe Llama3- en SD3-modellen te brengen met meerdere lagen filters. Het input-output-bewakingsmodel, Llama Guard, wordt op onze platform redelijk gebruikt, maar de adoptie is nog niet op het niveau van andere LLM’s. De industrie als geheel heeft nog een lange weg te gaan om inhoudsveiligheid en AI-ethiek naar de voorgrond te brengen.

Wij bij Fireworks geven veel om privacy en beveiliging. We zijn HIPAA- en SOC2-compliant en bieden beveiligde VPC- en VPN-verbindingen. Bedrijven vertrouwen Fireworks met hun eigendomsgegevens en -modellen om hun bedrijfsvoordeel te bouwen.

Wat is je visie op hoe AI zal evolueren?

Net zoals AlphaGo autonomie demonstreerde bij het leren van schaken, denk ik dat we genAI-toepassingen zullen zien die steeds autonomer worden. Apps zullen automatisch aanvragen routeren en sturen naar de juiste agent of API om te verwerken en zullen koers corrigeren totdat ze de juiste output behalen. En in plaats van één model dat andere modellen aanroept als controller, zullen we meer zelfgeorganiseerde, zelfgecoördineerde agenten zien die samenwerken om problemen op te lossen.

Fireworks’ bliksemsnelle inferentie, modelaanroepen en fine-tuningservice hebben de weg vrijgemaakt voor deze realiteit. Nu is het aan innovatieve ontwikkelaars om het te laten gebeuren.

Bedankt voor het geweldige interview, lezers die meer willen leren, moeten Fireworks AI bezoeken.

Antoine is een visionaire leider en oprichtend partner van Unite.AI, gedreven door een onwankelbare passie voor het vormgeven en promoten van de toekomst van AI en robotica. Een seriële ondernemer, hij gelooft dat AI net zo disruptief voor de samenleving zal zijn als elektriciteit, en wordt vaak betrapt op het enthousiast praten over het potentieel van disruptieve technologieën en AGI. Als een futurist, is hij toegewijd aan het onderzoeken van hoe deze innovaties onze wereld zullen vormgeven. Bovendien is hij de oprichter van Securities.io, een platform dat zich richt op investeren in cutting-edge technologieën die de toekomst opnieuw definiëren en hele sectoren herschappen.