Intervjuer
Etienne Bernard, medgrundare och VD för NuMind – Intervjuserie

Etienne Bernard, är medgrundare och VD för NuMind ett programvaruföretag som grundades i juni 2022 och som specialiserar sig på att utveckla maskinlärningsverktyg. Etienne är expert inom AI och maskinlärning. Efter en doktorsexamen (ENS) och postdoc (MIT) i statistisk fysik, gick Etienne med i Wolfram Research där han blev chef för maskinlärning i 7 år. Under denna tid ledde Etienne utvecklingen av automatiska lärandeverktyg, ett användarvänligt djupinlärningsramverk och olika maskinlärningsapplikationer.
Vad var det som initialt drog dig till maskinlärning?
Första gången jag hörde termen “maskinlärning” var 2009, tror jag, tack vare Netflix-priset. Jag fann idén att maskiner kan lära sig fascinerande och kraftfull. Det var redan tydligt för mig att detta skulle leda till många viktiga tillämpningar – inklusive den spännande möjligheten att skapa AI. Jag bestämde mig omedelbart för att dyka in i det, och kom aldrig tillbaka.
Efter att ha fått en doktorsexamen (ENS) och postdoc (MIT) i statistisk fysik, gick du med i Wolfram Research där du blev chef för maskinlärning i 7 år. Vilka var några av de mer intressanta projekten som du arbetade med?
Mina favoritprojekt på Wolfram var att utveckla automatiska maskinlärningsfunktioner för Wolfram Language (även känd som Mathematica). Den första var Classify, där du bara ger det data och det returnerar en klassificerare. För mig har maskinlärning alltid handlat om att vara automatisk. Du ställer inte in hyperparametrarna för din mänskliga student, och du borde inte heller för din maskin! Det var ganska utmanande från ett vetenskapligt och programvarutekniskt perspektiv att skapa riktigt robusta och effektiva automatiska maskinlärningsfunktioner.
Att skapa ett högnivåneuralt nätverksramverk var också ett mycket intressant projekt. Många svåra designbeslut om hur man representerar neuronnät symboliskt, hur man visualiserar dem och hur man manipulerar dem (dvs. att kunna klippa ut några bitar, klistra in andra, ersätta lager etc.). Jag tror att vi gjorde ett hyggligt jobb, och om det var öppen källkod, är jag ganska säker på att det skulle användas flitigt 😉
Under denna period skrev du också en banbrytande bok med titeln “Introduction to Machine Learning“, vad var några av utmaningarna bakom att skriva en sådan omfattande bok?
Oh, det fanns många! Det tog två år att skriva. Jag kunde ha bestämt mig för att bara skriva en “hur-man”-bok, som skulle ha varit lättare, men en del av min resa på Wolfram har varit att lära mig maskinlärning, och jag kände behovet av att förmedla det. Så den största svårigheten var att bestämma vad jag skulle prata om exakt, och i vilken ordning, för att göra det intressant och lätt att förstå. Sedan var det pedagogiska detaljerna: borde jag använda en matematisk formel för detta begrepp? Eller någon kod? Eller bara en visualisering? Jag ville göra den här boken så tillgänglig som möjligt, och det gav mig många huvudvärk. Sammanfattningsvis är jag nöjd med resultatet. Jag hoppas att det kommer att vara användbart för många!
Kan du dela berättelsen om NuMinds ursprung?
Okej. Jag ville skapa ett startup i flera år, ursprungligen 2012 för att skapa ett auto ML-verktyg, men arbetet på Wolfram var för roligt. Sedan, runt 2019-2020, började de första stora språkmodellerna (LLM) dyka upp, som GPT-2 och sedan GPT-3. Det var en chock för mig hur bra de kunde förstå och generera text. Samtidigt kunde jag se hur smärtsamt det var att skapa NLP-modeller: du behövde hantera en annoteringsteam, ha experter som körde många experiment etc. Jag tänkte att det borde finnas ett sätt att använda dessa LLM:er via ett verktyg för att dramatiskt förbättra upplevelsen av att skapa NLP-modeller. Min medgrundare, Samuel (som rånt ur är min kusin), delade samma vision, och så bestämde vi oss för att skapa det här verktyget.
Målet med NuMind är att sprida användningen av maskinlärning – och artificiell intelligens i allmänhet – genom att skapa enkla men kraftfulla verktyg. Vilka är några av de verktyg som för närvarande är tillgängliga?
Ja. Vårt första verktyg är för att skapa anpassade NLP-modeller. Till exempel, låt säga att du vill analysera sentimentet hos dina användare från deras feedback. Att använda en färdig modell är vanligtvis inte så bra, eftersom den har tränats på en annan typ av data och för en något annorlunda uppgift (sentimentanalysuppgifter är förvånansvärt olika från varandra!). Istället vill du träna en anpassad modell som fungerar bra på din data. Vårt verktyg tillåter dig att göra just det, på ett extremt enkelt och effektivt sätt. I princip laddar du upp din data, utför en liten mängd annotering och får en modell som du kan distribuera via en API. Detta är möjligt tack vare användningen av LLM:er, men också denna nya inlärningsparadigm som vi kallar Interaktiv AI-utveckling.
Vilka är några av de anpassade modellerna som du ser utvecklas från den första omgången av NuMind-kunder?
Det har funnits några sentimentanalyser. Till exempel, en kund övervakar sentimentet i gruppsamtal där människor hjälper varandra att bekämpa sina beroenden. Denna analys behövs för att ingripa i de sällsynta fallen där sentimentet sjunker. En annan kund använder oss för att hitta vilka jobböppningar som är bäst för en given CV – och förresten, jag tror att det finns mycket potential i den här sortens matchnings-AI. Vi har också kunder som extraherar information från medicinska och juridiska dokument.
Hur mycket tidsbesparing kan företag se genom att använda NuMind-verktyg?
Det beror naturligtvis på applikationen, men jämfört med traditionella lösningar (märkning av data och träning av en modell separat), ser vi upp till 10 gånger snabbare förbättring för att få en modell och sätta den i produktion. Jag förväntar mig att den här siffran kommer att förbättras när vi fortsätter att utveckla produkten. Till slut tror jag att projekt som skulle ha tagit månader kommer att slutföras på dagar, och med bättre prestanda.
Kan du förklara hur NuMinds Interaktiv AI-utveckling fungerar?
Idén bakom Interaktiv AI-utveckling kommer från hur människor lär varandra. Till exempel, låt säga att du anställer en praktikant för att klassificera dina e-postmeddelanden. Du skulle först beskriva uppgiften och dess syfte. Sedan kanske du ger några bra exempel, några hörnfall kanske. Sedan börjar din praktikant märka e-postmeddelanden, och en konversation börjar. Din praktikant kommer tillbaka med frågor som “Hur ska jag märka det här?” eller “Jag tror att vi borde skapa en ny etikett för det här”, eller till och med fråga dig “varför” vi ska märka på ett visst sätt. På samma sätt kanske du ställer frågor till din praktikant för att identifiera och korrigera deras kunskapsluckor. Detta sätt att lära är mycket naturligt och extremt effektivt i termer av informationsutbyte. Vi försöker härma den här arbetsflödet för att människor ska kunna effektivt lära maskiner.
I tekniska termer är det här arbetsflödet en låglatens, höghastighets, multimodal och dubbelriktad kommunikation mellan människa och maskin, och vi bestämde oss för att kalla det Interaktiv AI-utveckling för att betona de dubbelriktade och låglatenta aspekterna. Jag ser det här som en tredje paradigm för att lära maskiner, efter klassisk programmering och klassisk maskinlärning (där du bara ger en mängd exempel på uppgiften för datorn att lista ut vad den ska göra).
Denna nya paradigm är låst av LLM:er. Verkligen, du behöver ha något som redan är något smart i maskinen för att kunna effektivt interagera med den. Jag tror att den här paradigm kommer att bli vanlig i framtiden, och vi kan redan se glimtar av det med chatbaserade LLM:er och med vårt verktyg förstås.
Vi tillämpar den här paradigm på att lära NLP-uppgifter, men det kan – och kommer att – användas för mycket mer, inklusive utveckling av programvara.
Finns det något annat som du vill dela om NuMind?
Kanske att det är ett verktyg som kan användas av både experter och icke-experter inom maskinlärning, att det är flerspråkigt, att du äger dina modeller och att data kan stanna på din maskin!
Annars är vi i en privat betafas, så om du har några NLP-behov, skulle vi vara glada att prata och lista ut om/hur vi kan hjälpa dig!
Tack för den underbara intervjun, läsare som vill veta mer bör besöka NuMind.












