stub Xavier Conort, medgrundare och CPO för FeatureByte - Intervjuserien - Unite.AI
Anslut dig till vårt nätverk!

Intervjuer

Xavier Conort, medgrundare och CPO av FeatureByte – Intervju Series

mm

publicerade

 on

Xavier Conort är en visionär dataforskare med mer än 25 års erfarenhet av data. Han började sin karriär som aktuarie inom försäkringsbranschen innan han gick över till datavetenskap. Han är en topprankad Kaggle-konkurrent och var Chief Data Scientist på DataRobot innan han var med och grundade FeatureByte.

FeatureByte är på ett uppdrag att skala företags AI, genom att radikalt förenkla och industrialisera AI-data. Funktionsteknik- och hanteringsplattformen ger datavetare möjlighet att skapa och dela toppmoderna funktioner och produktionsfärdiga datapipelines på några minuter – istället för veckor eller månader.

Du började din karriär som aktuarie i försäkringsbranschen innan du gick över till Data Science, vad orsakade detta skifte?

Ett avgörande ögonblick var att vinna GE Flight Quest, en tävling organiserad av GE med ett pris på 250 2 $ i poolen, där deltagarna var tvungna att förutsäga förseningar av amerikanska inrikesflyg. Jag är skyldig en del av den framgången till en värdefull försäkringspraxis: modelleringen i två steg. Detta tillvägagångssätt hjälper till att kontrollera bias i funktioner som saknar tillräcklig representation i tillgänglig träningsdata. Tillsammans med andra vinster på Kaggle övertygade denna prestation mig om att min försäkringstekniska bakgrund gav mig en konkurrensfördel inom området datavetenskap.

Under min Kaggle-resa hade jag också förmånen att få kontakt med andra entusiastiska dataforskare, inklusive Jeremy Achin och Tom De Godoy, som senare skulle bli grundarna av DataRobot. Vi delade en gemensam bakgrund inom försäkring och hade nått betydande framgångar på Kaggle. När de så småningom lanserade DataRobot, ett företag som specialiserat sig på AutoML, bjöd de in mig att gå med dem som Chief Data Scientist. Deras vision om att kombinera bästa praxis från försäkringsbranschen med kraften i maskininlärning gjorde mig upphetsad och gav en möjlighet att skapa något innovativt och effektfullt.

På DataRobot och var avgörande för att bygga deras Data Science roadmap. Vilken typ av datautmaningar stod du inför?

Den största utmaningen vi stod inför var den varierande kvaliteten på data som tillhandahålls som input till vår AutoML-lösning. Det här problemet resulterade ofta i antingen tidskrävande samarbete mellan vårt team och kunder eller nedslående resultat i produktionen om de inte åtgärdades på lämpligt sätt. Kvalitetsproblemen härrörde från flera källor som krävde vår uppmärksamhet.

En av de primära utmaningarna uppstod från den allmänna användningen av affärsinformationsverktyg för dataförberedelse och -hantering. Även om dessa verktyg är värdefulla för att generera insikter, saknar de de möjligheter som krävs för att säkerställa punkt-i-tid korrekthet för maskininlärningsdata. Som ett resultat kan läckor i träningsdata uppstå, vilket leder till överpassning och felaktig modellprestanda.

Felkommunikation mellan dataforskare och dataingenjörer var en annan utmaning som påverkade modellernas noggrannhet under produktionen. Inkonsekvenser mellan utbildnings- och produktionsfaserna, som uppstår på grund av felaktig anpassning mellan dessa två team, kan påverka modellens prestanda i en verklig miljö.

Vilka var några av de viktigaste aspekterna av den här upplevelsen?

Min erfarenhet på DataRobot lyfte fram betydelsen av dataförberedelse i maskininlärning. Genom att ta itu med utmaningarna med att generera modellutbildningsdata, såsom korrekthet vid tidpunkten, expertluckor, domänkunskap, verktygsbegränsningar och skalbarhet, kan vi förbättra noggrannheten och tillförlitligheten hos modeller för maskininlärning. Jag kom till slutsatsen att effektivisering av dataförberedelseprocessen och införlivande av innovativ teknik kommer att vara avgörande för att frigöra AIs fulla potential och uppfylla dess löften.

Vi hörde också från din medgrundare Razi Raziuddin om tillkomstberättelsen bakom FeatureByte, kan vi få din version av händelserna?

När jag diskuterade mina observationer och insikter med min medgrundare Razi Raziuddin, insåg vi att vi delade en gemensam förståelse för utmaningarna i dataförberedelse för maskininlärning. Under våra diskussioner delade jag med Razi om mina insikter om de senaste framstegen i MLOps-gemenskapen. Jag kunde observera uppkomsten av funktionsbutiker och funktionsplattformar som AI-första teknikföretag införde för att minska fördröjningen av funktionsvisning, uppmuntra funktionsåteranvändning eller förenkla funktionsmaterialisering i träningsdata samtidigt som de säkerställer konsistens i utbildningsserveringen. Men det var uppenbart för oss att det fortfarande fanns en lucka när det gäller att tillgodose behoven hos datavetare. Razi delade med mig av sina insikter om hur den moderna datastacken har revolutionerat BI och analys, men inte utnyttjas fullt ut för AI.

Det blev uppenbart för både Razi och mig att vi hade möjligheten att göra en betydande inverkan genom att radikalt förenkla funktionsutvecklingsprocessen och förse datavetare och ML-ingenjörer med rätt verktyg och användarupplevelse för sömlös funktionsexperimentering och funktionsservering.

Vilka var några av dina största utmaningar med att göra övergången från datavetare till entreprenör?

Övergången från datavetare till entreprenör krävde att jag bytte från ett tekniskt perspektiv till ett bredare affärsorienterat tänkesätt. Även om jag hade en stark grund i att förstå smärtpunkter, skapa en färdplan, genomföra planer, bygga ett team och hantera budgetar, fann jag att det var ett av mina största hinder att skapa rätt meddelanden som verkligen gav genklang hos vår målgrupp.

Som dataforskare hade mitt primära fokus alltid varit på att analysera och tolka data för att få värdefulla insikter. Men som entreprenör behövde jag omdirigera mitt tänkande mot marknaden, kunderna och den övergripande verksamheten.

Lyckligtvis kunde jag övervinna den här utmaningen genom att utnyttja upplevelsen av någon som min medgrundare Razi.

Vi hörde från Razi om varför funktionsteknik är så svårt, vad tycker du är det som gör det så utmanande?

Feature engineering har två huvudutmaningar:

  1. Omvandling av befintliga kolumner: Detta innebär att konvertera data till ett lämpligt format för maskininlärningsalgoritmer. Tekniker som one-hot-kodning, funktionsskalning och avancerade metoder som text- och bildtransformationer används. Att skapa nya funktioner från befintliga, som interaktionsfunktioner, kan förbättra modellens prestanda avsevärt. Populära bibliotek som scikit-learn och Hugging Face ger omfattande stöd för denna typ av funktionsteknik. AutoML-lösningar syftar också till att förenkla processen.
  2. Extrahera nya kolumner från historiska data: Historisk data är avgörande i problemdomäner som rekommendationssystem, marknadsföring, bedrägeriupptäckt, försäkringsprissättning, kreditvärdering, efterfrågeprognoser och sensordatabearbetning. Att extrahera informativa kolumner från dessa data är utmanande. Exempel inkluderar tid sedan den senaste händelsen, sammanställningar över senaste händelser och inbäddningar från händelsesekvenser. Denna typ av funktionsteknik kräver domänexpertis, experimenterande, starka kodnings- och datateknikfärdigheter och djup datavetenskaplig kunskap. Faktorer som tidsläckage, hantering av stora datamängder och effektiv kodexekvering måste också beaktas.

Sammantaget kräver funktionsteknik expertis, experiment och konstruktion av komplexa ad-hoc-datapipelines i avsaknad av verktyg som är speciellt utformade för det.

Kan du dela med dig av hur FeatureByte stärker datavetenskapspersonal samtidigt som de förenklar funktionspipelines?

FeatureByte stärker datavetenskapspersonal genom att förenkla hela processen inom funktionsteknik. Med en intuitiv Python SDK möjliggör den snabbt funktionsskapande och extrahering från XLarge Event och Item Tables. Beräkningar hanteras effektivt genom att utnyttja skalbarheten hos dataplattformar som Snowflake, DataBricks och Spark. Bärbara datorer underlättar experimenterande, samtidigt som funktionsdelning och återanvändning sparar tid. Granskning säkerställer funktionsnoggrannhet, medan omedelbar implementering eliminerar huvudvärk för pipelinehantering.

Utöver dessa funktioner som erbjuds av vårt bibliotek med öppen källkod, tillhandahåller vår företagslösning ett omfattande ramverk för att hantera och organisera AI-operationer i stor skala, inklusive styrningsarbetsflöden och ett användargränssnitt för funktionskatalogen.

Vad är din vision för FeatureBytes framtid?

Vår ultimata vision för FeatureByte är att revolutionera området datavetenskap och maskininlärning genom att ge användare möjlighet att frigöra sin fulla kreativa potential och extrahera ett oöverträffat värde från sina datatillgångar.

Vi är särskilt glada över de snabba framstegen inom Generativ AI och transformatorer, som öppnar upp en värld av möjligheter för våra användare. Dessutom är vi dedikerade till att demokratisera funktionsteknik. Generativ AI har potential att sänka inträdesbarriären för kreativ funktionsteknik, vilket gör den mer tillgänglig för en bredare publik.

Sammanfattningsvis kretsar vår vision för FeatureBytes framtid kring kontinuerlig innovation, utnyttjande av kraften i Generativ AI och demokratisering av funktionsteknik. Vi strävar efter att vara den bästa plattformen som gör det möjligt för dataproffs att omvandla rådata till handlingsbar input för maskininlärning, vilket driver genombrott och framsteg inom olika branscher.

Har du några råd till blivande AI-entreprenörer?

Definiera ditt utrymme, håll fokus och välkomna nyhet.

Genom att definiera utrymmet som du vill äga kan du differentiera dig och etablera en stark närvaro i det området. Undersök marknaden, förstå potentiella kunders behov och smärtpunkter och sträva efter att tillhandahålla en unik lösning som effektivt hanterar dessa utmaningar.

Definiera din långsiktiga vision och sätt upp tydliga kortsiktiga mål som ligger i linje med den visionen. Koncentrera dig på att bygga en stark grund och leverera värde i ditt valda utrymme.

Slutligen, även om det är viktigt att vara fokuserad, dra dig inte för att omfamna nyheter och utforska nya idéer inom ditt definierade utrymme. AI-området utvecklas ständigt, och innovativa tillvägagångssätt kan öppna upp nya möjligheter.

Tack för den fina intervjun, läsare som vill veta mer bör besöka FeatureByte.

En av grundarna av unite.AI och en medlem av Forbes Technology Council, Antoine är en futurist som brinner för framtiden för AI och robotik.

Han är också grundare av Securities.io, en webbplats som fokuserar på att investera i disruptiv teknik.