Connect with us

Intervjuer

Razi Raziuddin, medgrunnlegger og CEO av FeatureByte – Intervju-serie

mm

Razi Raziuddin er medgrunnlegger og CEO av FeatureByte, hans visjon er å løse den siste store hindringen for å skala AI i bedrifter. Razi’s erfaring med analytics og vekst omfatter ledelseslaget i to unicorn-startups. Razi hjalp til å skala DataRobot fra 10 til 850 ansatte på under seks år. Han var pioner for en services-led go-to-market-strategi som ble kjennetegnet for DataRobots raske vekst.

FeatureByte er på en misjon til å skala bedrifts-AI, ved å radikalt forenkle og industrialisere AI-data. Plattformen for feature engineering og management (FEM) gir datascientister mulighet til å lage og dele state-of-the-art-egenskaper og produksjonsklare data-pipelines på minutter — i stedet for uker eller måneder.

Hva var det som først tiltalte deg til datavitenskap og maskinlæring?

Som noen som startet å kode på high school, var jeg fascinert av en maskin som jeg kunne “snakke” til og kontrollere gjennom kode. Jeg var umiddelbart fanget av de endelige mulighetene for nye applikasjoner. Maskinlæring representerte en paradigmeskifte i programmering, som gjorde det mulig for maskiner å lære og utføre oppgaver uten å spesifisere trinnene i kode. De uendelige mulighetene for ML-applikasjoner er det som får meg til å bli spennende hver dag.

Du var den første forretningsansatte i DataRobot, en automatisk maskinlæringsplattform som gjør det mulig for organisasjoner å bli AI-drevne. Du hjalp deretter til å skala selskapet fra 10 til 1 000 ansatte på under 6 år. Hva var noen nøkkelinsikter fra denne erfaringen?

Å gå fra null til en er hardt, men usedvanlig spennende og givende. Hvert stadium i selskapets utvikling presenterer en annen sett med utfordringer, men å se selskapet vokse og lykkes er en fantastisk følelse.

Min erfaring med AutoML åpnet mine øyne for de ubegrensede mulighetene i AI. Det er fascinerende å se hvordan denne teknologien kan brukes over så mange forskjellige industrier og applikasjoner. Til slutt handler det om å skape en ny kategori, som er en sjelden, men usedvanlig givende bedrift. Mine nøkkelinsikter fra erfaringen:

  • Byg en fantastisk produkt og unngå å jage etter trender
  • Vær ikke redd for å være en contrarian
  • Fokus på å løse kundernes problemer og gi verdi
  • Vær alltid åpen for innovasjon og prøving av nye ting
  • Skap og innfør riktig selskapskultur fra begynnelsen

Kan du dele opphavsfortellingen bak FeatureByte?

Det er en velkjent faktum i AI/ML-verdenen – at god AI starter med god data. Men å forberede, distribuere og håndtere AI-data (eller egenskaper) er komplekst og tidskrevende. Min medgrunnlegger, Xavier Conort, og jeg så dette problemet førstehånd på DataRobot. Mens modellering har blitt kraftig forenklet takket være AutoML-verktøy, forblir feature engineering og management en stor utfordring. Basert på vår kombinerte erfaring og ekspertise, følte Xavier og jeg at vi kunne virkelig hjelpe organisasjoner med å løse denne utfordringen og levere på løftet om AI overalt.

Feature engineering er i kjernen av FeatureByte, kan du forklare hva dette er for våre lesere?

Til slutt handler kvaliteten på data om kvaliteten og ytelsen til AI-modellene. Data som mates inn i modeller for å trene dem og forutsi fremtidige resultater, kalles egenskaper. Egenskaper representerer informasjon om enheter og hendelser, som demografisk eller psykografisk data om forbrukere, eller avstand mellom en kortinnehaver og forhandler for en kredittkorttransaksjon eller antall varer av forskjellige kategorier fra en butikk.

Prosessen med å transformere rådata til egenskaper – for å trene ML-modeller og forutsi fremtidige resultater – kalles feature engineering.

Hvorfor er feature engineering en av de mest kompliserte aspektene av maskinlæringsprosjekter?

Feature engineering er super viktig fordi prosessen er direkte ansvarlig for ytelsen til ML-modellene. God feature engineering krever tre ganske uavhengige ferdigheter som må komme sammen – domenekunnskap, data vitenskap og dataingeniør. Domenekunnskap hjelper datascientister å bestemme hva signaler å trekke ut fra data for et bestemt problem eller brukstilfelle. Du trenger data vitenskapelige ferdigheter for å trekke ut disse signalene. Og til slutt hjelper dataingeniør deg med å distribuere pipelines og utføre alle disse operasjonene på stor skala på store datavolumer.

I de fleste organisasjoner bor disse ferdighetene i forskjellige lag. Disse lagene bruker forskjellige verktøy og kommuniserer ikke godt med hverandre. Dette fører til mye friksjon i prosessen og bremser den ned til en stoppested.

Kan du dele noen innsikt i hvorfor feature engineering er den svakeste lenken i å skala AI?

Ifølge Andrew Ng, en kjent ekspert i AI, “Applied machine learning er i realiteten feature engineering.” Til tross for dets kritiske betydning for maskinlæringslivssyklusen, forblir feature engineering komplekst, tidskrevende og avhengig av ekspertkunnskap. Det er en alvorlig mangel på verktøy for å gjøre prosessen enklere, raskere og mer industrialisert. Arbeidet og ekspertisen som kreves holder bedrifter tilbake fra å kunne distribuere AI i stor skala.

Kan du dele noen av utfordringene bak å bygge en data-sentrert AI-løsning som radikalt forenkler feature engineering for datascientister?

Å bygge et produkt som har en 10X fordel over status quo er super hardt. Takk og lov har Xavier dyp data vitenskapelig ekspertise som han anvender for å tenke om hele feature-arbeidsflyten fra første prinsipp. Vi har et verdensklasse-lag av full-stack datascientister og ingeniører som kan omskape vår visjon til virkelighet. Og brukere og utviklingspartnere som råder oss om å strømlinjeformele brukergrensesnittet for å løse deres utfordringer best mulig.

Hvordan vil FeatureByte-plattformen akselerere forberedelsen av data for maskinlæringsapplikasjoner?

Dataforberedelse for ML er en iterativ prosess som avhenger av rask eksperimentering. Den åpne kildekode FeatureByte SDK er en deklarativ ramme for å lage state-of-the-art-egenskaper med bare noen få linjer kode og distribuere data-pipelines på minutter i stedet for uker eller måneder. Dette gjør det mulig for datascientister å fokusere på kreative problemløsninger og iterere raskt på live-data, i stedet for å bekymre seg om røret.

Resultatet er ikke bare raskere dataforberedelse og serving i produksjon, men også forbedret modell-ytelse gjennom kraftfulle egenskaper.

Kan du diskutere hvordan FeatureByte-plattformen også vil tilby mulighet til å strømlinjeformele forskjellige pågående forvaltningsoppgaver?

FeatureByte-plattformen er designet for å håndtere hele ML-egenskapslivssyklusen. Den deklarative rammen gjør det mulig for FeatureByte å distribuere data-pipelines automatisk, mens den trekker ut metadata som er relevant for å håndtere hele miljøet. Brukere kan overvåke pipeline-helse og kostnader, og håndtere linje, versjon og riktighet av egenskaper alle fra samme GUI. Bedriftsgradert rollebasert tilgang og godkjenning arbeidsflyt sikrer dataintegritet og sikkerhet, mens det unngår egenskaps-sprell.

Er det noe annet du ønsker å dele om FeatureByte?

De fleste bedrifts-AI-verktøy fokuserer på å forbedre maskinlæringsmodellene. Vi har gjort det til en misjon å hjelpe bedrifter å skala AI, ved å forenkle og industrialisere AI-data. Hos FeatureByte, adresserer vi den største utfordringen for AI-utøvere: Å gi en konsistent, skalerbar måte å forberede, serve og håndtere data over hele livssyklusen til en modell, mens det radikalt forenkler hele prosessen.

Hvis du er en data scientist eller ingeniør som er interessert i å holde deg på toppen av data vitenskap, ville jeg oppmuntre deg til å oppleve kraften til FeatureByte for free.

Takk for det flotte intervjuet, lesere som ønsker å lære mer, bør besøke FeatureByte.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.