cung Xavier Conort, Bashkë-themelues dhe CPO i FeatureByte - Seria e intervistave - Unite.AI
Lidhu me ne

intervistat

Xavier Conort, Bashkëthemelues dhe CPO i FeatureByte – Seria e Intervistave

mm

Publikuar

 on

Xavier Conort është një shkencëtar vizionar i të dhënave me më shumë se 25 vjet përvojë të dhënash. Ai filloi karrierën e tij si aktuar në industrinë e sigurimeve përpara se të kalonte në shkencën e të dhënave. Ai është një konkurrent i lartë i Kaggle dhe ishte Shefi i të Dhënave Scientist në DataRobot përpara se të bashkëthemelonte FeatureByte.

FeatureByte është në një mision për të shkallëzuar AI të ndërmarrjeve, duke thjeshtuar dhe industrializuar rrënjësisht të dhënat e AI. Platforma e inxhinierisë dhe menaxhimit të veçorive fuqizon shkencëtarët e të dhënave që të krijojnë dhe ndajnë veçoritë më të fundit të artit dhe tubacionet e të dhënave të gatshme për prodhimin në minuta - në vend të javëve ose muajve.

Ju e nisët karrierën tuaj si aktuar në industrinë e sigurimeve përpara se të kalonit në Data Science, çfarë e shkaktoi këtë ndryshim?

Një moment përcaktues ishte fitimi i GE Flight Quest, një konkurs i organizuar nga GE me një çmim prej 250 mijë dollarësh, ku pjesëmarrësit duhej të parashikonin vonesat e fluturimeve të brendshme amerikane. Një pjesë të këtij suksesi ia detyroj një praktike të vlefshme sigurimi: modelimit me 2 faza. Kjo qasje ndihmon në kontrollin e paragjykimeve në veçori që nuk kanë përfaqësim të mjaftueshëm në të dhënat e disponueshme të trajnimit. Së bashku me fitoret e tjera në Kaggle, kjo arritje më bindi se historia ime aktuariale më dha një avantazh konkurrues në fushën e shkencës së të dhënave.

Gjatë udhëtimit tim në Kaggle, pata gjithashtu privilegjin të lidhem me shkencëtarë të tjerë entuziastë të të dhënave, duke përfshirë Jeremy Achin dhe Tom De Godoy, të cilët më vonë do të bëheshin themeluesit e DataRobot. Ne kishim një sfond të përbashkët në sigurime dhe kishim arritur suksese të dukshme në Kaggle. Kur u nisën përfundimisht DataRobot, një kompani e specializuar në AutoML, ata më ftuan të bashkohem me ta si Shefi i të Dhënave Scientist. Vizioni i tyre për të kombinuar praktikat më të mira nga industria e sigurimeve me fuqinë e mësimit të makinerive më emocionoi, duke paraqitur një mundësi për të krijuar diçka inovative dhe me ndikim.

Në DataRobot dhe ishin të dobishëm në ndërtimin e udhërrëfyesit të tyre të Shkencës së të Dhënave. Me çfarë lloj sfidash të dhënash u përballët?

Sfida më e rëndësishme me të cilën u përballëm ishte cilësia e ndryshme e të dhënave të ofruara si hyrje në zgjidhjen tonë AutoML. Kjo çështje shpesh rezultoi ose në një bashkëpunim që kërkon shumë kohë midis ekipit tonë dhe klientëve ose në rezultate zhgënjyese në prodhim nëse nuk adresohen siç duhet. Çështjet e cilësisë vinin nga burime të shumta që kërkonin vëmendjen tonë.

Një nga sfidat kryesore lindi nga përdorimi i përgjithshëm i mjeteve të inteligjencës së biznesit për përgatitjen dhe menaxhimin e të dhënave. Ndërsa këto mjete janë të vlefshme për gjenerimin e njohurive, atyre u mungojnë aftësitë e kërkuara për të siguruar korrektësinë në kohë për përgatitjen e të dhënave të mësimit të makinës. Si rezultat, mund të ndodhin rrjedhje në të dhënat e trajnimit, duke çuar në përshtatje të tepërt dhe performancë të pasaktë të modelit.

Komunikimi i gabuar midis shkencëtarëve të të dhënave dhe inxhinierëve të të dhënave ishte një tjetër sfidë që ndikoi në saktësinë e modeleve gjatë prodhimit. Mospërputhjet midis fazave të trajnimit dhe prodhimit, që lindin nga mospërputhja midis këtyre dy ekipeve, mund të ndikojnë në performancën e modelit në një mjedis të botës reale.

Cilat ishin disa nga përfitimet kryesore nga kjo përvojë?

Përvoja ime në DataRobot theksoi rëndësinë e përgatitjes së të dhënave në mësimin e makinerive. Duke adresuar sfidat e gjenerimit të të dhënave të trajnimit të modelit, të tilla si korrektësia në kohë, boshllëqet e ekspertizës, njohuritë e domenit, kufizimet e mjeteve dhe shkallëzueshmëria, ne mund të rrisim saktësinë dhe besueshmërinë e modeleve të mësimit të makinerive. Arrita në përfundimin se thjeshtimi i procesit të përgatitjes së të dhënave dhe inkorporimi i teknologjive inovative do të jetë i dobishëm në zhbllokimin e potencialit të plotë të AI dhe përmbushjen e premtimeve të saj.

Ne kemi dëgjuar gjithashtu nga Bashkëthemeluesi juaj Razi Raziuddin rreth historisë së gjenezës pas FeatureByte, a mund të marrim versionin tuaj të ngjarjeve?

Kur diskutova vëzhgimet dhe njohuritë e mia me Bashkëthemeluesin tim Razi Raziuddin, kuptuam se ndamë një kuptim të përbashkët të sfidave në përgatitjen e të dhënave për mësimin e makinerive. Gjatë diskutimeve tona, unë ndava me Razin njohuritë e mia mbi përparimet e fundit në komunitetin MLOps. Mund të vëzhgoja shfaqjen e dyqaneve të veçorive dhe platformave të veçorive që kompanitë e para të teknologjisë së inteligjencës artificiale vendosën për të reduktuar vonesën e shërbimit të veçorive, për të inkurajuar ripërdorimin e veçorive ose për të thjeshtuar materializimin e veçorive në të dhënat e trajnimit duke siguruar konsistencën e shërbimit të trajnimit. Megjithatë, ishte e qartë për ne se kishte ende një boshllëk në plotësimin e nevojave të shkencëtarëve të të dhënave. Razi ndau me mua njohuritë e tij se si grumbulli modern i të dhënave ka revolucionarizuar BI dhe analitikën, por nuk po përdoret plotësisht për AI.

U bë e qartë si për Razi ashtu edhe për mua se patëm mundësinë të bënim një ndikim të rëndësishëm duke thjeshtuar rrënjësisht procesin e inxhinierisë së veçorive dhe duke u ofruar shkencëtarëve të të dhënave dhe inxhinierëve ML mjetet e duhura dhe përvojën e përdoruesit për eksperimentim pa probleme të veçorive dhe shërbim të veçorive.

Cilat ishin disa nga sfidat tuaja më të mëdha për të bërë kalimin nga shkencëtari i të dhënave në sipërmarrës?

Kalimi nga një shkencëtar i të dhënave në një sipërmarrës më kërkoi të ndryshoja nga një perspektivë teknike në një mentalitet më të gjerë të orientuar drejt biznesit. Ndërsa kisha një bazë të fortë për të kuptuar pikat e dhimbjes, krijimin e një udhërrëfyesi, ekzekutimin e planeve, ndërtimin e një ekipi dhe menaxhimin e buxheteve, zbulova se krijimi i mesazheve të duhura që rezononin vërtet me audiencën tonë të synuar ishte një nga pengesat e mia më të mëdha.

Si një shkencëtar i të dhënave, fokusi im kryesor ka qenë gjithmonë në analizimin dhe interpretimin e të dhënave për të nxjerrë njohuri të vlefshme. Megjithatë, si një sipërmarrës, më duhej të ridrejtoja mendimin tim drejt tregut, klientëve dhe biznesit në përgjithësi.

Për fat të mirë, unë munda ta kapërcej këtë sfidë duke shfrytëzuar përvojën e dikujt si Bashkëthemeluesi im Razi.

Dëgjuam nga Razi pse inxhinieria e tipareve është kaq e vështirë, sipas jush çfarë e bën atë kaq sfiduese?

Inxhinieria e veçorive ka dy sfida kryesore:

  1. Transformimi i kolonave ekzistuese: Kjo përfshin konvertimin e të dhënave në një format të përshtatshëm për algoritmet e mësimit të makinerive. Përdoren teknika si kodimi me një nxehtësi, shkallëzimi i veçorive dhe metoda të avancuara si transformimet e tekstit dhe imazhit. Krijimi i veçorive të reja nga ato ekzistuese, si veçoritë e ndërveprimit, mund të përmirësojë shumë performancën e modelit. Bibliotekat e njohura si scikit-learn dhe Hugging Face ofrojnë mbështetje të gjerë për këtë lloj inxhinierie të veçorive. Zgjidhjet AutoML synojnë gjithashtu të thjeshtojnë procesin.
  2. Nxjerrja e kolonave të reja nga të dhënat historike: Të dhënat historike janë thelbësore në fushat e problemit si sistemet e rekomandimeve, marketingu, zbulimi i mashtrimit, çmimi i sigurimit, vlerësimi i kredisë, parashikimi i kërkesës dhe përpunimi i të dhënave me sensorë. Nxjerrja e kolonave informative nga këto të dhëna është sfiduese. Shembujt përfshijnë kohën që nga ngjarja e fundit, grumbullimet mbi ngjarjet e fundit dhe përfshirjet nga sekuenca ngjarjesh. Ky lloj i inxhinierisë së veçorive kërkon ekspertizë në domen, eksperimentim, aftësi të forta të kodimit dhe inxhinierisë së të dhënave dhe njohuri të thella të shkencës së të dhënave. Faktorët si rrjedhja e kohës, trajtimi i grupeve të mëdha të të dhënave dhe ekzekutimi efikas i kodit gjithashtu duhet të merren parasysh.

Në përgjithësi, inxhinieria e veçorive kërkon ekspertizë, eksperimentim dhe ndërtim të tubacioneve komplekse të të dhënave ad-hoc në mungesë të mjeteve të krijuara posaçërisht për të.

A mund të ndani se si FeatureByte fuqizon profesionistët e shkencës së të dhënave ndërsa thjeshton tubacionet e veçorive?

FeatureByte fuqizon profesionistët e shkencës së të dhënave duke thjeshtuar të gjithë procesin në inxhinierinë e veçorive. Me një Python SDK intuitiv, ai mundëson krijimin dhe nxjerrjen e shpejtë të veçorive nga tabelat e ngjarjeve dhe artikujve XLarge. Llogaritja trajtohet në mënyrë efikase duke shfrytëzuar shkallëzueshmërinë e platformave të të dhënave si Snowflake, DataBricks dhe Spark. Fletoret lehtësojnë eksperimentimin, ndërsa ndarja dhe ripërdorimi i veçorive kursen kohë. Auditimi siguron saktësinë e veçorive, ndërsa vendosja e menjëhershme eliminon dhimbjet e kokës në menaxhimin e tubacionit.

Përveç këtyre aftësive të ofruara nga biblioteka jonë me burim të hapur, zgjidhja jonë e ndërmarrjes ofron një kornizë gjithëpërfshirëse për menaxhimin dhe organizimin e operacioneve të AI në shkallë, duke përfshirë rrjedhat e punës të qeverisjes dhe një ndërfaqe përdoruesi për katalogun e veçorive.

Cili është vizioni juaj për të ardhmen e FeatureByte?

Vizioni ynë përfundimtar për FeatureByte është të revolucionarizojë fushën e shkencës së të dhënave dhe të mësimit të makinerive duke fuqizuar përdoruesit të çlirojnë potencialin e tyre të plotë krijues dhe të nxjerrin vlerë të paparë nga asetet e tyre të të dhënave.

Ne jemi veçanërisht të emocionuar për përparimin e shpejtë në AI gjeneruese dhe transformatorët, i cili hap një botë mundësish për përdoruesit tanë. Për më tepër, ne jemi të përkushtuar ndaj demokratizimit të inxhinierisë së veçorive. Inteligjenca artificiale gjeneruese ka potencialin të ulë pengesën e hyrjes për inxhinierinë e veçorive krijuese, duke e bërë atë më të aksesueshme për një audiencë më të gjerë.

Si përmbledhje, vizioni ynë për të ardhmen e FeatureByte sillet rreth inovacionit të vazhdueshëm, duke shfrytëzuar fuqinë e AI gjeneruese dhe demokratizimin e inxhinierisë së veçorive. Ne synojmë të jemi platforma e përdorur që u mundëson profesionistëve të të dhënave të transformojnë të dhënat e papërpunuara në të dhëna të zbatueshme për mësimin e makinerive, duke nxitur përparime dhe përparime nëpër industri.

A keni ndonjë këshillë për sipërmarrësit aspirantë të AI?

Përcaktoni hapësirën tuaj, qëndroni të fokusuar dhe mirëpritni risinë.

Duke përcaktuar hapësirën që dëshironi të zotëroni, mund të dalloni veten dhe të krijoni një prani të fortë në atë zonë. Hulumtoni tregun, kuptoni nevojat dhe pikat e dhimbjes së klientëve potencialë dhe përpiquni të ofroni një zgjidhje unike që adreson ato sfida në mënyrë efektive.

Përcaktoni vizionin tuaj afatgjatë dhe vendosni qëllime të qarta afatshkurtra që përputhen me atë vizion. Përqendrohuni në ndërtimin e një themeli të fortë dhe dhënien e vlerës në hapësirën tuaj të zgjedhur.

Së fundi, megjithëse është e rëndësishme të qëndroni të fokusuar, mos u shmangni nga përqafimi i risive dhe eksplorimi i ideve të reja brenda hapësirës tuaj të përcaktuar. Fusha e inteligjencës artificiale po zhvillohet vazhdimisht dhe qasjet inovative mund të hapin mundësi të reja.

Faleminderit për intervistën e mrekullueshme, lexuesit që dëshirojnë të mësojnë më shumë duhet ta vizitojnë FeatureByte.

Një partner themelues i unite.AI dhe një anëtar i Këshilli i Teknologjisë i Forbes, Antoine është një futurist i cili është i apasionuar pas të ardhmes së AI dhe robotikës.

Ai është gjithashtu Themeluesi i Letrat me vlerë.io, një faqe interneti që fokusohet në investimin në teknologjinë përçarëse.