стуб Ксавиер Цонорт, суоснивач и главни директор ФеатуреБите - серија интервјуа - Уните.АИ
Повежите се са нама

Интервјуи

Ксавиер Цонорт, суоснивач и ЦПО серије ФеатуреБите – Интервиев Сериес

mm

објављен

 on

Ксавиер Цонорт је визионарски научник података са више од 25 година искуства у подацима. Каријеру је започео као актуар у индустрији осигурања пре него што је прешао на науку о подацима. Он је најбоље рангирани Каггле такмичар и био је главни научник за податке у ДатаРобот-у пре него што је суоснивао ФеатуреБите.

ФеатуреБите је у мисији да прошири АИ у предузећу, радикалним поједностављивањем и индустријализацијом АИ података. Платформа за инжењеринг и управљање функцијама омогућава научницима података да креирају и деле најсавременије функције и цевоводе података спремне за производњу за неколико минута – уместо недеља или месеци.

Почели сте своју каријеру као актуар у индустрији осигурања пре него што сте прешли на науку о подацима, шта је изазвало ову промену?

Одлучујући тренутак је била победа на ГЕ Флигхт Куест, такмичењу које је организовала ГЕ са наградом од 250 хиљада долара, где су учесници морали да предвиде кашњења америчких домаћих летова. Део тог успеха дугујем вредној пракси осигурања: моделирању у 2 фазе. Овај приступ помаже у контроли пристрасности у карактеристикама које немају довољну заступљеност у доступним подацима о обуци. Заједно са другим победама на Каггле-у, ово достигнуће ме је уверило да ми је моје актуарско искуство пружило конкурентску предност у области науке о подацима.

Током мог Каггле путовања, такође сам имао привилегију да се повежем са другим ентузијастичним научницима за податке, укључујући Џеремија Ачина и Тома Де Годоја, који ће касније постати оснивачи ДатаРобота. Делили смо заједничко искуство у осигурању и постигли смо запажене успехе на Каггле-у. Када су на крају покренули ДатаРобот, компанија специјализована за АутоМЛ, позвали су ме да им се придружим као главни научник за податке. Њихова визија комбиновања најбољих пракси из индустрије осигурања са снагом машинског учења ме је одушевила, представљајући прилику да створим нешто иновативно и утицајно.

У ДатаРобот-у и били су кључни у изградњи њихове мапе пута за науку података. Са којом врстом изазова у вези са подацима сте се суочили?

Најзначајнији изазов са којим смо се суочили био је различит квалитет података који су дати као улаз за наше АутоМЛ решење. Овај проблем је често резултирао или дуготрајном сарадњом између нашег тима и клијената или разочаравајућим резултатима у производњи ако се не реши на одговарајући начин. Проблеми са квалитетом потичу из више извора који су захтевали нашу пажњу.

Један од примарних изазова произашао је из опште употребе алата пословне интелигенције за припрему и управљање подацима. Иако су ови алати драгоцени за генерисање увида, недостају им могућности потребне да би се обезбедила тачност у тренутку за припрему података за машинско учење. Као резултат тога, могло би доћи до цурења података о обуци, што би довело до прекомерног прилагођавања и нетачних перформанси модела.

Погрешна комуникација између научника података и инжењера података била је још један изазов који је утицао на тачност модела током производње. Недоследности између фаза обуке и производње, које произилазе из неусклађености између ова два тима, могу утицати на перформансе модела у стварном окружењу.

Који су били неки од кључних закључака из овог искуства?

Моје искуство у ДатаРобот-у је истакло значај припреме података у машинском учењу. Бавећи се изазовима генерисања података за обуку модела, као што су тачност у тренутку, недостаци у стручности, знање о домену, ограничења алата и скалабилност, можемо побољшати тачност и поузданост модела машинског учења. Дошао сам до закључка да ће поједностављење процеса припреме података и укључивање иновативних технологија бити од кључног значаја за откључавање пуног потенцијала вештачке интелигенције и испуњење њених обећања.

Чули смо и вашег суоснивача Разија Разиуддина о причи о настанку иза ФеатуреБите-а, можемо ли добити вашу верзију догађаја?

Када сам разговарао о својим запажањима и увидима са својим суоснивачем Разијем Разиуддином, схватили смо да делимо заједничко разумевање изазова у припреми података за машинско учење. Током наших дискусија, поделио сам са Разијем своје увиде у недавна достигнућа у заједници МЛОпс. Могао сам да посматрам појаву продавница карактеристика и платформи функција које су технолошке компаније које су прве користиле вештачку интелигенцију поставиле да би смањиле кашњење у сервирању функција, подстакле поновну употребу функција или поједноставиле материјализацију функција у податке о обуци, истовремено обезбеђујући конзистентност у обуци. Међутим, било нам је очигледно да још увек постоји празнина у задовољавању потреба научника података. Рази је са мном поделио своје увиде у то како је савремени стек података револуционисао БИ и аналитику, али се не користи у потпуности за АИ.

И Разију и мени постало је очигледно да смо имали прилику да направимо значајан утицај радикалним поједностављивањем процеса инжењеринга карактеристика и пружањем научницима података и инжењерима МЛ-а праве алате и корисничко искуство за беспрекорно експериментисање функција и сервирање функција.

Који су били неки од ваших највећих изазова у транзицији од научника података до предузетника?

Прелазак са научника података у предузетника захтевао је од мене да се променим са техничке перспективе на шири начин размишљања оријентисан на пословање. Иако сам имао јаку основу у разумевању болних тачака, креирању мапе пута, извршавању планова, изградњи тима и управљању буџетима, открио сам да је прављење праве поруке која је заиста одјекнула код наше циљне публике била једна од мојих највећих препрека.

Као научник података, мој примарни фокус је одувек био на анализи и тумачењу података како бих извукао вредне увиде. Међутим, као предузетник, морао сам да преусмерим своје размишљање ка тржишту, купцима и целокупном пословању.

На срећу, успео сам да превазиђем овај изазов користећи искуство некога као што је мој суоснивач Рази.

Чули смо се са Разијем о томе зашто је инжењеринг карактеристика тако тежак, по вашем мишљењу шта га чини тако изазовним?

Инжењеринг карактеристика има два главна изазова:

  1. Трансформисање постојећих колона: Ово укључује претварање података у одговарајући формат за алгоритме машинског учења. Користе се технике као што су једнократно кодирање, скалирање функција и напредне методе као што су трансформације текста и слике. Креирање нових функција од постојећих, као што су функције интеракције, може значајно побољшати перформансе модела. Популарне библиотеке као што су сцикит-леарн и Хуггинг Фаце пружају опсежну подршку за ову врсту инжењеринга функција. АутоМЛ решења такође имају за циљ да поједноставе процес.
  2. Издвајање нових колона из историјских података: Историјски подаци су кључни у проблемским доменима као што су системи препорука, маркетинг, откривање превара, цене осигурања, бодовање, предвиђање потражње и обрада података сензора. Издвајање информативних колона из ових података је изазовно. Примери укључују време од последњег догађаја, агрегације на основу недавних догађаја и уграђивање низа догађаја. Ова врста инжењеринга карактеристика захтева експертизу у домену, експериментисање, јаке вештине кодирања и инжењеринга података, и дубоко знање науке о подацима. Факторе као што су цурење времена, руковање великим скуповима података и ефикасно извршавање кода такође треба узети у обзир.

Све у свему, инжењеринг карактеристика захтева стручност, експериментисање и изградњу сложених ад-хоц цевовода података у одсуству алата посебно дизајнираних за то.

Да ли бисте могли да поделите како ФеатуреБите оснажује професионалце у области науке о подацима док поједностављује цевоводе функција?

ФеатуреБите оснажује професионалце у области науке о подацима тако што поједностављује цео процес у инжењерингу карактеристика. Са интуитивним Питхон СДК-ом, омогућава брзо креирање и издвајање функција из КСЛарге табела догађаја и ставки. Рачунањем се ефикасно управља коришћењем скалабилности платформи података као што су Сновфлаке, ДатаБрицкс и Спарк. Бележнице олакшавају експериментисање, док дељење функција и поновна употреба штеде време. Ревизија обезбеђује тачност функција, док непосредна примена елиминише главобоље управљања цевоводом.

Поред ових могућности које нуди наша библиотека отвореног кода, наше решење за предузећа пружа свеобухватан оквир за управљање и организовање АИ операција на великом нивоу, укључујући токове рада управљања и кориснички интерфејс за каталог функција.

Која је ваша визија будућности ФеатуреБите-а?

Наша крајња визија за ФеатуреБите је да револуционише област науке о подацима и машинског учења тако што ће корисницима омогућити да ослободе свој пуни креативни потенцијал и извуку вредност без преседана из својих средстава података.

Посебно смо узбуђени због брзог напретка у генеративној вештачкој интелигенцији и трансформаторима, што отвара свет могућности за наше кориснике. Штавише, посвећени смо демократизацији инжењеринга карактеристика. Генеративна АИ има потенцијал да смањи баријеру уласка за креативни инжењеринг карактеристика, чинећи га доступнијим широј публици.

Укратко, наша визија будућности ФеатуреБите-а се врти око непрекидних иновација, искориштавања моћи генеративне АИ и демократизације инжењеринга карактеристика. Циљ нам је да будемо платформа која омогућава професионалцима за податке да трансформишу необрађене податке у делотворан улаз за машинско учење, подстичући открића и напредак у различитим индустријама.

Имате ли неки савет за амбициозне АИ предузетнике?

Дефинишите свој простор, останите фокусирани и добродошли новине.

Дефинисањем простора који желите да поседујете, можете се разликовати и успоставити снажно присуство у тој области. Истражите тржиште, разумејте потребе и болне тачке потенцијалних купаца и настојте да обезбедите јединствено решење које ефикасно решава те изазове.

Дефинишите своју дугорочну визију и поставите јасне краткорочне циљеве који су у складу са том визијом. Концентришите се на изградњу јаке основе и испоруку вредности у простору који сте изабрали.

Коначно, иако је важно да останете фокусирани, немојте се устручавати да прихватите новине и истражујете нове идеје унутар вашег дефинисаног простора. Област вештачке интелигенције се стално развија, а иновативни приступи могу отворити нове могућности.

Хвала вам на одличном интервјуу, читаоци који желе да сазнају више треба да посете ФеатуреБите.

Оснивачки партнер уните.АИ и члан Форбсов технолошки савет, Антоан је а футуристички који је страствен за будућност вештачке интелигенције и роботике.

Такође је оснивач Сецуритиес.ио, веб локација која се фокусира на улагање у дисруптивну технологију.