никулец Вилсон Панг, коавтор на реалниот свет вештачка интелигенција - серија интервјуа - Unite.AI
Поврзете се со нас

Интервјуа

Вилсон Панг, коавтор на реалниот свет AI – серија интервјуа

mm
Ажурирани on

Вилсон Панг се приклучи Аппен во ноември 2018 година како CTO и е одговорен за производите и технологијата на компанијата. Вилсон има повеќе од деветнаесетгодишно искуство во софтверско инженерство и наука за податоци. Пред да се приклучи на Appen, Вилсон беше главен директор за податоци на Ctrip во Кина, втората по големина компанија за онлајн туристичка агенција во светот, каде што ги предводеше инженерите за податоци, аналитичарите, менаџерите на производи за податоци и научниците за да го подобрат корисничкото искуство и да ја зголемат оперативната ефикасност. го зголеми бизнисот. Пред тоа, тој беше виш директор за инженерство на eBay во Калифорнија и обезбеди лидерство во различни домени, вклучувајќи услуги и решенија за податоци, наука за пребарување, маркетинг технологија и системи за наплата. Работел како архитект во IBM пред eBay, градејќи технолошки решенија за различни клиенти. Вилсон магистрирал и дипломирал по електротехника на Универзитетот Жеџијанг во Кина.

Разговараме за неговата нова книга: Реалниот свет на вештачката интелигенција: Практичен водич за одговорно машинско учење

Опишувате како кога ги водевте научните тимови за пребарување на eBay, една од вашите први лекции со машинското учење беше разбирањето на важноста да се знае која метрика да се измери. Дадениот пример беше како метриката „купувања по сесија“ не успеа да ја земе предвид монетарната вредност на ставката. Како компаниите можат најдобро да разберат кои метрики треба да се мерат за да се избегнат слични проблеми?

Започнете со целите што вашиот тим ги припишува на моделот со вештачка интелигенција - во нашиот случај, сакавме да постигнеме повеќе приходи со машинско учење. Кога ќе прикачите метрика на целите, размислете каква механика ќе произведат тие метрики, откако ќе го ослободите моделот и луѓето ќе почнат да комуницираат со него, но и да ги забележите вашите претпоставки. Во нашиот случај, претпоставувавме дека моделот ќе се оптимизира за приходите, но бројот на купувања по сесија не се претвори во тоа, бидејќи моделот се оптимизираше за голем број на продажби со ниска вредност на билетите, и на крајот на денот бевме не заработува повеќе пари. Откако го сфативме тоа, можевме да ја промениме метриката и да го насочиме моделот во вистинската насока. Значи, одредувањето на грануларна метрика, како и забележувањето на претпоставките се клучни за успехот на проектот.

Што научивте вие ​​лично од истражувањето и пишувањето на оваа книга?

Имаме многу различни проблеми кои може да се решат со вештачка интелигенција од различни компании и различни индустрии. Случаите на употреба може да бидат многу различни, решението за вештачка интелигенција може да биде различно, податоците за обука на тоа решение за вештачка интелигенција може да бидат различни. Сепак, без оглед на сите тие разлики, грешките што луѓето ги направиле за време на нивното патување со вештачка интелигенција се доста слични. Тие грешки се случуваа повторно и повторно во секакви компании од сите видови индустрии.

Споделивме некои вообичаени најдобри практики при имплементирање на проекти за вештачка интелигенција со надеж дека ќе им помогнеме на повеќе луѓе и компании да ги избегнат тие грешки и да им ја стекнеме довербата да распоредат одговорна вештачка интелигенција.

Кои се некои од најважните лекции што се надевате дека луѓето ќе ги земат од читањето на ова?

Ние жестоко веруваме дека внимателна, одговорна и етичка употреба на технологијата за машинско учење може да го направи светот поправеден, праведен и инклузивен место. Технологијата за машинско учење ветува дека ќе преобликува сè низ деловниот свет, но тоа не мора да биде тешко. Постојат испробани методи и процеси што тимовите можат да ги следат и да добијат доверба да ги применат во производството.

Друга клучна лекција е дека сопствениците на бизнис (како менаџерите на производи) и членовите на тимот од потехничката страна (како инженерите и научниците за податоци) треба да зборуваат заеднички јазик. За успешно распоредување на вештачката интелигенција, лидерите мора да го премостат јазот помеѓу тимовите, обезбедувајќи бизнис специјалисти и доволен контекст на C-ниво за ефикасно да разговараат со техничките имплементатори.

Многу луѓе прво размислуваат за кодот кога мислат на ВИ. Една од клучните лекции во книгата е дека податоците се клучни за успехот на моделот со вештачка интелигенција. Има многу што оди со податоци од собирање до етикетирање до складирање и секој чекор ќе влијае на успехот на моделот. Најуспешните распоредувања на вештачката интелигенција се оние кои ставаат голем акцент на податоците и се стремат постојано да го подобруваат овој аспект од нивниот ML модел.

Сè што бара вештачката интелигенција од реалниот свет е меѓуфункционален тим и иновативен дух.

Дискутирано е да се утврди кога точноста на моделот со вештачка интелигенција е доволно висока за да се поддржи користењето вештачка интелигенција. Кој е најлесниот начин да се процени типот на точност што е потребен?

Тоа зависи од вашите случаи на употреба и толеранцијата на ризик. Тимовите кои развиваат вештачка интелигенција секогаш треба да имаат фаза на тестирање каде што ги одредуваат нивоата на точност и прифатливите прагови за нивните организации и засегнати страни. За случаи на употреба на живот или смрт - каде што постои потенцијална штета ако вештачката интелигенција тргне наопаку, како во случајот со софтверот за казнување, автомобилите кои самостојно управуваат, случаите за медицинска употреба, барот е многу, многу висок - и тимовите мора да стават поставете непредвидени ситуации во случај моделите да се погрешни. За случаи на употреба по толерантни грешки, каде што има многу субјективност – како содржина, пребарување или релевантност на рекламите, тимовите може да се потпрат на повратните информации од корисниците за да продолжат да ги прилагодуваат своите модели дури и додека се во производство. Се разбира, тука има и некои случаи на употреба со висок ризик, каде што незаконски или неморален материјал може да им се прикаже на корисниците, така што тука мора да постојат заштитни механизми и повратни информации. 

Можете ли да ја дефинирате важноста на дефинирање на успехот за еден проект однапред? 

Подеднакво е важно да се започне со деловен проблем, како што е да се дефинира успехот однапред, како што и двете одат рака под рака. Следејќи го примерот во книгата за дилерот на автомобили што користи вештачка интелигенција за етикетирање на слики, тие не утврдија како изгледа успехот бидејќи не дефинираа деловен проблем за решавање. Успехот за нив можеше да биде голем број различни работи што го отежнуваат решавањето на проблемот, дури и за тимови од луѓе, а камоли модел за машинско учење со фиксен опсег. Доколку се нафатиле да го означат целото возило со вдлабнатини за да создадат листа на возила на кои им е потребна поправка и го дефинирале успехот како прецизно означување на 80% од сите вдлабнатини на возила во инвентарот на користени автомобили, тогаш кога точно би означиле 85%, тимот би го нарекле успех. Но, ако тој успех не е поврзан со деловниот проблем и со директно влијание врз бизнисот, тешко е да се оцени проектот надвор од фокусираната дефиниција за точноста на етикетирањето во овој пример. Овде деловниот проблем беше покомплексен, а етикетирањето вдлабнатини е само негова компонента. Во нивниот случај, тие би можеле да бидат подобри со дефинирање на успехот како заштеда на време/пари на процесот на побарувања или оптимизирање на процесот на поправки за X% и потоа да го преведат влијанието на етикетирањето во реални деловни резултати.

Колку е важно да се осигураме дека примерите со податоци за обука ги покриваат сите случаи на употреба што ќе се случат при распоредувањето на производството?

Исклучително е важно моделот да биде обучен за сите случаи на употреба за да се избегне пристрасност. Но, исто така е важно да се забележи дека, иако е невозможно да се опфатат апсолутно сите случаи на употреба во производството, тимовите што градат вештачка интелигенција треба да ги разберат нивните податоци за производство, како и податоците за нивната обука за да ја обучат вештачката интелигенција за она што ќе се сретне во производството. . Пристапот до податоци за обука кои доаѓаат од големи разновидни групи со различни случаи на употреба ќе биде од клучно значење за успехот на моделот. На пример, модел кој е обучен да препознава милениче на луѓе на поставената слика треба да се обучи за сите видови миленичиња; кучиња, мачки, птици, мали цицачи, гуштери итн. Ако моделот е воз само за кучиња, мачки и птици, тогаш кога некој ќе постави слика со своето заморче, моделот нема да може да го идентификува. Иако ова е многу едноставен пример, тој покажува како обуката за што е можно повеќе случаи на употреба е критична за успехот на моделот.

Во книгата се дискутира за потребата да се развијат добри хигиенски навики од горе надолу, кои се некои заеднички први чекори за да се негува оваа навика?

Добрите навики за хигиена на податоците ќе ја зголемат употребливоста на внатрешните податоци и ќе ги примат за случаи на употреба на ML. Целата компанија треба да стане добра во организирање и следење на нејзините збирки податоци. Еден сигурен начин да се постигне ова е тоа да се направи деловно барање и да се следи имплементацијата, така што има многу малку извештаи кои завршуваат како сопствени работни места, а тимовите работат се повеќе и повеќе со цевководи за податоци пренесени во централно складиште, со јасна онтологија. Друга добра практика е водење евиденција за тоа кога и каде се собрани податоците и со што се случило пред да бидат ставени во базата на податоци, како и воспоставување процеси за периодично чистење на неискористени или застарени податоци.

Ви благодарам за одличното интервју, на читателите кои се заинтересирани да дознаат повеќе, им препорачувам да ја прочитаат книгата Реалниот свет на вештачката интелигенција: Практичен водич за одговорно машинско учење.

Основачки партнер на unite.AI и член на Технолошкиот совет на Форбс, Антоан е а футуристички кој е страстен за иднината на вештачката интелигенција и роботиката.

Тој е и основач на Хартии од вредност.io, веб-страница која се фокусира на инвестирање во непушачка технологија.