етика

Уилсън Панг, главен технологичен директор в Appen – Серия от интервюта

Обновено on Декември 9, 2022

Уилсън Панг е главен технологичен директор в Appen, където той ръководи група от учени от световна класа за данни, инженери и продуктови мениджъри, за да съчетаят силата на технологиите и хората, за да решат проблемите с данните с ИИ.

В това интервю обсъждаме етиката на ИИ, Доклад на Appen за състоянието на ИИ и машинното обучение за 2020 г и настоящите предизвикателства в индустрията.

Какво ви привлече лично към софтуерното инженерство и науката за данни?

Получих възможността да работя върху данни и AI преди 10 години. В света на ИИ разработчиците вече не контролират логиката в кода, вместо това данните решават логиката на модела на ИИ, което е очарователно. Започнах кариерата си като разработчик в IBM, изграждайки големи системи за банки, телекомуникационни оператори и компании за обмен на ценни книжа. Бях развълнуван от силата на софтуера и AI.

Също така имам късмета да видя как данните и машинното обучение помагат за разрастването на бизнеса от първа ръка. Моят екип в eBay използва AI, за да увеличи покупките на купувачите, като по този начин увеличи десетки милиони приходи. Използвахме AI, за да увеличим вътрешната ефективност и да намалим значително оперативните разходи за Trip.com. Сега в Appen помагаме на компании от всички видове индустрии да използват AI, за да стимулират успеха на своя бизнес.

Можете ли да опишете някои от предложенията на Appen за AI и етикетиране на данни?

Ние сме доставчик на данни за обучение, който работи с над 1 милион изпълнители за събиране и етикетиране на изображения, текст, реч, аудио, видео и други данни. Тези изпълнители пребивават в над 130 държави и говорят 180 езика и диалекта, което ни дава възможност да предоставяме висококачествени данни за AI проекти. Имаме и професионални екипи, които са работили с AI данни повече от 20 години и имат много познания за това как да получат правилните данни за обучение. Не на последно място, имаме водеща в индустрията платформа за пояснения, подпомагана от AI, която има вградени функции за осигуряване на качество и продуктивност. Нашите клиенти могат да избират между нашето решение за управлявани услуги, където си партнираме с техния екип, или платформата за самообслужване. Нашата платформа за анотиране на данни, подпомагана от изкуствен интелект, дава на клиентите възможността да управляват проекти заедно с инструменти, подпомагани от машинно обучение, за подобряване на качеството, точността и скоростта на анотиране.

С повече от 20 години опит, нашите услуги предлагат данни за обучение от световна класа, най-модерната платформа за анотиране на данни, подпомагана от AI, и разнообразна, глобална тълпа, за да гарантира висококачествени данни.

Кои са някои от наличните набори от данни с отворен код?

Appen разполага с няколко набора данни с отворен код, достъпни онлайн от анотация на изображение до разпознаване на ръкопис. Тези набори от данни са безплатни за изтегляне и могат да се използват за подпомагане на изграждането и обучението на вашия AI модел. Един от най-интересните налични набори е сегментирането на ядрото от медицински изображения. Данните съдържат повече от 21000 XNUMX ядра, анотирани и валидирани от медицински експерти.

Какво беше най-голямото ви лично отнемане от Доклад за състоянието на ИИ и машинното обучение за 2020 г?

Най-интересното откритие от доклада е увеличаването на участието на C-Suite. Бях чувал за това, но да видя увеличението с 31% спрямо миналата година беше голяма изненада. AI се превръща в част от основния бизнес и не само при технологичните лидери.

Една от причините за безпокойство в доклада е, че само 25% от компаниите заявяват, че безпристрастният ИИ е критичен за мисията. Смятате ли, че това се дължи на липсата на образование относно важността на премахването на пристрастията към AI? Какво трябва да се направи, за да се подобри тази статистика?

Да, образованието е първата стъпка към подобряване на тази статистика. Един AI модел, изграден върху необективни данни, ще даде предубедени резултати и никога няма да бъде напълно успешен. Бизнес лидерите трябва да научат значението на безпристрастните данни и как това води до успешно внедряване.

Какви са етиките на ИИ, които компаниите трябва да имат предвид, когато работят с ИИ и големи масиви от данни?

Важно е да погледнете откъде идват данните. Дали тези данни са етично получени и безпристрастни? Когато разглеждате откъде са получени, искате да знаете дали хората са получили справедлива заплата и дали данните идват от разнообразна група. Наскоро пуснахме нашия Етичен кодекс на тълпата в подкрепа на включване, разнообразие, справедливо заплащане и комуникация за нашите сътрудници.

Какво смятате за най-голямото предизвикателство в индустрията в момента?

Липсата на данни и тяхното управление е най-голямото предизвикателство за индустрията. Екипите имат много решения, които трябва да вземат относно данните и много от тях имат предизвикателства да разпознаят от какво се нуждаят. Те трябва да разберат с какви данни разполагат, откъде идват и от какви данни все още се нуждаят. Всичко това управление на данни е важно за изграждането и обучението на AI модел. Липсата на данни може да доведе до предубеден модел, който от своя страна няма да бъде успешен.

Appen публикува доклади за състоянието на изкуствения интелект и машинното обучение в продължение на много години. Кога беше пуснат първият доклад и какви са някои от най-големите промени, наблюдавани след този първоначален доклад?

Първият доклад беше публикуван през 2015 г. и най-голямата промяна, която видяхме, е в собствеността върху проектите за изкуствен интелект. На първия доклад отговориха предимно учени по данни, които управляваха AI за своите компании. Днес 71% притежават C-Suite, което показва огромна промяна в гледната точка на ИИ, който става все по-критичен за бизнеса. Учените по данни също са изправени пред много предизвикателства от липсата на ресурси за изграждане на ценни прозрения от данните до неясни цели и нереалистични очаквания. Едно от ключовите предизвикателства обаче остава същото около данните и управлението на данни.

Има ли нещо друго, което бихте искали да споделите за Appen?

На 16 юли сме развълнувани да бъдем домакини на първата виртуална кръгла маса за пускането на AI в реалния свят на Appen.com. Поредицата от четири части включва водещи в индустрията практици, които споделят личен опит и прозрения за собствените си пътешествия с ИИ, хвърляйки светлина, така че другите да могат да ускорят напредъка към своите ИИ инициативи. За да успеят, компаниите ще трябва да бъдат подготвени да преодолеят няколко общи предизвикателства около данните, етиката, хората и жизнените цикли. В първото издание съберете водещи експерти, за да споделите какво означава за тях и тяхната организация да участват в създаването на отговорен ИИ.

Благодаря ви за интервюто. Читателите може да пожелаят да прочетат Доклад на Appen за състоянието на ИИ и машинното обучение за 2020 г или да посетите Appen уебсайта.