Інтерв’ю
Раян Колн, CEO в Appen – Серія інтерв’ю

Раян Колн є головним виконавчим директором та керівником компанії Appen. Раян має понад 20 років глобального досвіду в галузі технологій та телекомунікацій, а також глибоке розуміння бізнесу Appen та індустрії штучного інтелекту.
Його професійна кар’єра розпочалася як інженера, з фокусом на інженерії мобільних мереж даних в Австралії, Азії та Північній Америці. Після завершення програми MBA в Нью-Йоркському університеті Раян приєднався до The Boston Consulting Group (BCG) у 2011 році як стратегічний консультант. Під час роботи в BCG він спеціалізувався на технологіях та телекомунікаціях і здобув глибокий досвід стратегії в різних питаннях росту та операцій.
Приєднавшись до Appen AI у 2018 році на посаду віце-президента з корпоративного розвитку, він очолив стратегічні придбання, такі як Figure Eight і Quadrant, і підтримав створення підрозділів у Китаї та федеральних структурах. До призначення на посаду генерального директора він обіймав посаду операційного директора, керуючи глобальними операціями та стратегією.
З понад 20-річним досвідом у галузі технологій та телекомунікацій, як ваша кар’єрна траєкторія сформувала ваш підхід до керівництва Appen у швидкозмінному ландшафті штучного інтелекту?
Моя кар’єра розпочалася як інженер-телекомунікаційник, де моя роль полягала у будівництві та оптимізації мереж та включала величезну кількість даних, аналітики та пошуку інноваційних рішень для оптимізації продуктивності мережі та досвіду клієнта.
Після завершення програми MBA в Нью-Йоркському університеті це переросло у керівні ролі в галузі технологічної стратегії та злиття та поглинання, де я зосередився на більших стратегічних питаннях, таких як нові тенденції, інвестиційні можливості та бізнес-моделі. Цей досвід дав мені глибоке розуміння як технічної, так і бізнес-аспектів нових технологій.
В Appen ми працюємо на перетині штучного інтелекту та даних, і мій досвід дозволив мені керувати компанією та орієнтуватися в складностях швидкозмінного простору штучного інтелекту, рухаючись через основні розробки, такі як розпізнавання голосу, NLP, системи рекомендацій та зараз генеративний інтелект. Ця стратегічна видіння вкрай важлива, оскільки штучний інтелект продовжує трансформувати галузі по всьому світу.
Ви перебуваєте в Appen з 2018 року, керуючи стратегічними придбаннями, такими як Figure Eight і Quadrant. Як ці стратегічні ходи позиціонували Appen як лідера в сфері послуг з даних штучного інтелекту, і яку наступну велику можливість ви бачите для компанії?
Придбання Figure Eight і Quadrant були ключовими для розширення наших можливостей з даних штучного інтелекту, особливо в таких сферах, як анотація даних та геолокаційна розвідка. Платформа анотації даних Figure Eight була особливо впливовою. Платформа дуже настраївана, і ми використовували її для роботи в багатьох різних областях. Нещодавно ми використовували платформу для виконання більшості наших потоків даних генеративного інтелекту.
Крім придбань, близько 5 років тому ми створили операцію в Китаї під назвою Appen China. Ми зараз є найбільшою компанією з даних штучного інтелекту в Китаї, з доходом майже вдвічі більшим, ніж у наших найближчих конкурентів.
Оглядаючи майбутнє, фокус Appen зосереджено на підтримці розробки та впровадження генеративного інтелекту. Існують великі можливості росту як для розробників моделей, так і для компаній, які шукають можливість впровадити генеративний інтелект у свої продукти та операції. Ми відчуваємо, що ми тільки на початку найбільшої хвилі штучного інтелекту.
Якість даних відіграє важливу роль у розробці моделей штучного інтелекту. Чи можете ви розповісти, як Appen забезпечує точність, різноманітність та актуальність своїх наборів даних, особливо з огляду на зростаючий попит на високоякісні навчальні дані для великих мовних моделей?
Сила Appen полягає в нашій здатності створювати високоякісні дані послідовно та у великих масштабах. Ми працюємо у тісній співпраці з нашими клієнтами, щоб зрозуміти їхні цілі щодо моделей штучного інтелекту та розробити високоякісні дані для їхніх потреб за допомогою багаторівневого підходу, який поєднує автоматичні інструменти та людську зворотню зв’язок. У нас є глобальна робоча сила понад 1 мільйона осіб у понад 200 країнах, що дозволяє нам курирувати групу кваліфікованих та різноманітних учасників. За допомогою суворих заходів контролю якості та зворотної зв’язки ми забезпечуємо, щоб дані були точними, послідовними та актуальними, і могли бути використані для ефективного покращення продуктивності систем штучного інтелекту. Це дозволяє системам штучного інтелекту працювати ефективно в реальних умовах та також може бути використано для покращення стійкості та зменшення упередженості, особливо для великих мовних моделей.
Синтетична генерація даних набуває популярності, а інвестиції Appen у Mindtech підкреслюють ваш інтерес до цієї сфери. Чи можете ви обговорити переваги та недоліки використання синтетичних або веб-скрепед даних порівняно з краудсорсинговими даними для навчання моделей штучного інтелекту, і як ви бачите синтетичні дані як доповнення до краудсорсингових даних, які відомі Appen?
Високоякісні дані є вкрай важливими, але можуть бути дорогими та трудомісткими у виробництві, через що синтетичні дані набувають популярності. Вони працюють добре для структурованих даних у традиційних завданнях штучного інтелекту/машинного навчання, особливо в галузях з суворими нормативними вимогами, такими як охорона здоров’я та фінанси, оскільки вони уникують використання особистої інформації.
Однак синтетичні дані часто缺ують глибину та нюанси реальних даних, особливо для складних завдань генеративного інтелекту, які вимагають різноманітності та глибокої експертизи. Вони також можуть поширювати помилки або упередженості з оригінальних даних. Веб-скрепед дані, які часто використовуються для великих мовних моделей, представляють свої власні виклики з низькоякісним контентом, упередженістю та дезінформацією, що вимагає ретельної курирування.
Краудсорсингові дані, у яких спеціалізується Appen, залишаються “ґрунтовою правдою”. Людська експертиза вкрай важлива для генерації різноманітних та складних даних, необхідних для покращення точності моделей штучного інтелекту та забезпечення їхньої відповідності людським цінностям.
Ми розглядаємо синтетичні дані як доповнення до наших людських анотованих даних. Хоча синтетичні дані можуть прискорити частини процесу, людські дані забезпечують, що моделі відображають реальну різноманітність. Разом вони забезпечують збалансований підхід до створення високоякісних навчальних даних для штучного інтелекту.
Закон ЄС про штучний інтелект та інші глобальні регуляції формують етичні стандарти навколо розробки штучного інтелекту. Як ви бачите ці регуляції, що впливають на операції Appen та ширшу індустрію штучного інтелекту в майбутньому?
Закон ЄС про штучний інтелект та подібні глобальні регуляції, ймовірно, вплинуть на операції Appen, встановлюючи нові етичні стандарти для розробки та продуктивності моделей штучного інтелекту. Ми можемо побачити зміни в тому, як ми обробляємо дані, забезпечуємо справедливість моделей та звертаємося до етичних питань. Це може привести до більш суворих процесів та потенційних змін у нашому підході до навчання та валідації моделей.
В широкому сенсі ці регуляції, ймовірно, спонукатимуть індустрію до вищого етичного стандарту, збільшать витрати на дотримання вимог та потенційно сповільнять деякі аспекти інновацій. Однак вони також спонукатимуть до більшої відповідальності та прозорості, що в кінцевому підсумку може привести до більш відповідального та сталого розвитку штучного інтелекту.
З зростаючими проблемами щодо упередженості у штучному інтелекті, як Appen працює над тим, щоб забезпечити, що набори даних, використані для навчання моделей штучного інтелекту, є етично джерелені та вільні від упередженості, особливо у чутливих сферах, таких як обробка природної мови та комп’ютерне зору?
Ми активно працюємо над зменшенням упередженості, сприяючи різноманітності та інклюзивності у наших проєктах. Це приємно бачити, що багато наших клієнтів зосереджені на захопленні широких демографічних даних під час збору даних та оцінки моделей. Маємо глобальну робочу силу, яка мешкає у більшості країн, що дозволяє нам джерелити дані з широкого спектра перспектив та досвіду, що особливо важливо у чутливих сферах, таких як обробка природної мови та комп’ютерне зору.
Від 2019 року ми формалізували наші найкращі практики у Кодексі поведінки краудсорсингу, демонструючи нашу відданість справедливості, чесності та добробуту крауду. Це включає нашу приверженість справедливій оплаті, забезпечення того, щоб голос нашого крауду був почутий, та підтримання суворих заходів захисту конфіденційності. Підтримуючи ці принципи, ми прагнемо доставляти високоякісні, етично джерелені дані, які підтримують відповідальний розвиток штучного інтелекту.
Як штучний інтелект стає все більш інтегрованим у галузі, такі як автомобільна промисловість, реклама та AR/VR, як Appen позиціонує себе для задоволення зростаючого попиту на спеціалізовані навчальні дані в цих секторах?
За останні 27 років ми постачали спеціалізовані навчальні дані для широкого спектра галузей та випадків використання, і ми продовжимо еволюціонувати, оскільки наші клієнти змінюють свої потреби.
Як приклад, у галузі автомобільної промисловості ми працювали з провідними автомобільними компаніями та постачальниками рішень для салону автомобіля для будівництва систем голосового керування у транспортному засобі. Тепер ми допомагаємо нашим клієнтам у нових сферах, таких як збір відеоданих про водіїв для допомоги у безпеці шляхом моніторингу відволікань водіїв.
У сфері реклами ми допомогли провідній глобальній рекламній платформі покращити якість та точність реклами для відповідності користувачам за великим багаторічним глобальним програмою з понад 7 мільйонами оцінок. Тепер, оскільки багато платформ приймають рішення щодо генеративного інтелекту, наша робоча сила не тільки оцінює відповідність реклами, але також допомагає оцінювати якість згенерованих реклам.
Ми змогли зробити все це завдяки нашій потужній платформі анотації, яку можна налаштувати для підтримки складних робочих процесів та різних модальностей даних, включаючи текст, аудіо, зображення, відео та багатомодальну анотацію. Але в кінцевому підсумку наша здатність рухатися з змінюваною галуззю залежить від нашої глибокої експертизи у даних для розвитку штучного інтелекту та сильного партнерства з нашими клієнтами.
Appen був лідером у постачанні високоякісних даних для різних застосувань штучного інтелекту. Оглядаючи майбутнє, як ви бачите роль Appen, що еволюціонує, оскільки генеративний інтелект та великі мовні моделі продовжують розвиватися та впливати на глобальні ринки?
Генеративний інтелект та великі мовні моделі трансформують галузі, і ми продовжимо відігравати критичну роль у постачанні високоякісних даних для підтримки цих досягнень. Коли мова йде про глобальні ринки, наша здатність джерелити дані з понад 200 країн та понад 500 мов стане ще більш цінною, і у нас є сильна історія цього, оскільки ми допомогли компаніям, таким як Microsoft, запустити моделі машинного перекладу для понад 110 мов.
По мірі розширення розгортання застосувань великих мовних моделей ми бачимо зростаючий попит на відповідність з кінцевими користувачами, включаючи можливості локалізації для забезпечення мовних та культурних нюансів у різних глобальних ринках. Ми зобов’язані допомагати компаніям розробляти системи штучного інтелекту, які є як продуктивними, так і відповідальними, забезпечуючи, що дані, використані для навчання цих моделей, є різноманітними, актуальними та етично джереленими.
Appen відомий своєю підтримкою деяких з найбільш просунутих великих мовних моделей у світі. Які інновації у сфері анотації та збору даних Appen зосереджується на покращенні продуктивності цих моделей?
Ми безперервно інноваційно вдосконалюємо наші процеси анотації та збору даних для покращення продуктивності великих мовних моделей. Однією з областей фокусу є покращення ефективності та точності анотації даних за допомогою передових інструментів, підтримуваних штучним інтелектом, які допомагають оптимізувати та автоматизувати частини процесу, зберігаючи високі стандарти якості.
Ми можемо ідентифікувати дані, які потребують подальшого людського входу, забезпечуючи, що зусилля з анотації будуть націлені на те, де вони матимуть найбільший вплив. Ми інтегрували функції, такі як Model Mate, які можуть бути використані для прискорення виробництва даних та покращення якості даних. Ми також зосереджені на кращих практиках управління учасниками, що є важливим, оскільки складність завдань зростає.
Спроможність зрозуміти продуктивність учасників та надати зворотню зв’язок для безперервного покращення якості наших людських даних. Ці інновації дозволяють нам постачати високоякісні, великомасштабні дані, необхідні для підтримки та налаштування світових великих мовних моделей.
Як ви вступаєте на свою нову посаду генерального директора, які ваші головні пріоритети для Appen на найближчі роки, і як ви плануєте стимулювати зростання компанії в висококонкурентному просторі штучного інтелекту?
Як я переходжу на посаду генерального директора, мої стратегічні пріоритети призначені для забезпечення лідерства Appen у конкурентному ландшафті штучного інтелекту:
- Підтримка розробки моделей генеративного інтелекту: За останні 18 місяців генеративний інтелект став ключовим компонентом нашої пропозиції, з 28% доходу групи, отриманого від проектів, пов’язаних з генеративним інтелектом, у червні 2024 року порівняно з 8% у січні. Ми бачимо значний потенціал на ринку генеративного інтелекту, який, згідно з прогнозами галузі, має досягнути 1,3 трильйона доларів до 2032 року.
- Підтримка впровадження моделей генеративного інтелекту: Ми бачимо зростання у нових сегментах, оскільки підприємства використовують рішення генеративного інтелекту для своїх випадків використання. Хоча відсоток проектів генеративного інтелекту, які досягають розгортання, низький, ми очікуємо, що фінансовий рік 2024/25 буде перехідним періодом, під час якого експерименти переходять до виробництва, і стимулюють попит на спеціалізовані високоякісні дані.
- Оптимізація та автоматизація підготовки даних: За допомогою штучного інтелекту для забезпечення якості та автоматизації певних етапів процесу підготовки даних. Це дозволить нам підвищити якість даних, а також покращити операційну ефективність, покращуючи наші валові маржі.
- Еволюція досвіду наших працівників-учасників: Наша нова платформа CrowdGen дозволяє нам масштабувати проекти швидко та гнучко відповідно до потреб наших клієнтів, використовуючи штучний інтелект для автоматичного скринінгу та підтримки проектів. Це також покращить досвід наших учасників, забезпечуючи персоналізовану підтримку. Appen був одним з перших, хто підтримував прозорість, різноманітність та чесність у джерелах даних, і ми залишаємося прив’язаними до нашого Кодексу поведінки краудсорсингу.
Ці пріоритети позиціонують Appen для стійкого зростання та інновацій у ландшафті штучного інтелекту.
Дякуємо за велике інтерв’ю, ми закликаємо читачів, які бажають дізнатися більше, відвідати Appen.












