Интервью
Райан Коллн, генеральный директор Appen – Серия интервью

Райан Коллн является генеральным директором и управляющим директором Appen. Райан имеет более 20 лет глобального опыта в технологиях и телекоммуникациях, а также глубокое понимание бизнеса Appen и отрасли ИИ.
Его профессиональная карьера началась как инженера, с фокусом на инженерии мобильных сетей в Австралии, Азии и Северной Америке. После окончания MBA в Университете Нью-Йорка Райан присоединился к The Boston Consulting Group (BCG) в 2011 году в качестве стратегического консультанта. Во время работы в BCG он специализировался на технологиях и телекоммуникациях и получил глубокий опыт стратегии по различным вопросам роста и операций.
Присоединившись к Appen AI в 2018 году в качестве вице-президента по корпоративному развитию, он возглавил стратегические приобретения, такие как Figure Eight и Quadrant, и поддержал создание китайского и федерального отделений. До своего назначения на пост генерального директора он занимал должность операционного директора, курируя глобальные операции и стратегию.
С более чем 20-летним опытом в технологиях и телекоммуникациях, как ваш карьерный путь сформировал ваш подход к руководству Appen в быстро меняющемся ландшафте ИИ?
Моя карьера началась как инженера-телекоммуникациониста, где моя роль заключалась в построении и оптимизации сетей и включала огромное количество данных, аналитики и поиска инновационных решений для оптимизации производительности сетей и опыта пользователей.
После окончания моего MBA в Нью-Йоркском университете это переросло в руководящие роли в стратегии технологий и слияниях и поглощениях, где я фокусировался на более крупных стратегических вопросах, таких как появляющиеся тенденции, возможности инвестирования и бизнес-модели. Этот опыт дал мне глубокое понимание как технических, так и деловых аспектов появляющихся технологий.
В Appen мы работаем на пересечении ИИ и данных, и мой опыт позволил мне возглавить компанию и ориентироваться в сложностях быстро меняющегося пространства ИИ, проходя через основные разработки, такие как распознавание голоса, NLP, системы рекомендаций и теперь генеративный ИИ. Этот стратегический взгляд имеет решающее значение, поскольку ИИ продолжает трансформировать отрасли во всем мире.
Вы работаете в Appen с 2018 года, реализуя крупные приобретения, такие как Figure Eight и Quadrant. Как эти стратегические шаги позиционировали Appen в качестве лидера в услугах данных ИИ, и что вы видите как следующую большую возможность для компании?
Приобретения Figure Eight и Quadrant были ключевыми для расширения наших возможностей данных ИИ, особенно в таких областях, как аннотация данных и геолокационная разведка. Платформа аннотации данных Figure Eight оказалась особенно влиятельной. Платформа высоко настраиваема, и мы использовали ее для работы в многих разных доменах. Более недавно мы использовали платформу для запуска большинства наших потоков данных генеративного ИИ.
В дополнение к приобретениям, около 5 лет назад мы создали операцию в Китае под названием Appen China. Мы теперь являемся крупнейшей компанией данных ИИ в Китае, с доходом почти в два раза превышающим доход наших ближайших конкурентов.
В перспективе фокус Appen смещается в сторону поддержки разработки и внедрения генеративного ИИ. Есть значительные возможности роста как для создателей моделей, так и для компаний, стремящихся внедрить генеративный ИИ в свои продукты и операции. Мы считаем, что мы только начинаем самую большую волну ИИ.
Качество данных играет решающую роль в разработке моделей ИИ. Не могли бы вы поделиться, как Appen обеспечивает точность, разнообразие и актуальность своих наборов данных, особенно с учетом растущего спроса на высококачественные данные для обучения LLM?
Сила Appen заключается в нашей способности создавать высококачественные данные последовательно и в крупном масштабе. Мы тесно сотрудничаем с нашими клиентами, чтобы понять их цели моделей ИИ и разработать высококачественные данные для их потребностей посредством многослойного подхода, который сочетает автоматические инструменты и обратную связь человека. У нас есть глобальная рабочая сила из более чем 1 миллиона человек по более чем 200 странам, что позволяет нам курировать группу квалифицированных и разнообразных участников. Через строгий контроль качества и обратную связь мы гарантируем, что данные точны, последовательны и актуальны, и могут быть использованы для эффективного улучшения производительности моделей ИИ. Это позволяет системам ИИ работать эффективно в реальных условиях и также может быть использовано для улучшения устойчивости и снижения предвзятости, особенно для LLM.
Генерация синтетических данных набирает популярность, и инвестиции Appen в Mindtech подчеркивают ваш интерес в этой области. Не могли бы вы обсудить преимущества и недостатки использования синтетических или веб-скрапированных данных по сравнению с краудсорсинговыми данными для обучения моделей ИИ, и как вы видите синтетические данные, дополняющие краудсорсинговые данные, за которые известна Appen?
Высококачественные данные имеют решающее значение, но могут быть дорогими и трудоемкими в производстве, что является причиной, по которой синтетические данные привлекают внимание. Они работают хорошо для структурированных данных в традиционных задачах ИИ/МЛ, особенно в отраслях с жесткими правилами конфиденциальности, таких как здравоохранение и финансы, поскольку они избегают использования личной информации.
Однако синтетические данные часто лишены глубины и нюансов реальных данных, особенно для сложных задач генеративного ИИ, которые требуют разнообразия и глубокого опыта. Они также могут увековечить ошибки или предвзятости из исходных данных. Веб-скрапированные данные, обычно используемые для LLM, представляют свои собственные проблемы с низкокачественным контентом, предвзятостью и дезинформацией, требующими тщательной курирования.
Краудсорсинговые данные, в которых специализируется Appen, остаются “истинной основой”. Человеческий опыт имеет решающее значение для генерации разнообразных и сложных данных, необходимых для улучшения точности моделей ИИ и обеспечения соответствия человеческим ценностям.
Мы рассматриваем синтетические данные как дополнение к нашим данным, аннотированным человеком. Хотя синтетические данные могут ускорить части процесса, данные, аннотированные человеком, гарантируют, что модели отражают разнообразие реального мира. Вместе они предоставляют сбалансированный подход к созданию высококачественных обучающих данных для ИИ.
Закон ИИ ЕС и другие глобальные правила формируют этические стандарты вокруг разработки ИИ. Как вы видите, эти правила влияют на операции Appen и более широкую отрасль ИИ в будущем?
Закон ИИ ЕС и подобные глобальные правила, вероятно, повлияют на операции Appen, устанавливая новые этические стандарты для разработки и производительности моделей ИИ. Мы можем увидеть изменения в том, как мы обрабатываем данные, обеспечиваем справедливость моделей и решаем этические проблемы. Это может привести к более строгим процессам и потенциальным корректировкам нашего подхода к обучению и проверке моделей.
В целом эти правила, вероятно, приведут отрасль к более высоким этическим стандартам, увеличат затраты на соблюдение и потенциально замедлят некоторые аспекты инноваций. Однако они также будут стимулировать большую ответственность и прозрачность, что в конечном итоге может привести к более ответственной и устойчивой разработке ИИ.
С растущими проблемами вокруг предвзятости в ИИ, как Appen работает над тем, чтобы гарантировать, что наборы данных, используемые для обучения моделей ИИ, являются этически полученными и свободными от предвзятости, особенно в чувствительных областях, таких как обработка естественного языка и компьютерное зрение?
Мы активно работаем над снижением предвзятости, способствуя разнообразию и инклюзивности во всех наших проектах. Приятно видеть, что многие из наших клиентов сосредоточены на захвате широких демографических данных при сборе и оценке моделей. Имея глобальную толпу, проживающую в большинстве стран, мы можем получить данные из широкого спектра перспектив и опыта, что особенно важно в чувствительных областях, таких как обработка естественного языка и компьютерное зрение.
С 2019 года мы формализовали наши лучшие практики в Кодексе поведения толпы, демонстрируя нашу приверженность разнообразию, справедливости и благополучию толпы. Это включает нашу приверженность справедливой оплате, гарантирующую, что голос нашей толпы услышан, и поддержание строгих защит конфиденциальности. Соблюдая эти принципы, мы стремимся предоставить высококачественные, этически полученные данные, которые поддерживают ответственное развитие ИИ.
Поскольку ИИ становится более интегрированным в отрасли, такие как автомобильная промышленность, реклама и AR/VR, как Appen позиционирует себя, чтобы удовлетворить растущий спрос на специализированные обучающие данные в этих секторах?
За последние 27 лет мы предоставляли специализированные обучающие данные для широкого спектра отраслей и случаев использования, и мы продолжаем эволюционировать по мере эволюции потребностей наших клиентов.
Как пример, в автомобильной промышленности мы работали с ведущими автомобильными компаниями и поставщиками решений для салона, чтобы построить системы речи в транспортном средстве. Теперь мы помогаем нашим клиентам в новых областях, таких как сбор видеоданных о водителях, чтобы помочь в безопасности, контролируя отвлекающие факторы водителей.
В рекламе мы помогли ведущей глобальной рекламной платформе улучшить качество и точность рекламы для актуальности пользователей за большой многолетний глобальный программой с более чем 7 миллионами оценок. Теперь, поскольку многие из этих платформ принимают решения генеративного ИИ, наша толпа не только оценивает актуальность рекламы, но и помогает оценить качество сгенерированной рекламы.
Мы смогли сделать все это благодаря нашей прочной платформе аннотации, которая может быть настроена для поддержки сложных рабочих процессов и различных модальностей данных, включая текст, аудио, изображения, видео и мультимодальную аннотацию. Но в конечном итоге наша способность двигаться с меняющейся отраслью заключается в нашем глубоком опыте данных для разработки ИИ и сильном партнерстве с нашими клиентами.
Appen был лидером в предоставлении высококачественных данных для различных приложений ИИ. Смотрите вперед, как вы видите эволюцию роли Appen, поскольку генеративный ИИ и LLM продолжают развиваться и влиять на глобальные рынки?
Генеративный ИИ и LLM трансформируют отрасли, и мы продолжим играть критическую роль в предоставлении высококачественных данных для поддержки этих достижений. Когда речь идет о глобальных рынках, наша способность получать данные по более чем 200 странам и более чем 500 языкам станет еще более ценной, и у нас есть прочная история этого, поскольку мы помогли компаниям, таким как Microsoft, запустить модели машинного перевода для более чем 110 языков.
По мере роста развертывания приложений LLM мы видим растущий спрос на соответствие с конечными пользователями, включая возможности локализации, чтобы гарантировать, что языковые и культурные нюансы решаются на различных глобальных рынках. Мы привержены помощи компаниям в разработке систем ИИ, которые являются как производительными, так и ответственными, гарантируя, что данные, используемые для обучения этих моделей, разнообразны, актуальны и этически получены.
Appen известен тем, что обеспечивает некоторые из самых передовых LLM в мире. Какие инновации в аннотации и сборе данных Appen фокусируется на улучшении производительности этих моделей?
Мы постоянно инновируем наши процессы аннотации и сбора данных, чтобы улучшить производительность LLM. Одна из областей фокуса – улучшение эффективности и точности аннотации данных посредством инструментов, поддерживаемых ИИ, которые помогают оптимизировать и автоматизировать части процесса, сохраняя при этом высокие стандарты качества.
Мы можем определить точки данных, которые требуют дальнейшего человеческого входа, гарантируя, что усилия по аннотации сосредоточены там, где они будут иметь наибольшее влияние. У нас есть интегрированные функции в нашей платформе, такие как Model Mate, которые могут быть использованы для ускорения производства данных и улучшения качества данных. Мы также фокусируемся на лучших практиках управления участниками, что важно по мере роста сложности задач.
Способность понимать производительность участников и предоставлять обратную связь для непрерывного улучшения качества наших данных, сгенерированных человеком. Эти инновации позволяют нам предоставить высококачественные, крупномасштабные данные, необходимые для питания и настройки ведущих LLM в мире.
Когда вы вступаете в свою новую роль генерального директора, какие ваши главные приоритеты для Appen в ближайшие несколько лет, и как вы планируете стимулировать рост компании в высококонкурентном пространстве ИИ?
Когда я перехожу на должность генерального директора, мои стратегические приоритеты предназначены для обеспечения лидерства Appen в конкурентном ландшафте ИИ:
- Поддержка разработки моделей генеративного ИИ: За последние 18 месяцев генеративный ИИ стал ключевым компонентом нашей предложения услуг, с 28% дохода группы, полученного от проектов, связанных с генеративным ИИ, в июне 2024 года по сравнению с 8% в январе. Мы видим значительный потенциал на рынке генеративного ИИ, который, по прогнозам отрасли, достигнет 1,3 триллиона долларов к 2032 году.
- Поддержка внедрения моделей генеративного ИИ: Мы видим рост в новых сегментах, поскольку предприятия используют решения генеративного ИИ для своих случаев использования. Хотя процент проектов генеративного ИИ, достигающих развертывания, низок, мы ожидаем, что 2024/25 год будет переходным периодом, когда эксперименты перейдут в производство и будут стимулировать спрос на индивидуальные, высококачественные и специализированные данные.
- Оптимизация и автоматизация процесса подготовки данных: Используя ИИ для контроля качества и автоматизации определенных шагов процесса подготовки данных. Это позволит нам улучшить качество данных, а также повысить операционную эффективность, улучшая наши валовые маржи.
- Эволюция опыта для наших работников-толпы: Наша новая платформа CrowdGen позволяет нам масштабировать проекты быстро и гибко в соответствии с потребностями наших клиентов, используя ИИ для автоматического скрининга и сопоставления проектов. Это также улучшит опыт наших участников, предоставляя персонализированную поддержку. Appen был одним из первых, кто выступал за прозрачность, разнообразие и справедливость в наших источниках данных, и мы остаемся приверженными нашему Кодексу поведения толпы.
Эти приоритеты позиционируют Appen для устойчивого роста и инноваций в эволюционирующем ландшафте ИИ.
Благодарим за отличное интервью, мы призываем читателей, желающих узнать больше, посетить Appen.












