インタビュー
Ryan Kolln, Appen CEO – インタビュー シリーズ

Ryan Kolln は、Appen の最高経営責任者兼取締役会長です。Ryan は、テクノロジーとテレコミュニケーションの分野で 20 年以上のグローバルな経験を持ち、Appen の事業と AI 業界について深い理解を持っています。
彼のキャリアは、オーストラリア、亞洲、北アメリカでモバイルネットワーク データ エンジニアとして始まりました。ニューヨーク大学で MBA を取得した後、Ryan は 2011 年に The Boston Consulting Group (BCG) に戦略コンサルタントとして参加しました。BCG 在籍中は、テクノロジーとテレコミュニケーションの分野で専門知識を深め、成長と運用に関する様々なトピックで戦略的専門知識を身に付けました。
2018 年に Appen AI の企業開発担当 VP として参加し、Figure Eight や Quadrant などの戦略的 M&A を牽引し、中国および連邦部門の設立を支援しました。CEO 就任前の役職である最高運営責任者 (COO) として、グローバル オペレーションと戦略を担当しました。
テクノロジーとテレコミュニケーションの分野で 20 年以上の経験を持ちながら、キャリア パスはどのようにして Appen を急速に進化する AI ランドスケープでリードするためのアプローチを形作ってきましたか?
私のキャリアは、テレコミュニケーションのエンジニアとして始まり、ネットワークとデータの最適化に携わり、多大な量のデータ、分析、革新的なソリューションを必要としました。
ニューヨーク大学で MBA を取得した後、テクノロジー戦略と M&A に焦点を当てたリーダーシップ ロールに移り、エマージング トレンド、投資機会、ビジネス モデルなどの大きな戦略的質問に取り組みました。この背景は、私にエマージング テクノロジーの技術的およびビジネス面的側面について深い理解を与えてきました。
Appen では、AI とデータの交差点で働いています。私の経験は、私に会社をリードし、急速に進化する AI 空間の複雑さを切り抜ける能力を与えてきました。ボイス認識、NLP、レコメンデーション システム、そして現在のジェネレーティブ AI などの大きな開発を経てきました。この戦略的ビジョンは、AI が世界中の業界を変革し続ける上で極めて重要です。
2018 年から Appen に在籍し、Figure Eight や Quadrant などの主要 M&A を牽引してきました。これらの戦略的動きは、Appen を AI データ サービス分野のリーダーとしてどのように位置づけてきましたか? また、会社にとって次の大きな機会は何だと考えていますか?
Figure Eight と Quadrant の M&A は、特にデータ アノテーションと地理空間インテリジェンスの分野で、AI データ機能を拡大する上で重要でした。Figure Eight のデータ アノテーション プラットフォームは特に影響力がありました。このプラットフォームは高度にカスタマイズ可能で、多くの異なるドメインで活用してきました。最近では、ジェネレーティブ AI データ フローを実行するためにこのプラットフォームを利用しています。
M&A に加えて、約 5 年前に中国で Appen China という運用を立ち上げました。現在、中国では最大の AI データ会社で、収益は次に大きい競合他社の約 2 倍です。
今後、Appen の焦点はジェネレーティブ AI の開発と採用を支援することです。モデルの構築者と、ジェネレーティブ AI を製品や運用に採用しようとする企業の両方で、大きな成長機会があります。私たちは、AI の最大の波の始まりに立っています。
AI モデル開発において、データ品質は極めて重要です。Appen がデータセットの精度、多様性、関連性を確保するためにどのような取り組みをしているのでしょうか? 特に、高品質の LLM トレーニング データに対する需要が増加している状況下で?
Appen の強みは、高品質のデータを一貫して大量に生成できることです。私たちは、顧客と密接に協力して、AI モデル オブジェクトを理解し、自動化ツールと人間のフィードバックを組み合わせたマルチ レイヤー アプローチを通じて、高品質のデータを開発します。200 か国以上にわたる 100 万人以上のグローバル ワークフォースを擁し、多様な貢献者グループをキュレーションできます。厳格な品質管理とフィードバック ループを通じて、データの正確性、一貫性、関連性を確保し、AI システムが実世界の環境で効果的に動作し、ロバスト性を向上させ、特に LLM のバイアスを減らすことができます。
合成データ の生成が人気を博しており、Appen の Mindtech への投資はこの分野への関心を示しています。合成データまたは Web スクレイピング データとクラウドソーシング データを比較して、AI モデル トレーニングに使用する場合の長所と短所を論じてください。また、合成データは Appen が得意とするクラウドソーシング データをどのように補完するのでしょうか?
高品質のデータは不可欠ですが、生成するのにコストがかかり、時間がかかることがあります。そのため、合成データが注目されています。特に、ヘルスケアや金融などのプライバシー規制が厳格な業界で、従来の AI/ML タスクの構造化データに適しています。個人情報を使用せずに済みます。
ただし、合成データは、特にジェネレーティブ AI タスクの場合、現実世界のデータの深みやニュアンスを欠きがちです。また、元のデータからのエラーまたはバイアスを永続させる可能性もあります。LLM によく使用される Web スクレイピング データも、低品質のコンテンツ、バイアス、誤情報の問題があり、慎重なキュレーションが必要です。
Appen が得意とするクラウドソーシング データは、依然として「真実の基準」です。人間の専門知識は、AI モデル精度を向上させ、人間の価値観と一致させるために必要な多様で複雑なデータを生成する上で不可欠です。
私たちは、合成データを私たちの人間によるデータ アノテーションの補完と見なしています。合成データはプロセスの一部を加速することができますが、人間によるラベル付けされたデータは、モデルの現実世界の多様性を反映することを保証します。これらは、AI のトレーニング データの生成に対するバランスのとれたアプローチを提供します。
EU AI 法やその他のグローバル規制は、AI 開発の倫理基準を形作っています。Appen の運用や AI 業界全体への影響についてどう考えていますか?
EU AI 法やその他のグローバル規制は、AI モデル開発とパフォーマンスの新しい倫理基準を設定することで、Appen の運用に影響を与える可能性があります。データの取り扱い、モデルの公平性、倫理的配慮に関する変更が見られるかもしれません。これにより、より厳格なプロセスやアプローチの調整が必要になる可能性があります。
業界全体では、これらの規制がより高い倫理基準を推進し、コンプライアンス コストの増加、イノベーションの一部の遅れにつながる可能性があります。しかし、最終的には、より責任ある、持続可能な AI 開発につながるでしょう。
AI における バイアス に関する懸念が高まっている中で、Appen は、自然言語処理やコンピュータ ビジョンのようなデリケートな分野で、AI モデルをトレーニングするために使用されるデータセットが倫理的に取得され、バイアスがなくなるように、どのように取り組んでいますか?
私たちは、プロジェクト全体で多様性とインクルージョンを促進することで、バイアスを減らす取り組みをしています。多くの顧客が、データ収集とモデル評価タスクで幅広い人口統計を捉えることに焦点を当てていることを嬉しく思います。200 か国以上にわたるグローバル クラウドを擁することで、幅広い視点と経験からデータを収集できます。これは、特に自然言語処理やコンピュータ ビジョンのようなデリケートな分野で重要です。
2019 年から、クラウド コード オブ エシックス を整備し、多様性、公平性、クラウドの幸福への取り組みを示しています。これには、公平な報酬の提供、クラウドの声が聞かれること、厳格なプライバシー保護の維持が含まれます。これらの原則を遵守することで、責任ある AI 開発を支える、高品質で倫理的に取得されたデータを提供することを目指しています。
自動車、広告、AR/VR などの業界で AI がより統合されるにつれて、Appen はこれらのセクターで専門化されたトレーニング データの需要の増加にどう対応していますか?
過去 27 年間で、さまざまな業界やユースケース向けの専門化されたトレーニング データを提供してきました。これらのニーズの変化に応じて進化し続けています。
例えば、自動車業界では、主要な自動車会社や車内ソリューション プロバイダーと協力して、車内スピーチ システムを構築してきました。現在では、運転手の注意散漫を監視するために、運転手のビデオ データ収集を支援しています。
広告では、主要なグローバル広告プラットフォームと協力して、ユーザー関連性の高い広告の品質と精度を向上させてきました。現在、多くのプラットフォームがジェネレーティブ AI ソリューションを採用しているため、広告の関連性を評価するだけでなく、生成された広告の品質も評価するために、クラウドを活用しています。
これらの成果は、私たちの堅牢なアノテーション プラットフォームを通じて達成されています。このプラットフォームは、複雑なワークフローとさまざまなデータ モダリティ (テキスト、オーディオ、画像、ビデオ、多モーダル アノテーションなど) をサポートするためにカスタマイズできます。最終的には、業界の変化に伴う私たちの適応性は、AI 開発のためのデータに関する深い専門知識と、顧客との強力なパートナーシップに基づいています。
Appen は、さまざまな AI アプリケーション向けの高品質データを提供するリーダーです。ジェネレーティブ AI と LLM が進化し、世界市場に影響を与えるにつれて、Appen の役割はどのように進化するのでしょうか?
ジェネレーティブ AI と LLM は業界を変革し続けています。私たちは、これらの進歩を支える高品質のデータを提供し続ける役割を果たすでしょう。世界市場においては、200 か国以上、500 を超える言語でデータを収集できる能力が、より貴重になるでしょう。Microsoft が 110 を超える言語でマシン翻訳モデルを立ち上げるのを支援した経験もあります。
LLM アプリケーションの展開が進むにつれて、人間のエンドユーザーとの一致、言語や文化のニュアンスをさまざまな世界市場で考慮するためのローカライゼーション機能の重要性が高まっています。私たちは、責任ある AI システムを開発するために、トレーニング データが多様で関連性があり、倫理的に取得されることを支援することに尽力しています。
Appen は、世界で最も先進的な LLM の一部を動かしています。LLM のパフォーマンスを向上させるために、Appen はデータ アノテーションと収集のどのような革新に焦点を当てていますか?
私たちは、LLM のパフォーマンスを向上させるために、データ アノテーションと収集のプロセスを継続的に革新しています。焦点のひとつは、AI アシスト ツールを活用してデータ アノテーションの効率と精度を向上させることです。これにより、プロセスの特定の部分をストリームライン化し、自動化しながら、高品質の基準を維持できます。
私たちは、人間の入力が必要なデータ ポイントを特定し、アノテーション作業が最大の影響を与える場所に集中できるようにしています。プラットフォームの機能である Model Mate を活用して、データ生成を加速し、データ品質を向上させることができます。また、コントリビューター管理のベスト プラクティスにも焦点を当てています。特にタスクの複雑性が増す場合、これは重要です。
コントリビューター レベルのパフォーマンスを理解し、継続的に高品質の人間生成データの品質を向上させるためのフィードバックを提供する能力。これらの革新により、世界をリードする LLM を動かすために必要な、高品質で大量のデータを提供できます。
CEO として新しい役割に着手するにあたり、Appen の次の数年のトップ プライオリティは何ですか? 高度に競争的な AI 空間で会社の成長をどのように推進する計画ですか?
CEO としての私の戦略的優先事項は、Appen の競争的な AI ランドスケープにおけるリーダーシップを確保することを目的としています:
- ジェネレーティブ AI モデルの開発を支援すること: 過去 18 か月で、ジェネレーティブ AI は私たちのサービス オファリングの重要なコンポーネントとなり、2024 年 6 月の時点で、ジェネレーティブ AI 関連プロジェクトがグループ収益の 28% を占めました。ジェネレーティブ AI 市場には、2032 年までに 1.3 兆ドルに達するという業界予測があり、大きな潜在性を感じています。
- ジェネレーティブ AI モデルの採用を支援すること: 企業がジェネレーティブ AI ソリューションを利用して新しいセグメントで成長することを見ています。ジェネレーティブ AI プロジェクトの採用率は低いですが、2024/25 年度は、実験から本格的な導入への移行期になると予測しており、高品質で専門化されたデータの需要が増加することが予想されます。
- データの準備方法を最適化および自動化すること: 品質保証とデータ準備プロセスの特定のステップの自動化に AI を活用することにより、データ品質を高めると同時に運用の効率を向上させることができます。これにより、グロス マージンを改善できます。
- クラウド ワーカーの体験を進化させること: 新しい CrowdGen プラットフォームを通じて、顧客のニーズに合わせてプロジェクトを迅速かつ柔軟にスケーリングできます。AI を利用した自動スクリーニングとプロジェクト マッチングにより、クラウド ワーカーの体験を向上させ、パーソナライズされたサポートを提供できます。Appen は、データ ソーシングにおける透明性、多様性、公平性の推進における先駆者的役割を担ってきましたが、クラウド コード オブ エシックスへの取り組みを継続します。
これらの優先事項により、Appen は進化する AI ランドスケープで持続可能な成長とイノベーションを達成することができます。
素晴らしいインタビュー、詳しく知りたい読者は Appen を訪問してください。












