Connect with us

ソートリーダー

成功したGenAI PoCのための戦術的ステップ

mm

Proof of Concept (PoC)プロジェクトは、新しいテクノロジーのテスト場であり、Generative AI (GenAI)も例外ではありません。GenAI PoCの成功とは、本当に何を意味するのでしょうか。簡単に言えば、成功したPoCとは、シームレスに本稼働に移行できるものです。問題は、新しいテクノロジーとその急速な進化のため、ほとんどのGenAI PoCは、技術的実現可能性と精度やリコールなどのメトリクスに主に焦点を当てていることです。この狭い焦点は、PoCが失敗する主な理由の1つです。 McKinseyの調査によると、回答者の4分の1が精度について心配していたのに対し、多くの回答者はセキュリティ、説明可能性、知的財産(IP)管理、規制遵守についても同様の困難に直面していたことがわかります。データの品質の低さ、スケーラビリティの限界、統合の難しさなどの一般的な問題を加えると、多くのGenAI PoCが本稼働に移行できない理由は明らかです。

ハYPEを超えて:GenAI PoCの現実

GenAIの導入は明らかに上昇しているが、PoCの実際の成功率は不明です。報告書にはさまざまな統計が記載されています。

  • Gartnerによると、2025年末までに、少なくとも30%のGenAIプロジェクトがPoC段階で放棄されることが予測されており、70%は本稼働に移行する可能性があることを意味します。
  • Avanade(RTInsightsに引用されている)による調査では、41%のGenAIプロジェクトがPoC段階で停滞していることがわかりました。
  • Deloitteの2025年1月のThe State of GenAI in the Enterprise報告書によると、PoCの10〜30%のみが本稼働にスケールアップすることが予測されています。
  • IDC(CIO.comに引用されている)による調査では、平均して、37のPoCのうち5つのみ(13%)が本稼働に移行することがわかりました。

推定値は10%から70%の範囲ですが、実際の成功率は低い方にある可能性が高いです。これは、多くの組織がスケーラビリティへの明確なパスを持つPoCを設計するのに苦労していることを強調しています。低い成功率は、リソースを浪費し、熱意を冷まし、イノベーションを停滞させる可能性があり、PoC疲労と呼ばれる状態になることがあります。ここで、チームは本稼働に移行できないパイロットを実行しているように感じます。

無駄な努力を超えて

GenAIはまだ導入サイクルの初期段階にあり、クラウドコンピューティングや従来のAIと同様です。クラウドコンピューティングは、広範な導入に達するまでに15〜18年かかりました。一方、従来のAIは8〜10年かかり、まだ成長を続けています。歴史的に見ると、AIの導入はブームとバストのサイクルに従い、初期の興奮が過大な期待につながり、課題が生じるとスローダウンし、最終的に主流の使用に安定します。歴史が何らかの指針となるのであれば、GenAIの導入もそのような上下動を経験するでしょう。

このサイクルを効果的に航行するには、組織は毎回のPoCをスケーラビリティを念頭に設計し、無駄な努力につながる一般的な落とし穴を避ける必要があります。これらの課題を認識して、先導的なテクノロジーとコンサルティング会社は、組織が実験を超えてGenAIイニシアチブを成功裏にスケールアップするのを支援するための構造化されたフレームワークを開発しています。

この記事の目的は、これらのフレームワークや戦略的な取り組みを補完し、実用的な戦術的ステップを概説することで、GenAI PoCがテストからリアルワールドのインパクトへの移行の可能性を大幅に高めることです。

GenAI PoCの重要な戦術的ステップ

1. 本稼働を念頭に用途を選択する

まず第一に、本稼働への明確なパスを持つ用途を選択します。これは、包括的なエンタープライズワイドのGenAI Readiness評価を実施することを意味しません。代わりに、データの品質、スケーラビリティ、統合要件などの要素に基づいて個々の用途を評価し、本稼働に到達する可能性が最も高い用途を優先します。

用途を選択する際に考慮すべきいくつかの重要な質問:

  • 私のPoCは長期的なビジネス目標と一致していますか。
  • 必要なデータを法的にアクセスして使用できますか。
  • スケーラビリティを妨げる明確なリスクはありますか。

2. キックオフ前に成功メトリクスを定義および整列する

PoCが停滞する最大の理由の1つは、成功を測定するための明確なメトリクスが欠けていることです。目標やROIの期待に関する強力な整列がないと、技術的に健全なPoCでも、本稼働への採用を得ることが難しい場合があります。ROIの推定は簡単ではありませんが、以下の推奨事項があります:

  • このようなフレームワークを考案または採用します。
  • コスト計算機を使用して、費用を推定します。たとえば、OpenAI APIの価格ツールやクラウドプロバイダーの計算機を使用します。
  • 単一のターゲットではなく、不確実性に対処するために確率を伴う範囲ベースのROI推定値を開発します。

ここでは、UberのQueryGPTチームが、テキストからSQLへのGenAIツールの潜在的な影響をどのように推定したかを示します。

3. 急速な実験を可能にする

GenAIアプリの構築は、継続的なイテレーションを必要とする実験についてです。テクノロジー スタック、Architecture、チーム、プロセスを選択する際には、イテレーションアプローチをサポートするようにします。選択は、仮説の生成、テストの実行、データの収集、結果の分析、学習、改良を可能にするシームレスな実験を可能にします。

  • 実験を加速するために、小規模から中規模のサービス ベンダーを検討します。
  • ベンチマーク、評価、および評価フレームワークを最初から選択し、用途と目標に整列していることを確認します。
  • LLM-as-a-judge またはLLM-as-Juries などのテクニックを使用して評価を自動化(半自動化)します。

4. 低摩擦のソリューションを目指す

低摩擦のソリューションには、承認が少なく、採用とスケーラビリティへの反対が少ないかありません。GenAIの急速な成長により、PoCと本稼働の展開を加速するように設計されたツール、フレームワーク、プラットフォームが爆発的に増えています。しかし、これらのソリューションの多くは、IT、法務、セキュリティ、リスク管理チームからの厳格な審査を必要とするブラックボックスとして動作します。これらの課題に対処し、プロセスを合理化するために、低摩擦のソリューションを構築するための以下の推奨事項を考慮してください:

  • 承認のための専用ロードマップを作成します。パートナー チームの懸念に対処し、承認を取得するための専用ロードマップを作成します。
  • 事前に承認されたテクノロジー スタックを使用します。可能な限り、承認済みで使用中のテクノロジー スタックを使用して、承認と統合の遅延を避けます。
  • 基本的なツールに焦点を当てます。初期のPoCでは、通常、モデル ファインチューニング、自動化されたフィードバック ループ、または広範な観察可能性/SREは必要ありません。代わりに、ベクトル化、埋め込み、知識の取得、ガードレール、UI開発などのコア タスク用のツールを優先します。
  • 低コード/ノーコード ツールを注意して使用します。これらのツールはタイムラインを加速できますが、ブラックボックスの性質により、カスタマイズと統合の機能が制限されます。長期的な影響を考慮して、慎重に使用します。
  • セキュリティの懸念を早期に解決します。合成データの生成、PII データのマスキング、暗号化などのテクニックを実装して、セキュリティの懸念を事前に解決します。

5. レーンで起業家的なチームを結成する

どのプロジェクトにも、成功の鍵となるのは、必要なスキルを持つ適切なチームです。技術的専門知識に加えて、チームは機敏で起業家的な精神を持っている必要があります。

  • 正しい問題を解決していることを確認するために、プロダクト マネージャーとドメインの専門家 (SME) を含めることを検討します。
  • チームにフルスタック デベロッパーと機械学習エンジニアの両方がいることを確認します。
  • PoCや、優先順位の高い長期的なプロジェクトから内部リソースを借りて、特定のPoCのために雇用するのではなく、小規模から中規模のサービス ベンダーを検討して、適切な才能をすばやく導入します。
  • 最初の日から法務とセキュリティのパートナーを組み込みます。

6. 非機能要件も優先する

成功したPoCのために、明確な問題の境界と固定の機能要件のセットを確立することは不可欠です。ただし、非機能要件も見過ごさないでください。PoCは問題の境界内に焦点を当てる必要がありますが、そのアーキテクチャは高パフォーマンスに対応するように設計する必要があります。特に、ミリ秒の待機時間を達成する必要はありませんが、PoCはベータ ユーザーが拡大するにつれてシームレスにスケールアップできる可能性があります。ツールに依存しない柔軟性とモジュラー性を備えたアーキテクチャを選択します。

7. ハルシネーションを処理する計画を立てる

ハルシネーションは、言語モデルでは避けられません。したがって、GenAI ソリューションを責任を持ってスケールアップするには、ガードレールが重要です。ただし、自動化されたガードレールがPoC段階で必要か、またどの程度必要かを評価します。ガードレールを無視したり、過度にエンジニアリングしたりするのではなく、PoC ユーザーにフラグを設定して、モデルがハルシネーションを起こしていることを検出します。

8. 製品およびプロジェクト管理のベスト プラクティスを採用する

このXKCDのイラストは、PoCにも本稼働にも当てはまります。一概的なプレイブックはありません。ただし、プロジェクトと製品管理のベスト プラクティスを採用することで、ストリームライン化と進歩を支援できます。

  • 戦術的計画と実行のために、カンバンまたはアジャイル メソッドを使用します。
  • すべてを文書化します。
  • パートナー チームと効果的にコラボレーションするために、スクラム オブ スクラムを実施します。
  • ステークホルダーとリーダーシップを、進捗状況について十分に情報にします。

結論

成功したGenAI PoCを実行することは、技術的な実現可能性を証明することだけではなく、長期的な基礎となる選択を評価することです。正しい用途を慎重に選択し、成功メトリクスに整列し、急速な実験を可能にし、摩擦を最小限に抑え、適切なチームを組み、機能的および非機能要件の両方に取り組み、ハルシネーションのような課題に取り組む計画を立てることで、組織はPoCから本稼働への移行の可能性を大幅に高めることができます。

上記のステップは網羅的ではなく、すべての用途に当てはまるわけではありません。各PoCはユニークであり、成功の鍵は、これらのベスト プラクティスを特定のビジネス目標、技術的制約、規制環境に適応させることです。

強力なビジョンと戦略は、GenAIの導入に不可欠ですが、適切な戦術的ステップがなければ、最もよく考えられた計画もPoC段階で停滞する可能性があります。実行は、偉大なアイデアが成功するか失敗するかを決定する場所であり、明確で構造化されたアプローチが、イノベーションを現実世界のインパクトに変えることを保証します。

ロケシュは、AI/MLおよびジェネレーティブAIの戦略、開発、イノベーションを専門としています。彼は、LatentView AnalyticsのジェネレーティブAI CoEの責任者です。