Connect with us

AIフィードバックループ:AI生成コンテンツの時代におけるモデル生産品質の維持

人工知能

AIフィードバックループ:AI生成コンテンツの時代におけるモデル生産品質の維持

mm
The AI Feedback Loop: Maintaining Model Production Quality In The Age Of AI-Generated Content

生産環境にデプロイされたAIモデルには、信頼性の高い継続的なパフォーマンス評価メカニズムが必要です。これは、AIフィードバックループを適用して、モデルパフォーマンスの一貫性を確保するために使用できます。

エロン・マスクの言葉を借りてみましょう:

「フィードバックループを持つことは非常に重要です。そこでは、常に何をしているか、そしてどうすればより良くできるかについて考えます。」

すべてのAIモデルに対して、標準的な手順は、モデルをデプロイしてから、最新のリアルワールドデータで周期的に再トレーニングして、パフォーマンスが低下しないことを確認することです。しかし、ジェネレーティブAIの急速な台頭により、AIモデルトレーニングは異常でエラーが発生しやすくなっています。その理由は、オンラインデータソース(インターネット)が、人間が生成したデータとAIが生成したデータの混合物になっているからです。

例えば、今日の多くのブログには、LLM(Large Language Modules)のようなChatGPTまたはGPT-4によって動作するAI生成テキストが特集されています。多くのデータソースには、DALL-E2またはMidjourneyを使用して生成されたAI生成画像が含まれています。また、AI研究者は、ジェネレーティブAIを使用して生成された合成データをモデルトレーニングパイプラインで使用しています。

したがって、AIモデルの品質を確保するための信頼性の高いメカニズムが必要です。これは、AIフィードバックループの必要性がさらに増幅された場所です。

AIフィードバックループとは何か

AIフィードバックループは、AIモデルの決定と出力が継続的に収集されて同じモデルを強化または再トレーニングするための反復プロセスです。このプロセスでは、AIシステムのトレーニングデータ、モデルパラメータ、アルゴリズムがシステム内から生成された入力に基づいて更新および改善され、継続的な学習、開発、モデル改善が行われます。

主に2種類のAIフィードバックループがあります:

  1. 正のAIフィードバックループ: AIモデルがユーザーの期待と好みに一致する正確な結果を生成すると、ユーザーはフィードバックループを通じて肯定的なフィードバックを提供し、将来の結果の正確性を強化します。这种フィードバックループは正と呼ばれます。
  2. 負のAIフィードバックループ: AIモデルが不正確な結果を生成すると、ユーザーはフィードバックループを通じて欠陥を報告し、システムの安定性を改善するために欠陥を修正します。这种フィードバックループは負と呼ばれます。

両方のタイプのAIフィードバックループにより、継続的なモデル開発とパフォーマンスの改善が可能になります。また、これらは孤立して使用または適用されることはありません。両方とも、生産環境にデプロイされたAIモデルが何が正しいか、または何が間違っているかを知るのに役立ちます。

AIフィードバックループの段階

AIフィードバックループにおけるAI生成データのイラスト

AIモデルにおけるフィードバックメカニズムの高レベルなイラスト。 ソース

AIフィードバックループの動作を理解することは、AI開発の全潜在能力を解放する上で重要です。以下に、AIフィードバックループのさまざまな段階を詳しく見てみましょう。

  1. フィードバックの収集: モデルの結果を評価するために関連する情報を収集します。通常、ユーザーはモデル結果についてフィードバックを提供し、それが再トレーニングに使用されます。または、システムのパフォーマンスを微調整するために、ウェブからキュレーションされた外部データを使用できます。
  2. モデルの再トレーニング: 収集した情報を使用して、AIシステムを再トレーニングして、より良い予測を提供したり、特定の活動を実行したりするためにモデルパラメータまたは重みを改良します。
  3. フィードバックの統合とテスト: 再トレーニング後、モデルを再度テストおよび評価します。この段階では、データ以外の問題を強調するために、サブジェクトマターの専門家(SME)からのフィードバックも含まれます。
  4. デプロイ: 変更を検証した後、モデルを再デプロイします。この段階では、モデルは新しいリアルワールドデータで改善されたパフォーマンスを報告し、ユーザーエクスペリエンスが向上します。
  5. モニタリング: モデルを継続的にメトリックを使用してモニタリングし、ドリフトなどの潜在的な低下を特定します。フィードバックサイクルは継続されます。

生産データとAIモデル出力の問題

信頼性の高いAIシステムを構築するには、生産データ(リアルワールドデータ)とモデル出力の潜在的な問題を理解する必要があります。以下に、AIシステムの精度と信頼性を確保する上で障害となるいくつかの問題を示します。

  1. データドリフト: モデルがトレーニングデータ分布と比較して異なる分布からのリアルワールドデータを受信し始めると発生します。
  2. モデルドリフト: モデルの予測能力と効率が、変化するリアルワールド環境のために時間の経過とともに低下します。これはモデルドリフトとして知られています。
  3. AIモデル出力とリアルワールドの決定: AIモデルは、リアルワールドの利害関係者の決定と一致しない不正確な出力を生成します。
  4. バイアスと公平性: AIモデルはバイアスと公平性の問題を開発する可能性があります。たとえば、Janelle ShaneによるTEDトークでは、アマゾンがジェンダー差別のために履歴書のソートアルゴリズムの作業を停止したことを説明しています。

AIモデルがAI生成コンテンツでトレーニングを開始すると、これらの問題はさらに増大する可能性があります。どうしてでしょうか。詳しく見てみましょう。

AI生成コンテンツの時代におけるAIフィードバックループ

ジェネレーティブAIの急速な採用の波に乗って、研究者は「モデルコラプス」という現象を研究しました。彼らはモデルコラプスを次のように定義しています。

「学習したジェネレーティブモデルを生成するための退行的プロセスであり、生成されたデータが次の世代のモデルのトレーニングセットを汚染し、汚染されたデータでトレーニングされたモデルは現実を誤って認識します。」

モデルコラプスには2つの特殊なケースがあります。

  • 初期モデルコラプス は、モデルが「分布の尾部に関する情報を失う」こと、つまりトレーニングデータ分布の極端な端で発生します。
  • 後期モデルコラプス は、モデルが「元の分布のさまざまなモードを絡み合わせて収束し、元のものに似ていない分布に収束する」こと、つまり非常に小さな分散を伴う場合に発生します。

モデルコラプスの原因

この問題に対処するには、AIプラクティショナーがモデルコラプスの理由を理解する必要があります。これは、2つの主要なカテゴリに分類できます。

  1. 統計近似誤差: これは、有限なサンプル数によって引き起こされる主な誤差であり、サンプル数が無限大に近づくにつれて消失します。
  2. 関数近似誤差: この誤差は、ニューラルネットワークなどのモデルが、データから学ぶべき真の根底にある関数を捉えられない場合に発生します。
モデルコラプスの例

モデルコラプスによって影響を受ける複数のモデル世代のモデル出力のサンプル。 ソース

AI生成コンテンツがAIフィードバックループに与える影響

AIモデルがAI生成コンテンツでトレーニングされると、AIフィードバックループに悪影響を及ぼし、再トレーニングされたAIモデルに多くの問題を引き起こす可能性があります。

  • モデルコラプス: 上記で説明したように、AIフィードバックループにAI生成コンテンツが含まれている場合、モデルコラプスが発生する可能性があります。
  • カタストロフィックフォゲッティング: 継続的な学習における一般的な課題は、モデルが新しい情報を学習するときに前のサンプルを忘れることです。これはカタストロフィックフォゲッティングとして知られています。
  • データ汚染 操られた合成データをAIモデルに提供してパフォーマンスを妥協し、不正確な出力を生成させることを指します。

企業はAIモデルにロバストなフィードバックループをどのように作成できるか

企業は、AIワークフローにフィードバックループを使用することで利益を得ることができます。以下の3つの主要なステップに従って、AIモデルのパフォーマンスを強化します。

  • サブジェクトマターの専門家からのフィードバック: サブジェクトマターの専門家は、ドメインの高度な知識を持ち、AIモデルの使用を理解しています。彼らは、モデルをリアルワールドの設定に合わせて調整し、正しい結果をもたらす可能性を高めるための洞察を提供できます。また、AI生成データをより適切に管理および管理できます。
  • 関連するモデル品質メトリックの選択: タスクに適した評価メトリックを選択し、モデルをこれらのメトリックに基づいて生産環境で監視することで、モデル品質を確保できます。AIプラクティショナーはまた、MLOpsツールを使用して自動評価と監視を実行し、モデルのパフォーマンスが生産環境で低下し始めたときにすべての利害関係者に警告します。
  • 厳格なデータキュレーション: 生産モデルは新しいデータで再トレーニングされるため、過去の情報を忘れる可能性があります。したがって、モデルの目的とよく一致する高品質のデータをキュレーションすることは非常に重要です。このデータは、ユーザーのフィードバックとともに、モデルを将来の世代で再トレーニングするために使用できます。

AIの進歩についてさらに詳しく知りたい場合は、Unite.aiを訪問してください。

Haziqaは、AIおよびSaaS企業向けの技術コンテンツの作成における豊富な経験を持つデータサイエンティストです。