プロンプトエンジニアリング

大規模言語モデルにおけるホールユーションの対処: 最新の技術の調査

mm

大規模言語モデル(LLM) seperti GPT-4、PaLM、Llamaは、自然言語生成能力において驚くべき進歩をもたらしました。しかし、これらのモデルを信頼性が高く安全に展開する上で、重大な課題となっているのは、ホールユーション(hallucination)という問題です。ホールユーションとは、モデルが入力コンテキストや事実に基づかない、つまり現実に基づかないコンテンツを生成することを指します。

LLMが現実世界のアプリケーションでさらに普及するにつれて、ホールユーションに対処することは不可欠になります。この記事では、ホールユーションを検出、量化、軽減するための最新の技術について概要を提供します。

LLMにおけるホールユーションの理解

ホールユーションとは、LLMが事実に基づかない、または入力コンテキストに基づかないコンテンツを生成することを指します。ホールユーションの例としては、以下のようなものがあります。

  • 入力されたテキストに基づかない、架空の出来事や人物の詳細を生成すること。
  • 事実に基づかない、誤った医療アドバイスを提供すること。
  • 存在しないデータ、研究、または情報源を生成すること。

ホールユーションは、LLMが大量のオンラインテキストデータでトレーニングされるため発生します。このトレーニングにより、モデルは強力な言語モデリング能力を獲得しますが、同時に、情報を外挿し、論理的な飛躍を行い、ギャップを埋めることができますが、これは誤った情報になる可能性があります。

ホールユーションを引き起こす主な要因としては、以下のようなものがあります。

  • パターン一般化 – モデルはトレーニングデータのパターンを特定し、一般化しますが、これは必ずしも適切ではありません。
  • 古い知識 – 静的な事前トレーニングにより、新しい情報の統合が不可能になります。
  • 曖昧さ – 曖昧なプロンプトにより、モデルは誤った仮定を行う可能性があります。
  • 偏見 – モデルは偏った視点を永続させ、増幅させます。
  • 不十分な根拠付け – モデルは生成するコンテンツを十分に理解していないため、根拠付けられない情報を生成する可能性があります。

ホールユーションを対処することは、医療、法律、金融、教育などの分野でモデルを信頼性が高く安全に展開するために不可欠です。

ホールユーション軽減技術の分類

研究者は、ホールユーションを軽減するためのさまざまな技術を導入しました。これらの技術は、以下のように分類できます。

1. プロンプトエンジニアリング

プロンプトエンジニアリングとは、モデルが事実に基づいた、根拠付けられた応答を生成するように、プロンプトを慎重に設計することを指します。

  • リトリーバーオーグメンテーション – 外部の証拠を取得してコンテンツを根拠付けます。
  • フィードバックループ – モデルが自分の応答を改善するために、繰り返しフィードバックを提供します。
  • プロンプトチューニング – モデルが特定の行動を実現するために、プロンプトを調整します。

2. モデル開発

ホールユーションを軽減するために、モデルアーキテクチャを変更して、ホールユーションが発生しにくいモデルを作成します。

  • デコーディング戦略 – テキストを生成する方法を変更して、信頼性を高めます。
  • 知識根拠付け – 外部の知識ベースを統合します。
  • 新しい損失関数 – モデルをトレーニングする際に、信頼性を優先します。
  • 教師ありファインチューニング – 人間がラベル付けしたデータを使用して、モデルを改善します。

次に、各アプローチの下で有名な技術を調査します。

注目すべきホールユーション軽減技術

リトリーバーオーグメンテーション

リトリーバーオーグメンテーションは、モデルが外部の証拠ドキュメントを取得して、テキスト生成を条件付けることで、ホールユーションを軽減します。

注目すべき技術としては、以下のようなものがあります。

  • RAG – リトリーバーモジュールを使用して、関連するパスを提供し、シーケンスツーシーケンスモデルが生成します。
  • RARR – モデルが生成したテキストを調査して、証拠と一致するように修正します。
  • 知識リトリーバー – 不確かな生成について、取得した知識を使用して検証します。
  • LLM-オーグメンテーション – 収集した知識を使用して、証拠チェーンを構築します。

フィードバックと推論

フィードバックと推論を使用して、モデルが自分の応答を改善し、ホールユーションを軽減します。

CoVe は、検証チェーンを使用して、モデルが自分の応答を検証します。モデルは、ユーザーの質問に対する応答を生成し、次に、自分の応答を検証するために、潜在的な検証質問を生成します。例えば、医療処置についての応答の場合、CoVe は、「治療の有効率は?」、「承認を受けているか?」、「副作用は?」などの質問を生成します。モデルは、これらの質問に回答して、自分の応答の正確性を検証します。

DRESS は、モデルを人間の好みに合わせて調整するために、自然言語フィードバックを使用します。ユーザーは、モデル生成のテキストについて、自由形式の批評や改善の指示を提供できます。DRESS は、モデルを強化するために、人間のフィードバックを使用して、より人間の好みに合った応答を生成します。

MixAlign は、ユーザーの質問が取得した情報と直接対応していない場合に、ユーザーと対話して、情報を正しく関連付けることを支援します。例えば、ユーザーが「中国での汚染は悪化するか?」と質問した場合、取得した情報は世界的な汚染について言及している場合があります。MixAlign は、ユーザーと対話して、情報を正しく関連付けることを支援し、ホールユーションを軽減します。

自己反省 は、モデルが自分の応答を評価し、フィードバックを提供し、改善することを学習します。モデルは、自分の応答の事実的正確性を評価し、矛盾や不支持のあるステートメントを特定し、証拠を取得してそれらを編集します。自己反省を使用することで、ホールユーションを軽減します。

プロンプトチューニング

プロンプトチューニングは、モデルが特定の行動を実現するために、プロンプトを調整することを指します。

SynTra は、合成要約タスクを使用して、ホールユーションを軽減します。モデルは、入力パスを要約するために、リトリーバーを使用して関連するパスを取得し、シーケンスツーシーケンスモデルが生成します。SynTra は、モデルが事実に基づいた応答を生成することを支援します。

UPRISE は、ユニバーサルプロンプトリトリーバーを使用して、タスクに最適なソフトプロンプトを取得します。モデルは、さまざまなタスクで学習したプロンプトを取得して、タスクに適応します。

新しいモデルアーキテクチャ

FLEEK は、人間のファクトチェッカーとバリデーターを支援するシステムです。モデルは、テキスト内の事実的主張を自動的に特定し、証拠を取得して、人間のバリデーターが文書の正確性を検証できるようにします。

CAD は、コンテキストに基づいたデコーディングアプローチを使用して、ホールユーションを軽減します。モデルは、コンテキストに基づいた出力分布を生成し、コンテキストに矛盾する応答を減らします。

DoLA は、トランスフォーマーモデルの異なる層からのロジットを比較して、事実的ホールユーションを軽減します。事実的知識は特定の層に局在しているため、DoLA はこれらの層からの信号を増幅して、ホールユーションを減らします。

THAM は、トレーニング中に、入力とホールユーションされた出力の間の相互情報量を最小化する正則化項を導入します。モデルは、入力コンテキストに基づいた応答を生成することを支援します。

知識根拠付け

知識根拠付けは、モデルが生成するコンテンツを構造化された知識に基づいて、ホールユーションを軽減します。

RHO は、会話のコンテキストでエンティティを特定し、知識グラフ(KG)にリンクします。エンティティに関する事実と関係を KG から取得して、コンテキスト表現に統合します。知識根拠付けされたコンテキストは、モデルが事実に基づいた応答を生成することを支援します。

HAR は、モデルが事実に基づいたコンテンツを生成することを支援するために、カウンターファクタルトレーニングデータセットを作成します。モデルは、事実に基づいたパスを生成し、ホールユーションを導入して、カウンターファクタルバージョンを生成します。モデルは、このデータセットでファインチューニングされ、ホールユーションを軽減します。

教師ありファインチューニング

  • コーチ – モデルはユーザーの質問に答えるだけでなく、改善のために修正を求めます。
  • R-チューニング – モデルは、トレーニングデータの知識ギャップを特定して、サポートされていない質問を拒否します。
  • TWEAK – モデルは、入力事実をサポートする仮説に基づいて、生成をランク付けします。

課題と限界

ホールユーションを軽減する技術は、以下のような課題と限界があります。

  • 技術は、品質、連続性、創造性を犠牲にして、真実性を優先します。
  • 評価は、限られたドメインにしか適用できません。メトリックは、すべてのニュアンスを捉えていません。
  • 多くの方法は、計算コストが高く、リトリーバーまたは自己推論を必要とします。
  • トレーニングデータの品質と外部知識源に大きく依存しています。
  • ドメインやモダリティー間での汎用性を保証することは難しいです。
  • ホールユーションの根本的な原因である、過剰な外挿は未解決です。

これらの課題を解決するには、多層的なアプローチが必要です。トレーニングデータの改善、モデルアーキテクチャの改善、忠実性の向上を目的とした損失関数、推論時技術などが必要です。

今後の道

ホールユーションを軽減する技術は、活発に進化しています。以下のような将来的な方向性が期待されます。

  • ハイブリッド技術 – リトリーバー、知識根拠付け、フィードバックなどのアプローチを組み合わせます。
  • 因果モデリング – モデルの理解と推論を向上させます。
  • オンライン知識統合 – 世界の知識を最新に保ちます。
  • 形式的検証 – モデルの動作について数学的な保証を提供します。
  • 解釈可能性 -軽減技術に透明性をもたらします。

LLM が高リスクな分野でさらに普及するにつれて、ホールユーションを抑制するための強力な解決策を開発することは、安全で信頼性が高く、倫理的な展開を保証するために不可欠です。この記事で調査した技術は、ホールユーションを軽減するために提案された技術の概要を提供します。さらに、多くの開かれた研究課題が残っています。ホールユーションを抑制するための限界と新しい方向性を解決するには、研究者が各分野で協力して取り組む必要があります。そうすることで、信頼性が高く、倫理的な LLM の開発を実現できます。

私は過去5年間、機械学習とディープラーニングの魅力的世界に没頭してきました。私の情熱と専門知識は、AI/MLに特に焦点を当てた50以上の多様なソフトウェアエンジニアリングプロジェクトに貢献することになりました。私の継続的な好奇心は、自然言語処理という分野にも私を引き付け、さらに探求したいと思っています。