人工知能

大規模言語モデルが中間を忘れる理由:AIの隠れた盲点を暴く

mm

大規模言語モデル(LLM)は、文書要約、法的分析、医療歴評価などのタスクで広く使用されているため、これらのモデルの限界を認識することが重要である。一般的な問題であるハルシネーションバイアスはよく知られているが、研究者は最近、別の重大な欠陥を発見した:長いテキストを処理するとき、LLMは開始と終了の情報を保持する傾向があるが、中間の情報をしばしば無視する。

この問題は、「中間を忘れる」現象と呼ばれ、実際のアプリケーションでのモデルのパフォーマンスに深刻な影響を及ぼす可能性がある。例えば、AIが長い法的文書を要約するように指示された場合、中間の重要な詳細を欠落させると、誤解を招くまたは不完全な要約につながる可能性がある。医療現場では、患者の歴史の中間の情報を無視すると、不正確な推奨につながる可能性がある。なぜこれが起こるのかを理解することは、より安全で信頼性の高いAIを構築しようとする研究者にとって、課題である。ただし、最近の研究は、これらのモデルのアーキテクチャに深く根ざしたこの問題に対する最も明確な答えを提供している。

中間を忘れる問題

「中間を忘れる」現象は、LLMが長い入力シーケンスの中間の情報にあまり注意を払わない傾向があることを指す。これは、人間がリストの最初と最後のアイテムを中間のアイテムよりもよく覚える傾向があるのと似ている。この認知バイアスは、プライマシーとレセンチー効果として知られている。LLMの場合、これは、重要な情報がテキストの開始または終了にある場合に、より良く機能するが、中間にある場合に苦労することを意味する。これにより、「U字型」のパフォーマンス曲線が生成され、開始時に精度が高く、中間で大幅に低下し、終了時に再び上昇する。

この現象は、単に理論的な問題ではない。質問回答や文書要約を含む、幅広いタスクで観察されている。例えば、LLMに長い記事の最初の数パラグラフに答えがある質問をすると、正しく回答する可能性が高い。同様に、答えが最後の数パラグラフにある場合も正しく回答する。しかし、重要な情報が中間にある場合、モデルの精度は大幅に低下する。これは、長く複雑なコンテキストを理解するタスクにこれらのモデルを完全に信頼できないことを意味する、重大な制限である。また、これにより、モデルは操作されやすくなる。誰かが、AIの出力を影響させるために、文書の開始または終了に誤解を招く情報を意図的に配置する可能性がある。

LLMのアーキテクチャの理解

中間を忘れる理由を理解するには、LLMがどのように構築されているかを見てみる必要がある。モダンなLLMは、Transformerと呼ばれるアーキテクチャに基づいている。Transformerは、自己注意と呼ばれるメカニズムを導入したことで、AIのブレークスルーとなった。自己注意により、モデルは、入力テキストの各単語を処理するときに、さまざまな単語の重要性を評価できる。例えば、「猫が座っている」の文を処理するとき、自己注意メカニズムは、「猫」と「座っている」が密接に関連していることを学習する可能性がある。これにより、モデルは、以前のアーキテクチャでは不可能だった、単語間の関係をより豊かな理解を構築できる。

もう1つの重要なコンポーネントは、位置エンコードである。自己注意メカニズム自体には、単語の順序に関する固有の認識がないため、位置エンコードは、モデルに各単語の位置に関する情報を提供するために、入力に追加される。そうでなければ、モデルは、入力テキストを単に「バッグ・オブ・ワーズ」と見なし、構造がないと見なす。自己注意と位置エンコードの2つのコンポーネントは、LLMをより効果的にするために協力している。ただし、新しい研究は、これらのコンポーネントが相互作用する方法が、この隠れた盲点の源であることを示している。

位置バイアスの発生

最近の研究は、Transformer内の情報の流れをグラフとしてモデル化する、巧妙なアプローチを使用して、この現象を説明する。各単語はノードであり、注意接続はエッジである。このアプローチにより、研究者は、さまざまな位置からの情報がモデルの多くの層を通じてどのように処理されるかを数学的に追跡できる。

彼らは2つの主要な洞察を得た。まず、多くのLLMで使用されている因果マスキングは、シーケンスの開始にバイアスを生み出す。因果マスキングは、モデルが単語を生成するときに、前の単語のみに注目し、後の単語には注目しないことを保証するテクニックである。これは、テキスト生成などのタスクに不可欠である。ただし、多くの層を経ると、累積効果が生じる。テキストの最初の数単語は繰り返し処理され、その表現はより影響力を持つようになる。一方、中間の単語は、すでに確立されたコンテキストを常に参照し、その独自の貢献が埋もれる可能性がある。

2番目に、研究者は、位置エンコードがこの因果マスキング効果とどのように相互作用するかを調べた。モダンなLLMは、絶対的な位置ではなく、単語間の距離に焦点を当てた相対的な位置エンコードを使用することが多い。これにより、モデルは、さまざまな長さのテキストに一般化できる。ただし、これにより、競合する圧力が生じる。因果マスクは、モデルの焦点を開始に引き付け、相対的な位置エンコードは、モデルの焦点を近くの単語に引き付ける。結果として、モデルは、テキストの非常に開始と、任意の単語の近くのローカルなコンテキストに最も注意を払う。遠く離れており、開始ではない、つまり中間の情報は、最も注意が払われていない。

より広い意味

「中間を忘れる」現象は、長いテキストを処理するアプリケーションに重大な影響を及ぼす。研究は、この問題は、単にランダムな効果ではなく、モデルの設計の基本的な結果であることを示している。これは、単にこれらのモデルをより多くのデータでトレーニングすることで問題を解決することはできないことを意味する。代わりに、Transformerの基本的なアーキテクチャ的な原則を再検討する必要がある。

AIのユーザーと開発者にとって、これは重要な警告である。長いドキュメントを扱うタスクでは、このバイアスを軽減するための戦略を開発する必要がある。ドキュメントを小さなチャンクに分割したり、モデルがテキストのさまざまな部分に注目するように設計されたモデルを作成したりすることが必要である。また、徹底的なテストの重要性も強調される。短いテキストで良好に動作するLLMが、より長く複雑な入力に対して信頼性が高いと仮定することはできない。

結論

AIの開発は、常に限界を特定し、克服することに焦点を当てている。「中間を忘れる」問題は、長いテキストシーケンスの中間の情報をLLMが見落とす傾向がある、重大な欠陥である。これは、特に因果マスキングと相対的な位置エンコードの相互作用による、Transformerアーキテクチャのバイアスに起因する。LLMは、テキストの開始と終了の情報を処理するときに良く機能するが、中間の重要な詳細が配置されている場合に苦労する。この制限は、文書要約や質問回答などのタスクでLLMの精度を低下させる可能性があり、法や医療などの分野で重大な影響を及ぼす可能性がある。開発者と研究者は、実用的なアプリケーションでLLMの信頼性を向上させるために、この問題を解決する必要がある。ils are placed in the middle. This limitation can reduce the accuracy of LLMs in tasks like document summarization and question answering, which can have serious implications in fields like law and medicine. Developers and researchers must resolve this issue to improve the reliability of LLMs in practical applications.

Dr. Tehseen ZiaはCOMSATS University Islamabadの正教授であり、オーストリアのVienna University of TechnologyでAIのPh.D.を取得しています。人工知能、機械学習、データサイエンス、コンピュータビジョンを専門とし、信頼性の高い科学雑誌に掲載された出版物で著しい貢献をしています。Dr. Tehseenは、主な調査員としてさまざまな産業プロジェクトを率い、AIコンサルタントとしても務めています。