人工知能
AIがAIから学ぶ: 大規模言語モデルにおける社会的学習の出現
OpenAIが2022年後半にChatGPT 3.5を発表して以来、基礎的な大規模言語モデル(LLM)の役割は、特に自然言語処理(NLP)における人工知能(AI)で、ますます重要になってきました。これらのLLMは、人間のようなテキストを処理して生成するように設計されており、インターネット上のさまざまなテキスト、書籍からウェブサイトまでから学習します。この学習プロセスにより、LLMは人間の言語の本質を捉えることができ、汎用的な問題解決器のように見えます。
LLMの開発により、新しい扉が開かれましたが、これらのモデルを特定のアプリケーションに適応させる方法、つまりファインチューニングは、独自の課題をもたらします。モデルをファインチューニングするには、より焦点を当てたデータセットでの追加のトレーニングが必要であり、これにより、ラベル付けされたデータの必要性、モデルのドリフトと過剰適合のリスク、および大量のリソースの必要性などの困難が生じます。
これらの課題に対処するために、Googleの研究者は最近、AIがAIから学ぶことを助けるための『社会的学習』のアイデアを採用しました。基本的な考え方は、LLMをチャットボットに変換すると、それらは人間の社会的学習と同様の方法で相互に学習し、交換することができるということです。この相互作用により、それらはお互いから学習し、有効性を高めることができます。
社会的学習とは何か?
社会的学習は新しい考え方ではありません。1970年代のアルバート・バンドゥーラによる理論に基づいており、人々は他人を観察することで学習するというものです。この概念をAIに適用すると、AIシステムは相互に学習することで改善でき、直接的な経験だけでなく、仲間の行動からも学習できるようになります。この方法は、スキルの習得を速める可能性があり、AIシステムが知識を共有することで独自の「文化」を開発する可能性もあります。
他のAIの学習方法、たとえば試行錯誤の強化学習や直接的な例から学ぶ模倣学習とは異なり、社会的学習は相互作用を通じて学習することを強調しています。これは、AIが新しいスキルを身につけるためのより実践的で共同的な方法を提供します。
LLMにおける社会的学習
社会的学習の重要な側面は、元の機密情報を共有せずに知識を交換することです。したがって、研究者は、教師モデルが学習プロセスを促進する教師と生徒のダイナミクスを採用しました。教師モデルは、生徒モデルが学習できる合成された例や指示を生成しますが、実際のデータを共有することはありません。たとえば、教師モデルがユーザーによってマークされたデータを使用してスパムとスパムではないテキストメッセージを区別するようにトレーニングされたとします。別のモデルがこのタスクをマスターするために、元のプライベートデータに触れる必要がない場合、社会的学習が役立ちます。教師モデルは、生徒モデルがスパムメッセージを正確に識別できるように、合成された例や洞察を提供します。 この戦略は、学習効率を高めるだけでなく、LLMがダイナミックで適応可能な方法で学習する可能性を示し、集団的な知識文化を構築する可能性もあります。このアプローチの重要な特徴は、合成された例と工夫された指示に依存していることです。教師モデルは、元のデータセットとは異なる新しい、情報に富んだ例を生成することで、プライバシーを保護しながら生徒モデルを効果的に学習させることができます。このアプローチは、実際のデータを使用して得られた結果と同等の結果を達成することができました。
社会的学習がファインチューニングの課題に対処する方法
社会的学習は、LLMを特定のタスクに適応させるための新しい方法を提供します。これは、以下の点でファインチューニングの課題に対処します:
- ラベル付けされたデータの必要性の減少: モデル間で共有される合成された例から学習することで、社会的学習はラベル付けされたデータへの依存を減らします。
- 過剰な特化の回避: これは、モデルをより広範な例の範囲に露出させることで、それらを小さな、特定のデータセットに特化させないようにします。
- 過剰適合の軽減: 社会的学習は、学習体験を拡大し、モデルがより一般化し、過剰適合を避けるのに役立ちます。
- リソースの節約: このアプローチにより、モデルが直接の大規模なデータセットにアクセスする必要なく、相互の経験から学習できるため、リソースの使用がより効率的になります。
将来の方向性
LLMにおける社会的学習の潜在性は、将来のAI研究のためのさまざまな面白い方法を示唆しています:
- ハイブリッドAI文化: LLMが社会的学習に参加するにつれて、それらは共通の方法論を開発する可能性があります。研究者は、これらの出現するAI「文化」の影響を調査し、人間の相互作用と関連する倫理的問題を検討することができます。
- クロスモダリティ学習: 社会的学習をテキストの範囲を超えて拡張し、画像、音、さらに多くのものを含めることで、AIシステムは世界に対するより豊かな理解を得る可能性があります。人間は複数の感覚を通じて学習するようにです。
- 分散型学習: AIモデルが分散ネットワーク全体で相互に学習するという考えは、知識の共有を拡大するための新しい方法を提示します。これには、調整、プライバシー、セキュリティの重要な課題に対処する必要があります。
- 人間とAIの相互作用: 人間とAIが社会的学習から相互に利益を得る可能性があることを探求する潜在性があり、特に教育および共同の環境では、知識の転送とイノベーションの方法を再定義することができます。
- 倫理的なAI開発: 社会的学習を通じてAIに倫理的なジレンマに対処する方法を教えることが、より責任あるAIへのステップとなる可能性があります。焦点は、倫理的に推論し、社会的価値観と一致するAIシステムを開発することになります。
- 自己改善システム: AIモデルが相互に学習し、改善するエコシステムでは、AIのイノベーションが加速する可能性があります。これは、AIが新しい課題に対してより自律的に適応できる将来を示唆しています。
- 学習におけるプライバシー: AIモデルが知識を共有するにつれて、基礎となるデータのプライバシーを確保することが重要です。将来の取り組みは、データのセキュリティを損なうことなく知識の転送を可能にするためのより洗練された方法を探求する可能性があります。
結論
Googleの研究者は、人間が他人を観察することで学習する能力にインスパイアされた、LLMにおける社会的学習という革新的なアプローチを導入しました。このフレームワークでは、LLMは機密情報へのアクセスや公開なしに知識を共有し、機能を改善することができます。合成された例や指示を生成することで、LLMは効果的に学習し、ラベル付けされたデータの必要性、過剰な特化、過剰適合、リソース消費などのAI開発の重要な課題に対処します。社会的学習は、AIの効率と適応性を高めるだけでなく、AIが共有された「文化」を開発し、クロスモダリティ学習に従事し、分散型ネットワークに参加し、新しい方法で人間と相互作用し、倫理的なジレンマを乗り越え、プライバシーを確保する可能性をも示唆しています。これは、人工知能研究と応用のランドスケープを再定義する、より協調的で多様で倫理的なAIシステムへの重大なシフトを示しています。












