AGI

GPT-4はAGIへの飛躍であるか?

mm

マイクロソフトは最近、研究論文「Sparks of Artificial General Intelligence: Early experiments with GPT-4」を発表しました。この論文では、マイクロソフトは次のように述べています。

この論文では、GPT-4の初期バージョンに関する調査結果を報告しています。当初、GPT-4はOpenAIによって開発中でした。私たちは、GPT-4(およびChatGPTやGoogleのPaLMなど)は、以前のAIモデルよりも一般的な知能を示す新しいLLMのグループの一部であると主張しています。

この論文では、GPT-4は単に記憶に頼るのではなく、概念、スキル、ドメインについて深く柔軟な理解を持っていることを示す決定的な証拠が示されています。実際、GPT-4の一般化能力は、現在生きている人間のそれを超えています。

私たちは以前、AGIの利点について議論しましたが、AGIシステムの一般的な合意を簡単にまとめましょう。基本的に、AGIは複数のドメインにわたって一般化できる、高度なAIであり、狭い範囲に限定されていません。狭いAIの例としては、自律車、チャットボット、チェスボット、または単一の目的のために設計された他のAIがあります。

一方、AGIは上記のどれでも、または他の専門分野を柔軟に切り替えることができます。AGIは、転移学習や進化学習などの新しいアルゴリズムを活用し、ディープリインフォースメントラーニングなどの従来のアルゴリズムを利用します。

AGIのこの説明は、私自身のGPT-4使用経験と、マイクロソフトが発表した研究論文の証拠と一致しています。

論文では、GPT-4に、無限の素数の証明を詩の形式で書くように求めるプロンプトが示されています。

このような詩を作成するための要件を分析すると、数学的推論、詩的表現、自然言語生成が必要であることがわかります。これは、多くの人間の平均的な能力を超える課題です。

論文では、GPT-4が単に一般的な記憶に基づいてコンテンツを生成しているのではなく、コンテキストを理解し、推論する能力があるかどうかを調べるために、GPT-4にシェイクスピア風の詩を再現するように求めました。これには、理論的思考や数学的天才を含む、人間の一般的な能力を超える多面的な理解が必要です。

GPT-4の知能を計算する方法

質問は、LLMの知能をどのように測定することができるか、そしてGPT-4は真の学習の挙動を示しているか、単に記憶に頼るだけかということです。

現在、AIシステムをテストする一般的な方法は、標準のベンチマークデータセットでシステムを評価し、トレーニングデータから独立し、さまざまなタスクとドメインをカバーすることです。このようなテストは、GPT-4がトレーニングされたデータの量がほぼ無限であるため、ほぼ不可能です。

論文では、GPT-4が単に記憶に頼るのではなく、概念、スキル、ドメインについて深く柔軟な理解を持っていることを示す、新しい難しいタスクや質問を生成することが示されています。

知能に関しては、GPT-4は短い物語、脚本を生成でき、最も複雑な式を計算できます。

GPT-4はまた、非常に高いレベルでコードを生成でき、指示からコードを書くだけでなく、既存のコードを理解することもできます。GPT-4は、コードの課題からリアルワールドのアプリケーションまで、低レベルのアセンブリから高レベルのフレームワークまで、シンプルなデータ構造からゲームなどの複雑なプログラムまで、幅広いコーディングタスクを処理できます。GPT-4はまた、コードの実行について推論し、結果を自然言語で説明し、疑似コードを実行することもできます。

GPT-4は、ほぼどのようなプロンプトにも合理的な回答を提供できます。実際、GPT-4の知能は複雑さにおいてほぼ無敵です。

GPT-4の限界

論文では、GPT-4の回答と行動を調査し、整合性、連貫性、正確性を確認し、限界と偏見を明らかにする方法について説明しています。

最も明らかな限界は、妄想の傾向です。論文では、GPT-4が完全に間違った答えを自信を持って出した妄想の例が示されています。

GPT-4自身も現在の限界を理解しているようです。GPT-4に「GPTの妄想とは何か」と聞いたときの回答は次の通りです。

GPTの妄想とは、GPTモデル(現在あなたが対話しているモデル)が、事実情報に基づいていない、または提供されたコンテキストと一致しない回答を生成する現象を指します。妄想は、モデルが妥当ではあるが実際には間違った、または誤解を招いた、または無意味なテキストを生成するときに発生します。

つまり、世界のデータでLLM AIをトレーニングする場合、誤ったデータを学習するシステムを避ける方法は何でしょうか。誤った情報や陰謀論を学習し、再生産する大規模な言語モデルは、人類がLLMを大規模に採用する上で直面する最大の落とし穴、そして脅威となる可能性があります。これは、AGIの危険性について議論する際に、驚くほど見落とされているものです。

GPT-4の知能の証明

論文では、GPT-4は複雑なプロンプトであっても、常に期待を超えることを示しています。論文では次のように述べられています。

その並外れた自然言語のマスター性。GPT-4は、流暢で一貫性のあるテキストを生成するだけでなく、さまざまな方法でテキストを理解し操作できます。例えば、要約、翻訳、または非常に広い範囲の質問に回答することができます。さらに、翻訳には、異なる自然言語間の翻訳だけでなく、医学、法律、会計、コンピュータープログラミング、音楽など、さまざまなドメイン間の翻訳も含まれます。

GPT-4には、モックの技術レビューが行われ、簡単に合格しました。つまり、このコンテキストでは、GPT-4が人間であれば、すぐにソフトウェアエンジニアとして雇用されます。GPT-4のマルチステートバー試験の予備テストでは、70%以上の正確性を示しました。つまり、将来、現在弁護士に与えられている多くのタスクを自動化できる可能性があります。実際、GPT-4を使用してロボット弁護士を作成するスタートアップがあります。

新しい知識の生成

論文では、GPT-4が真の理解のレベルを証明するために残された唯一のこと、それは新しい知識、たとえば新しい数学的定理を証明することであると主張しています。

しかし、これはAGIの聖杯です。AGIが間違った手に渡った場合の危険性はありますが、AGIがすべての歴史的なデータを分析して新しい定理、治療法、エネルギー源の最適化を発見できる場合の利点はほぼ無限大です。

AGIは、現在民間企業の資金提供が不足している希少な遺伝性疾患の治療法を発見するための欠けているリンクになる可能性があります。がんを完全に治癒するためのもの、そして、持続不可能なエネルギー源への依存を除去するためのものです。実際、AGIは、AGIシステムに与えられたあらゆる重大な問題を解決できます。これは、サム・アルトマンとOpenAIのチームが理解していることです。つまり、AGIは、ほとんどの問題を解決し、人類に利益をもたらすために必要な最後の発明です。

当然、AGIを制御するのは誰か、そして彼らの意図は何かという問題は残っています。しかし、この論文は、GPT-4がAGIを達成するための飛躍であると主張することで、優れた仕事をしています。1956年に初めてダートマスサマーレサーチプロジェクトのAIサマーワークショップが開催された以来、AI研究者が抱いてきた夢です。

GPT-4がAGIであるかどうかは議論の余地がありますが、人間の歴史上初めて、チューリングテストに合格するAIシステムであると主張することができます。

アントワーヌは、Unite.AIのビジョナリーレーダーであり共同創設者であり、AIとロボティクスの未来を形作り推進することに尽力しています。シリアルエントレプレナーである彼は、AIが電気と同様に社会に大きな変化をもたらすと信じており、破壊的な技術とAGIの可能性について語ることがよくあります。

彼はフューチャリストとして、これらのイノベーションが私たちの世界をどのように形作るかを探求することに尽力しています。さらに、彼はSecurities.ioの創設者であり、未来を再定義し、全セクターを再構築する最先端技術への投資に焦点を当てたプラットフォームです。