AGI

Чи є GPT-4 стрибком вперед до досягнення штучного загального інтелекту?

Published April 2, 2023

Updated May 23, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Microsoft最近發表了一篇研究論文，題為：Sparks of Artificial General Intelligence：Early experiments with GPT-4。根據Microsoft的描述：

本文介紹了我們對GPT-4早期版本的調查，当時它仍在OpenAI的活躍開發中。我们認為（這個早期版本的）GPT-4是新一代LLM（與ChatGPT和Google的PaLM等）的一部分，這些模型表現出比以前的AI模型更具一般性智慧的特徵。

在這篇論文中，有令人信服的證據表明，GPT-4遠遠超出了記憶的範圍，它對概念、技能和領域有著深刻和靈活的理解。事實上，它的泛化能力遠遠超出了任何現今的人類。

雖然我們之前曾經討論過AGI的優點，但是我們應該快速總結AGI系統的一般共識。簡而言之，AGI是一種先進的AI，可以跨多個領域泛化，並且不是狹隘的。例如，自主車輛、聊天機器人、國際象棋機器人或任何其他為單一目的而設計的AI都是狹隘的AI。

相比之下，AGI可以靈活地在任何領域之間切換。它是一種可以利用新興算法（如轉移學習和進化學習）以及傳統算法（如深度強化學習）的AI。

上述AGI的描述與我個人使用GPT-4的經驗以及微軟發布的研究論文中的證據相符。

論文中的一個提示是要求GPT-4用詩的形式證明質數的無窮性。

如果我們分析創作這樣一首詩的要求，我們會發現它需要數學推理、詩歌表達和自然語言生成。這是一個超出大多數人能力的挑戰。

論文想要了解GPT-4是否只是基於一般記憶而產生內容，還是能夠理解上下文和推理。當要求它以莎士比亞風格重寫一首詩時，它成功地做到了。这需要一個多面向的理解水平，遠遠超出了普通人的能力，包括心智理論和數學天才。

如何計算GPT-4的智慧?

問題變成了如何衡量LLM的智慧？GPT-4是否表現出真正的學習行為，還是只是記憶？

目前測試AI系統的方法是評估系統在一組標準的基準數據集上的表現，確保它們與訓練數據無關，並且涵蓋了一系列任務和領域。由於GPT-4的訓練數據量幾乎無窮無盡，因此這種測試幾乎是不可能的。

論文討論了生成新型和具有挑戰性的任務/問題，以證明GPT-4遠遠超出了記憶，並且對概念、技能和領域有著深刻和靈活的理解。

在智慧方面，GPT-4可以生成短篇小說、劇本，並且可以計算最複雜的公式。

GPT-4還可以在很高的水平上編寫代碼，既可以根據指令編寫代碼，也可以理解現有的代碼。GPT-4可以處理廣泛的編碼任務，從編碼挑戰到現實世界的應用，從低級別的組裝語言到高級別的框架，從簡單的數據結構到複雜的程序，如遊戲。GPT-4還可以推理代碼執行，模擬指令的效果，並以自然語言解釋結果。GPT-4甚至可以執行偽代碼，

GPT-4可以對幾乎任何提示做出合理的響應。事實上，它的智慧幾乎是無窮無盡的。

GPT-4的局限性

論文接著描述了如何探測GPT-4的響應和行為，以驗證其一致性、連貫性和正確性，並揭示其局限性和偏見。

最明顯的局限性是它的幻覺傾向。以下是論文中的一個例子，GPT-4對其答案充滿信心，但實際上是完全錯誤的。

似乎GPT-4本身也理解這個當前的局限性，因為當我問它什麼是GPT-4的幻覺時，它給出了以下的回應：

GPT-4的幻覺是指一個生成式預訓練轉換器（GPT）模型（如您目前正在交互的模型）生成了一個不基於事實信息或與所提供的上下文不一致的響應。這些幻覺發生在模型生成的文本看似合理但實際上是錯誤、誤導或無意義的時候。

換句話說，當你訓練一個LLM在世界數據上時，如何避免系統學習錯誤的數據？一個大型語言模型學習和複製虛假信息和陰謀論，可能是人類在大規模採用LLM時面臨的最大陷阱和威脅之一，這可能是AGI的最大威脅之一，令人驚訝的是，當討論AGI的危險時，這一點經常被忽略。

GPT-4的智慧證據

論文表明，無論向GPT-4提出什麼複雜的提示，它都會超出預期。如論文所述：

它在自然語言方面的無與倫比的掌握。它不僅可以生成流暢和連貫的文本，還可以以各種方式理解和操作文本，例如總結、翻譯或回答極其廣泛的問題。另外，通過翻譯，我們的意思是不僅可以在不同的自然語言之間進行翻譯，還可以在語調和風格上進行翻譯，甚至可以在醫學、法律、會計、計算機編程、音樂等領域之間進行翻譯。

對GPT-4進行模擬技術審查，它輕松通過，表明如果這是一個人類對方，它將立即被聘用為軟件工程師。GPT-4在多州律師考試中的初步測試表明準確率超過70%。這意味著在未來，我們可以自動化目前由律師完成的許多任務。事實上，有一些初創公司正在使用GPT-4創建機器人律師。

生產新知識

論文中的一个論點是，GPT-4唯一需要證明的真實理解水平是生產新知識，例如證明新的數學定理，一個目前仍然超出LLM的能力範圍的壯舉。

然而，這是AGI的聖杯。雖然AGI在錯誤的控制下可能存在危險，但AGI可以快速分析所有歷史數據以發現新的定理、治療方法和治愈方法的好處幾乎是無窮的。

AGI可以成為解決罕見基因疾病的缺失鏈條，這些疾病目前缺乏私人行業的資金支持；可以徹底治愈癌症；可以最大限度地提高可再生能源的效率，以消除我們對不可持續能源的依賴。事實上，AGI可以解決任何被輸入AGI系統的重大問題。這是Sam Altman和OpenAI團隊所理解的，AGI是真正需要解決大多數問題和造福人類的最後一項發明。

當然，這並不能解決核按鈕問題，即誰控制AGI及其意圖。無論如何，這篇論文做得非常出色，論證了GPT-4是朝著實現1956年首次發起的達特茅斯夏季研究項目人工智慧工作坊的AI研究人員夢想邁出的一大步。

雖然GPT-4是否為AGI仍存在爭議，但可以輕易論證，GPT-4是人類歷史上第一個可以通過圖靈測試的AI系統。

Antoine Tardif, CEO & Founder of Unite.AI

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.

Unite.AI

Чи є GPT-4 стрибком вперед до досягнення штучного загального інтелекту?

如何計算GPT-4的智慧?

GPT-4的局限性

GPT-4的智慧證據

生產新知識

You may like