AGI

Чи є GPT-4 стрибком вперед до досягнення штучного загального інтелекту?

mm

Microsoft最近發表了一篇研究論文,題為:Sparks of Artificial General Intelligence:Early experiments with GPT-4。根據Microsoft的描述:

本文介紹了我們對GPT-4早期版本的調查,当時它仍在OpenAI的活躍開發中。我们認為(這個早期版本的)GPT-4是新一代LLM(與ChatGPT和Google的PaLM等)的一部分,這些模型表現出比以前的AI模型更具一般性智慧的特徵。

在這篇論文中,有令人信服的證據表明,GPT-4遠遠超出了記憶的範圍,它對概念、技能和領域有著深刻和靈活的理解。事實上,它的泛化能力遠遠超出了任何現今的人類。

雖然我們之前曾經討論過AGI的優點,但是我們應該快速總結AGI系統的一般共識。簡而言之,AGI是一種先進的AI,可以跨多個領域泛化,並且不是狹隘的。例如,自主車輛、聊天機器人、國際象棋機器人或任何其他為單一目的而設計的AI都是狹隘的AI。

相比之下,AGI可以靈活地在任何領域之間切換。它是一種可以利用新興算法(如轉移學習和進化學習)以及傳統算法(如深度強化學習)的AI。

上述AGI的描述與我個人使用GPT-4的經驗以及微軟發布的研究論文中的證據相符。

論文中的一個提示是要求GPT-4用詩的形式證明質數的無窮性。

如果我們分析創作這樣一首詩的要求,我們會發現它需要數學推理、詩歌表達和自然語言生成。這是一個超出大多數人能力的挑戰。

論文想要了解GPT-4是否只是基於一般記憶而產生內容,還是能夠理解上下文和推理。當要求它以莎士比亞風格重寫一首詩時,它成功地做到了。这需要一個多面向的理解水平,遠遠超出了普通人的能力,包括心智理論和數學天才。

如何計算GPT-4的智慧?

問題變成了如何衡量LLM的智慧?GPT-4是否表現出真正的學習行為,還是只是記憶?

目前測試AI系統的方法是評估系統在一組標準的基準數據集上的表現,確保它們與訓練數據無關,並且涵蓋了一系列任務和領域。由於GPT-4的訓練數據量幾乎無窮無盡,因此這種測試幾乎是不可能的。

論文討論了生成新型和具有挑戰性的任務/問題,以證明GPT-4遠遠超出了記憶,並且對概念、技能和領域有著深刻和靈活的理解。

在智慧方面,GPT-4可以生成短篇小說、劇本,並且可以計算最複雜的公式。

GPT-4還可以在很高的水平上編寫代碼,既可以根據指令編寫代碼,也可以理解現有的代碼。GPT-4可以處理廣泛的編碼任務,從編碼挑戰到現實世界的應用,從低級別的組裝語言到高級別的框架,從簡單的數據結構到複雜的程序,如遊戲。GPT-4還可以推理代碼執行,模擬指令的效果,並以自然語言解釋結果。GPT-4甚至可以執行偽代碼,

GPT-4可以對幾乎任何提示做出合理的響應。事實上,它的智慧幾乎是無窮無盡的。

GPT-4的局限性

論文接著描述了如何探測GPT-4的響應和行為,以驗證其一致性、連貫性和正確性,並揭示其局限性和偏見。

最明顯的局限性是它的幻覺傾向。以下是論文中的一個例子,GPT-4對其答案充滿信心,但實際上是完全錯誤的。

似乎GPT-4本身也理解這個當前的局限性,因為當我問它什麼是GPT-4的幻覺時,它給出了以下的回應:

GPT-4的幻覺是指一個生成式預訓練轉換器(GPT)模型(如您目前正在交互的模型)生成了一個不基於事實信息或與所提供的上下文不一致的響應。這些幻覺發生在模型生成的文本看似合理但實際上是錯誤、誤導或無意義的時候。

換句話說,當你訓練一個LLM在世界數據上時,如何避免系統學習錯誤的數據?一個大型語言模型學習和複製虛假信息和陰謀論,可能是人類在大規模採用LLM時面臨的最大陷阱和威脅之一,這可能是AGI的最大威脅之一,令人驚訝的是,當討論AGI的危險時,這一點經常被忽略。

GPT-4的智慧證據

論文表明,無論向GPT-4提出什麼複雜的提示,它都會超出預期。如論文所述:

它在自然語言方面的無與倫比的掌握。它不僅可以生成流暢和連貫的文本,還可以以各種方式理解和操作文本,例如總結、翻譯或回答極其廣泛的問題。另外,通過翻譯,我們的意思是不僅可以在不同的自然語言之間進行翻譯,還可以在語調和風格上進行翻譯,甚至可以在醫學、法律、會計、計算機編程、音樂等領域之間進行翻譯。

對GPT-4進行模擬技術審查,它輕松通過,表明如果這是一個人類對方,它將立即被聘用為軟件工程師。GPT-4在多州律師考試中的初步測試表明準確率超過70%。這意味著在未來,我們可以自動化目前由律師完成的許多任務。事實上,有一些初創公司正在使用GPT-4創建機器人律師。

生產新知識

論文中的一个論點是,GPT-4唯一需要證明的真實理解水平是生產新知識,例如證明新的數學定理,一個目前仍然超出LLM的能力範圍的壯舉。

然而,這是AGI的聖杯。雖然AGI在錯誤的控制下可能存在危險,但AGI可以快速分析所有歷史數據以發現新的定理、治療方法和治愈方法的好處幾乎是無窮的。

AGI可以成為解決罕見基因疾病的缺失鏈條,這些疾病目前缺乏私人行業的資金支持;可以徹底治愈癌症;可以最大限度地提高可再生能源的效率,以消除我們對不可持續能源的依賴。事實上,AGI可以解決任何被輸入AGI系統的重大問題。這是Sam Altman和OpenAI團隊所理解的,AGI是真正需要解決大多數問題和造福人類的最後一項發明

當然,這並不能解決核按鈕問題,即誰控制AGI及其意圖。無論如何,這篇論文做得非常出色,論證了GPT-4是朝著實現1956年首次發起的達特茅斯夏季研究項目人工智慧工作坊的AI研究人員夢想邁出的一大步。

雖然GPT-4是否為AGI仍存在爭議,但可以輕易論證,GPT-4是人類歷史上第一個可以通過圖靈測試的AI系統。

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.