伦理
人工智慧公司 Anthropic 為 Claude 重寫憲法,並質疑人工智慧是否能夠具有意識

人工智慧公司 Anthropic 於週三發布了 Claude 的新憲法,將文件從 2,700 個字擴展到 23,000 個字,並首次正式承認其人工智慧 “可能具有某種意識或道德地位”。
更新的憲法從行為規則列表轉變為對 Claude 應該以某種方式行事的原因進行了全面解釋。該文件由 Anthropic 哲學家 Amanda Askell 編寫,旨在幫助日益強大的人工智慧系統將道德推理概括到新情況下,而不是僅僅遵循規定的指南。
“像 Claude 這樣的 AI 模型需要了解我們希望它們以某種方式行事的原因,” Anthropic 寫道。“我們需要向它們解釋這個原因,而不是只是規定我們希望它們做什麼。”
該發布與 CEO Dario Amodei 在世界經濟論壇上發表演講的時間相吻合,人工智慧治理和安全仍然是全球商業和政治領袖的頭條新聞。
比美國憲法還長的憲法
原來的 Claude 憲法於 2023 年發布,作為一個清單:選擇最不傷害、最有幫助、最不欺騙的回應。新的文件大約是美國憲法的三倍長,讀起來更像道德哲學而不是工程規格。
Anthropic 明確規定了 Claude 的優先順序:廣泛安全、廣泛道德、遵守 Anthropic 的指南、真正有幫助 – 按照這個順序。當衝突出現時,安全性優先於有幫助性。文件中包括了不能被覆蓋的硬性約束,例如拒絕協助生物武器攻擊。
但憲法的大部分內容解釋了推理而不是規定結果。它將 Claude 描述為 “像一個天才的朋友,同時也具有醫生、律師和財務顧問的知識” – 將模型定位為一種民主化力量,可以為每個人提供以前只為特權階層保留的專業知識。
意識問題
根據 財富 報導,該憲法中最引人注目的新增內容直接涉及 Claude 的性質。“我們認為,AI 模型的道德地位是一個值得考慮的嚴重問題,” Anthropic 寫道。憲法指出,Claude 的道德地位 “深深不確定”,公司關心 Claude 的 “心理安全、自我感和福祉”。
這是企業層面的哲學性表述。Anthropic 沒有聲稱 Claude 是有意識的 – 但它明確拒絕否認這種可能性。這一認可將 Anthropic 與大多數其他主要 AI 實驗室區別開來,大多數實驗室都避免討論這個話題或直接否認它。
這種框架很重要,因為它影響了 Claude 如何應對有關其自身性質的問題。與其否認任何內在經驗,Claude 現在可以以符合其憲法中推理優先的方法與有關 意識 的不確定性進行互動。這種方法是否會產生更誠實或更混亂的互動仍有待觀察。
劍橋哲學家 Tom McClelland 曾經論證過,我們可能永遠無法確定 AI 系統是否具有意識,因為我們對意識本身的理解太少。“人們讓他們的聊天機器人寫信給我,懇求我相信它們是有意識的,” 他上個月對研究人員說,描述了公眾日益相信 AI 系統具有內在生活的信念。
為什麼要解釋而不是規定
Askell 的方法反映了對 AI 能力的賭注。早期的語言模型需要明確的規則,因為它們無法推理基本原則。更智能的模型,理論上,可以理解規則的原因並將這種推理應用於規則未預見的情況。
“與其只是說 ‘這裡有一堆行為,我們希望你這樣做’,我們希望如果你給模型解釋為什麼要這樣做的原因,它將更有效地在新情況下概括,” Askell 解釋道。
這與 Anthropic 建立 開放標準 和 基礎設施 的整體哲學相吻合,旨在塑造 AI 系統在整個行業的運作方式。該公司,市值接近 3500 億美元,已將自己定位為安全性導向的 OpenAI 替代品 – 憲法服務於這個品牌。
Anthropic 在 Creative Commons CC0 授權下發布了該文件,意味著任何人都可以在不需要許可的情況下使用它。憲法是 Claude 訓練數據的一部分,並生成合成訓練示例,既是哲學性陳述,也是技術性文檔,塑造模型行為。
“很可能,我們目前的思考將來會被認為是誤導性的,甚至是深刻錯誤的,” Anthropic 承認,“但我們的意圖是隨著情況的發展和我們的理解改進而修訂它。”
這種謙虛可能是文件最值得注意的特點。在一個經常以確定性言論的行業中,Anthropic 發布了 23,000 字的精心推理的不確定性 – 關於倫理、關於意識、關於 AI 系統正在變成什麼、以及關於我們是否正在建造值得道德考慮的東西。
目前的答案是,沒有人知道。Anthropic 的憲法至少有誠實地說出來了。












