文章上線

Anthropic 執行長在公司發布更強大 AI 時呼籲採納具約束力的安全規則

Anthropic 執行長在公司發布更強大 AI 時呼籲採納具約束力的安全規則

序言

背景: 這篇文章總結了 Anthropic 執行長 Dario Amodei 的言論與政策文章,他主張各國政府必須超越自願性透明做法,對最先進的 AI 系統採取具約束力的安全規範。文章說明了為何現行以透明為主的做法不足以應對風險,概述了 Amodei 受 FAA 啟發所提出的針對所謂前沿模型的測試建議,並指出時機:Anthropic 在發布這些政策建議的同時,正在擴大對其更強大 Claude Mythos 系列的存取。目的在於以清晰、中立的方式呈現核心論點、建議的監管要素與相關辯論,使讀者能理解相關利害與取捨。

重點摘要

關鍵要點: 僅靠透明已不足以保護大眾。 Amodei 呼籲採取強制性的第三方測試、政府有權封鎖不安全的部署,並採取防範網路、生物與控制風險的措施。Anthropic 同時釋出模型變體與政策建議——此一作為既獲支持亦遭質疑。

正文

大型 AI 模型的快速進展引發了各方就政府應如何監管前沿系統的重新討論。在題為「Policy on the AI Exponential」的文章中,Anthropic 執行長 Dario Amodei 主張進展速度已超越以自願為主、先求透明的安全與治理方法。他提出一套較具干預性的制度,部分以航空監管為範本,要求強制的技術測試、第三方稽核,以及政府在出現不可接受風險時有權阻止或撤回部署。

Amodei 的論點建立在三個相互關聯的前提上。首先,AI 能力在極短時間內大幅提升;數年前無法完成基本程式設計任務的模型,如今可協助或生成大型企業所使用的大量程式碼。其次,能力的提升產生了新的系統性風險類型——包括網路安全危害、來自自動化研究與設計的生物風險、對複雜自主系統的人類控制喪失,以及可能帶來危險後果的快速自動化科學或技術研發。第三,因為現行做法依賴營運者自我評估與可能偏向快速部署的市場激勵,自願揭露與有限透明不足以管理這些系統性風險。

為應對這些顧慮,Amodei 勾勒了一套監管框架,強調在部署前後對前沿模型進行獨立評估。他以美國聯邦航空管理局為類比,建議先進模型應在多個風險類別中接受嚴格測試,並且政府應保有在安全門檻未達時拒絕授權或要求回退的權力。建議納入強制第三方測試的類別包括網路安全韌性、生物安全(以限制在生化發現與武器化方面的濫用)、控制喪失風險,以及自動化研發的影響。

在操作面上,該提案將要求公司確保並控制模型權重的存取,進行並資助獨立的安全評估,並向監管機構通報重大事故。它也呼籲政策制定者為可能產生的重大社會經濟影響做準備。特別是,Amodei 強調需要規劃以預期並緩解長期的職業流失,同時保留人們尋得意義與能動性的機會——不僅是經濟上的支持。

這篇文章發布的時機值得注意。Anthropic 同時擴大了對更強大 Claude Mythos 變體的存取,並推出了對外的 Claude Fable 變體,該變體對某些高風險查詢類型(網路安全、生物、化學和先進 AI 開發)實施路由與限制。該產品架構試圖在更廣泛的可用性與對敏感使用情境的保護性路徑之間取得平衡,必要時將它們路由至能力較低的模型。不過批評者指出對資料保留政策的擔憂、較高的使用成本,以及可能未公開的能力減弱,這些都可能影響開發者與研究人員的實用性。

並非所有人都接受 Amodei 的診斷或處方。一些業界領袖警告說,援引特殊監管措施可能會導致少數能承擔合規成本的大型組織集中控制先進模型。有指控稱這是以恐懼為基礎的行銷:反對者認為強調最壞情境風險可能被用來為集中監督與限制競爭辯護。Amodei 拒絕將他的警告視為僅具修辭性的說法:他主張公眾關切反映了真實且有實證基礎的風險,這些風險需要民主問責與強而有力的政府行動。

除了即時的許可與測試制度外,該文章還呼籲民主國家就關鍵 AI 技術進行國際合作、限制國內對自主武器與監控工具的使用,以及明確為 AI 可能加速藥物發現或其他研發而改變戰略風險環境的情形做準備。這套措施結合了短期的技術性保障(測試、模型產物的安全處理、事故通報)與較長期的社會與地緣政治政策工作(就業政策、跨境規範與國防相關限制)。

主張更嚴格規則的支持者認為,強制第三方測試與阻止有害部署的能力,能為安全設計創造更強的誘因,遏止搶先上市的行為,並使監管機構對系統能力有更好的能見度。批評者則反駁,過於具體的規範可能扼殺創新,施加有利於既有業者的高額合規成本,且可能與快速演進的技術現實不相匹配。

以 FAA 式模式來監管 AI 也帶來實務上的問題。誰有資格成為獨立的測試機構?測試標準如何在能力演進時被設定與更新?哪些門檻決定模型何時被視為前沿系統?監管者如何以跟上領域速度的方式維持技術專業能力?答案將需要結合政府、產業、學界與公民社會的多方利害關係人程序。試點計畫、分級風險框架與適應性監管機制,或可透過循環的法規制定(以實證測試與紅隊結果為依據)來協助縮小落差。

總之,Amodei 的文章在持續的辯論中注入了一項具體的監管提案:他主張透明已不再是足夠的救濟,民主國家應對最有能力的 AI 系統採取具約束力的安全要求。是否採納此一方法,將取決於政策制定者如何在創新、競爭與公共安全之間做出政治判斷——以及政府建立評估前沿模型之技術與制度能量的能力。

關鍵見解表

面向 描述
關鍵事實 1 Amodei 主張以透明為先的監管不足;前沿 AI 需要具約束力的安全規則。
關鍵事實 2 提案包括在網路安全、生物風險、控制喪失與自動化研發等範疇實施強制第三方測試。
最後編輯時間:2026/6/10

Mr. W

Z新聞專職作家