Anthropic 表示 AI 正在構建 AI——人類可能成為瓶頸

文章上線

Anthropic 表示 AI 正在構建 AI——人類可能成為瓶頸

重點摘要

Anthropic 報告稱 Claude 現在撰寫了合併到公司代碼庫中超過 80% 的程式碼，且自 2024 年以來工程師的產出大約增加了八倍。公司主張，AI 已經透過撰寫程式碼、執行實驗與支援研究，在開發未來 AI 系統方面做出重大貢獻。Anthropic 警告說，雖然遞歸自我改進並非必然，但若趨勢持續，AI 可能能夠設計自己的後繼系統，將人類的角色轉向監督與驗證。

情緒分析

本文整體語調是謹慎樂觀，並帶有一些擔憂。文章強調了顯著的進展——生產力提高與更深層的代理能力——同時強調圍繞自主 AI 驅動開發的不確定性與風險。敘事在對快速技術進展的熱情與遞歸自我改進並非必然以及人類判斷仍然重要的冷靜提醒之間取得平衡。
文章以可驗證的指標（程式碼佔比與產出成長）突顯正面面向。然而文章也帶有關於監督、治理與當前 AI 研究判斷力侷限的警示語調。這產生了一種混合但偏正向的情緒：承認明顯進展，同時以負責任的警告來調和。
65%

文章內容

Anthropic 報告指出，其 Claude 系列模型已成為公司軟體開發過程中的核心貢獻者，現在產生了合併到主要代碼庫中超過 80% 的程式碼。根據公司的分析，引入 Claude Code 以及該模型能夠執行程式碼而不僅僅是提出片段，恰逢生產力急遽上升：工程師交付的合併程式碼數量比 2025 年之前大約提高了八倍。這一變化在每位工程師的產出上可見端倪：在公司早期數年期間產出保持穩定，但在 Claude 開始執行程式碼並自動化部分開發工作流程後顯著增加。

Anthropic 將這些變化框定為 AI 系統參與研究與工程活動方式的更廣泛轉型的一部分。除了產生程式碼之外，Claude 還被描述為有助於執行實驗、分類問題與協助研究任務——這些功能共同加速迭代並降低人工摩擦。公司建議，當 AI 系統承擔更多開發循環中例行與探索性工作時，剩餘的人類角色將轉向監督：驗證結果、確認安全性，並為研究議程設定高層方向。

重要的是，Anthropic 警告目前像程式碼行數等指標並非衡量生產力或科學進展的完美代理。程式碼量並不直接等同於長期品質、設計洞見或選擇真正有價值研究方向的能力。公司明確指出，雖然趨勢指向更高的自動化，但遞歸自我改進——即 AI 能夠自主設計並構建其自身後繼者——尚非確定。模型是否具備選擇正確問題或在沒有人工指導下可靠地追求富有成效研究路線的研究判斷力仍然不確定。

儘管如此，這一軌跡提出了合理的情境，即 AI 系統承擔越來越多自身進步的責任。Anthropic 概述了多種可能的未來：進展放緩、在廣泛自動化例行任務下持續的人類主導監督，或更具轉型性的結果——系統逐漸發展出能讓它們自主設計改良後繼者的能力。公司並未宣稱最後一種結果是必然的，但警告若運算與演算法改進持續加速，該結果可能比許多組織預期的來得更早。

該報告發表之際，業界在模型定位上正發生廣泛轉變。企業正把進階模型行銷為協作者與代理而非單純的對話工具。Anthropic 自身也持續迭代 Claude，發布多個版本以強化程式設計、推理與代理表現，其他公司也推出了各自的生成與代理產品。這些發展激起了關於在研究與產品開發中自動化與人類監督之間適當平衡的討論。

在運作層面上，Anthropic 預期人類參與將演變為對擴展中的「虛擬實驗室」的監督、驗證與核查，在該虛擬實驗室中 AI 系統可大規模執行並測試想法。公司強調潛在的外溢利益：自動化 AI 研究任務的系統可能會將這些技能轉移到其他科學領域，加速機器學習之外的進展。與此同時，Anthropic 強調需要謹慎的治理、安全審查與對齊關注，因為增加的自主性可能同時放大利益與風險。

總之，Anthropic 的報告記錄了由像 Claude 這類高能力模型驅動的開發工作流中可衡量的變化，並探討了這些變化的意涵。雖然證據指向顯著的生產力提升與 AI 在研究與工程中的更深整合，但公司強調重要的能力缺口與治理挑戰仍然存在。關鍵在於，Claude 仍然缺乏被證明的研究判斷力，這表示人類當前仍然是設定優先順序並確保科學方向健全性的必要者。未來可能出現更多自主的 AI 驅動開發，但這將需要謹慎管理、強有力的監督以及持續評估自動化系統可以且應該被允許執行的範圍。

關鍵洞見表

面向	描述
程式碼貢獻	Claude 撰寫了超過 80% 的合併程式碼，反映出其已深度整合到開發工作流程中。
生產力變化	工程師合併的程式碼量比 2024 年大約增加了八倍，這與 Claude 執行程式碼並自動化任務有關。
潛在軌跡	結果範圍從進展放緩到人在監督下的大量例行任務自動化，或可能的遞歸自我改進，但最後一項並非保證。
人類角色	預期將轉向對 AI 執行的實驗與虛擬實驗室進行監督、驗證與核查。
不確定性	主要未知數包括模型的研究判斷力、自動化輸出之長期品質，以及增加自主性所需的治理措施。

最後編輯時間：2026/6/5