Anthropic 指控阿里巴巴在大規模行動中非法提取先進 AI 能力
目錄
你可能想知道
是否有一家主要的中國科技公司參與有組織的行動,從美國開發的模型中提取專有的 AI 行為?
大規模的「蒸餾」攻擊可能如何影響 AI 研究和國家技術投資的競爭力與安全性?
主要議題
總部位於美國的人工智慧開發商 Anthropic 正式指控中國電子商務與科技集團阿里巴巴,進行 Anthropic 所稱的大規模、非法從其 Claude 模型中提取能力的行為。在一封日期為 6 月 10 日、致美國參議員 Tim Scott 和 Elizabeth Warren 的信中,Anthropic 指稱與阿里巴巴有關的操作者透過數千個偽造帳戶對 Claude 執行了近 2,900 萬次互動。該公司將此活動描述為同類行動中規模最大的,並敦促立法與監管方面的回應。
Anthropic 解釋說,這些活動使用了所謂的「蒸餾攻擊」,這是一種從更強大的 AI 提取回應以訓練或改進較弱模型的技術。根據 Anthropic 的說法,攻擊者針對 Claude 最具價值的功能——特別是其處理長篇、複雜任務的能力以及其內部推理與決策方式。藉由系統性地查詢較先進的模型並收集輸出,攻擊者可以在不直接接觸其底層權重或訓練資料的情況下,近似或重現目標模型的行為。
該公司將這些攻擊框架化為以「工業規模」執行,使對手得以收穫先進能力並將其重新打包為自家產品的一部分。Anthropic 進一步主張,這類努力實際上將美國在研發上的大量投資轉化為對地緣政治競爭者的事實性補貼。該公司還強調其他被指稱的事件,在其觀點中,這些事件帶來超出商業競爭的風險,包括可能對國防的影響。
這項關鍵見解顯著影響了對 AI 模型如何在不直接竊取程式碼下被濫用的理解:蒸餾攻擊可以透過反覆查詢模型並將其輸出作為訓練資料來複製高階行為。其結果可能是在遠低於從頭構建可比系統的成本下,快速轉移能力。
Anthropic 援引美國國防部將阿里巴巴與其他幾家大型中國公司與軍事相關活動聯繫在一起的說法。那些公司已否認此類指稱。阿里巴巴已對美國政府的行動採取法律行動,包括起訴以將其名稱從五角大廈黑名單中移除。Anthropic 的信件也要求國會考慮對執行或實質上促成這些提取活動的實體施加制裁或其他處罰,並呼籲採取更強的保護措施以防止美國的技術創新被挪用。
Anthropic 提出的擔憂並非個別現象。其他美國 AI 開發者,包括 OpenAI,先前亦報告外國操作者使用類似策略來訓練競爭模型。業界觀察人士警告,類似蒸餾的提取手法削弱了對昂貴且耗時研究的激勵,並可能加速先進能力向未投入基礎工作之行為者的擴散。除了經濟與競爭上的損害外,Anthropic 也警告可能的網路安全與國防後果,指出一些先進模型具備可被濫用來識別弱點或自動化複雜任務的能力。
從技術角度來看,對抗蒸餾攻擊的防護措施相當複雜。可能的防禦包括更嚴格的存取控制、使用情況監控與異常偵測、API 速率限制、模型輸出的合成浮水印,以及在法律或合約上限制再利用。每種方法都有權衡:更嚴格的控制可能妨礙正當研究與協作,而浮水印與檢測技術可能會被有決心的對手規避。因此,Anthropic 呼籲採取技術、法律與政策相結合的回應,以降低風險並提高大規模提取的成本。
對於這些指控,BBC 與其他媒體曾尋求阿里巴巴回應,公司對某些美國當局提出的指控已公開否認。阿里巴巴亦對某些美國政府措施採取法律行動。與此同時,Anthropic 與其他 AI 公司持續為重要商業里程碑做準備——包括首次公開募股——這可能增加外界對其主張與保護智慧財產做法的審視。
整體而言,此事件凸顯了商業 AI 開發、國際競爭與國家安全交會處日益升高的緊張關係。它突顯出先進 AI 能力可能透過非傳統途徑被散佈,並強調需要協調的技術、企業與政府戰略來保護關鍵研究,同時維持有成效的全球合作。
關鍵見解表
| 面向 | 描述 |
|---|---|
| 指控 | Anthropic 聲稱與阿里巴巴相關的操作者執行了近 2,900 萬次互動以提取 Claude 的能力。 |
| 方法 | 此活動被描述為「蒸餾攻擊」,使用較強模型的輸出來訓練較弱的模型。 |
| 目標能力 | 重點在處理長篇、複雜任務與決策行為的能力。 |
| 規模與影響 | Anthropic 將該活動描述為工業規模,具有潛在的經濟與國家安全影響。 |
| 建議回應 | 更強的技術防護、法律處罰、監控與國際政策協調。 |
之後...
展望未來,有數個技術與政策領域可減少大規模提取攻擊的風險與影響。改進 API 使用的監控與異常偵測、健全的輸出浮水印以及加強的存取控制模型是值得追求的技術方向。此外,有關負責任使用、資料來源與跨境商業行為的國際規範與協議,亦可幫助設定濫用的期望與處罰。
政策制定者應考慮在創新與保護之間取得平衡的框架:有針對性的出口管制、更明確的中介責任規則,以及鼓勵企業採取保護措施而不抑制正當研究的激勵。產業、學界與政府之間的合作將對制定實用、可執行且能適應快速演進的 AI 能力的標準至關重要。
探討模型浮水印、查詢行為分析與供共享研究使用的隱私保護機制的防禦性研究,將強化韌性。與此同時,關於可接受商業實踐與合作性安全措施的國際對話,對防止透過隱蔽手段進行高風險技術轉移亦相當重要。
最終,此事件強調了在全球互聯的研究與商業生態系中,需重新思考如何保護、治理與共享先進 AI 能力的更廣泛需求。持續投資於檢測技術,結合周到的政策與外交參與,是在兼顧創新與安全方面的最佳途徑。