KPMG 因涉嫌 AI「幻覺」及誤述使用情形而撤回報告
目錄
你可能想知道
在撰寫分析時使用 AI 是否可能產生關於組織做法的錯誤斷言?
需要哪些保障措施以防止 AI 生成的報告呈現不準確或捏造的引用與主張?
主要議題
專業服務公司 KPMG 從其公開網站上移除了題為「在具代理性的 AI 時代重新定義卓越」的報告,因為多個組織對該文件中描述其 AI 使用情形的陳述提出異議。該報告於 2025 年 10 月發表,後來被發現包含數項被文件中所指名機構代表形容為不正確或具誤導性的斷言。獨立研究團隊 GPTZero 指出多處不準確之處,並將其歸因於所謂的 AI「幻覺」。
此情況凸顯一種日增的緊張:公司越來越多使用 AI 工具來分析與綜合資訊,然而這些工具可能產生聽起來自信但實為錯誤的內容。在本例中,像 UBS、英國國民保健署、瑞士聯邦鐵路以及倫敦運輸局等主要組織都向媒體表示,報告中關於它們採用或使用 AI 的敘述與現實不符。它們的反駁促使 KPMG 在調查錯誤來源期間暫時撤下該文件。
KPMG 發表聲明指出,該報告已在內部審查期間下架。該公司強調,員工預期遵守既定的負責任 AI 使用準則,其中包括維持 以人工監督來驗證內容並核實獨立來源。此評論強調了更廣泛的責任:當 AI 被用作起草或研究輔助時,組織必須確保最終成果經由人工審查與可靠參考資料加以印證。
這類事件並非 KPMG 所獨有。前一個月,另一家專業服務公司 EY 也撤回了一份關於忠誠獎勵計劃的研究,因觀察者發現似為捏造的腳註與其他與 AI 生成幻覺一致的不一致之處。綜觀來看,這些事件說明生成式 AI 如何在混合分析、引用與歸屬的報告中引入事實性錯誤。
從方法論角度看,風險出現在於當 AI 工具被授予廣泛的自由去生成關於第三方的描述性或推論性內容而缺乏嚴格驗證時。大型語言模型被訓練以產生看似合理的文字,但並不具備萬無一失的事實查核機制,或對近期、特定機構的作法有直接知識,除非那些資訊被明確印證。若無刻意的交叉查證,關於被點名組織、其政策或技術部署的主張可能會有誤、被誇大或完全捏造。
解決此風險需要程序性控制與技術性防護的結合。在程序面上,作者與審閱者必須將 AI 產出視為草稿或研究輔助,而非完成品——對每一項事實性斷言、歸屬與引用,皆應對照主要來源或直接確認。技術上,組織可使用來源追溯工具、metadata 追蹤,以及限制易產生幻覺內容之模型設定。同等重要的是訓練員工辨識可能的 AI 錯誤,並為已發表資料維持責任鏈條。
發佈未經核實的 AI 生成內容,對聲譽可能造成重大影響。當報告不正確地描述機構行為或誤歸屬做法時,可能損害與利害關係人的關係、誤導公共討論,並需耗費大量時間進行更正。對於其可信度建立在謹慎分析與信任之上的專業服務公司來說,避免此類錯誤的迫切性尤其高。
總之,KPMG 撤回報告——以及先前 EY 的事件——提醒我們,雖然 AI 能加速研究與起草,但無法取代徹底的人工驗證。 確保事實準確性需要明確的驗證程序與對最終產出的清晰問責。
重點洞察表
| 面向 | 說明 |
|---|---|
| 事件 | KPMG 在 2025 年 10 月的一份報告中撤下內容,因多個組織對其關於 AI 使用的主張提出異議。 |
| 辨識原因 | 研究團隊 GPTZero 發現不準確之處,並將其歸因於 AI 的「幻覺」,顯示生成式模型產生了不正確的陳述。 |
| 受影響的組織 | UBS、英國國民保健署、瑞士聯邦鐵路與倫敦運輸局表示這些主張不真實或具誤導性。 |
| 公司回應 | KPMG 為調查而撤回報告,並重申使用 AI 時需有人為監督與來源驗證的準則。 |
| 更廣泛的趨勢 | 類似的撤回(例如 EY)顯示出一種模式:若未徹底檢查,AI 輔助的報告可能包含捏造的引用或錯誤。 |
後續...
展望未來,組織應投入治理框架與技術工具以降低 AI 生成不準確內容的風險。這包括制定嚴謹的編輯標準、對 AI 衍生主張的強制驗證步驟,以及協助員工辨識並更正幻覺的訓練計畫。
在技術面,推進模型可解釋性、來源追蹤與將檢索增強生成與人工驗證結合的混合工作流程之研究將具價值。AI 開發者、專業機構與監管機構之間持續對話以界定可接受的做法與問責機制亦同等重要。
最終,在報告撰寫中負責任地部署生成式 AI 需要一種文化,將 AI 視為工具而非權威來源,並保有人為對準確性與完整性的責任。