OpenAI 公布 Jalapeño：與 Broadcom 共同打造的首款自訂推理晶片

文章上線

OpenAI 公布 Jalapeño：與 Broadcom 共同打造的首款自訂推理晶片

重點摘要

OpenAI 公布其首款自訂推理處理器 Jalapeño，與 Broadcom 共同開發以滿足公司特定的推理工作負載。早期測試顯示，相較於目前的領先選項，性能每瓦有顯著提升。這項針對性的硬體可能大幅降低推理成本並減少對現有 GPU 供應商的依賴。該晶片專注於即時模型執行，尤其是程式碼與互動式應用程式，而較大規模的訓練任務可能仍會使用其他加速器。

情緒分析

整體語調：正面且具前瞻性。該公告將 Jalapeño 定位為優化推理效率與成本的策略性一步，強調有希望的早期結果，但並未對部署時間表做過度承諾。由於具體的技術主張及主要硬體合作夥伴的背書，情緒強度屬於中高等級。

70%

文章內文

OpenAI 推出其首款為推理工作負載量身設計的處理器，與 Broadcom 合作開發並命名為 Jalapeño。該晶片專為執行回應使用者輸入的預訓練模型而設，這個角色有別於模型預訓練所需的大量運算。根據 OpenAI 表示，開發過程中獲得自身 AI 模型於設計上的協助，初步評估顯示新處理器在性能每瓦方面相較於目前頂級方案帶來顯著改進。

與 Broadcom 的合作於十月對外公布，但事先已有廣泛傳聞指出計畫要打造自有矽晶片，以降低對第三方 GPU 的依賴。主要雲端供應商與科技公司亦採取類似做法：例如 Google 與 Amazon 都開發了針對機器學習任務的自訂加速器。OpenAI 的此一動作延續了該趨勢，目標是使硬體更貼合公司特定的工作負載特性。

OpenAI 總裁 Greg Brockman 在公司內部 Podcast 中說明了其理由，指出公司對其工作負載非常熟悉，並有機會以專用硬體改善被忽視的領域。透過聚焦特定的推理模式與瓶頸，公司希望加速對其產品與使用者最重要的能力。

Jalapeño 為推理優化——即實時執行預訓練模型以處理諸如程式碼協助、聊天與其他互動服務之類的任務。OpenAI 在公告中強調該晶片在運行對延遲敏感模型時具有低運營成本，可能帶來實質節省。雖然耗算力的訓練工作在可預見的未來可能仍將依賴既有 GPU 平台，即使推理成本僅有些微降低，鑑於大量模型查詢，仍會對整體經濟產生重大影響。

優化推理已成為 AI 經濟學的一個關鍵因素，改進可能發生在多個層面：模型架構、軟體核心、記憶系統、網路、調度與硬體。OpenAI 已在開發具代理性的產品及運行它們的基礎設施；進入自訂矽晶片是這種整合方法的合理延伸。公司主張，通過擁有更多堆疊層級，可以使每個組件朝同一目標調校：速度、可靠性與可負擔性。

OpenAI 在公告中將此項工作描述為不僅僅是晶片發布。公司強調其努力涵蓋模型研究、產品開發與基礎系統：「晶片架構、核心、記憶系統、網路、調度、部署系統與產品體驗。」這種系統層級的觀點旨在促成協同優化，為使用者帶來更佳的端到端效能。對硬體與軟體的控制讓 OpenAI 能夠追求針對其獨特服務量身打造的效率提升。

儘管 Jalapeño 仍在測試階段且 OpenAI 並未提出詳盡的基準測試，但宣稱的更高性能每瓦值得注意，因為在大規模推理部署中，功率效率是成本的關鍵推動因素。未來關於可用性、整合進 OpenAI 的資料中心以及與現有加速器比較的指標細節，將決定此晶片多快及多大程度上影響市場。

總結來說，Jalapeño 代表 OpenAI 將關鍵基礎設施組件縱向整合以更好地服務其推理工作負載的策略。如果早期的性能與成本優勢在更廣泛的測試與生產環境中成立，該晶片可能降低即時服務的營運支出並減少對第三方 GPU 供應商的依賴，而較大的訓練任務仍是另一項挑戰，可能會繼續使用既有的加速器生態系統。

關鍵見解表

面向	描述
產品	Jalapeño，OpenAI 與 Broadcom 共同開發的首款自訂推理處理器。
用途	為執行預訓練模型（推理）而優化，特別是對延遲敏感的即時應用。
早期效能	在早期測試中聲稱相較於現有替代方案在性能每瓦上有顯著更好表現。
策略目標	降低推理成本與對外部 GPU 供應商的依賴；整合硬體與軟體堆疊。

最後編輯時間：2026/6/25