AWS 雲端年會:推出首款 3nm 晶片 - Trainium3 將於明年底亮相
前言
本文討論亞馬遜 AWS 部門關於其新晶片技術的最新公告。 AWS 執行長 Matt Garman 介紹了突破性的 Trainium3,這是該公司首款採用 3 奈米製程設計的晶片。隨著 AWS 不斷突破雲端運算的界限,這項發展有望顯著增強運算能力並提高能源效率。該公告標誌著 AWS 在滿足 AI 工作負載不斷增長的需求方面取得的重大進展,預計將於 2025 年末發布。
懶人包
AWS 最新發布的主要亮點是Trainium3 晶片,與前代產品相比,該晶片的運算能力提高了一倍,能源效率提高了 40% 。它預計於2025 年底發布,旨在支援下一代 AI 模型,支援 AWS 的高級UltraServer ,使其效能提高四倍。
在AWS雲端年會上,執行長Matt Garman推出了Trainium3晶片,標誌著亞馬遜雲端運算服務的一個重要里程碑。作為 AWS 首款採用 3 奈米技術的晶片,Trainium3 比上一代 Trainium2 有了重大改進。具體來說,它的運算能力提高了一倍,能源效率提高了 40%。這些進步凸顯了 AWS 致力於為高效能產生型 AI 工作負載不斷變化的需求提供尖端解決方案的承諾。
Trainium3 旨在滿足下一代人工智慧工作負載嚴格的效能需求,促進更快、更大的模型創建和部署。作為 AWS 增強運算產品策略的一部分,Trainium3 驅動的 UltraServer 預計將比目前的 Trn2 UltraServer 效能提高多達四倍。這項技術飛躍將使 AWS 客戶能夠更有效率地建立更複雜的模型。
在開發 Trainium3 的同時,AWS 也推出了基於現有 Trainium2 晶片的 Trn2 UltraServers。這些伺服器旨在滿足大規模人工智慧模型日益增長的運算需求。 Trn2 UltraServer 允許客戶將訓練推向單一 Trn2 執行個體之外,從而減少訓練時間、加快上市時間並透過快速迭代提高模型準確性。
Trn2 UltraServers 是 AWS EC2 產品系列的新成員,採用超快 NeuronLink 互連技術,將四台 Trn2 伺服器合併為一個大型伺服器單元。這種配置使客戶能夠在 64 個 Trainium2 晶片上有效地分配其生成式 AI 工作負載。該架構支援廣泛的人工智慧模型訓練,為大規模人工智慧專案提供強大的解決方案。
對於推理工作負載,Trn2 UltraServer 為具有數萬億個參數的模型的即時推理提供增強的效能。 AWS 與 Anthropic 合作建置了一個 EC2 UltraCluster,綽號為 Project Rainier,由眾多互連的 Trn2 UltraServer 組成。該設定將利用數十萬個 Trainium2 晶片,為 AWS 平台上人工智慧運算能力的重大進步鋪平道路。