電商巨頭亞馬遜繼續在雲計算領域發力,自研AI(人工智慧)產品如期上新。
當地時間12月2日,亞馬遜雲科技(AWS)在2025 re:Invent全球大會上宣佈了一系列AI產品上新,包括第三代定制AI晶片Trainium3和三款全新前沿AI Agent(AI助理)的正式推出。AWS的CEO馬特·加曼(Matt Garman)表示:“Trainium如今已經是一項數十億美元規模的業務,並且仍在快速增長。”
Trainium是AWS為AI訓練和推理任務設計的自研晶片系列,旨在在保持高性能的同時,大幅降低模型訓練與部署的整體成本。在去年的全球大會上,AWS首次宣佈了Trainium3。
據介紹,作為公司旗下第一款採用3納米工藝節點製造的晶片,Trainium3性能較上一代提升4倍,與同等GPU系統相比,可將AI模型訓練和運行成本降低40%。每顆晶片配備144 GB HBM3E高帶寬記憶體,提供4.9 TB/s的記憶體帶寬,並可實現略高於2.5 PFLOPS的密集FP8運算性能。
在此基礎上,搭載Trainium3的伺服器Amazon EC2 Trn3 UltraServer能夠提供極高密度的訓練算力,容納多達144個Trainium3晶片,AI算力峰值達到362 PFLOPs(FP8精度)。在FP8級別,這些系統的性能大致與英偉達基於Blackwell Ultra的GB300 NVL72系統相當,而在FP4級別依然存在顯著差距。
同時,AWS確認公司正在開發下一代Trainium4晶片。該晶片預計在FP4精度運算下將運算性能提升6倍,記憶體帶寬提升4倍,記憶體容量增加2倍。AWS還透露,在合作夥伴英偉達的幫助下,Trainium4將支持英偉達的NVLink Fusion高速互連技術,意味著Trainium4將能夠在英偉達的MGX機架中與GPU無縫協同工作,為客戶提供更靈活的混合架構選擇。
目前,已有多家AWS合作客戶採用了Trainium3。其中,AI生成視頻公司Decart表示,使用Trainium3進行即時視頻生成的推理速度提升了4倍,而成本僅為此前使用GPU加速運算的一半。Anthropic和理光(Ricoh)等客戶也通過採用Trainium晶片,成功降低了高達50%的訓練與推理成本。
另一方面,AWS還透露了與Anthropic合作的“雷尼爾計畫”(Project Rainier)計畫的最新進展:啟動一年後,該計畫已連接超過50萬顆Trainium2晶片,成為全球最大的AI運算集群之一,其規模是Anthropic訓練上一代模型時的5倍。
此外,AWS在本次大會上推出三款全新的前沿AI Agent,具備自主性與可擴展性,能夠在無需持續干預的情況下連續工作數小時乃至數天。其中,Kiro自主Agent能夠獨立完成任務並在工作中持續學習;Amazon Security Agent負責在應用設計、代碼審查與滲透測試等環節充當安全顧問;Amazon DevOps Agent則能夠協助團隊解決並預防運行故障。
Trainium系列持續上新,意味著亞馬遜也在持續進軍AI晶片行業。今年11月,穀歌發佈公司第七代自研TPU(張量處理單元)晶片Ironwood。隨後,有消息稱Meta正在考慮從2027年起在其數據中心部署穀歌的TPU,價值達到數十億美元,導致英偉達股價一度大跌。
不過,和英偉達以及穀歌相比,亞馬遜的Trainium晶片缺乏有深度且易於使用的軟體庫。除了亞馬遜自己以及公司大力投資的AI初創企業Anthropic外,還沒有其他大規模採用Trainium晶片的知名公司。這或許也解釋了,亞馬遜為何將支持英偉達NVLink作為下一代晶片的一大亮點。
AWS計算和機器學習副總裁Dave Brown在接受外媒採訪表示:“AI晶片市場的多樣性是一件好事……我們的客戶希望能夠不斷獲得更強的計算能力和更高的性能,更重要的是,價格還要更低。”而負責Trainium專案的AWS副總裁兼首席架構師直言:“我不認為我們會試圖取代英偉達。”
2日當天,據大智慧VIP,亞馬遜(Nasdaq:AMZN)漲0.23%收於每股234.42美元,總市值2.51萬億美元。
來源:中國澎湃新聞