OpenAI與DeepSeek，正在把AI競爭引入軟硬協同階段

ZH-CN

English

没有结果

查看所有结果

没有结果

查看所有结果

您當前的位置：科技 > 文章内容返回

OpenAI與DeepSeek，正在把AI競爭引入軟硬協同階段

发布：2025-10-15

全球AI競爭正在走向模型與算力的協同，在這方面，OpenAI與DeepSeek分別在美國與中國扮演了最重要的角色。

OpenAI正在打造輻射硬體與軟體的萬億美元AI平臺。繼採購英偉達與AMD晶片，部署10GW與6GW數據中心後，它終於官宣了與博通的合作。這款傳聞已久的定制AI晶片，已經秘密設計了18個月，有望在2026年下半年投入使用，並於2029年底全面部署，整體規模高達10GW。

這款AI晶片為推理而生。按照參與該晶片設計的首位核心員工的說法，早在o1正式發佈前的幾個月內，即進入去年下半年，團隊就已開始著手設計。期間，公司的模型團隊與晶片團隊，以及博通合作團隊，就已經緊密協作起來，試圖把智能的成本與延遲，一起壓向零的邊際。

事實上，OpenAI與博通的合作，已經超出了最初的設想。與其說它們在合作開發一款定制AI晶片，不如說它們在合作定制一整套完整的，能夠直接塞到數據中心裏的算力系統。據雙方的聲明，OpenAI負責設計晶片和系統整體架構，博通設計端到端的以太網、PCIe和光纖連接解決方案組合。

它還是一套協同創新的方法論，圍繞OpenAI生態而生。OpenAI宣稱將其“在開發前沿模型和產品過程中積累的經驗直接嵌入到硬體中，從而釋放更高水準的功能和智能”。博通也稱，雙方討論的下一件事，是將算力從晶片的二維空間堆疊到三維空間，並將光學也引入其中。

這背後反映的是OpenAI正在打造一個自我閉環的模型+算力帝國。過去，OpenAI曾幾次嘗試讓晶片廠商圍著自己轉。GPU緊缺和溢價已經成為了OpenAI的瓶頸；更要命的是，OpenAI越來越綁定在英偉達的CUDA體系內，無法迅速最大化地釋放模型性能，也不會符合推理時代的token經濟學。

由OpenAI 研究員創建的深度學習編譯器Triton，最初相容CUDA，然後逐步擴展到AMD ROCm等更多架構，讓旗下模型能跨硬體運行。微軟最初發佈Maia 100，宣傳的可是專為Azure平臺設計，旨在運行生產級OpenAI模型。在初版“星門專案”的藍圖裏，OpenAI更願意使用以太網，希望避免使用InfiniBand。

OpenAI的野心是構築自己的萬億美元AI商業生態。這次OpenAI開發者日，奧特曼展示了ChatGPT Apps SDK、AgentKit等，相當於要讓ChatGPT成為新的操作系統。但當天在接受Stratechery採訪時，奧特曼卻聲稱，自己現在花時間最多的地方，是基礎設施。

這呼應了Groq創始人Jonathan Ross的最近的觀點。誰掌控算力，誰才真正掌控AI，“自己造晶片，並不只是擁有一顆晶片，真正意義是你把命運掌握在自己手裏”。

去年初，奧特曼提出的7萬億美元AI基礎設施計畫遭到所有人的嘲笑與質疑，如今，奧特曼計畫在2033年就將算力規模提升到驚人的250GW，差不多就要對應超過10萬億美元資金。

OpenAI的星門計畫之上，正在構築出全球晶片星際艦隊：英偉達、AMD、博通、英特爾（通過英偉達），還包括ARM、三星、海力士等。

ARM已經深度介入，為OpenAI與博通的定制AI晶片，開發一款高度適配的專用CPU架構。有意思的是，ARM是軟銀的子公司，而軟銀又是OpenAI的股東與客戶。軟銀簽下的其中一份訂單，就是從OpenAI購買技術，以幫助ARM縮短晶片開發週期。這次OpenAI與博通合作，OpenAI聯合創始人Greg Brockman就宣佈了AI設計AI晶片這一噱頭。

資本市場正在醞釀“記憶體超級週期”，無論是DRAM、NAND還是HDD，首次同時面臨短缺。DRAM是製造HBM的基礎，HDD是儲存Sora生成的視頻的最廉價的儲存介質，而NAND的未來將是有望取代HBM市場地位的HBF。OpenAI已經開始與三星和SK海力士合作開發AI晶片記憶體。

而在中國開啟算力生態軟硬體協同的關鍵角色是DeepSeek。此前瘋傳的《AI 2027》報告，虛構了美國公司OpenBrain與中國公司DeepCent之間的競爭，決定了智能體的未來。它們映射的正是現實世界的OpenAI與DeepSeek，以及各自所引領的AI生態。

DeepSeek創始人梁文鋒很早就認為，中國的AI發展缺乏矽谷的軟硬體協同生態，“很多國產晶片之所以發展受限，是因為缺乏配套的技術社區，往往只能獲得第二手資訊。” 沒有前沿大模型的協同，閉門造不出好晶片。

自去年以來，DeepSeek對外公佈了自己的代碼，還在陸續發表的論文裏“指導”中國硬體廠商前來適配，設計出未來晶片的架構，包括突破CPU與GPU通信瓶頸與更智能化的互聯網路。從魔改PTX到使用UE8M0 FP8 Scale的參數精度，DeepSeek先榨取英偉達GPU算力，再牽引國產算力生態的演進。

近期，DeepSeek-V3.2-Exp更新，作為實驗性版本，它不僅探索了新的稀疏注意力機制，也在推動中國算力生態的協同創新與格局演進。該模型的開發，用到了一款“土生土長”的新型編程語言TileLang，將是替代目前主流的OpenAI 領域特定語言（DSL）Triton的有力備選，已經擴展支持多款國產晶片。

該模型發佈後，華為昇騰和寒武紀均第一時間宣佈完成適配工作，加上海光、昆侖芯、沐曦等的深度適配，意味著國產AI算力生態的軟硬體協同，已經進入實戰階段。

儘管DeepSeek目前仍然是一家AGI實驗室，但它的技術信仰仍然需要強大的算力支持。可以預見的將來，它會別英偉達GPU；讓中國頭部晶片廠商同步適配自己，相當於也“掌握了自己的命運”。開源與分享正在成為中國創新的公共品，模型與晶片廠商可以更快速地驗證設計方向，儘量減少協同成本。

圍繞OpenAI的生態是封閉的。源自這一體系的創新，將會通過硬體合作夥伴，部分或間接地外溢至其他模型層以及應用層企業。但更多的仍然是鎖定在OpenAI自己的技術黑箱與價值體系之內。

中國與美國的AI競爭，正在從算力與模型的單打獨鬥，收斂到軟硬體協同的開源與閉源的競爭。狂熱的資金仍在繼續湧入。在美國，已經從產業資本邁向金融資本下場的新階段；在中國，無論是晶片還是模型，廠商數量眾多，各地建設熱火朝天，力爭把算力變成生產力。

來源：中國鳳凰網

上一篇：國際貨幣基金組織上調增長預期關稅衝擊小於預期

下一篇：國際貨幣基金組織首席經濟學家稱，人工智慧投資熱潮可能引發崩盤，但不太可能引發系統性危機