全球AI競爭正在走向模型與算力的協同,在這方面,OpenAI與DeepSeek分別在美國與中國扮演了最重要的角色。
OpenAI正在打造輻射硬體與軟體的萬億美元AI平臺。繼採購英偉達與AMD晶片,部署10GW與6GW數據中心後,它終於官宣了與博通的合作。這款傳聞已久的定制AI晶片,已經秘密設計了18個月,有望在2026年下半年投入使用,並於2029年底全面部署,整體規模高達10GW。
這款AI晶片為推理而生。按照參與該晶片設計的首位核心員工的說法,早在o1正式發佈前的幾個月內,即進入去年下半年,團隊就已開始著手設計。期間,公司的模型團隊與晶片團隊,以及博通合作團隊,就已經緊密協作起來,試圖把智能的成本與延遲,一起壓向零的邊際。
事實上,OpenAI與博通的合作,已經超出了最初的設想。與其說它們在合作開發一款定制AI晶片,不如說它們在合作定制一整套完整的,能夠直接塞到數據中心裏的算力系統。據雙方的聲明,OpenAI負責設計晶片和系統整體架構,博通設計端到端的以太網、PCIe和光纖連接解決方案組合。
它還是一套協同創新的方法論,圍繞OpenAI生態而生。OpenAI宣稱將其“在開發前沿模型和產品過程中積累的經驗直接嵌入到硬體中,從而釋放更高水準的功能和智能”。博通也稱,雙方討論的下一件事,是將算力從晶片的二維空間堆疊到三維空間,並將光學也引入其中。
這背後反映的是OpenAI正在打造一個自我閉環的模型+算力帝國。過去,OpenAI曾幾次嘗試讓晶片廠商圍著自己轉。GPU緊缺和溢價已經成為了OpenAI的瓶頸;更要命的是,OpenAI越來越綁定在英偉達的CUDA體系內,無法迅速最大化地釋放模型性能,也不會符合推理時代的token經濟學。
由OpenAI 研究員創建的深度學習編譯器Triton,最初相容CUDA,然後逐步擴展到AMD ROCm等更多架構,讓旗下模型能跨硬體運行。微軟最初發佈Maia 100,宣傳的可是專為Azure平臺設計,旨在運行生產級OpenAI模型。在初版“星門專案”的藍圖裏,OpenAI更願意使用以太網,希望避免使用InfiniBand。
OpenAI的野心是構築自己的萬億美元AI商業生態。這次OpenAI開發者日,奧特曼展示了ChatGPT Apps SDK、AgentKit等,相當於要讓ChatGPT成為新的操作系統。但當天在接受Stratechery採訪時,奧特曼卻聲稱,自己現在花時間最多的地方,是基礎設施。
這呼應了Groq創始人Jonathan Ross的最近的觀點。誰掌控算力,誰才真正掌控AI,“自己造晶片,並不只是擁有一顆晶片,真正意義是你把命運掌握在自己手裏”。
去年初,奧特曼提出的7萬億美元AI基礎設施計畫遭到所有人的嘲笑與質疑,如今,奧特曼計畫在2033年就將算力規模提升到驚人的250GW,差不多就要對應超過10萬億美元資金。
OpenAI的星門計畫之上,正在構築出全球晶片星際艦隊:英偉達、AMD、博通、英特爾(通過英偉達),還包括ARM、三星、海力士等。
ARM已經深度介入,為OpenAI與博通的定制AI晶片,開發一款高度適配的專用CPU架構。有意思的是,ARM是軟銀的子公司,而軟銀又是OpenAI的股東與客戶。軟銀簽下的其中一份訂單,就是從OpenAI購買技術,以幫助ARM縮短晶片開發週期。這次OpenAI與博通合作,OpenAI聯合創始人Greg Brockman就宣佈了AI設計AI晶片這一噱頭。
資本市場正在醞釀“記憶體超級週期”,無論是DRAM、NAND還是HDD,首次同時面臨短缺。DRAM是製造HBM的基礎,HDD是儲存Sora生成的視頻的最廉價的儲存介質,而NAND的未來將是有望取代HBM市場地位的HBF。OpenAI已經開始與三星和SK海力士合作開發AI晶片記憶體。
而在中國開啟算力生態軟硬體協同的關鍵角色是DeepSeek。此前瘋傳的《AI 2027》報告,虛構了美國公司OpenBrain與中國公司DeepCent之間的競爭,決定了智能體的未來。它們映射的正是現實世界的OpenAI與DeepSeek,以及各自所引領的AI生態。
DeepSeek創始人梁文鋒很早就認為,中國的AI發展缺乏矽谷的軟硬體協同生態,“很多國產晶片之所以發展受限,是因為缺乏配套的技術社區,往往只能獲得第二手資訊。” 沒有前沿大模型的協同,閉門造不出好晶片。
自去年以來,DeepSeek對外公佈了自己的代碼,還在陸續發表的論文裏“指導”中國硬體廠商前來適配,設計出未來晶片的架構,包括突破CPU與GPU通信瓶頸與更智能化的互聯網路。從魔改PTX到使用UE8M0 FP8 Scale的參數精度,DeepSeek先榨取英偉達GPU算力,再牽引國產算力生態的演進。
近期,DeepSeek-V3.2-Exp更新,作為實驗性版本,它不僅探索了新的稀疏注意力機制,也在推動中國算力生態的協同創新與格局演進。該模型的開發,用到了一款“土生土長”的新型編程語言TileLang,將是替代目前主流的OpenAI 領域特定語言(DSL)Triton的有力備選,已經擴展支持多款國產晶片。
該模型發佈後,華為昇騰和寒武紀均第一時間宣佈完成適配工作,加上海光、昆侖芯、沐曦等的深度適配,意味著國產AI算力生態的軟硬體協同,已經進入實戰階段。
儘管DeepSeek目前仍然是一家AGI實驗室,但它的技術信仰仍然需要強大的算力支持。可以預見的將來,它會別英偉達GPU;讓中國頭部晶片廠商同步適配自己,相當於也“掌握了自己的命運”。開源與分享正在成為中國創新的公共品,模型與晶片廠商可以更快速地驗證設計方向,儘量減少協同成本。
圍繞OpenAI的生態是封閉的。源自這一體系的創新,將會通過硬體合作夥伴,部分或間接地外溢至其他模型層以及應用層企業。但更多的仍然是鎖定在OpenAI自己的技術黑箱與價值體系之內。
中國與美國的AI競爭,正在從算力與模型的單打獨鬥,收斂到軟硬體協同的開源與閉源的競爭。狂熱的資金仍在繼續湧入。在美國,已經從產業資本邁向金融資本下場的新階段;在中國,無論是晶片還是模型,廠商數量眾多,各地建設熱火朝天,力爭把算力變成生產力。
來源:中國鳳凰網