晶上生成式變結構計算可為中國打破算力晶片“制程工藝繭房”開闢新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。
今年以來,中國以DeepSeek為代表的大模型企業通過演算法優化、有針對性的訓練和開源生態協作,在使用“縮水版”GPU晶片的情況下,將千億參數模型訓練成本壓縮至同類模型的1/10,走出了一條從粗放式算力堆砌向內生式效能提升的新路徑。
在全球驚歎中國非對稱創新奇跡的同時,也要清醒看到,就人工智慧(AI)技術和產業自主可持續發展而言,中國仍未擺脫對高端乃至“縮水版”智算晶片等物理器件的依賴。在可以預見的未來,外部環境可能更趨惡劣,封鎖遏制常態化、供應鏈不確定性等挑戰難以回避。中國亟需在智能算力層面實現“DeepSeek式突圍”,用超限創新解耦當前硬體算力提升與制程工藝進步強綁定的關係。
換言之,中國要在AI領域獲得與競爭對手可博弈的能力,不僅要在演算法層面繼續革命、突破“算力繭房”,而且要在演算法與物理層面深度融合上實現換道超車,破解“制程工藝繭房”。以生成式變結構計算、軟體定義晶上系統(Software defined System on Wafer,SDSoW)為主要內容的晶上生成式體系架構,為解決演算法模型與算力載體失配難題、增強軟硬體協同算力可持續發展提供了新的技術路徑。
讓計算架構的“鞋”適應演算法的“腳”
先進的晶片制程工藝能夠提供更高的電晶體密度,提升晶片單位面積計算能力,為大模型訓練和推理提供更強大的計算資源支持。然而,基於還原論的工程設計範式,晶片制程工藝艱辛迭代獲得的物理算力提升,很難被大規模分佈式物理系統上運行的軟體演算法有效利用。晶片峰值計算能力與演算法系統性收益存在結構性錯位,加之分佈式系統在技術體制上受“大規模、低時延、高帶寬”不可能三角問題制約,靠簡單堆砌千張、萬張乃至十萬張以上GPU卡的方式,難以滿足“規模定律-Scaling low”驅動的大模型訓練之非線性算力增長需求。
簡而言之,由於存算分離體制的馮·諾依曼計算架構,硬體系統設計(如晶片制程、記憶體帶寬、併發單元等)與演算法模型的運算特徵(如計算密度、數據流模式、精度需求等)之間存在系統性錯位。即便晶片制程工藝有所進步,帶來了性能增益,也會由於“逐級插損”的系統工程範式大打折扣。
突破“制程工藝繭房”,在更高維度上尋求問題的解空間,需要變革傳統剛性計算架構及技術物理實現範式。
近80年來,傳統計算架構一直沿用運算器、控制器、內記憶體、輸入輸出設備幾大件組成的馮·諾依曼計算架構。無論是複雜的AI演算法,還是簡單的數據處理任務,都被“硬塞”進剛性的計算架構之中,奢望“一勞永逸”地處理千變萬化的應用。這就好比不管你腳多大,都必須穿37碼的鞋才能走路。然而,鞋不合腳就走不快:小腳穿大鞋會絆腳;大腳穿小鞋則會感到疼,結局往往是“削足適履”。
化解剛性架構算力與多樣化演算法間結構性矛盾,需要借助物理學增維求解法則,導入自適應計算架構新機理。
2009年,受“自然界偽裝大師”擬態章魚啟發,中國科學家在世界上首次提出領域專用軟硬體協同變結構計算——擬態計算。如同擬態章魚,可“隨機應變”地隱匿在沙質海底或珊瑚礁等環境之中,擬態計算能讓“鞋子”更好地適配穿著它走路的“腳板”。
2018年,電腦體系結構大師、圖靈獎得主大衛·帕特森和約翰·軒尼詩預言,基於軟硬體協同計算語言的領域專用軟硬體協同計算架構,將成為今後十年電腦體系架構黃金發展期的主流發展方向之一。前不久,特斯拉Dojo超算公佈了其計算範式變革的解決方案,提出硬體架構像變形金剛般隨任務變形,實現從“演算法適應硬體”到“演算法定義硬體”的範式轉換。
用二流零部件構建一流系統
生成式變結構計算的核心在於按演算法需求動態重構計算架構,要求算力的硬體載體能夠實現以軟體驅動物理結構變化,大幅度提升特定計算結構對特定演算法的執行效能。SDSoW就是要推動計算架構從“剛性流水線”向“軟體可塑形”躍遷,打通生成式變結構計算從理論到技術物理實現的閉環,使得基於二流器件或部件構建一流系統成為可能。
具體來說,SDSoW具備五大能力。
一是系統破局能力。SDSoW擺脫“核心器件決定論”思維,改變“芯粒、晶片、模組、機匣、機架、系統”的逐級堆砌、逐級插損式工程技術路線,通過晶圓級異構集成實現功能解構—晶上重組,達成功能等價、系統最優的目標,將制程工藝短板通過系統工程方法轉化為非主要矛盾。
二是整體增效能力。借助晶圓級高密度互連、超短距離、異質異構封裝,獲得高帶寬、低延遲、低功耗的系統增益,SDSoW系統的帶寬可提升一個數量級,時延可縮小一個數量級,功耗可降低一個數量級,系統效能可提升三個量級。
三是通專融合能力。基於晶圓級系統硬體可編程/重定義架構,可通過軟體即時配置或由AI大模型生成SDSoW功能和性能。在同一物理載體上,能根據不同應用需求或使用場景,實現“一平臺、多樣性”生成式變結構計算,既可滿足專用場景特殊算力需求,又能兼顧領域內相對靈活的通用算力要求。
四是開源協同能力。通過建立SDSoW開源社區,發佈基礎互連協議、動態控制器及生成式變結構計算工具鏈等,SDSoW可構建“中國引領、全球參與”的生態環境,以開放破壟斷,形成相對Chiplet(小晶片)路線的比較優勢。
五是內生安全能力。SDSoW可從源頭上應對開放生態帶來的新域新質安全挑戰,通過引入內生安全架構實現開放可控,即便供應鏈欠安全,仍能保證開放條件下該系統具有“開箱即用、默認安全”的網路彈性。
總之,晶上生成式變結構計算可為中國打破算力晶片“制程工藝繭房”開闢新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。通過應用與設計、演算法與算力的垂直整合,解耦當前中國算力基礎設施產品對晶片先進制程工藝的強依賴關係,最大程度獲取體系結構與工藝進步的綜合增益。晶上生成式變結構計算也能為全球智算普惠提供中國方案。
基於晶圓級集成/封裝的生成式變結構計算,開闢了演算法架構突破與物理載體革命、演算法工程實現與計算範式創新深度耦合的新方向。目前,應儘快推動根理論突破,重點攻關晶上熱力學、異構集成理論、可重構架構數學描述等底層理論;持續加強根技術攻堅,突破晶圓級鍵合、3D互連、晶圓級操作系統、生成式結構計算語言/編譯器等關鍵技術,實現從架構設計、物理實現到技術應用自主生態;多維推進根產業培育,以智能駕駛、具身智能、工業數字孿生、AI一體機等新興市場需求為牽引,通過“場景開放+體系創新+生態聚合”三位一體模式,以超限創新、超常規舉措突破“小院高牆”“遏制封鎖”,蹚出一條中國特色技術平權和產業可持續發展之路。
來源:科技日報