拆解數據中心機櫃中的伺服器,通常會看到裏面有十來張固態硬碟 (SSD)。這些固態硬碟承擔著數據存儲的重任,其中的主控晶片又是固態硬碟的大腦,高效精准調度數據進出存儲單元。
存儲是大模型時代的關鍵基礎設施之一。只要有數據,就需要存儲。當數據成為AI領域的核心資源,存儲技術就決定了大模型數據處理效率,並影響訓練和推理速度。伴隨訓練數據集規模的指數級增長,數據儲存成本與性能的平衡也至關重要。
“存儲是一個確定的大市場。”存儲晶片設計公司英韌科技CFO鐘曉蕙日前對記者表示,算力、存力、傳輸能力,三者往往協同促進、共生發展,大模型熱潮正推動存儲技術演進,對存儲晶片企業及SSD廠商的差異化競爭和技術迭代能力提出了更高要求。
算力很重要,存力也很重要
固態硬碟 (SSD) 的主要硬體組件包括NAND閃存顆粒、DRAM緩存和主控晶片等。如果把需要存儲的數據比作汽車,那麼固態硬碟就是一個巨型停車場,閃存晶片上的存儲單元是一個停車位,主控晶片是這個巨型停車場的“管理員”,負責指揮每一輛車準確、快速、合理地進出自己的停車位。
可以說,主控晶片就是固態硬碟的大腦,通過相應的固件代碼,負責對閃存顆粒等部件執行數據讀取、寫入、加密等複雜操作。英韌科技就是固態硬碟這類核心存儲部件的開發商,其核心產品包括固態硬碟的整盤解決方案及其內部存儲主控晶片。
全球範圍企業級SSD市場主要由韓國的三星電子、SK海力士長期佔據壟斷地位,合計市場份額超過70%。國內企業級SSD產業鏈仍處於快速追趕階段。2017年英韌科技成立時,主流存儲技術正從機械硬碟轉向固態硬碟,數據傳輸介面也從SATA(用於連接主板和大量存儲設備的端口)介面向更高速的PCIe(高速串行電腦擴展匯流排標準)轉換,這為國內初創企業的發展提供了機遇。
“從2017年到2021年,國產廠商都在解決技術能不能轉化成產品的問題。從2021年到2024年,解決產品問題後,大家要解決的是有沒有客戶的問題。”英韌科技CFO鐘曉蕙表示,國產替代客觀上推進了中國存儲晶片行業的發展,而AI熱潮是眼下更大的助力。
在江蘇連雲港海州區的“悟空智算”6876P算力中心,一字排開的機櫃裏,伺服器進行著每秒687億億次的浮點運算。“悟空智算”對DeepSeek全參數版進行軟硬體協同深度優化後,實現了每秒超6900 Token的超高吞吐率,支持企業3分鐘快速啟動AI應用。
算力很重要,存力也很重要。當前,大模型熱潮下,數據量越來越大。冷數據越來越少,更多的數據變成溫數據甚至是熱數據。過去,金融系統或傳統數據中心裏的數據經過5年時間就存起來不再使用,但現在情況已經改變,模型跑起來後需要即時吞吐數據,原先的冷數據和溫數據都變成了熱數據。
江蘇中環雲控物聯科技有限公司正依託“悟空智算”開發海州環衛大模型,探索智能體落地應用。環衛工人佩戴智能手環即可即時回傳體征、位置與任務進度,系統自動調整作業路線;無人清掃車與無人機即時共用路況與垃圾分佈數據,按秒級頻率刷新作業策略。通過虛實映射、統籌調度、自主協同的作業方式,傳統環衛作業模式變成新型智能體模式。“過去我們把智慧環衛叫資訊化管理,現在叫具身智能體,區別就在於系統不再只是看數據的大腦,而是讓每一臺設備、每一位工人、每一條作業鏈路都變成會思考、能對話、自進化的數字生命體。” 中環雲控執行董事徐磊表示。
與此同時,DeepSeek等應用打開了推理和邊緣計算的大門。輕量化模型設計、硬體適配優化,以及模型部署成本降低,推動了算力需求從“訓練側”向“推理側”傾斜,訓練任務集中在雲端,推理任務則下沉到邊緣設備。海量數據“升溫”,算力需求不斷演進,人們對於推理體驗的追求不斷升級,渴望實現極致的低延遲,這些都對存力也提出了更高的要求。
大模型驅動存儲技術升級
在表面打磨行業,優良的工藝是不可逾越的技術壁壘,而AI的價值就在於持續積累工藝數據,開發更智能的機器人大腦,進一步優化工藝。
2018年成立的索菲絲智能科技(上海)有限公司從機器人代理走向產品自研,旗下工業機器人聚焦解決製造業中打磨、切割、鑽孔、去毛刺等應用場景。創始人杜玲表示,只有AI化才能讓機器人更智能,團隊開發了可在手機和電腦等智能終端顯示的智能磨機,端側操作保證員工遠離粉塵和噪音等惡劣工作環境,也能記錄老師傅打磨過程中留下來的壓力、溫度、轉速、材料等工藝數據和關鍵參數,未來開發打磨大模型,應對不同產品的打磨需求,提升工藝。
這也凸顯了對算力與存力的迫切需求。據英韌科技介紹,原始數據的收集和推理日誌,帶來的數據量非常大,對於存儲的要求是海量寫入、高速讀取。數據清洗和模型訓練對於存儲的要求是高併發混合讀寫,對隨機性能要求更高。不同的數據應用場景對存儲晶片的要求已經出現差異化。
傳統數據中心的固態硬碟需求是4T到8T,DeepSeek出現後,閃存容量需求提升到32T、64T甚至128T,閃存顆粒容量越大,開發難度也越大。這就好比房子建得越高,對於結構的要求也越高。就像英韌科技同一代次的產品已經衍生出各種細分應用,這恰恰對存儲晶片企業及SSD廠商的差異化競爭和技術迭代能力提出了更高要求。
事實上,AI正在推進存儲技術的演進方向。“過去,國內大量數據中心還在使用機械硬碟。前兩年開始,出於對速度的要求更換成固態硬碟,從SATA變成PCIe4.0,現在進入PCIe5.0時代。”鐘曉蕙介紹,2022年ChatGPT落地後,以AIGC為代表的應用市場開始對存儲提出更高的性能和容量需求。DeepSeek的出現促進了大模型推理的應用落地,新一代的PCIe 6.0固態硬碟和基於CXL介面的存儲級記憶體方案也開始受到關注,這些技術將以新的方式支持大模型數據中心雲服務以及本地部署的一體機,使DeepSeek等開源大模型加速落地。“AI的出現加速了SSD的市場導入,我們大概用了一年左右的時間導入標準伺服器廠商,2024年半年時間出貨量就攀升了10倍以上。”
算力、存力、傳輸能力,三者往往協同促進、共生發展。國內AI晶片公司正在使用更開放的架構RISC-V,探索從邊緣伺服器到雲端伺服器的佈局。晶片設計公司知合計算CEO孟建熠表示,RISC-V在高性能計算領域實現突破不僅要在通用計算層面進入高性能領域,更需要在架構層面融合AI增強計算,實現AI原生。
“存儲一直跟隨算力和傳輸能力跑。這兩端,但凡有一端起來了,你必須跟上。”鐘曉蕙認為,要針對不同應用場景匹配差異化存儲方案,支撐算力需求。今年團隊的重點工作就是開發符合未來AI需求的存儲主控晶片及解決方案,“全球存儲控制器還是有不少廠商,要撕開這個市場缺口,站住腳並且能夠站得穩,必須在迭代升級過程中,做到人無我有。”未來國產廠商除了要關注產品滿足國產替代需求和可持續的產品迭代能力,還要重視產品“出海”能力,國產存儲產品要走向海外,這是未來3-5年甚至5-10年國產存儲企業必經的階段。
來源:中國澎湃新聞