6月30日,一家定位為AI時代“賣水人”的初創公司北京矽基流動科技股份有限公司(下稱“矽基流動”),正式向港交所遞交上市申請。此時,距離這家於2023年8月註冊成立的公司,還不到三年時間。
不到三年,七輪融資,從天使輪的2.8億元估值,一路狂飆到B+輪的77.4億元。它的背後,站著阿裏巴巴、美團、華為哈勃、商湯、智譜、創新工廠等一眾令人眼花繚亂的產業巨頭和頂級VC。
資本盛宴烈火烹油、繁花似錦。但翻開347頁招股書,「數智研究社」發現,這是一家營收雖然暴增七倍,但毛利率卻斷崖式跌至-24.0%的公司。這是一家手握上千萬註冊用戶、日均吞吐量高達幾千億次,卻深陷“做得越多,虧得越慘”泥潭的算力中間商。
在巨頭環伺、算力帳單高企、API價格戰刺刀見紅的今天,矽基流動“流血衝刺”,是新一代基礎設施霸主的加冕,還是在大廠圍剿下不得不提前搶跑的大逃亡?
矽基流動不是一家大模型公司,也不直接開發面向C端的AI應用。它是一家“開放、獨立的Token供應平臺”,也就是所謂的“Token工廠”。
在AI世界裏,無論寫代碼、畫圖還是做數據分析,大模型處理資訊的原子單位就是Token(詞元)。矽基流動的生意邏輯,就是把上游各種亂七八糟的異構算力(如英偉達的GPU,以及昇騰、沐曦、摩爾線程等國產晶片),和各種不同架構的AI模型整合在一起,通過自己研發的推理引擎和算力資源編排系統,打包成標準化、可計費的Token,像自來水一樣賣給下游的開發者和企業。
在這個宏大敘事下,矽基流動交出了一份漂亮的流量成績單。
招股書顯示,截至2026年4月30日,矽基流動平臺註冊用戶數已經突破了1028萬。作為對比,2024年底註冊用戶數還僅只有12.7萬。短短一年多時間,用戶量暴漲了幾十倍。
在代表業務活躍度的日均Token吞吐量上,2026年4月達到5785億次,單日最高峰值甚至突破1.0714萬億次。以弗若斯特沙利文數據計,按2025年詞元年吞吐量計算,它已經成為中國最大的獨立生態詞元供應商。
如此恐怖的流量爆發,很大程度上要歸功於年初轟動全球的DeepSeek狂歡。
2025年初,DeepSeek V3和R1模型火爆出圈,官方伺服器被龐大的訪問量擠爆。就在千萬用戶無處嘗鮮的絕佳窗口期,矽基流動憑藉其在國產晶片適配上的技術積累,迅速聯合華為雲上線了滿血版服務,一舉承接了海嘯般的溢出流量。配合著“註冊送14元、邀請再送14元”的裂變拉新玩法,矽基流動一夜間名聲大噪,網站訪問量飆升近40倍。
潑天的富貴,直接把矽基流動的營收推上了天。2025年公司實現收入5533萬元,較2024年的734.6萬元同比暴增653.2%。這其中,公有雲服務(包括無伺服器詞元服務和專屬實例)立下汗馬功勞,收入占比達到52.9%,反超了傳統的本地部署業務。
故事講到這裏,看起來是一個完美的AI創投範本。但商業世界的殘酷是,命運饋贈的所有禮物,早就在暗中標好了價格。
當大批小白用戶和開發者湧入平臺瘋狂消耗Token時,矽基流動的後臺也在承受著失控的成本反噬。
賣Token,從來就不是一門穩賺不賠的生意。2024年,公司規模還不大時,毛利率維持在39.4%的體面水準。但到營收大爆發的2025年,隨著公有雲業務的快速擴張,公司銷售成本從前一年的445.2萬元飆升到6863.2萬元,反超了全年總收入。
這樣一來,2025年矽基流動的毛利率直接轉負,暴跌至-24%,單在毛利層面就虧掉了1330.2萬元。其中,公有雲服務的毛利率更是擴大到-119%。
為什麼會這樣?
答案很簡單:算力太貴了。
作為一家中間商,矽基流動自己並不生產晶片,它的算力資源嚴重依賴向上遊雲廠商和算力中心租賃。為了承接瞬間湧入的海量用戶請求,保證服務穩定性,它必須提前租賃並囤積大量算力。
然而,這些昂貴算力資源的利用率仍處於爬坡階段,規模效應根本沒有跑出來。換句話說,公司花高價租來了伺服器,卻在用極低的價格甚至是通過送代金券免費倒貼,把Token賣給用戶。
在這種賠本賺吆喝的模式下,虧損自然如同滾雪球般迅速擴大。2023年至2025年,公司淨虧損分別為1222.3萬元、8191.5萬元和3.45億元。剔除股份薪酬等影響後,2025年經調整淨虧損依然高達1.87億元,經營現金流出1.72億元,平均每個月都要燒掉1480萬元的現金。
如果僅僅是短期的戰略性虧損,資本或許還有耐心等待規模效應的到來。
但矽基流動頭頂上真正致命的麻煩,是整個AI Infra(人工智慧基礎設施)賽道正在發生劇烈的模式切換。
矽基流動賺的是“算力與模型之間”的差價。行業早期,大廠的底層算力生態割裂,開源模型層出不窮,確實需要一個技術過硬的“中間商”來做跨晶片的適配和推理優化。
矽基流動創始人袁進輝,作為清華張鈸院士的高徒、前OneFlow(一流科技)掌舵人,在系統軟體和分佈式框架上有著深厚積澱。2026年6月,矽基流動還正式收購了OneFlow的知識產權組合,進一步強化了底層的推理架構能力。
然而,隨著AI行業迅速成熟,這條曾經的護城河被巨頭們快速填平了。如今的牌桌上,阿裏、騰訊、百度、位元組跳動等互聯網大廠,哪一個沒有組建百人甚至千人規模的頂尖Infra團隊?
阿裏雲成立了專門的Token Foundry事業部,由集團CEO吳泳銘親自掛帥,把Token生產拉到了集團戰略級高度。位元組跳動的Seed-Infrastructures團隊和火山引擎深度融合,將大模型的訓練與推理框架一手包辦。就連底層的晶片廠商摩爾線程、沐曦股份等,也開始越過中間商,直接與大模型公司進行深度綁定。
在巨頭們“上擠下壓”中,獨立的AI Infra創業公司定位變得極其尷尬。
更要命的是,大廠們為了爭奪開發者生態,瘋狂發動API價格戰。自2023年以來,頭部廠商已累計十餘次下調定價,部分主流模型每千Token的價格降幅甚至超過90%。2026年5月,DeepSeek官宣V4-Pro永久降價75%,騰訊雲迅速跟進,最高降幅達到97.5%。
對於那些有自有雲生態、能靠其他業務補貼算力的大廠來說,降價是搶佔地盤的戰略。但對純靠算力差價盈利、本就毛利率為負的矽基流動來說,這無異於釜底抽薪。
在殘酷的價格戰和體驗落差下,矽基流動此前靠燒錢和熱點拉來的用戶,忠誠度薄如蟬翼。有媒體和用戶實測回饋,矽基流動平臺調用的某些模型存在嚴重的數據幻覺和穩定性問題,甚至在回答簡單商業問題時肆意編造數據,多模態能力也遠遜於主流競品。隨著大廠官方管道擴容,大量C端用戶迅速回流,矽基流動的留存面臨嚴峻考驗。
內部動盪更是讓這種焦慮雪上加霜。在2024年下半年火線加入、主導矽基流動這波潑天流量增長的核心高管聯合創始人兼增長業務副總裁楊攀,在近期悄然離職,正籌畫新的創業專案。在衝刺上市的敏感期,一員身經百戰的大將突然掛印而去,無論對外如何粉飾,都不可避免地讓外界對公司未來的商業化打上一個問號。
來源:中國數智研究社