本網綜合 Aditya Soni 報導 對於希望為未來做好準備的企業而言,矽谷那些功能強大但價格高昂的AI模型曾是必不可少的。但如今,越來越多的科技公司首席執行官認為,更便宜的選擇對於AI的廣泛採用至關重要。
微軟的薩蒂亞・納德拉、派拓網路(Palo Alto Networks)的尼凱什・阿羅拉以及Coinbase Global的布萊恩・阿姆斯特朗等高管均表示,規模較小、成本更低的模型足以滿足企業的大部分需求。
這一觀點源於企業內部的重新評估。此前,這些企業一直鼓勵大量使用AI工具,往往將AI使用量的增長視為生產力的指標,這種做法被稱為“令牌最大化(tokenmaxxing)”。如今,這些帳單開始給企業帶來沉重負擔。
作為衡量AI使用量的單位,“令牌”價格雖在下跌,但隨著AI企業從固定訂閱費模式轉向按使用量計費,完成一項任務的成本卻在上升。由於每項任務的使用量越來越難以估算,這導致企業面臨難以預測且往往更高的帳單。
據報導,以優步為例,由於員工爭相採用AI編碼工具,該公司僅用四個月就耗盡了2026年的全部AI預算,迫使管理層不得不限制使用量。
“許可模式的變更讓很多人措手不及,”幫助企業安全運行AI系統的初創公司BlueRock首席執行官哈羅德・拜恩(Harold Byun)表示。“此後不久,我們就收到許多客戶的回饋,稱預算超支幅度達到了20%至30%。”
企業擔憂巨額帳單
隨著企業越來越多地使用AI,相關成本正遠超最初預估——因為任務現在涉及更多步驟、更多數據以及更長的輸入內容。
高德納(Gartner)預計,到2028年,AI編碼成本將超過普通開發人員的平均薪資;而該研究公司的一項調查發現,四分之三的高管預計今年技術預算將增加,其中近半數預計增幅將達到兩位數。
這促使企業採用更經濟的模型,並轉向OpenRouter等路由工具——OpenRouter是一個AI市場平臺。企業希望將任務分配給最具成本效益的系統,同時將高端模型保留用於編碼等複雜工作。
據花旗報告顯示,在OpenRouter上處理的開源模型令牌處理量占比從1月的34%躍升至6月的65%。
這將惠及中國深度求索(DeepSeek)等開源模型開發商——這些模型雖已在初創企業中得到廣泛採用,但因安全顧慮而難以打入大型企業市場。
“若想贏得企業市場,就應提前設定令牌定價,”派拓網路的阿羅拉上周在X平臺發文寫道,他敦促AI實驗室以令牌預計在幾年後才可能達到的較低費率,立即向客戶收費。
OpenAI似乎正在適應這一變化。據報導,這家ChatGPT開發商正考慮大幅降價,包括降低令牌使用費,以應對競爭對手Anthropic可能採取的類似舉措。
然而,轉向更便宜的模型可能會損害其營收增長,尤其是在它們為潛在的首次公開募股(IPO)做準備之際。
“當OpenAI和Anthropic為爭奪‘率先上市’的IPO日期而展開激烈角逐時,將出現價格戰的態勢,”賽諾維斯證券(Synovus Securities)私人財富管理部財務顧問克裏斯托弗・布朗表示。該公司持有數家科技巨頭的股份。
上周大部分時間裏,科技股遭遇拋售,投資者正在重新評估人工智慧領域的估值——對巨額支出回報的疑慮,加上SpaceX上市後表現疲軟,以及OpenAI可能推遲上市的報導,進一步加劇了這種疑慮。
開源及中國模型備受關注
成本飆升正推動更多企業轉向開源模型,包括更便宜的中國替代方案。OpenRouter上最受歡迎的四款模型均來自中國,其中深度求學位居榜首。
花旗報告顯示,中國模型正在縮小與美國頂級模型的能力差距,而收費低至每百萬令牌18美分,而頂級模型的平均收費為4美元。
“它們(開源模型)過去曾落後(領先的AI模型)一年多。現在,據估計大概只落後四個月左右。這一差距將繼續縮小,”BlueRock的拜恩表示。
不過,一些分析師指出,對中國模型安全性的擔憂可能會阻礙企業採用,特別是在網路安全等敏感行業。
相反,他們預計企業將遵循雲計算的模式,在多家服務商之間分散部署,以尋找最合適且價格最優的方案。
WEKA公司首席AI官瓦爾・伯科維奇(Val Bercovici)表示,開源模型正展現出“以10%的價格達到90%的性能”的優勢。WEKA致力於幫助企業更快、更經濟地運行AI模型。“我們無需在每個工作環節都花費高價令牌。”