今年以來,矽谷掀起“Token最大化”(tokenmaxxing)之風,Token與KPI直接掛鉤,不斷增長的消耗量被視為生產力提升。在矽谷,亞馬遜建立內部排行榜,根據員工使用AI的情況排名。Meta內部的排名系統讓員工比拼誰消耗的Token最多。如今,這些昂貴的AI帳單開始讓企業感到壓力。
據英國《金融時報》6月30日報道,在員工紛紛採用AI編程工具後,美國打車應用公司Uber僅四個月就耗盡了2026年一整年的AI預算,迫使管理層限制使用量。現在,Uber限制每位員工每月使用AI編程工具的費用為1500美元。畢馬威5月對2145名全球企業領導者的調查顯示,由於成本超過收益,其中近半數表示已縮減了AI智能體的使用。
“人們真的在說…… ‘我的公司在第一季度就花掉了2026年的預算’。”OpenAI首席執行官山姆·奧特曼在6月早些時候表示,“今年年初,一個從未被提及的問題……突然變成了一個巨大的問題”。
儘管Token價格在降低,但AI公司的Token定價從固定訂閱模式轉向按使用量收費,完成一項任務的總成本在上升。任務步驟和數據更多,輸入的內容更長,每項任務的Token使用量難以估算,企業面臨不可預測且價格高昂的AI支出帳單。
諮詢機構Gartner預計,到2028年,AI編程成本將超過開發者的平均薪資。Gartner的調查發現,3/4的高管預計今年技術預算將增加,其中近半數預計會有兩位數增長。
飆升的Token帳單讓企業重新審視AI支出情況,重塑模型選擇方式,企業開始接受更便宜的模型。據路透社報導,微軟CEO薩提亞·納德拉(Satya Nadella)和美國網路安全公司Palo Alto Networks的CEO尼科什·阿羅拉(Nikesh Arora)等科技高管紛紛表示,更小、更便宜的模型足以滿足企業大部分需求。
另據《金融時報》報導,企業軟體公司Atlassian限制每位員工在給定時期內可以使用的Token數量。員工可以申請更多Token,但需經理批准。Atlassian首席執行官邁克·坎農-布魯克斯(Mike Cannon-Brookes)表示,很多公司基本上就是選最貴的模型,想用多少就用多少,“這相當危險,因為它也會教出非常糟糕的習慣。”
企業也在轉向OpenRouter這樣的AI市場平臺,在分配任務時,簡單任務選擇具有成本效益的系統,編程等複雜任務用高端模型處理。開源模型有利於企業降低AI成本,OpenRouter上最受歡迎的四個模型全部來自中國,其中DeepSeek位居榜首。
矽谷AI搜索初創公司Perplexity首席執行官阿拉文德·斯裏尼瓦斯(Aravind Srinivas)表示,如果有一個開源模型能在90%的情況下完成任務,而它的成本比前沿模型更便宜,就可能會選擇使用。他表示,前沿智能的未來依然光明,但企業不會再像過去幾個月那樣不計成本地投入了。能夠從AI消耗的電力中提供最大經濟價值的公司,最終才能獲得最高的估值。
幫助企業運行AI模型的WEKA公司首席AI官瓦爾·貝爾科維奇(Val Bercovici)表示,開源模型以10%的價格做到90%的效果,“我們不需要在每個環節都花費高昂的Token。”
阿羅拉呼籲,AI實驗室現在就應該按幾年後預計的低價來對Token收費。持有多家科技巨頭股份的Synovus證券公司私人財富管理財務顧問克裏斯托弗·布朗(Christopher Brown)則認為,OpenAI和Anthropic之間將出現價格戰,因為兩者都在爭奪率先IPO的機會。
來源:中國澎湃新聞