在國產大模型競爭日益激烈之際,AI初創公司北京月之暗面科技有限公司(以下簡稱“月之暗面”)日前發佈全新開源模型Kimi K2(以下簡稱“K2”),試圖重新爭奪市場領先地位。7月13日,美國AI搜索初創公司Perplexity CEO阿拉溫德(Aravind Srinivas)發文稱,K2模型在測試中良好表現,後續可能會基於K2進行後訓練。
Perplexity的CEO阿拉溫德(Aravind Srinivas)點贊Kimi
有業內人士對此次K2模型的發佈表示看好,他認為“Kimi現在在走一條比之前更正確的道路,具備深度研究能力才是大模型提供真正價值的核心”。該業內人士進一步向澎湃科技表示,大模型此前依靠Token(詞元)低價競爭的策略並不會長久。
前述業內人士分析指出,大模型的研發和運營成本非常高,包括巨大的計算資源消耗、電力成本以及頂尖人才的投入,低價競爭策略會讓企業難以收回成本,無法持續投入在研發上。從長遠來看,這種模式並不利於行業發展。
Kimi K2 在自主編程(Agentic Coding)、工具調用(Tool Use)和數學推理(Math & Reasoning)三大能力維度的基準性能測試。 來源:月之暗面
月之暗面此次發佈的K2模型具備更強的編程能力,在執行通用智能代理任務與工具整合方面表現出色,能更高效地拆解複雜任務。該模型總參數達到一萬億,啟動參數為320億。K2的API服務支持最長128K上下文,具備更強的通用性與工具調用能力,每百萬輸入tokens 4元,每百萬輸出tokens 16元。
而在此之前,國產大模型市場經歷了一輪激烈的價格戰,DeepSeek、豆包、文心一言、通義千問等頭部廠商紛紛大幅下調模型服務價格。今年2月,DeepSeek宣佈在每日00:30至08:30的夜間時段大幅降價:DeepSeek-V3輸入價格降至每百萬tokens 0.25元、輸出價格1元,較原價下調50%。2024年5月,阿裏雲也將其Qwen-Long API的輸入價格從0.02元/千tokens降至0.0005元,輸出價格約為0.002元/千tokens,整體降幅最高達97%。
在模型性能上,K2在自主編程、工具調用及數學與邏輯推理三大核心能力的基準測試中表現良好。在前端開發任務中,K2擅長生成兼具設計感與視覺表現力的代碼,支持粒子系統、可視化和3D場景等表現形式,具備較強的圖形能力與交互性。此外,在Agent(智能體)任務執行方面,K2 Agent現已具備穩定的複雜指令解析能力,完成複雜任務或自動化編碼。
月之暗面成立於2023年,由清華大學畢業生楊植麟創辦,獲得阿裏巴巴等多家互聯網巨頭支持。該公司在2024年因推出具備長文本分析和AI搜索功能的Kimi模型而迅速走紅,吸引大量用戶關注。
不過,隨著競爭對手DeepSeek今年初推出低成本、高性能模型R1並重塑全球AI市場格局,月之暗面的市場反響和熱度略有所下滑。據追蹤人工智慧產品的中國網站aicpb.com稱,月之暗面的Kimi應用程式去年8月在月活躍用戶中排名第三,但到6月份卻跌至第七位。
在沉寂數月之後,6月中旬,月之暗面推出Kimi-Research(深度研究)功能內測。據介紹,Kimi-Researcher是基於端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代Agent模型,也是一個專為深度研究任務而生的Agent產品。
來源:中國澎湃新聞