10月27日,記者獲悉,MiniMax(稀宇極智)發佈並開源新一代文本大模型MiniMax-M2,在全球權威測評榜單Artificial Analysis (AA)中總分位列全球前五、開源第一,躋身全球第一梯隊,與OpenAI、穀歌等矽谷巨頭同台競技,這也是中國開源大模型首次在該榜單中躋身全球前五。
在性能方面,這款大模型的速度超越穀歌旗下Claude Sonnet 4.5近一倍,而價格僅為其8%。

“讓每個人都用得起AI,這是我們對AI發展的判斷。我們認為AGI一定會實現,並且一定會服務大眾、普惠大眾。”在過去不久的世界人工智慧大會(WAIC)上,MiniMax創始人閆俊傑曾表示,在他看來,中國AI企業正以“高智能、低成本”的新組合,向全球AI格局發起正面衝擊。
性能對標國際,成本大幅降低
此次全新發佈的M2大模型,進一步降低了大模型的使用成本:其綜合成本API(介面)價格定在每百萬Token輸入0.3美元/2.1元人民幣,以及輸出1.2美元/8.4元,同時線上上提供TPS(每秒輸出Token數)在100左右的推理服務(還在快速提升)。
這也意味著,其綜合成本不到OpenAI旗下旗艦大模型GPT-5 (high) 的六分之一,並且不到 Claude 4.5 Sonnet的十分之一(大概為8%)。
在性能方面,MiniMax在代碼(Coding)、代理(Agentic)、深度搜索(Deep Search)等多方面進行優化,通過高效的啟動參數設計,實現智能、速度與成本的最佳平衡,在全球核心權威榜單上,得分超過穀歌的 Gemini 2.5 Pro、Anthropic 的 Claude 4.1 等最新的 SOTA 模型。過去國產模型多在文本生成上競爭,現在 MiniMax 能在“複雜資訊檢索與推理”中與 GPT-5、Claude 這類 SOTA 模型並列,說明強化學習(RL)與推理優化的策略,正在奏效。
這標誌著,中國開源模型首次在國際通用智能評測體系中達到“第一梯隊”水準,真正進入“可與全球頂尖模型競爭”的階段。
海外科技巨頭點贊
中國大模型的日新月異,也深受海外好評。
矽谷科技巨頭Meta曾在論文中提到,MiniMax的研究是近期強化學習(RL)突破的代表之一,他們在超過40萬小時的實驗中,採用MiniMax提出的CISPO損失函數和FP32 Head技術。
這兩項技術也是MiniMax在強化學習(RL)階段中提出的關鍵創新點,目標是讓模型在“大規模訓練”中更穩、更准、更具泛化能力,在同等算力下能“跑得更穩、學得更深、用得更順”。
知名科技評測平臺LMarena第一時間在社交媒體上向開發者推薦M2模型測試; Reddit社區技術大V在基準測試中運行了MiniMax M2,“它獲得了58.3%的分數,這算是相當不錯的表現”。

CoreViewHQ聯合創始人兼CTO Ivan Fioravant 表示,“MiniMax-M2 的表現相當出色!甚至比 Claude 4.1 Opus 還要好,即使在實際使用中也令人印象深刻”。更有海外個人開發者接入API進行了廣泛測試,並在技術社區分享真實案例。

OpenRouter 作為全球最具影響力的 AI 模型聚合與調用平臺之一,其數據源於真實開發者的使用行為,極具代表性和權威性。M2在其平臺上線不到兩天,模型調用量已躋身全球前十。
MiniMax方面向記者表示,M2專為編碼與智能體任務深度優化,具備強大的端到端開發與執行能力,可實現多代碼檔的自動調試與修復。這款僅有10B啟動參數(總參230B)的羽量級模型,在保持卓越性能的同時,實現了更低的延遲與成本,以及更高的吞吐效率,完美契合了新興多智能體工作流對高效協同與快速回應的需求。
憑藉其在代碼生成、工具調用和深度搜索方面的卓越能力,M2有望在國內金融、工業、醫療、教育、文化等眾多行業的智能化轉型中扮演關鍵角色 。
據MiniMax披露,M2發佈後兩周內開放全球API介面免費調用,此外將上線國內版MiniMax Agent,擁有“高效”與“專業”雙模式——前者適配羽量級對話、基礎編碼等場景,後者則針對全棧開發、專業PPT製作等複雜需求優化,實現不同場景下的高效化,同樣,MiniMax Agent在網頁端與app限時免費,將普惠進行到底。
中國開源大模型實力已經引起全球震動,據外媒報導,中國企業正在研發的人工智慧模型不僅智能化水準提升,使用成本也持續降低。在業內人士看來,中國在開源大模型上的突出表現,將進一步提升中國在AI產業的話語權——引導全球更多開發者跟隨使用,也有利於AI整體生態的開放和完善,未來,中國在開源大模型上的競爭力無疑將繼續加強,也將引導更加激烈的行業競爭。
來源:中國澎湃新聞