DeepSeek新模型降價：優化推理效率，API價格降超50%

ZH-CN

English

没有结果

查看所有结果

没有结果

查看所有结果

您當前的位置：科技 > 文章内容返回

DeepSeek新模型降價：優化推理效率，API價格降超50%

发布：2025-09-30

DeepSeek發佈新版本模型，調用API成本降低超50%。

9月29日，DeepSeek正式發佈DeepSeek-V3.2-Exp模型，這是一個實驗性（Experimental）的版本。

值得注意的是，此前有不少科技博主發現，DeepSeek-V3.2新模型已上傳至其HuggingFace官方頁面，隨後被刪除，此後DeepSeek正式公告新版本的推出。

據DeepSeek介紹，作為邁向新一代架構的中間步驟，V3.2-Exp在V3.1-Terminus的基礎上引入DeepSeek Sparse Attention（一種稀疏注意力機制），針對長文本的訓練和推理效率進行探索性優化和驗證。目前，官方App、網頁端、小程式均已同步更新為DeepSeek-V3.2-Exp，同時API大幅度降價。

據瞭解，DeepSeek Sparse Attention（DSA）首次實現細粒度稀疏注意力機制，在幾乎不影響模型輸出效果的前提下，實現長文本訓練和推理效率的大幅提升。為嚴謹評估引入稀疏注意力帶來的影響，把DeepSeek-V3.2-Exp的訓練設置與V3.1-Terminus進行嚴格的對齊。在各領域的公開評測集上，DeepSeek-V3.2-Exp的表現與V3.1-Terminus基本持平。

在新模型的研究過程中，需要設計和實現很多新的GPU算子，使用高級語言TileLang進行快速原型開發，以支持更深入的探索。在最後階段，以TileLang作為精度基線，逐步使用底層語言實現更高效的版本。此次開源的主要算子包含TileLang與 CUDA兩種版本。

DeepSeek表示，得益於新模型服務成本的大幅降低，官方API價格也相應下調，開發者調用DeepSeek API的成本將降低50%以上。從價格來看，輸入緩存命中從0.5元降至0.2元/百萬tokens，緩存未命中從4元降至2元/百萬tokens，輸出由12元降至3元/百萬tokens。