zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
DeepSeek新模型降價:優化推理效率,API價格降超50%
发布:2025-09-30

DeepSeek發佈新版本模型,調用API成本降低超50%。

9月29日,DeepSeek正式發佈DeepSeek-V3.2-Exp模型,這是一個實驗性(Experimental)的版本。

值得注意的是,此前有不少科技博主發現,DeepSeek-V3.2新模型已上傳至其HuggingFace官方頁面,隨後被刪除,此後DeepSeek正式公告新版本的推出。

據DeepSeek介紹,作為邁向新一代架構的中間步驟,V3.2-Exp在V3.1-Terminus的基礎上引入DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓練和推理效率進行探索性優化和驗證。目前,官方App、網頁端、小程式均已同步更新為DeepSeek-V3.2-Exp,同時API大幅度降價。

據瞭解,DeepSeek Sparse Attention(DSA)首次實現細粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,實現長文本訓練和推理效率的大幅提升。為嚴謹評估引入稀疏注意力帶來的影響,把DeepSeek-V3.2-Exp的訓練設置與V3.1-Terminus進行嚴格的對齊。在各領域的公開評測集上,DeepSeek-V3.2-Exp的表現與V3.1-Terminus基本持平。

在新模型的研究過程中,需要設計和實現很多新的GPU算子,使用高級語言TileLang進行快速原型開發,以支持更深入的探索。在最後階段,以TileLang作為精度基線,逐步使用底層語言實現更高效的版本。此次開源的主要算子包含TileLang與 CUDA兩種版本。

DeepSeek表示,得益於新模型服務成本的大幅降低,官方API價格也相應下調,開發者調用DeepSeek API的成本將降低50%以上。從價格來看,輸入緩存命中從0.5元降至0.2元/百萬tokens,緩存未命中從4元降至2元/百萬tokens,輸出由12元降至3元/百萬tokens。

除了DeepSeek,國內另一大模型廠商智譜的新一代旗艦模型GLM-4.6也即將發佈,目前,在Z.ai官網可以看到,GLM-4.5標識為上一代旗艦模型。

此前9月18日,梁文鋒帶著DeepSeek-R1的研究,登上最新一期國際頂級期刊《自然》(Nature)封面。

今年1月份,國產大模型公司深度求索(DeepSeek)在預印本平臺arxiv公佈論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,創始人梁文鋒位於署名之列。

《自然》雜誌指出,如此總結DeepSeek-R1帶來的進步:如果訓練出的大模型能夠規劃解決問題所需的步驟,那麼它們往往能夠更好地解決問題。這種“推理”與人類處理更複雜問題的方式類似,但這對人工智慧有極大挑戰,需要人工干預來添加標籤和注釋。

DeepSeek的研究人員揭示了他們如何能夠在極少的人工輸入下訓練一個模型,並使其進行推理。DeepSeek-R1模型採用強化學習進行訓練。在這種學習中,模型正確解答數學問題時會獲得高分獎勵,答錯則會受到懲罰。

來源:中國澎湃新聞

上一篇:溢價25%!三家投資機構擬550億美元私有化美國遊戲巨頭EA
下一篇:中國渤海灣盆地勘探取得重大突破,成功鑽獲高產油氣井
相關推荐
  • 特斯拉2025年底推出第三代人形機器人 2026年開始量產
    链接阅读
  • 極米科技向港交所提交上市申請書,上半年淨利潤暴增2062%
    链接阅读
  • AI眼鏡元年:下一個智能終端,變得比手機更貼身
    链接阅读
  • 高德發佈鷹眼守護預警系統,實測重大異常事件預警準確率達90%
    链接阅读
  • 全球容量最大!中國超重力場大科學裝置核心設備正式啟動,可實現“時空壓縮”效應
    链接阅读
  • AI重構供應鏈:京東宣佈未來三年持續投入,構建萬億人工智慧生態
    链接阅读
  • 特朗普簽署命令,宣佈 TikTok 出售事宜已準備就緒,並將其估值定為 140 億美元
    链接阅读
  • 蘋果敦促歐盟監管機構更仔細審視科技規則
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

特朗普限制簽證促使美國公司考慮將更多工作轉移到印度

2025-09-30

特朗普對木材進口加征10%的關稅,對櫥櫃和傢俱加征25%的關稅

特朗普的聯合國演講引發歐洲對全球共同承諾的焦慮

2025-09-28

美國最高法院允許特朗普扣留 40 億美元對外援助

特朗普對重型卡車、藥品和傢俱加征新的美國關稅

2025-09-26

是時候收手了 特朗普誓言以色列不會吞併約旦河西岸

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.