zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
DeepSeek V3.1再更新:緩解中英文混雜,智能體輸出更穩定
发布:2025-09-23

DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。

9月22日晚間,據DeepSeek介紹,此次更新在保持模型原有能力的基礎上,針對用戶回饋的問題進行了改進,包括:語言一致性:緩解中英文混雜、偶發異常字元等情況。在Agent(智能體)能力方面,進一步優化Code Agent與Search Agent的表現,DeepSeek-V3.1-Terminus的輸出效果相比前一版本更加穩定。

目前,官方App、網頁端、小程式與DeepSeek API模型均已同步更新為DeepSeek-V3.1-Terminus。不過,記者看到這款大模型名為Terminus,意思是“終極版”,或許這也是V3.1最後一次更新。外界觀望下一次大版本更新到底是V4還是R2的到來。

在公開的基準測試成績中,V3.1-Terminus整體較V3.1有所提升,不過其中部分分數也有下滑,不過在“人類最後考試”(Humanity’s Last Exam)基準上進步較為突出,分數從 15.9大幅提升至21.7,根據官網數據,這一成績僅次於 Grok 4(25.4)和GPT-5(25.3),並略微超越 Gemini 2.5 Pro(21.6)。

值得注意的是,DeepSeek在中英文混雜方面的改進尤為受到歡迎。澎湃新聞記者在社交媒體上看到,不少用戶點贊:“中英文混雜問題在思考時間很長的時候確實會出現,遇到過幾次,還在想這是什麼問題,這下子正好給解決了。”

資深AI投資人郭濤向記者分析稱,本次DeepSeek-V3.1-Terminus版本更新聚焦工程化落地與場景適配,核心突破體現在兩大核心競爭提升:一方面,通過語義層降噪技術顯著改善語言一致性,有效抑制中英文混雜、異常字元等干擾,提升文本生成純淨度;另一方面,深度重構Agent執行框架,針對Code Agent的語法解析精度、Search Agent的資訊檢索召回率進行專項優化,使智能體輸出穩定性提升。

此次全管道(App/網頁/小程式/API)同步升級,展現國產大模型從演算法創新向工程可靠性演進的關鍵跨越,標誌著國產模型在複雜任務處理、多模態協同等工業化應用層面邁出重要一步,為後續垂直領域深度賦能奠定更堅實基礎。

作為國產大模型的風向標,DeepSeek的動態都廣泛被外界關注。

此前9月18日,梁文鋒帶著DeepSeek-R1的研究,登上最新一期國際頂級期刊《自然》(Nature)封面。

今年1月份,國產大模型公司深度求索(DeepSeek)在預印本平臺arxiv公佈論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,創始人梁文鋒位於署名之列。

《自然》雜誌指出,如此總結DeepSeek-R1帶來的進步:如果訓練出的大模型能夠規劃解決問題所需的步驟,那麼它們往往能夠更好地解決問題。這種“推理”與人類處理更複雜問題的方式類似,但這對人工智慧有極大挑戰,需要人工干預來添加標籤和注釋。

DeepSeek的研究人員揭示了他們如何能夠在極少的人工輸入下訓練一個模型,並使其進行推理。DeepSeek-R1模型採用強化學習進行訓練。在這種學習中,模型正確解答數學問題時會獲得高分獎勵,答錯則會受到懲罰。

DeepSeek團隊也首次對外回應“蒸餾”相關質疑。論文中表示,對於深度求索V3基礎版(DeepSeek-V3-Base)的訓練數據僅使用普通網頁和電子書,未納入任何合成數據,“不過,我們注意到部分網頁包含大量由OpenAI模型生成的答案,這可能會讓基礎模型間接地從其他強大模型獲取知識。但在預訓練冷卻階段,我們並未刻意加入由OpenAI生成的合成數據;該階段使用的所有數據都是通過網路爬取自然獲取的。預訓練數據集包含大量與數學和代碼相關的內容,這表明深度求索V3基礎版接觸到大量的推理軌跡數據。”

今年1月20日,中國AI初創公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行業,作為一款開源模型,R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAIo1模型正式版,並採用MIT許可協議,支持免費商用、任意修改和衍生開發等。春節假期後,國內多個行業龍頭公司均宣佈接入DeepSeek。

伴隨AI大模型行業的日新月異,DeepSeek已經更新出R1以外的新版本,但萬眾期待的R2尚未面世。此前8月21日DeepSeek正式發佈DeepSeek-V3.1,稱其為“邁向Agent(智能體)時代的第一步”。

來源:中國澎湃新聞

上一篇:多家房企境內債務重組,遠洋集團重組方案投票延期至9月30日
下一篇:安踏體育耗資1.99億港元回購212萬股,早盤股價再回落
相關推荐
  • Allwyn 以 16 億美元收購夢幻體育運營商 PrizePicks 的股份,以擴大在美國的業務
    链接阅读
  • 穀歌力求在反壟斷案開庭之際避免廣告技術業務被拆分
    链接阅读
  • 位元組跳動推出豆包翻譯大模型:支持28種語言互譯,性能比肩GPT-4o
    链接阅读
  • Gemini AI助手已正式登陸Google TV智能電視平臺
    链接阅读
  • 蘋果宣佈將為Vision Pro推出七部全新沉浸式視頻
    链接阅读
  • 上海發佈人形機器人數據集標準,人形機器人有了統一數據語言
    链接阅读
  • 人工智慧與量子科技的雙向奔赴,量子智能有望開闢技術變革新路徑
    链接阅读
  • 從未來食品到綠色化工,實現“生物製造”離不開技術與生態
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

聯合國:各國領導人支持巴勒斯坦建國,挑戰美以立場

2025-09-23

多家房企境內債務重組,遠洋集團重組方案投票延期至9月30日

四大西方國家承認巴勒斯坦國,引發以色列強烈抗議

2025-09-22

特朗普政府擬對H-1B簽證徵收每年10萬美元費用,科技行業受重創

中國華為大肆宣傳晶片和計算能力計畫,向英偉達發起新挑戰

2025-09-18

世界貿易組織報告稱人工智慧將重塑全球貿易格局

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.