zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 公司 > 文章内容 返回
DeepSeek,大消息
发布:2025-02-27

2月27日,DeepSeek宣佈開源Optimized Parallelism Strategies。與此同時,英偉達開源了首個在Blackwell架構上優化的DeepSeek-R1,實現了推理速度提升25倍,並且每token成本降低20倍的驚人成果。這一新模型的推出,標誌著英偉達在人工智慧領域的又一次重大進展。

開源周第三天,DeepSeek宣佈開源Optimized Parallelism Strategies(優化並行策略)。

據悉,該策略是為了提高計算效率、減少資源浪費並最大化系統性能而設計的並行計算方案。這些策略通過合理分配任務、協調資源利用和減少通信開銷,實現在多核、分佈式或異構系統中的高效並行執行。

最近,DeepSeek動作不斷。此前,該公司宣佈將DeepEP向公眾開放。在宣佈後的約20分鐘內,DeepEP已在 GitHub、微軟(MSFT.US)等平臺上獲得超過1000個 Star收藏。

據悉,DeepEP是MoE模型訓練和推理的Expert Parallelism通信基礎,可實現高效優化的全到全通信,以支持包括FP8在內的低精度計算,適用於現代高性能計算。DeepEP還針對從NVLink到RDMA的非對稱帶寬轉發場景進行了深度優化,不僅提供高吞吐量,還支持流式多處理器數量控制,從而在訓練和推理任務中實現高吞吐量性能。

稍早於2月26日,DeepSeek宣佈,即日起,北京時間每日00:30至08:30的夜間空閒時段,DeepSeek開放平臺推出錯峰優惠活動。在此期間,API調用價格大幅下調:DeepSeek-V3降至原價的50%,DeepSeek-R1降至25%。

DeepSeek稱,鼓勵用戶充分利用這一時段,享受更經濟更流暢的服務體驗。

DeepSeek推出優惠措施之時,正值其“開源周”。首個開源的代碼庫為針對Hopper GPU優化的FlashMLA,第二日是首個用於MoE模型訓練和推理的開源EP通信庫DeepEP,26日則開源了一個支持密集和MoE GEMM的FP8 GEMM 庫,為V3/R1訓練和推理提供支持。

英偉達通過在Blackwell架構上應用TensorRT DeepSeek優化,讓具有FP4生產級精度的模型,在MMLU通用智能基準測試中達到了FP8 模型性能的99.8%。目前,英偉達基於FP4優化的DeepSeek-R1檢查點已經在Hugging Face上開源,並且可以通過以下鏈接訪問模型地址:DeepSeek-R1-FP4。

在後訓練量化方面,該模型將Transformer模組內的線性算子的權重和啟動量化到了FP4,適用於TensorRT-LLM推理。這一優化使每個參數的位數從8位減少到4位,從而讓磁碟空間和GPU顯存的需求減少了約1.6倍。

來源:中國證券時報

上一篇:英偉達業績、指引均超市場預期 黃仁勳感歎Blackwell晶片需求驚人
下一篇:英偉達連續兩年將華為列入競爭對手名單:實力極強
相關推荐
  • 股價起飛!華友鈷業與LG新能源簽訂長單:5年16.4萬噸三元材料
    链接阅读
  • 愛瑪科技:全資子公司廣東車業將停產,產能轉移至廣西和重慶,剩餘資產對外出售
    链接阅读
  • 張江高科控股股東擬減持1%股份,年內股價已翻倍
    链接阅读
  • 全球最貴初創公司!OpenAI估值5000億美元,員工售出66億美元股份
    链接阅读
  • 金風科技16MW漂浮式風機成功吊裝,關鍵部件全面國產化
    链接阅读
  • 全力籌措資金保交樓,華夏幸福:7455萬元轉讓懷來人工智能產業港部分資產
    链接阅读
  • 特斯拉三季度儲能裝機量12.5GWh,第三代Megapack明年下半年開始交付
    链接阅读
  • 巴斯夫:到2030年,湛江一體化基地利潤最高達12億歐元
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

法國政府上任數小時後辭職,加劇政治危機

2025-10-06

特朗普施壓結束加沙戰爭 納坦亞胡面臨極右翼反彈

右翼高市早苗有望成為日本首位女首相

隨著美聯儲重啟寬鬆政策,外國投資者可利用更便宜的美元對沖工具

特朗普干預後,加沙戰爭距離結束還有多遠?

2025-10-05

比特幣突破 12.5 萬美元創歷史新高

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.