zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
摩爾線程發佈Torch-MUSA v2.7.0,增強AI模型訓練與推理支持
发布:2025-11-29

11 月 28 日消息,近日,摩爾線程正式發佈 PyTorch 深度學習框架的 MUSA 擴展庫 ——Torch-MUSA v2.7.0,新版本在功能集成、性能優化與硬體支持方面實現進一步突破。Torch-MUSA 在短短一個月內,連續完成 v2.5.0 和 v2.7.0 兩次版本更新。

據介紹,自 v2.5.0 起,Torch-MUSA 版本號已與 PyTorch 主版本號保持同步,便於開發者進行版本識別與管理。新版本進一步集成 muSolver 與 muFFT 等計算加速庫,顯著提升複雜計算任務的執行效率;同時新增對統一記憶體設備(Unified Memory)的 UMM 支持,有效優化記憶體使用效率。

此外,新版本繼續保持與最新 MUSA SDK 的相容性,支持使用 MUSA SDK 4.2.0 至 4.3.0 及更高版本進行編譯。目前 Torch-MUSA 專屬支持的算子總數已超過 1050 個,系統在性能與穩定性方面均實現進一步提升。

v2.7.0 版本主要更新內容:

新增特性

新增 muFFT 與 muSolver 庫集成,大幅擴展計算能力;

在面向邊緣計算的 SoC 設備中支持統一記憶體管理,基於 Arm 架構的 UMA(統一記憶體尋址)設計,實現 GPU 與 CPU 共用同一物理記憶體空間,顯著降低模型運行過程中的記憶體開銷,具體包括:消除 GPU 端重複記憶體分配;減少主機與設備間的記憶體拷貝;GPU 可直接訪問由 CPU 分配器申請的記憶體空間。

算子擴展與性能優化

新增支持包括 ilshift、irshift、replication_pad1d_bwd、angle、ctcLossTensor、ctcLossTensorBwd、logit、amin / amax / prod.dim_int、glu_bwd 等多個算子;

新增基礎 Sparse (CSR) 操作支持;

擴充量化算子支持範圍;

修復 torch.norm 形狀錯誤問題;

支持 reduce_sum 的 uint8 輸入與 int64 輸出;

C++ 擴展新增支持 tensor.is_musa 方法;

修復空輸入下 argmax/argmin 的異常行為;

優化 var / std、pad、convolution3d、layer_norm 等操作的執行效率。

系統功能增強

開放 torch.musa.mccl.version 介面;

支持 getCurrentMUSABlasHandle 與 getCurrentMUSABlasLtHandle;

優化 FSDP2 流水線並行策略,降低訓練記憶體佔用。

記者從官方獲悉,Torch-MUSA 將繼續跟進 PyTorch 的版本更新,計畫下一版本支持 PyTorch 2.9.0,並進一步優化性能與功能。

Torch-MUSA 開源地址:https://github.com/MooreThreads/torch_musa

來源:中國IT之家

上一篇:AI算力太“渴”,水資源危機讓馬來西亞叫停低能效數據中心
下一篇:歐空局史上最大撥款:221億歐元預算鋪平登月路,德、法、意鎖定宇航員席位
相關推荐
  • 臺積電展望定制版HBM4E記憶體:N3P制程基礎裸片集成記憶體控制器
    链接阅读
  • 中國科學家在量子體系中首次實現並探測高階非平衡拓撲相
    链接阅读
  • 中國要佈局太空數據中心:距地700km!不費電、無需散熱
    链接阅读
  • DeepSeek推出DeepSeekMath-V2模型,主打自驗證數學推理能力
    链接阅读
  • 阿裏千問成新加坡國家AI專案技術底座:預訓練階段即涵蓋119語言
    链接阅读
  • 網易雲音樂測試“AI寫歌”:可一鍵把靈感寫成歌
    链接阅读
  • 全球首個!中國自研氣溶膠-氣象耦合預報AI模型試運行
    链接阅读
  • 國產高端光刻機關鍵突破!芯上微裝首臺350nm步進光刻機正式發運 
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

國民警衛隊成員遇襲身亡 美國首都伏擊事件成政治焦點

2025-11-28

法國總統馬克龍宣佈啟動自願兵役制應對“加速升級的威脅”

英國財政大臣裏夫斯將稅收負擔推至戰後新高以穩固財政

2025-11-27

中國首次執行天宮空間站應急任務

2025-11-25

中日間計畫航班的取消量較上月同期增長56%

COP30協議暴露氣候團結脆弱性 美國退縮之際

2025-11-24

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.