zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 公司 > 文章内容 返回
Anthropic發佈首款混合推理模型:擅長解決實際問題,得分遠超OpenAI
发布:2025-02-25

被視為OpenAI競爭對手的美國AI(人工智慧)初創公司Anthropic宣佈推出“迄今為止最智能的首款混合推理模型”。

當地時間2月24日,由美國科技巨頭亞馬遜投資支持的Anthropic宣佈推出新模型Claude 3.7 Sonnet,並將其稱為“市面上首款混合推理模型”。根據用戶的選擇,Claude 3.7 Sonnet既可以快速地給出回應,也可以向用戶提供擴展後的分步思考。用戶可以免費使用Claude 3.7 Sonnet,但擴展思考模式僅向付費用戶開放。同時,公司還推出了代理編碼工具Claude Code。

據官方介紹,Claude 3.7 Sonnet 在編碼和前端Web開發方面表現出了“特別顯著的改進”,在升級後,Claude模型的價格與前代產品相同,每百萬輸入token(文本中的最小單位)定價3美元,每百萬輸出token定價15美元。而OpenAI的o1模型定價分別為每百萬輸入token花費15美元和每百萬輸出token花費60美元。

Anthropic方面強調,團隊開發新模型的理念不同於市場上的其他推理模型:“正如人類使用單個大腦進行快速反應和深度思考一樣,我們認為推理應該體現前沿模型的綜合能力,而不是完全獨立的模型。這種統一的方法也為用戶創造了更加無縫的體驗。”

因此,公司將新模型定義為“市面上首款混合推理模型”。在標準模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升級版;而在擴展思維模式下,模型會在回答前進行自我反思,從而提高其在數學、物理和編碼等任務上的表現。

此外,當用戶通過API(應用程式編程介面)使用Claude 3.7 Sonnet時,用戶可以通過命令Claude思考不超過多少token來控制“思考預算”,該數值需要小於模型輸出限制的12.8萬個token,以便於用戶在速度、成本和答案品質之間進行權衡。

Anthropic方面還指出,新模型最大的優勢是“更擅長現實世界中的任務”,而不是針對“數學和電腦科學競賽問題進行優化”。在評估AI模型解決實際軟體問題的能力的編碼測試SWE-Bench Verified中,Claude 3.7 Sonnet的得分從Claude 3.5 Sonnet的49.0%提升至62.3%,在經過特定框架調整後最高得分可至70.3%。OpenAI o3-mini和DeepSeek R1在該項測試上的得分分別為49.3%和49.2%。

在指令遵循、一般推理、多模態能力和代理編碼方面,Claude 3.7 Sonnet都取得了出色的表現,擴展思維模式則在數學和科學方面展現出了顯著提升。Anthropic表示,除了傳統的基準測試之外,Claude 3.7 Sonnet甚至還在《精靈寶可夢:紅》的遊戲測試中超越了Claude系列過去的所有模型。

Claude 3.7 Sonnet(開啟或關閉擴展思維模式)在各大基準測試中的得分。來源:Anthropic

同時,Anthropic宣佈推出旗下第一款代理編碼工具Claude Code,可以搜索和讀取代碼、編輯檔、編寫和運行測試、提交和推送代碼到GitHub,以及使用命令行工具。據介紹,在早期測試中,Claude Code一次性完成了通常需要45分鐘以上手動操作才能完成的任務。目前,該工具已開放預覽版,將在未來幾周內不斷改進。

另據外媒報導,24日當天,Anthropic即將完成一輪35億美元的融資,公司估值將達到615億美元。公司本輪融資的最初目標為20億美元,但在談判期間成功說服投資者增加投資。本輪融資的參與者包括Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners,總部位於阿布扎比的投資公司MGX正在洽談參與事宜。

不過,Anthropic依然面對較大的競爭壓力。據知情人士透露,Anthropic的年化收入(根據近期銷售額推斷未來12個月的收入)在近期達到約12億美元,公司仍在虧損,將利用最新融資的現金支持訓練更強大的AI模型。亞馬遜已向Anthropic累計投資80億美元,而穀歌母公司Alphabet已向其投資20億美元。

此前,1月20日,中國AI初創公司深度求索(DeepSeek)推出開源推理模型DeepSeek-R1,憑藉其性能表現引發全球AI界轟動,各家AI大模型企業也紛紛宣佈推出自己的推理模型。例如,OpenAI發佈推理模型o3-mini,穀歌也在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking實驗版。

此外,2月25日,阿裏通義Qwen發佈基於旗艦模型Qwen2.5-Max構建的推理模型QwQ-Max-Preview預覽版,會和DeepSeek以及Kimi的推理模型一樣展現思考過程,目前用戶可在通義千問網頁版進行體驗。通義千問團隊表示,QWQ-Max的官方版本將在近日發佈,會同步發佈安卓和iOS版應用程式,以及規模更小的可在本地設備部署的模型。

來源:中國澎湃新聞

上一篇:馬來西亞證實重啟搜尋馬航370航班殘骸
下一篇:中國自主研製,全球最大功率甲醇雙燃料船用發動機正式發佈
相關推荐
  • 珠江啤酒前三季度淨利增長17%,單季營收兩年來首次下滑
    链接阅读
  • 安世中國:荷蘭總部相關決定在中國境內不具備法律效力,安世中國業務運營一切正常
    链接阅读
  • 凱格精機逾3200萬元募資違規發工資被監管追責,董事長等四名高管領罰
    链接阅读
  • 華大智造前三季度同比減虧74%,“國產替代”何時能換來業績?
    链接阅读
  • 物美集團:調改門店日均銷售額實現倍增,看好硬折扣模式發展
    链接阅读
  • Meta人工智慧部門裁員約600人,精簡架構應對競爭
    链接阅读
  • 半導體巨頭要上市!存儲一哥估值上看3千億人民幣 或刷新IPO紀錄
    链接阅读
  • TCL華星全球首條8.6代印刷OLED顯示面板生產線開工,總投資295億元
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

東盟峰會將接待特朗普,中美尋求避免貿易戰升級

2025-10-24

日本高市早苗面臨特朗普訪日帶來的國防抱負早期考驗

特朗普將赴韓國會晤習近平 作為亞洲之行環節

日本新執政聯盟計畫大規模支出,但不支持安倍經濟學2.0

2025-10-23

同花順前三季度淨利增85%,員工持股平臺已減持69萬股至少套現2.49億元

日本新首相將以皮卡車和大豆爭取特朗普支持

2025-10-22

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.