zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
AI成為數學家得力助手還要多久
发布:2025-06-17

從電腦科學到醫學再到國家安全,數學是眾多關鍵應用的基石,但數學領域的進步可能需要數年時間才能實現。
  
幾百年來,數學家使用的工具依然簡樸:一張紙、一支筆。他們憑藉邏輯與靈感,在符號的迷宮中尋找通往真理的路徑。
  
為了打破這一局面,美國國防高級研究計畫局今年4月啟動了“指數性數學”計畫,旨在開發一種能極大提升數學研究效率的人工智慧(AI)“合著者”系統。
  
幾十年來,數學家借助電腦進行輔助計算或驗證命題,如今的AI或許能更上層樓,挑戰那些人類長年未解的難題。不過,從能解高中題的AI,到能協助攻克前沿數學難關的AI,中間仍隔著一道鴻溝。

解決重大難題仍力不從心
  
大型語言模型(LLM)並不擅長數學。它們常常出現“幻覺”,甚至可能被誤導相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現出的進步令數學家眼前一亮。
  
今年,這些模型在美國數學邀請賽中的表現接近優秀高中生水準。不同於過去“一錘定音”式的輸出,這些模型開始嘗試模擬數學家逐步推理的思考過程。
  
同時,一些將LLM與某種事實核查系統相結合的新型混合模型也取得了突破。例如,穀歌“深度思維”的AlphaProof系統將語言模型與棋類AI——AlphaZero結合,成為首個取得與國際數學奧林匹克競賽銀牌得主成績相當的系統。今年5月,穀歌的AlphaEvolve模型更進一步,在多個長期未解的數學與計算難題上找到優於人類現有方案的解法。
  
美國《麻省理工科技評論》指出,儘管這些AI成績亮眼,但專家們普遍認為,它們仍不具備真正的協助科研的能力。競賽題雖難,卻更像是智力遊戲,有一定“套路”。真正的數學研究則更開放、更複雜。面對“P vs NP”“黎曼猜想”等重大難題時,AI仍力不從心。
  
為了更準確地評估AI的能力,初創公司Epoch AI去年推出了FrontierMath測試,聯合60多位數學家設計出全新高難度題目,避開模型已見過的訓練數據,結果LLM幾乎集體“交白卷”。
  
這些測試表明,AI在數學道路上雖已邁步,但離“合著者”角色仍有很長一段路要走。
  
需攻克“超長推理鏈”
  
仔細觀察數學問題會發現,它們在某些方面類似:解決問題需完成一系列連續步驟,關鍵在於找到這些步驟。
  
美國加州理工學院謝爾蓋·古科夫指出,困難的差異往往體現在路徑的長度上。高中數學可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長達百萬步。
  
這類“超長路徑”極難處理。就像下圍棋時尋找一條制勝序列,AI必須在指數級增長的可能路徑中找到正確解法。而在數學中,這個複雜度要遠超棋類遊戲。
  
據物理學家組織網今年2月報道,為應對這一挑戰,古科夫團隊開發了一種方法,將多個步驟打包成“超級步驟”,相當於穿上“巨人靴”跨越大段路程。他們設計了一個系統,其中強化學習模型負責提出超級步驟,另一個模型負責驗證其合理性。
  
該策略在經典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學家推翻了一個40年來被廣泛引用的“反例”。這曾被視為證明該猜想錯誤的關鍵依據。
  
牛津大學數學家馬丁·布裏森對此表示肯定:“排除錯誤路徑,是科研中非常有價值的一步。”
  
古科夫相信,這種“壓縮路徑”的思路適用於所有需要推理鏈條的領域。他希望,這種方法不僅能推動AI跳出固有模式,也為數學研究帶來新突破。
  
真正的創新和突破仍屬人類
  
跳出思維定式,正是數學家攻克難題的關鍵。數學常被看作機械推理,而高等數學則更像是一場實驗,充滿一波三折的試錯與靈光乍現的頓悟。
  
這正是AlphaEvolve等AI工具的優勢所在。它通過LLM不斷生成並改進解題代碼,配合第二個模型評估每一輪結果,最終提出比人類更優的解法。這種方法不僅能獨立探索,也支持人類隨時介入,提供靈感和指令。
  
澳大利亞悉尼大學數學家喬迪·威廉姆森強調,探索性思維是數學的核心。據英國《新科學家》網站報導,他與Meta合作開發了PatternBoost AI系統,可根據一個數學想法生成相似概念,幫助激發靈感。他說:“這就像是這裏有一堆有趣的東西,我不知道是怎麼回事,但你能再生成一些類似的東西嗎?”
  
這種頭腦風暴在數學中至關重要,它是新想法產生的源泉。以二十面體為例——古希臘人通過純粹推理發現了它,其形狀並不存在於自然界中,卻深刻影響了數學的發展。威廉姆森希望,AI未來也能協助發現類似的“新數學對象”。
  
不過,目前AI仍缺乏真正的創造力。讓AI贏棋是一回事,讓它發明圍棋遊戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺的“偵察兵”,幫助人們發現路徑、避開死路,但專家普遍認為,真正的創新與突破,仍然屬於人類。

來源:科技日報

上一篇:文化中國行|數位化賦能 讓千年瑰寶“飛”出茫茫大漠
下一篇:國產航空明星產品齊聚巴黎航展
相關推荐
  • 科研人員首次觀測到新核素鋁-20
    链接阅读
  • AI能力新高度!OpenAI發佈ChatGPT智能體:能自主選擇工具完成任務
    链接阅读
  • 隨著人工智慧應用程式的發展,OpenAI 推出了 ChatGPT 代理來處理任務
    链接阅读
  • 隨著對計算能力需求的不斷增長,OpenAI 將穀歌列為雲合作夥伴
    链接阅读
  • 國內首個低空飛行器風洞啟用
    链接阅读
  • 影目CEO楊龍昇:小米入局AI眼鏡是好事,大家銷量翻了兩三倍
    链接阅读
  • 又一個“首次”!中國天眼FAST再傳好消息
    链接阅读
  • 單筆最大,阿聯酋企業10億美元採購中國“空中計程車”
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

美國明年擔任二十國集團輪值主席國時,有意對二十國集團進行“回歸基礎”的改革

2025-07-18

特朗普的關稅陰雲籠罩南非G20財長會議

特朗普削減援助後,美國援助人員數周來努力遊說以保食品庫存不被銷毀

2025-07-17

特朗普對印尼商品徵收19%關稅,歐盟準備採取報復措施

2025-07-16

中國經濟增速放緩,消費者緊縮開支,美國關稅風險加劇

2025-07-15

特朗普要求更多讓步,歐盟暫緩對美國加征關稅採取反制措施

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.