SEMGO
Eng
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 宏觀
    • 公司
    • 產經
    • 金融
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 宏觀
    • 公司
    • 產經
    • 金融
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 產經 > 文章内容 返回
穀歌推出兩大數學模型,19秒解開IMO2024幾何問題
发布:2024-07-26
  • 六道題每題可得7分,總分最高42分。穀歌DeepMind的人工智慧系統在今年國際數學奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達到了這一門檻。
  • DeepMind表示,儘管基於自然語言的方法可以訪問更多數據,但會產生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優勢,即涉及數學推理的證明可以被形式化地驗證其正確性。

DeepMind人工智慧系統在IMO 2024上相對於人類競爭者的表現。在42分的總分中,人工智慧系統獲得了28分。

穀歌DeepMind的AI模型解決了今年國際數學奧林匹克競賽(IMO)六個問題中的四個問題,人工智慧首次達到了銀牌標準。

當地時間7月25日,穀歌DeepMind公佈專用於數學推理的模型AlphaProof,以及專注於幾何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解決了數學中的高級推理問題,具有先進數學推理能力的通用人工智慧或開啟科學和技術的新領域。

IMO是歷史最悠久、規模最大、最負盛名的青年數學家競賽,自1959年以來每年舉辦一次。選手要解決代數、組合學、幾何和數論方面六個異常困難的問題。菲爾茲獎是數學家的最高榮譽之一,菲爾茲獎獲得者也會代表他們的國家參加IMO。

近年來,IMO競賽被認為是機器學習領域的重大挑戰,也是衡量人工智慧系統高級數學推理能力的理想基準。

穀歌DeepMind表示,IMO的數學問題被人工翻譯成數學語言,供系統理解。在正式比賽中,學生們分兩次提交答案,每次4.5小時。而人工智慧系統在幾分鐘內解決了一個問題,花了三天時間來解決其他問題。基於強化學習的推理系統AlphaProof解決了兩個代數問題和一個數論問題並被證明答案正確,這些問題包括今年IMO比賽中只有5名選手解決的最難的問題。AlphaGeometry 2證明了幾何問題,但兩個組合問題仍未解決。

六道題每題可得7分,總分最高可達42分。DeepMind的人工智慧系統最終得分28分。DeepMind表示,今年金牌的門檻從29分開始,在正式比賽的609名選手中,有58名達到了這個門檻。

“事實上,這個程式能想出這樣一個不明顯的結構是非常令人印象深刻的,遠遠超出了我認為的最先進的水準。”IMO金牌得主和菲爾茲獎牌得主蒂莫西·高爾斯(Timothy  Gowers)表示。

在大量書面文本上訓練的人工智慧模型歷來在數學推理方面很困難,往往傾向於語言智能而非數學智能,解決數學問題需要更複雜的推理技能。AlphaProof將預先訓練好的語言模型與AlphaZero強化學習演算法結合在一起,AlphaZero此前自學了如何掌握國際象棋、將棋和圍棋。

大語言模型容易產生幻覺,或以令人信服的方式傳遞錯誤資訊。DeepMind表示,儘管基於自然語言的方法可以訪問更多數據,但會產生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優勢,即涉及數學推理的證明可以被形式化地驗證其正確性。“我們通過微調Gemini模型,在這兩個互補的領域之間建立了一座橋樑,自動將自然語言問題語句轉換為形式語句,創建了一個不同難度的龐大形式問題庫。”

當遇到一個數學問題時,AlphaProof會生成候選解決方案,然後搜索可能的證明步驟來證明或反駁它們。每一個被發現和驗證的證明都被用來強化AlphaProof的語言模型,增強其解決後續更具挑戰性問題的能力。

AlphaGeometry 2解決的幾何問題:證明∠KIL與∠XPY之和等於180°。AlphaGeometry 2提出在直線BI上構造點E,使∠AEB=90°。點E有助於為AB的中點L提供作用,創造了許多對相似三角形,如三角形ABE和三角形YBI、三角形ALE和三角形IPC,以證明結論。

AlphaGeometry 2是AlphaGeometry的一個改進版本。AlphaGeometry 2是一個神經符號混合系統,其中的語言模型基於Gemini模型,並在比前身多一個數量級的合成數據上從零開始訓練。這幫助模型解決更具挑戰性的幾何問題,包括物體運動問題和角度、比例或距離方程。在今年的比賽之前,AlphaGeometry 2可以解決過去25年中IMO歷史幾何問題的83%,而AlphaGeometry只有53%。在今年的比賽中,AlphaGeometry 2收到形式語言後19秒內解決了問題。

但穀歌研究人員也表示,人工智慧遠不能以其解決問題的能力取代人類數學家。“即使我們有最大的雄心壯志,我認為我們的目標是提供一個可以證明任何事情的系統。”穀歌DeepMind強化學習副總裁大衛·西爾弗(David Silver)表示,“但這並不是數學家工作的終點。”

西爾弗說,DeepMind的人工智慧模型更類似於強大的計算工具,有朝一日可能會幫助人類提出數學證明,但人工智慧系統缺乏的是想像力,而“數學家提出了有趣的問題”。

來源:中國澎湃新聞

上一篇:英國監管機構稱,英國司機仍在為道路燃油支付過高的價格
下一篇:六天減持5%,巴菲特要“清倉”美銀?
相關推荐
  • 寧德時代:明年6月啟動鈉電儲能系統全球市場交付
    链接阅读
  • 簽供貨協議,AI記憶體聯合設計!財報前夕美光與Anthropic達成戰略合作
    链接阅读
  • 寧德時代換電業務殺入歐洲:與章魚能源合資建設歐洲重卡換電網絡
    链接阅读
  • 印度極端高溫衝擊全球染料供給,浙江龍盛、閏土股份雙雙漲停
    链接阅读
  • 蔚來已建成近9000座充換電站 自有充電樁逼近3萬根
    链接阅读
  • 機器人情侶火爆:優必選超仿生人形機器人首發預訂單超5000臺
    链接阅读
  • 5月中國電視銷量大幅下滑 均價反而漲了500多元
    链接阅读
  • 全球光纖供應鏈告急,長飛光纖光纜大漲超24%
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

SpaceX的瘋狂征程才剛剛開始  

2026-06-25

德拉埃斯普列拉在哥倫比亞的勝選鞏固了拉丁美洲向右轉的趨勢

2026-06-23

歐洲央行研究報告顯示:迄今為止,人工智慧熱潮對美國就業和工資的影響有限

英鎊承壓,斯塔默辭職令財政前景蒙陰

2026-06-22

全球庫存充裕或可緩解厄爾尼諾現象引發的糧食供應衝擊

美伊協議重塑中東格局:伊朗獲益,對手憂心忡忡

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 宏觀
    • 公司
    • 產經
    • 金融
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論

© 2023 SEMG.