“強化學習之父”薩頓：人工智慧正在進入以持續學習為核心的“經驗時代”

ZH-CN

English

没有结果

查看所有结果

没有结果

查看所有结果

您當前的位置：深度· 言論 > 文章内容返回

“強化學習之父”薩頓：人工智慧正在進入以持續學習為核心的“經驗時代”

发布：2025-09-11

9月11日上午，2025 Inclusion·外灘大會在上海黃浦世博園區開幕。2024年圖靈獎得主、“強化學習之父”理查德·薩頓（Richard Sutton）在主旨演講中展望人工智慧的未來時提出了四條現實的“預測原則”：第一，對世界應該如何運轉並沒有共識，但沒有哪一種看法能夠淩駕於其他；第二，人類將真正理解智能，並借助技術將其創造出來；第三，當今人類的智力水準，很快將會被超級人工智慧，或者超級智能增強的人類遠遠超越；第四條，權力和資源會流向最聰明的智能體。

基於此，他認為，在人類的發展進程中，人工智慧的替代將是不可避免的。

薩頓認為，人類數據紅利正逼近極限，人工智慧正在進入以持續學習為核心的“經驗時代”，潛力將遠超以往。

薩頓在演講中表示，今天大多數機器學習的目標，是把人類已有的知識轉移到靜態、缺乏自主學習能力的 AI 上。“我們逐漸達到人類數據的極限，現有的方法不能生成新的知識，不適合持續學習，而持續學習對智能的效用至關重要。”他認為，我們正進入“經驗時代”，需要一種新的數據源，由智能體與世界直接交互中生成。這正是人類和其他動物的學習方式，是AlphaGo自我博弈下的“第37手”，也是近期AlphaProof在國際數學奧林匹克斬獲銀牌的路徑。

薩頓解釋，“經驗”指的是觀察、行動和獎勵，這三種信號在智能體與世界之間來回傳遞。“知識來自於經驗，可以從經驗中學習。一個智能體的智能程度，取決於它能預測並控制自身輸入信號的程度。經驗是一切智能的核心與基礎。”他同時指出，強化學習帶領我們進入了新的經驗時代，但要釋放全部潛力，還需要兩專案前尚不成熟的技術——持續學習（continual learning）和元學習（meta-learning）技術。

薩頓指出，總而言之，在人工智慧未來的科學趨勢上，未來如果能創造出超級智能體和由超級智能增強的人類，將為世界帶來純粹的福祉。完全智能的智能體必須從經驗中學習，這超出了大型語言模型的範疇，令人驚歎且實用，將作為世界知識的可定制介面。我們已經使用強化學習進入了新的經驗時代，但要釋放經驗的全部潛力，還需要我們現在還不具備的持續學習和元學習技術。

面對外界對AI帶來偏見、失業甚至人類滅絕的擔憂，薩頓認為，這種對人工智慧的恐懼被誇大了，並且是被某些從中獲利的組織和個人煽動起來的。他以經濟社會的運行為例，只有當每個人有不同的目標和能力，經濟才能運行得最好。同樣，目標不同的智能體，可以通過去中心化的協作實現雙贏。

9月10日-13日，2025 Inclusion·外灘大會在上海舉行，大會以“重塑創新增長”為主題，共設1場開幕主論壇、40多場開放見解論壇、2場全球主題日系列論壇、10多場創新者舞臺、10000平米科技展覽、5000平科技集市、科技智能創新大賽和1場科技人才招聘會，此外還有創投Meetup等特色環節，為參會者提供深度交流與合作的機會。

來源：中國澎湃新聞

上一篇：波蘭最大能源公司 PGE 因資產減值第二季度轉為淨虧損

下一篇：澳大利亞將斥資 11 億澳元採購安杜裏爾公司的水下無人機艦隊