9月11日上午,2025 Inclusion·外灘大會在上海黃浦世博園區開幕。2024年圖靈獎得主、“強化學習之父”理查德·薩頓(Richard Sutton)在主旨演講中展望人工智慧的未來時提出了四條現實的“預測原則”:第一,對世界應該如何運轉並沒有共識,但沒有哪一種看法能夠淩駕於其他;第二,人類將真正理解智能,並借助技術將其創造出來;第三,當今人類的智力水準,很快將會被超級人工智慧,或者超級智能增強的人類遠遠超越;第四條,權力和資源會流向最聰明的智能體。
基於此,他認為,在人類的發展進程中,人工智慧的替代將是不可避免的。
薩頓認為,人類數據紅利正逼近極限,人工智慧正在進入以持續學習為核心的“經驗時代”,潛力將遠超以往。
薩頓在演講中表示,今天大多數機器學習的目標,是把人類已有的知識轉移到靜態、缺乏自主學習能力的 AI 上。“我們逐漸達到人類數據的極限,現有的方法不能生成新的知識,不適合持續學習,而持續學習對智能的效用至關重要。”他認為,我們正進入“經驗時代”,需要一種新的數據源,由智能體與世界直接交互中生成。這正是人類和其他動物的學習方式,是AlphaGo自我博弈下的“第37手”,也是近期AlphaProof在國際數學奧林匹克斬獲銀牌的路徑。
薩頓解釋,“經驗”指的是觀察、行動和獎勵,這三種信號在智能體與世界之間來回傳遞。“知識來自於經驗,可以從經驗中學習。一個智能體的智能程度,取決於它能預測並控制自身輸入信號的程度。經驗是一切智能的核心與基礎。”他同時指出,強化學習帶領我們進入了新的經驗時代,但要釋放全部潛力,還需要兩專案前尚不成熟的技術——持續學習(continual learning)和元學習(meta-learning)技術。
薩頓指出,總而言之,在人工智慧未來的科學趨勢上,未來如果能創造出超級智能體和由超級智能增強的人類,將為世界帶來純粹的福祉。完全智能的智能體必須從經驗中學習,這超出了大型語言模型的範疇,令人驚歎且實用,將作為世界知識的可定制介面。我們已經使用強化學習進入了新的經驗時代,但要釋放經驗的全部潛力,還需要我們現在還不具備的持續學習和元學習技術。
面對外界對AI帶來偏見、失業甚至人類滅絕的擔憂,薩頓認為,這種對人工智慧的恐懼被誇大了,並且是被某些從中獲利的組織和個人煽動起來的。他以經濟社會的運行為例,只有當每個人有不同的目標和能力,經濟才能運行得最好。同樣,目標不同的智能體,可以通過去中心化的協作實現雙贏。
9月10日-13日,2025 Inclusion·外灘大會在上海舉行,大會以“重塑創新增長”為主題,共設1場開幕主論壇、40多場開放見解論壇、2場全球主題日系列論壇、10多場創新者舞臺、10000平米科技展覽、5000平科技集市、科技智能創新大賽和1場科技人才招聘會,此外還有創投Meetup等特色環節,為參會者提供深度交流與合作的機會。
來源:中國澎湃新聞