在本月初於阿塞拜疆舉行的國際大學生程式設計競賽(ICPC)世界決賽中,OpenAI、穀歌DeepMind兩家公司的人工智慧模型獲得了金牌級別的成績,順利解出人類參賽者無法完成的問題。DeepMind稱之為“朝著通用人工智慧(AGI)邁進的歷史性時刻”。
ICPC世界總決賽彙集了來自全球103個國家、近3000所大學的139支頂尖隊伍。在一共12道題目中,排名第一的是OpenAI,成功解決全部12道題目。Gemini 2.5 Deep Think模型最終解決10道題目,達到金牌水準,位列第二。
OpenAI參賽系統由多個通用模型組成,包括GPT-5和一個實驗性推理模型。其中,GPT-5解決了11題,實驗性推理模型解決了最難的第12題,並負責最終提交決策。所有模型均未針對ICPC進行專門訓練。OpenAI技術團隊在賽後表示,“我記得剛加入OpenAI時,我們最好的AI模型甚至連Codeforces的簡單問題都解決不了。看到過去兩年的進步速度,真是令人難以置信。”
穀歌方面介紹,參賽的Gemini2.5並非專門為ICPC訓練,而是用戶在Gemini應用中可直接使用的版本。模型在比賽開始10分鐘後啟動,前45分鐘便解出8題,三小時內又完成兩題。DeepMind稱,這一表現是人工智慧在“解決抽象問題能力上的飛躍”。例如,Gemini在不到半小時內解出了“問題C”——一項關於管道網絡向儲液器分配液體的複雜優化問題,而這一題目無人類隊伍成功解答。
“對我來說,這是一個相當於國際象棋的‘深藍’和圍棋的AlphaGo的時刻。”DeepMind副總裁Quoc Le進一步解釋說,“更重要的是,它更接近現實世界,而不僅僅是像國際象棋和圍棋這樣受限的環境。正因如此,我認為這一進步有可能改變許多科學和工程學科,”比如設計新藥或晶片。
穀歌表示,Gemini 2.5 Deep Think是一款經過專門訓練的通用人工智慧模型,可以解決非常困難的編碼、數學和推理問題,其表現“與世界前20名的程式員一樣好”。在這些競賽中解決複雜的任務需要深度抽象推理、創造力、綜合新解決方案的能力,以及真正的創造力火花。
不少網友在社交平臺慶祝這一歷史性時刻。AI在ICPC上斬獲金牌可能意味著人工智慧可以成為程式員真正的問題解決夥伴。但同時也引發了未來人類的編程能力可能會永遠落後於AI的擔憂。
加州大學伯克利分校的電腦科學教授斯圖爾特·拉塞爾(Stuart Russell)在細節公佈之前表示,“具有劃時代意義的說法似乎有些誇大其詞。”他認為,人工智慧系統在編程任務上表現優秀已經有一段時間了,而“人工智慧公司一直聲稱取得突破要面臨巨大的壓力。”
同時他也承認,“要正確回答ICPC的問題,代碼實際上必須能夠正常工作(至少在有限數量的測試用例上),所以這種性能可能表明,人工智慧編碼系統在足夠準確地生成高質量代碼方面取得了進步。”
來源:中國澎湃新聞