4月2日,美國AI機器人公司Generalist AI(以下簡稱“Generalist”)推出了GEN-1模型,該模型將各類簡易物理操作任務平均成功率從64%提升至 99%,被視為機器人學習規模化發展的最新里程碑。
Generalist是一家成立於2024年的AI機器人公司,總部位於美國加州聖馬特奧,由前穀歌DeepMind高級研究科學家Pete Florence(皮特·弗洛倫斯)聯合創立。該公司聚焦於開發具身智能基礎模型。
2025年11月,Generalist發佈首款模型GEN-0,首次驗證了具身智能領域的Scaling Law(縮放定律),將物理人工智慧模型帶入預訓練時代,被業內視為機器人領域的“ChatGPT時刻”。
通過繼續擴大數據與算力規模,並疊加預訓練、後訓練、強化學習、多模態人類引導以及推理階段優化等技術改進,Generalist表示,GEN-1 開始展現出更接近“任務掌握(mastery)”的能力。
速度是此次模型更新的重點。GEN-1完成箱體組裝僅需12.1秒,此前最優模型完成同款箱體組裝需約34秒;在手機入殼封裝任務上,GEN-1耗時15.5秒,速度是前代最優模型的2.8倍。
在 Generalist看來,GEN-1模型的一個核心突破在於訓練數據的路徑不同。據稱,過去不少成功率超過90%的通用機器人模型往往依賴大規模成本較高的遙運算元據。GEN-1的基礎預訓練階段使用的數據主要來自通過低成本可穿戴設備採集的人類活動數據。
按照官方說法,這種做法的意義在於:模型在接觸真機機器人之前,已經通過大規模人類活動數據建立起對物理世界的初步理解,因此在遷移到具體機器人任務時,對真機數據的依賴明顯下降。
Generalist 稱,在部分測試中,GEN-1可以用約GEN-0十分之一的專項訓練數據和微調步驟,達到與 GEN-0 相近的性能;而此次展示出的各項結果,每項僅使用了約 1 小時機器人數據完成適配。
這也是 Generalist 反復強調的一點:在較低真機數據成本下,把能力遷移到新的任務和新的機器人本體上。若這一點成立,機器人模型的訓練與部署成本就有望繼續下降。
過去幾十年,工業機器人的高可靠性建立在嚴格的環境控制之上,一旦環境偏離預設便無法工作。早期的端到端模型雖然靈活,但極不穩定,往往需要投入大量昂貴的遙控運算元據,才能換來並不理想的成功率。GEN-1的高度穩定性,意味著它無需複雜的系統設計,就能在不同任務、不同系統、不同環境中實現高頻且可重複的穩定操作,這是商業化部署的關鍵。
不過,Generalist也坦言,GEN-1目前僅部分精細操作任務實現99%以上成功率,並非所有測試任務都能達標;部分落地場景還需進一步提升任務成功率與運行速度。研發團隊預計,下一代模型將攻克更多高複雜度實操任務,同時隨著基礎模型迭代,單項任務所需訓練數據量將持續降低。
來源:中國澎湃新聞