當地時間1月6日,英偉達在於拉斯維加斯拉開帷幕的2025CES(國際消費類電子產品展覽會)期間,推出了涵蓋生成世界基礎模型的Cosmos世界基礎模型平臺,旨在加速自動駕駛汽車、機器人等物理AI系統開發。
“機器人的ChatGPT時刻即將到來。與大語言模型一樣,世界基礎模型對於推進機器人和自動駕駛汽車的開發至關重要。”英偉達創始人兼首席執行官黃仁勳在發佈會上表示,英偉達創造Cosmos是為了讓物理AI民主化,讓每個開發人員都能接觸到通用機器人。
Cosmos是為物理交互、模擬工業環境和駕駛環境的高質量生成而構建,它可從文本、圖像和視頻等輸入以及機器人感測器或運動數據的組合中生成基於物理的視頻。該模型生成逼真的視頻可用於訓練機器人和自動駕駛汽車,通過創建合成訓練數據幫助機器人和汽車理解物理世界,成本遠低於使用傳統數據。
英偉達表示,物理AI模型開發成本高,需要大量真實世界數據和測試。Cosmos為開發人員提供了一種簡單的方法來生成大量基於物理的合成數據,以訓練和評估模型。開發人員也可以通過微調Cosmos來構建定制模型。
在今年的CES開幕演講中,黃仁勳展示了開發人員使用Cosmos的方法,例如開發人員能夠從視頻數據中輕鬆找到下雪的路況、擁堵的倉庫等特定訓練場景,使用Cosmos模型從英偉達Omniverse仿真平臺開發的受控3D場景生成真實感視頻,使用Cosmos和Omniverse生成AI模型可以採取的每一種可能的未來結果。
人形機器人企業Agility首席技術官普拉斯·韋拉加普迪(Pras Velagapudi)表示,數據稀缺和可變性是機器人環境中成功學習的關鍵挑戰。“Cosmos的文本、圖像、視頻、世界能力使我們能夠為各種任務生成和增強逼真的場景,而不需要大量昂貴的真實世界數據捕獲。”
“我們真的希望Cosmos能為機器人和工業人工智慧領域做出貢獻,就像Llama 3(Meta公司發佈的大語言模型)為企業人工智慧所做的那樣。”黃仁勳表示。
來源:中國澎湃新聞