本網綜合報導 繼家務機器人火爆全網後,近日,斯坦福大學研發Mobile Aloha團隊又出新作——一款名為“Yell At Your Robot”(簡稱YAY Robot)的系統。有了這個系統,可以通過“喊話”來訓練機器人。
利用YAY技術調教訓練後,機器人在完成每個階段的成功率都有顯著提高。
目前,YAY Robot系統作為研究成果,已經在社交平臺上公開,系統也已開源。
通過喊話訓練機器人
根據論文介紹,YAY Robot系統是一個通過自然語言回饋,來改善機器人後期訓練的系統。在傳統方法訓練機器人的過程中,研究人員需要觀看機器人視頻,並且要為每個技能片段、事後動作,進行重新標注或一次性糾正,過程非常費力費時。
為了簡化這一過程,YAY Robot研發團隊採用了一種更有效的數據收集方法:現場解說。通過在機器人附近放置麥克風,操作人員可以先用語言說出機器人需要掌握的技能,然後遙控機器人進行同步操作,錄製的音頻可以與機器人的軌跡同步。
經過訓練後的YAY Robot可以在與用戶的互動中不斷改進,提升動作水準,即時調整策略,將語言更有機地融入機器人的學習過程中。研究人員表示,利用YAY技術調教訓練後,機器人在完成每個階段的成功率都有顯著提高。比如,在“準備混合食物”這一任務中,經過喊話訓練的機器人動作準確性提高了30%-45%、在“清洗盤子”任務中提高了15%-25%。尤其是在清洗盤子這項任務中,研究人員可以直觀地看到整個盤子表面的清潔效果,通過人類的口頭回饋經過微調之後的機器人清潔力度更強,範圍也變大了。
YAY Robot還引入了即時語言糾正機制
YAY Robot系統是怎麼做到的呢?
研發人員透露,整個YAY系統在架構上主要由高級策略和低級策略兩個部分組成。其中高級策略負責通過自然語言指令控制低級策略,低級策略則用於執行具體動作。
YAYRobot系統工作機制
此外,YAY系統引入了即時的語言糾正機制。當機器人的操作行為不理想時,操作人員會對YAY Robot系統說,“我想讓機器人稍微調整一下”,這些修正語言就會被記錄包含在未來的訓練數據收集中。
研究人員表明,YAY Robot的目標是通過不斷學習,最大可能的減少修正的需要,並隨著時間的推移,能與用戶的偏好保持一致。
為了提高機器人操作任務的性能,研究人員透露,YAY Robot系統每次要進行 20 次試驗,還對子任務的成功率進行測量。“我們的代碼實現了採集數據與處理這一過程的自動化,並且已經開源。”研究人員在論文中稱。
研究人員施露西在論文中展望,希望未來的研究能進一步讓機器人在人類的監督下不斷進步,最終讓任何人都能幫助教育機器人。
YAY Robot研究成果第一作者施露西本科畢業於大學電腦科學專業,曾在英偉達研究院與朱玉珂教授和 Jim Fan 博士合作,2023年3月加入斯坦福大學切爾西·費恩(Chelsea Finn)實驗室,同年8月受邀在穀歌DeepMind就AWE發表演講。
來源:中國澎湃新聞