小米開源Xiaomi-Robotics-0後訓練全流程!機器人秀神操作:絲滑連續收納耳機
4月27日消息,今年2月,小米機器人團隊正式發佈並開源全新具身智能VLA模型——Xiaomi-Robotics-0,該模型發佈首月便在HuggingFace全球VLA模型下載榜斬獲第六名。
今日,小米技術宣佈,為了讓該模型真正成為“開箱即用”的生產力利器,正式發佈Xiaomi-Robotics-0真機後訓練(Post-training)全流程,並展示最新能力演示。

基於預訓練基座,小米僅使用20小時的任務數據進行真機後訓練,便讓Xiaomi-Robotics-0掌握了“將耳機收納進耳機盒”這一高難度動作,並能夠連續絲滑地完成多個耳機的收納。
小米表示,該任務涉及兩大核心挑戰:
耳機與槽位間公差極小,模型必須達到亞毫米級的空間感知精度,才能完成精准對位。
耳機與盒體表面粗糙度最低至Ra0.03μm,極易在觸碰過程發生位移,模型必須能快速修正動作偏差,避免裝配失敗。

為實現機器人動作的無縫銜接,小米在部署階段採用了非同步推理方案,在執行當前軌跡時,同步推理下一步動作。
同時,為避免前後兩次推理產生動作突變,小米在訓練中引入動作首碼機制。
這如同為接力賽選手提供了“助跑區”,讓新動作能夠從既有軌跡中自然生長,從而實現動作流的平滑切換。
官方將其比喻為接力賽中的助跑區,讓新動作能夠順暢接續既有軌跡,從而實現更平滑、更連貫的動作切換。
來源:中國快科技