7月26日,在WAIC世界人工智慧大會期間,百度公司對外展示了其在數字人領域的最新研發成果——新一代數字人技術NOVA。該技術依託百度慧播星平臺發佈,旨在顯著提升數字人在直播場景下的綜合表現力與互動能力。
NOVA技術核心優勢體現在三個方面。首先,該技術基於文心大模型4.5構建的大師級劇本模式,能夠自動生成高質量直播腳本,通過多模態技術協同實現數字人在直播環境中的形態、神情、聲音和容貌的精准統一。
在智能交互層面,NOVA配備的AI決策系統能夠即時分析直播數據流,通過多智能體調度機制完成觀眾問答互動,同時結合即時熱點生成具有個性化風格的直播內容。
技術複刻效率成為該方案的突出亮點。根據百度介紹,NOVA僅需採集10分鐘的真人樣本數據,即可完成對目標對象聲音特徵、動作習慣以及表達氛圍的全面複刻,實現高度還原的數字人形象。

該技術此前已在商業場景中得到驗證。羅永浩數字人直播間運用該技術創造了5500萬元的商品交易總額,展現了數字人直播的商業潛力。
百度方面透露,NOVA技術計畫於今年10月面向全行業開放使用。屆時,普通商家和個人用戶將能夠獲得專業級的數字人直播能力。目前,該技術已啟動邀請測試階段,率先在教育培訓、健康醫療等十餘個垂直行業的內容創作者和商家中進行應用試點。
來源:中國鳳凰網科技