10 月 11 日消息,科技媒體 testingcatalog 昨日(10 月 10 日)發佈博文,曝光了穀歌新一代文生視頻模型 Veo 3.1 的首批真實生成樣本,能夠生成時長 8 秒、解析度為 720p 且包含音軌的視頻片段。
該媒體指出在雲平臺 Vertex AI 及視頻創作工具 Google Vids 中,已經出現新一代模型 Veo 3.1 的蹤跡,首批由 Veo 3.1 生成的真實視頻樣本已流出。
集成在 Google Vids 中的 Veo 3.1 已具備核心的文生視頻功能,用戶可輸入文本提示詞,生成時長為 8 秒、解析度為 720p 的視頻片段。此次更新的一大亮點是視頻自帶音軌,其配樂相比前代更具感染力。
從曝光的“賽博朋克駭客機器人”和“火山噴發”等對比測試視頻來看,Veo 3.1 在性能上實現了巨大飛躍。
相較於前代模型 Veo 3 有時略顯重複的輸出,Veo 3.1 對提示詞的細微之處理解得更透徹,生成的畫面在視覺保真度和細節豐富度上表現更優,例如能夠精准呈現熔岩的流動感或更逼真的恐龍形態。此外,3.1 版修復了前代模型中偶爾出現的物體比例失調等問題,整體輸出品質更穩定、更準確。
來源:中國IT之家