2月18日,昆侖萬維(300418)開源首個面向AI短劇創作的視頻生成模型SkyReels-V1,及基於視頻基座模型的表情動作可控演算法SkyReels-A1。
針對當前全球AI視頻生成模型和產品不開源、用不到、費用高、不好用等痛點,昆侖萬維此次開源的兩款模型和演算法,可幫助解決傳統短劇製作面臨的挑戰,如線下拍劇涵蓋劇本創作、選演員、場景佈景、分鏡創作、拍攝、後期處理等複雜流程,大模型有助於縮減成本。
SkyReels-V1針對表演細節打標,利用好萊塢級別數據訓練微調。
據介紹,為提升表情生成、肢體生成的可控表演效果,SkyReels-V1針對表演細節打標,利用好萊塢級別數據訓練微調。針對人物微表情、人物表演細節、場景描述、光影、畫面構圖等進行更精細的技術升級。為了實現更加精准可控的人物視頻生成,昆侖萬維開源了基於視頻基座模型的表情動作可控演算法SkyReels-A1,支持視頻驅動的電影級表情捕捉,能夠基於任意人體比例生成高度逼真的人物動態視頻,以及皮膚肌理、身體動作跟隨等多維度細節的深度還原。
同日,大模型企業階躍星辰與吉利汽車集團聯合開源兩款多模態大模型,包括開源視頻生成模型階躍Step-Video-T2V、開源語音交互大模型階躍Step-Audio。階躍星辰表示,此次聯合開源旨在促進大模型技術的共用與創新,推動人工智慧普惠發展。
據階躍星辰介紹,階躍Step-Video-T2V模型參數量達300億,可直接生成204幀、540P解析度的視頻。階躍Step-Video-T2V在複雜運動、美感人物、視覺想像力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面能力突出。
上海對外經貿大學人工智慧與變革管理研究院副院長、上海開源資訊技術協會秘書長張國鋒此前對澎湃科技表示,開源是數字經濟公共基礎設施,開源在物理世界萌芽發展、逐步壯大,成為數字經濟創新創業主導模式,這是歷史趨勢。作為社會創新方法論的開源降低了創新創業門檻,激發了創業熱情,將改變軟體的產業鏈和供應鏈,改變遊戲規則。DeepSeek讓人們看到了開源的重要性,開源專案將雨後春筍般湧現,2025年是開源大發展之年,一場波瀾壯闊的開源社會運動正在開展。
來源:中國澎湃新聞