當地時間週一(12月1日),美國人工智能初創公司Runway推出Gen-4.5——一款新視頻模型,該模型在獨立基準測試中表現優於穀歌和OpenAI同類產品。
Gen-4.5能根據用戶提供的文字提示,通過描述其中的運動與動作,生成高清的視頻內容。Runway 表示,這款模型在理解物理規律、人體動作、鏡頭運動以及因果關係方面表現突出。
該模型在獨立AI基準測試與分析公司Artificial Analysis的Video Arena排行榜上位居第一,而穀歌的Veo 3位列榜單第二,OpenAI的Sora 2 Pro則排在第七。
該排行榜的文本生成視頻模型排名是通過盲選方式得出:人們比較兩個模型的輸出視頻,並投票選擇更好的一個,投票時不會知道對應的是哪家公司。
Runway CEO Cristóbal Valenzuela在接受採訪時表示,“我們僅靠一百人的團隊,就擊敗了萬億美元規模的公司。只要極度專注、勤奮,就能觸及技術前沿。”

Runway成立於2018年,公司從事AI研究,打造視頻模型和世界模型,即在視頻與觀測數據上訓練、以更真實反映物理世界運行方式的模型。
目前,Runway的客戶包括媒體機構、影視工作室、品牌方、設計師、創作者和學生,但公司的員工規模只有120人。
根據PitchBook數據,其估值已膨脹至35.5億美元。投資者包括 General Atlantic、Baillie Gifford、英偉達、Salesforce Ventures等。
Valenzuela表示,Gen-4.5的內部代號是 “David(大衛)”,象徵著聖經中“大衛戰歌利亞”(以弱勝強)的典故。他說,這個模型“是一個可以一夜成名、卻花了七年時間打造的產品”。
“現在確實是一個非常有趣的時間節點,一個講究效率和研究的時代正在到來。”Valenzuela說,“我們非常興奮能確保AI不會被兩三家公司壟斷。”
Runway表示,Gen-4.5正在逐步上線,本周內將向所有客戶開放。Valenzuela表示,這是公司接下來發佈的一系列重大更新中的第一個。
“它將通過Runway的平臺、其應用程式介面(API)以及公司的一些合作夥伴管道提供。”
來源:中國財聯社