不久前,NVIDIA(英偉達)發佈了一個面向3D建模的生成式AI服務,引起了業內的廣泛矚目。如果說之前的生成式AI更多是在生成文字、圖片、視頻等二維世界的內容。那麼,這次NVIDIA正在通過生成式AI去幫助企業構建3D資產,加速數字孿生和仿真產業的發展,同時也加速AI在物理世界的應用落地。
01
“CUDA原生”瞄準了工業
春江水暖鴨先知。作為全球加速計算的領導者,NVIDIA的動作正在透露出一些新的風向。
NVIDIA創始人兼CEO黃仁勳,在2024年SIGGRAPH上的兩場圍爐談話中,將其對AI的最新洞察,放在了生成式AI和加速計算,如何通過可視化,來改變製造業等行業上。NVIDIA也在會議期間推出了一套全新的NIM微服務。
SIGGRAPH大會是討論電腦圖形學最新創新的場所。NVIDIA發佈了適用於OpenUSD、幾何體、物理學、材質等的生成式AI模型與NIM微服務。OpenUSD是三維場景內部數據交換的開源軟體,已逐漸成為三維視覺、建築、設計、製造等眾多行業的標準。
借助這些模型和服務,開發者能加速製造業、汽車、機器人等行業應用的開發。
在兩場圍爐談話中,黃仁勳探討了構建數字孿生、虛擬世界的重要性。他說,行業通過構建城市規模的大規模數字孿生,來提高效率並降低成本。“比如,在部署到下一代人形機器人之前,AI可以在這種虛擬世界中進行訓練。”
為什麼黃仁勳會重點討論工業可視化、虛擬世界或數字孿生?NVIDIA又為何在此時在CUDA生態中,推出全新的NIM微服務?
圖片來自NVIDIA官網
就如NVIDIA Omniverse與仿真技術副總裁Rev Lebaredian所表示的——重工業的生成式AI潮已經到來。數智前線也獲悉,生成式AI正在從一些簡單場景,走入複雜的生產環節。而上述技術生態,可加速這一進程。
“直到最近,數字世界的主要用戶還是創意行業;而現在,借助NVIDIA NIM微服務為OpenUSD帶來的增強功能和可訪問性,各個行業都可以創建基於物理學的虛擬世界和數字孿生,為這次新一輪AI技術熱潮做好準備。”Rev Lebaredian說。
在汽車行業,國內車企都在“卷”數字孿生。“最近特斯拉即將發佈FSD12.5版本,也在積極推動FSD在中國的落地。”一家中國大型車企人工智慧人士告訴數智前線,“特斯拉把仿真作為戰略級目標,我們也在做元宇宙,解決自動駕駛數據閉環問題。”此前,車企採集“鬼探頭”數據難度大、成本高。現在,車企可以在元宇宙仿真環境中,解決長尾場景的訓練。
在機器人行業,一家電力巡檢機器人公司正在通過仿真環境訓練AI,讓機器人能即時感知到電廠內複雜的環境和物理空間,規劃移動路線,並可以查看沿路數千個在不同設備上的表計。
建築設計是一項複雜耗時的工作,建築設計中的3D模型是個必不可少的交付件。而對於一些複雜幾何形狀和異形結構,3D模型的重建工作難度較大。現在,一些設計企業與AI企業一起,嘗試只需要一些圖片、草圖和文字,就可以生成模型。還可以賦予建築設計不同的材質,來完善設計。
在鋼鐵行業,金相分析是通過顯微鏡查看材料切片內部的缺陷和結構等的一種方法,來瞭解基礎材料的整體性能。傳統人工的效率較低,還要嚴重依賴人的經驗。現在,不少鋼鐵企業的一個共同的訴求是,期望利用以往的知識庫,通過訓練專業的AI,來對材料進行全方位的解析。
而NVIDIA通過全新的NIM微服務,讓應用企業不用從零開始,直接去調用服務,再結合自己的數據,快速實現一個應用。因此,一些企業將此形容為“CUDA原生”。
伴隨生成式AI從一些邊緣場景到更深層次場景的落地,黃仁勳稱,“每個人都將擁有AI助手”。同時,AI與圖像技術等的融合正在深化,“幾乎每個行業都將受到這項技術的影響,無論是科學計算以更少的能源更好地預測天氣,還是與創作者合作生成圖像,或為工業可視化創建虛擬場景,”黃仁勳表示,“生成式AI還將徹底改變機器人自動駕駛汽車領域。”
02
新NIM微服務,帶來哪些想像
上述這些行業應用背後,都依賴3D建模和仿真技術的應用。
而3D內容和場景的構建在過去一直是令人頭疼的事情,它涉及的鏈條和流程很複雜,比如建模、著色、動畫、照明、渲染等。
在過去數十年,動畫、視覺特效和遊戲工作室一直在努力提升流程中各種工具之間的互操作性,但收效甚微。將數據從一個位置遷移到另一個位置非常棘手,因此工作室構建了複雜的工作流程來管理數據互操作性。
而且,除了系統和工具的割裂,傳統的3D製作流程是線性協作,涉及多部門多人員的格式轉換和修改,費時費力。
OpenUSD是一個開源的通用3D數據交換框架,它在2023年由NVIDIA、皮克斯、蘋果等廠商牽頭成立,可通過軟體工具與數據類型之間的互通構建虛擬世界,具有極高的互操作性和相容性,解決創建三維場景時工作流和複雜性方面的多項挑戰。
OpenUSD也是NVIDIA Omniverse平臺的基礎。在與《連線》雜誌資深撰稿人的對談中,黃仁勳曾如此表示:OpenUSD是第一種幾乎將所有工具的多模態表達融合在一起的格式。理想情況下,隨著時間的推移,人們可以將幾乎任何格式引入其中,讓每個人都能進行協作並使內容永遠留存。而生成式AI,一定能夠助力Omniverse產生更好的仿真效果。
而NVIDIA這次推出的針對OpenUSD開發的NIM微服務,也是全球首個用於OpenUSD開發的生成式AI模型。它將生成式AI的能力以NIM微服務的形式,整合進USD工作流中,大幅降低了用戶運用OpenUSD的門檻。同時,NVIDIA也發佈了多款適用於機器人數據格式和Apple Vision Pro流式傳輸的全新USD連接器。
圖片來自NVIDIA官網
目前,已經發佈的NIM微服務有三項:一是USD Code NIM微服務,可以回答常識性OpenUSD問題,並基於文本提示自動生成Python代碼。
二是USD Search NIM微服務,使開發者能夠使用自然語言或圖像輸入,在海量OpenUSD、3D和圖像資料庫中進行搜索,大大提高企業流程化檢索並處理材料的速度。
三是USD Validate NIM微服務,可以檢查上傳檔與OpenUSD發佈版本的相容性,並生成完全由NVIDIA Omniverse Cloud API驅動的RTX渲染路徑追蹤圖像。
除了NVIDIA提供的原生NIM微服務,生態夥伴也正在基於這些微服務,創建了多個熱門的AI模型,提供給用戶進行推理優化。
全球知名的創意內容平臺Shutterstock基於NVIDIA最新版本的Edify視覺生成模型,推出了文本轉3D的全新服務,包括製作3D原型或填充虛擬環境等。
比如為虛擬場景創建能夠準確反射的照明是一項複雜的任務。以前,創作者需要操作昂貴的360度攝像機裝備,親身到拍攝現場從頭開始創建背景,或者在龐大的資料庫中搜索近似的內容。
但現在,通過3D生成服務,用戶只需用文字或圖片描述他們所需要的具體環境,就能得到最大解析度為16K的高動態範圍全景圖像 (360 HDRi)。而且,這些場景和組件可以快速切換,比如讓跑車出現在沙漠、熱帶海灘或者蜿蜒的山路上。
除了創建照明,創作者也可以快速添加各種渲染材質,如混凝土、木材或皮革等,從而構建自己的3D資產。而且,在AI幫助下生成的3D資產也可以隨時進行編輯並以各種流行的檔格式提供。
而NVIDIA的Edify AI模型,也在幫助Getty Images讓藝術家實現任意控制圖像的構圖和風格。比如在一張完美的珊瑚礁照片上漂浮一個紅色沙灘球。而且,創作者也可以用企業的數據,在基礎模型上進行微調,生成符合特定品牌創意風格的圖像。
這些模型微服務和工具正在極大地加速品牌方在3D資產上的創建,將使數字孿生的開發變得更加普及和便捷。
03
先發企業已開始嘗試
正是隨著3D內容和資產創建變得更加便捷和準確,工業、自動駕駛、工程、機器人等行業正在享受到生成式AI帶來的技術紅利。尤其在製造業和廣告創意行業,一批先發企業正在積極通過NVIDIA Omniverse平臺加速數字孿生和仿真的落地應用。
可口可樂是首個將Omniverse和NIM微服務所提供的生成式AI用於行銷場景的品牌。在其演示的一段視頻中,只需要在系統中用自然語言輸入“給我建一張桌子,上面放著塔可和莎莎醬,沐浴在晨光中”。
很快,USD Search NIM微服務能在龐大的3D資產庫中搜索出對應的3D資產,通過API的方式快速調用,而USD Code NIM則可以將這些模型組合成場景,開發人員輸入提示就可以獲得用於創造新穎3D世界的Python代碼,大大增強了他們的創作能力。可口可樂通過生成式AI,可以在全球100多個市場定制個性化的形象,實現本地化行銷。
圖片來自NVIDIA官網
而作為可口可樂背後的廣告服務商,WPP專門推出了智能行銷操作系統。該系統利用了Omniverse開發平臺和OpenUSD,能夠非常精簡且自動化地實現多語言文本、圖像和視頻的創建,簡化了廣告主和行銷人員的內容創建過程。通過生成式AI服務於客戶,WPP將一個個瘋狂的創意搬到了現實。
正如WPP首席技術官所言,“這些創新的美妙之處在於它與我們的工作方式高度相容,並充分利用了開放標準。這不僅加速了未來的工作,而且使我們能夠繼續鞏固和擴展我們之前在OpenUSD等標準上的所有投資。通過使用NVIDIA NIM微服務與NVIDIA Omniverse,我們能夠以前所未有的速度與可口可樂公司等企業聯合推出創新的新生產工具。”
作為全球最大的消費電子代工企業,富士康專門為墨西哥的一家新工廠構建了虛擬的數字孿生工廠,工程師可以在虛擬環境中定義流程和訓練機器人,從而提高工廠的自動化水準和生產效率,節約時間、成本和能源。
富士康在背後也用到了Omniverse平臺來構建其數字孿生,將所有3D CAD元素整合到同一個虛擬工廠中,並在那裏使用Omniverse和OpenUSD上開發的可擴展機器人仿真平臺NVIDIA Isaac Sim對機器人進行訓練,為其數字孿生帶來物理級精確和逼真的視覺呈現。
除了富士康,包括臺達電子、聯發科、和碩等電子製造企業,都在使用NVIDIA AI和Omniverse構建工廠數字孿生。
而小鵬汽車MPV車型小鵬X9在設計過程中則使用Omniverse平臺,通過將車型開發工作流引入虛擬世界,讓小鵬汽車在新車設計時規避傳統工作流存在的瓶頸。
比如,Omniverse平臺一方面擁有強大的互操作性,使得用於工業建模、渲染和3D特效的檔和數據不再需要繁複的轉換,加速了小鵬汽車設計團隊之間的溝通協作;另一方面,小鵬汽車借助Omniverse的即時渲染與光線追蹤等功能,實現了汽車顏色和內飾變化的即時可視化,讓虛擬效果更加真實,幫助承接用戶需求,進而改進產品體驗。
過去兩年,生成式AI的爆火讓外界的目光更多在一些ToC和協同辦公領域的應用上,但現在,物理世界也將迎來一波新的爆發和機遇。
來源:中國第一財經