英偉達CEO黃仁勳稱市場對DeepSeek帶來的影響存在誤解。
在近日播出的一檔採訪節目中,黃仁勳在與英偉達合作夥伴、數據中心解決方案提供商DataDirect Networks的CEO亞曆克斯・布紮裏(Alex Bouzari)進行交談時,稱中國AI(人工智慧)初創公司深度求索(DeepSeek)的開源推理模型R1“令人興奮不已”,而市場對於R1的反應中存在一些誤解,R1的發佈本質上利好AI市場。
黃仁勳表示:“我認為市場對R1的反應是,‘天哪,AI已經完了’。你知道,就像是R1從天而降,我們不再需要進行任何計算。但事實恰恰相反。”
黃仁勳認為,R1的發佈本質上利好AI市場,能夠加速AI被採用,也就意味著市場仍然需要計算資源:“這讓每個人都注意到,模型的效率遠超我們的想像。因此,它正在不斷擴大,並加速AI的普及。”
黃仁勳還指出,雖然DeepSeek在AI模型的預訓練方面取得了進步,但作為模型“學習解決問題”的關鍵環節,後訓練(post-training)仍然很重要,需要大量的資源,並且推理本身就是“計算密集型的部分”。黃仁勳表示:“從投資者的角度來看,他們有一種思維模式,認為只要先進行預訓練,然後進行推理,而推理就是向AI提問並立即得到答案。顯然,這種觀念是錯誤的。”
2月21日,英偉達(Nasdaq:NVDA)跌4.05%收於每股134.43美元,總市值3.29萬億美元。公司將於當地時間2月26日公佈其2024財年第四財季業績。
此前,1月20日,DeepSeek推出高性能的開源大模型DeepSeek-R1,隨後在國際市場上引發轟動。1月24日,英偉達股價收於每股142.62美元,在下一個工作日(1月27日)大幅下跌收於每股118.52美元,導致英偉達市值在短短三天內蒸發6000億美元。
當地時間1月27日,英偉達發言人表示:“DeepSeek是AI領域的一項卓越進步,也是測試時間縮放(Test Time Scaling)技術的完美範例。DeepSeek的工作展示了如何利用這種技術、廣泛可用的模型以及完全符合出口管制的計算資源來創建新型號。推理過程需要大量英偉達GPU和高性能網路支持。我們現在掌握三種擴展規律:持續進行的預訓練與後訓練,以及新的測試時間縮放技術。”
1月30日,英偉達官方網站宣佈,DeepSeek-R1模型正式上線英偉達NIM平臺。而現在,英偉達股價基本恢復到了這波大跌前的水準。
1月末至2月初,科技巨頭微軟、Meta、穀歌母公司Alphabet、亞馬遜先後發佈2024年最後一個季度的業績報告,四家巨頭在2025年的資本支出不約而同地持續上漲,意味著AI競賽將愈發激烈。DeepSeek也成為了幾乎每位科技巨頭CEO在財報後電話會上都會被問到的話題,總體來看,巨頭們認為AI成本下降是未來趨勢,也會帶來發展機遇,讓AI被更多企業採用並創造新的營收管道。
當地時間2月4日美股盤後,被視為英偉達競爭對手的晶片巨頭超威半導體公司(AMD)公佈了截至2024年12月31日的2024年第四季度業績。公司CEO蘇姿豐強調,最近在AI領域出現了一些新突破,例如DeepSeek開發R1大模型和美國宣佈成立5000億美元“星際之門”專案,而這些正是公司“希望看到的那種進步”:“所有這些舉措都需要大量的新的計算,為AMD在整個業務中創造了前所未有的增長機會。”
來源:中國澎湃新聞