在大模型如火如荼地發展一年後,外界眼中火熱的AI行業究竟現狀如何?未來將走向何方?
“目前大模型還在快速迭代階段,我們還沒有看到上限。”12月4日,中国上海AI獨角獸企業稀宇科技(MiniMax)副總裁劉華在接受澎湃新聞記者採訪時坦言,“我們沒感覺到Scaling Law(尺度定律)放緩,也不同意大模型在技術上正在面臨天花板。”
MiniMax成立於2021年12月,旗下具備文本、語音、音樂、圖像和視頻等多模態大模型。一個值得關注的亮點是,在AI出海方面,MiniMax走在了國內最前列。最新數據顯示,MiniMax旗下海螺AI海外版登頂10月AI產品全球增速榜,月訪問量達1173萬,同比增長高達2772.92%。
“我們從去年就開始開拓海外市場,中國有自己的工程師紅利,也對產品有更好的理解。在堅持技術驅動的發展戰略下,和海外AI企業相比,我們的迭代速度更快。”談到出海成功的心得,劉華坦言。
在他看來,美國在AI大模型技術方面整體處於領先地位,而在語音、文字等細分領域,中國大模型追趕速度很快,例如海螺AI和快手旗下的可靈大模型等都在美國有廣泛應用,目前在這些領域,兩國技術水準已達到不相伯仲的階段。
今年大模型從一開始的熱潮湧動,又逐漸歸於冷靜,對於融資、變現、落地等話題的討論始終在持續。MiniMax如何看待今年AI行業的整體發展?
“我們並沒有觀察到AI行業存在泡沫。”劉華表示,此前很多企業競相入局基礎大模型,開啟“百模大戰”,確實在一定程度造成了資源浪費和“重複造輪子”,“行業的資源應該得到有效分配,有實力做好基礎大模型的企業並不多。更多企業適合開發的是AI應用,術業有專攻。”
據他披露, MiniMax的長期目標,首先是提升大模型實用性和滲透率,同時也要降低錯誤率。上一代ChatGPT系列模型普遍存在“幻覺”,錯誤率達到30%左右,導致在嚴肅生產場合無法使用,更多應用在文創領域。如果要讓大模型進入嚴肅的生產、研發、科研、設計,就要進一步降低錯誤率,“我們的目標是把錯誤率從30%降低至2%-3%,為此一直在進行各種模型迭代。”
此外,實現無限長的輸入和輸出。從文本進化到語音和視頻,大模型技術的進化需要更多的數據處理量。劉華告訴記者,目前MiniMax最新研發的,基於MoE + Linear Attention架構的abab 7大模型,使得長文本處理效率不斷提高,比起傳統架構有顯著優化。
第三個目標是堅持多模態。未來大模型將從純文本走向多模態,必然兼具文本、語音、視覺等多重功能。MiniMax將在海螺AI等應用上提供更豐富的功能,為藝術創作持續賦能,包括後續會提升AI視頻生成的時長,這是重要的努力方向之一。
另一個業內關注的話題是大模型卷“投流”帶來的高額廣告支出,部分大模型公司動輒投入高達幾千萬甚至上億的廣告投放費用,引起人們關注。對此,劉華表示,單純以擴大用戶總規模為目的的投流價值不大,“對大模型的研發來說,最重要的是到底有多少用戶能夠留下,高頻使用大模型,這才是最大的價值。”
“如果一味依賴於投流,帶來的最大問題就是客戶黏性和留存度較差。”劉華坦言,這也意味著對於大模型行業而言,單純卷投放沒有意義,還是要依靠扎實的技術吸引更多的用戶。
算力是大模型發展不可或缺的要素,大模型需要處理海量的數據,並且需要在短時間內完成複雜的計算任務,這就意味著需要更高的計算能力,也離不開雲計算廠商的支持。
三年前,MiniMax 就與騰訊雲建立合作關係。“早期AI企業的需求可能只有幾百卡、幾千卡,現在普遍達到上萬卡,後續會有更大規模的需求。”騰訊雲北區雲原生總經理田豐告訴澎湃新聞記者,“算力上的考驗對於雲服務商的組網能力和集群運維能力都會成為非常巨大的挑戰,騰訊雲為MiniMax 提供了一系列集計算、存儲、網路為一體的高性能智算產品,讓 MiniMax釋放更多的精力聚焦在模型本身的訓練和工程化上。”
例如,騰訊雲高性能計算集群通過系統化的運維機制,可做到網路故障一分鐘內發現問題,三分鐘內定位問題,最快五分鐘恢復系統。其千卡集群的日故障數已刷新至 0.16,是行業平均水準的三分之一。騰訊雲星脈網路,可實現大模型訓練過程中,網路通信占比(通信時間占總體時間比例)低至6%,整體訓練效率提升了 20% 以上。
不過,田豐直言,並不是所有的大模型訓練廠商都需要1萬卡或是幾萬卡這樣超大的算力集群,並且大集群不等於大算力,智能算力存在比較典型的木桶短板效應,需要不斷調整GPU資源利用率和集群通信效能,才能真正優化算力的利用率。
“對於AI大模型的發展,無論是創業者還是投資人,都要有充分的耐心和信心,看似炫酷的技術,最終都要落實到商業化本身,才能走向盈利。想要指望大模型短期帶來很高價值的經濟效益可能性並不大,目前仍處於長跑的第一公里階段。”田豐表示。
來源:中國澎湃新聞