本網綜合報導 一場科技競賽正在美國矽谷上演。
5月15日,穀歌舉辦了2024年I/O開發者大會,AI是全場的主題,穀歌CEO桑達爾·皮查伊和他的同事們發佈了Gemini 1.5 Pro的新版本,在100萬Tokens的窗口能力上,進一步擴大至200萬Tokens,它們的最終目標是無限上下文。
穀歌還展示了新的搜索產品,比如從本周開始,穀歌搜索引擎將在美國推出“AI概覽”(AI Overviews)的功能,搜索引擎會直接歸納總結搜索結果。此外,穀歌還推出了新的TPU,第六代TPU晶片Trillium,較上一代晶片的算力表現翻4.7倍。
就在這場發佈會前一天,OpenAI舉行了春季發佈會,發佈最新GPT-4o多模態大模型,相較於GPT-4 Trubo速度更快、價格也更便宜。接下來的一個月裏,矽谷還將迎來兩家科技巨頭的重磅大會——5月21日左右,微軟將舉行Build年度開發者大會;6月10日左右,蘋果將舉辦全球開發者大會。一場有關AI的大比拼在大洋彼岸開賽。
伴隨著OpenAI的崛起,以及穀歌在AR眼鏡等失利,外界一度評價穀歌已經成為一家為“賺錢”打造的機器,失去了創新激情。
不過,穀歌仍然擁有穀歌搜索、YouTube、雲服務、Gmail、Android以及自動駕駛Waymo等業務,僅YouTube就有20億月活用戶,Android也擁有20億月活用戶,可以說,穀歌掌握著全球最多的用戶場景、數據以及設備介面。
穀歌發佈更新產品後,穀歌-C股價微漲0.6%,收盤價為171.93美元,市值2.12萬億美元,股價較2024年開年上漲了23%。
在剛剛過去的財季,穀歌展現出強有力的競爭力。2024年第一季度,穀歌實現營收805.39億美元,同比增長15%,非美國通用會計準則下淨利潤為236.62億美元,同比增長57%。
穀歌艱難守陣地
大會一開場,皮查伊就介紹說,現在已經有超過150萬開發者正在使用穀歌的原生多模態大模型Gemini。Gemini在2023年12月上線,它被認為超過了GPT-4。
皮查伊宣佈,Gemini 1.5 Pro向全球所有開發者開放,並支持200萬Tokens的Gemini 1.5 Pro模型的預覽,他們的目標是“無限上下文”。
此次開發者大會,穀歌著墨最多的是搜索,這是穀歌的起家業務,現在穀歌要重新定義搜索,它要把搜索做成多輪對話的推理,用戶只需要問就可以了。
皮查伊以“重新定義搜索”的架勢,連續上線多款基於Gemini的產品,比如總結穀歌搜索引擎結果的“AI概覽”功能,支持用戶存儲圖片的AI搜索Ask Photos。
以練瑜伽為例,穀歌會幫用戶找到排名更靠前的工作室,並介紹他們的服務,可以看到每個門店的距離。穀歌搜索會把更大的問題分解成各個部分的問題,比如排名、評論、營業時間以及其他更多的研究。
但“重新定義搜索”的最大主動權可能不在穀歌手裏,而在OpenAI這邊。今年年初有傳言說,OpenAI計畫上線AI搜索業務,不過在5月14日OpenAI的發佈會上,並沒有展現該業務,這可能與算力成本有關系。
成熟大公司對待創新公司的崛起仍然毫無辦法。對標OpenAI,穀歌仍在努力顯示自己的存在。
在此次發佈會上,穀歌還展示了一個名為Astra的專案,這是穀歌開發的通用人工助理,在演示視頻中,Astra通過手機攝像頭能識別真實環境中的物體,實現了能看、能說、能聽。這與前一天OpenAI上線的GPT-4o功能類似,都實現了人機交互的新形式。但穀歌似乎不滿足於此,Astra更強調指向人、機器與現實世界的三重交互。
大模型最大的挑戰是解決回應時間的問題。穀歌介紹說,它們在Gemini模型的基礎上,開發了通過連續編碼視頻幀,更快地處理資訊的代理,同時,將視頻和語音輸入組合到事件的時間線中,捕捉並有效記憶。這些代理可以更好地理解用戶所處的環境,並在對話中快速回應,使交互的速度和品質更加自然。
Gemini也將支持語音即時交互,同時今年晚些時候還將上線即時視頻交互功能。未來幾個月內,穀歌也將推出類似於GPTs的自定義AI助手Gems。它將能與“穀歌全家桶”進行交互。
“Gems易於創建,它們可以充當你的瑜伽閨蜜、你的私人副主廚、聰明的微積分導師、代碼的同行評審員。”穀歌的相關負責人說。
穀歌發佈會上還宣佈了安卓生態的AI新進展,今年晚些時候,能夠在本地運行的多模態Gemini Nano模型將登陸Pixel手機,它更智能,更注重隱私保護,比如,如果用戶接到詐騙電話,將會提醒用戶。
如果沒有OpenAI,上述穀歌的創新技術可以稱得上可圈可點,但奈何“既生瑜,何生亮”。
矽谷科技競賽升級
在發佈會上,穀歌只提到一家科技大公司,那就是英偉達。皮查伊發佈了第六代TPU(張量處理器,穀歌為機器學習定制的專用晶片)晶片Trillium,較上一代晶片的算力表現翻4.7倍,TPU是穀歌自己研發的GPU晶片。
同時,皮查伊說,穀歌雲將在2025年初,用上英偉達的最新Blackwell架構GPU。在過去數年,穀歌投資了200萬英里的地面和海底光纖。
今年3月,英偉達發佈了基於“Blackwell”架構的B100晶片與B200 GPU加速器,英偉達創始人黃仁勳說,這是迄今為止,英偉達最強大的GPU晶片,在生產出首批伺服器之後,黃仁勳將一臺伺服器送給了OpenAI。
GPU在過去一年多時間成為堪比黃金的硬通貨,各大科技公司不得不排隊數月來等貨,這讓黃仁勳成為矽谷最受歡迎的CEO,人們爭相排隊和他見面,英偉達也是所有科技公司的合作夥伴。
而在GPU大熱的背後,矽谷正在進入新一輪的科技競賽。
2022年底,OpenAI發佈ChatGPT開始,整個矽谷進入亢奮狀態,這裏甚至誕生了AI一條街,五六個人就可以組建一個公司,依靠一個想法獲得融資,比如斯坦福博士生郭文景和同學創辦的Pika,短短數月間就完成5500萬美元融資,並推出了視頻生成器Pika1.0。
科技巨頭之間的關係變得異常緊張,主要是AI重構了邊界,大公司重新變得野心勃勃:
微軟重新盯上了搜索,扶持Bing發展;Meta向第三方硬體製造商開放VR頭顯操作系統Meta Horizon OS,進一步蠶食蘋果生態;為應對OpenAI的崛起,蘋果不得不放棄數十年的造車計畫,集中資源搞AI。
進化以群體聚集的形式在矽谷上演,大公司你追我趕,它們之間的合縱連橫也讓AI競賽變得複雜。
蘋果公司計畫和OpenAI合作,將OpenAI的技術引入iPhone之中,但微軟是OpenAI的最大出資方;穀歌正和OpenAI酣戰,支持其開源系統Android的AI進化,以展開和蘋果iOS系統之間的競爭。
席捲全球的這次科技競賽浪潮頗有點20世紀七八十年代矽谷的意味。那時,原生技術層出不窮,1968年,英特爾成立;1969年,AMD成立;1976年,喬布斯創辦蘋果電腦;1977年,甲骨文成立;1984年,思科公司成立。
只不過,50年前,是晶片等硬體造就了創業潮,創造了財富;現在,AI以及產品化則是最新的動力。
在AI時代,中國互聯網同樣也迎來了新發展機會,但正如大部分中國AI創業者所說,雖然一家又一家公司會在這次浪潮中轉型甚至退場,但是千萬不要低估中國創業者的生命力。
來源:中國企業家雜誌