谷歌逆風(fēng)翻盤暴擊OpenAI！44頁(yè)報(bào)告押注25年三大技術(shù)前沿

萬(wàn)皇之皇 2024-12-18

展開(kāi)全文

編輯：編輯部

【新智元導(dǎo)讀】在這場(chǎng)如火如荼的AI軍備競(jìng)賽中，谷歌在年底徹底打響翻身仗，成功逆襲！Google Cloud于近日也發(fā)布了一份44頁(yè)「2024 數(shù)據(jù)和AI趨勢(shì)報(bào)告」，直指AI智能體、多模態(tài)AI，企業(yè)搜索將成為2025年三大主導(dǎo)技術(shù)。

逆襲之戰(zhàn)開(kāi)啟，谷歌用90天重回巔峰！

短短90天，谷歌就從業(yè)內(nèi)笑柄，逆襲成突破最大、產(chǎn)品最顛覆的科技大公司。

谷歌逆風(fēng)翻盤暴擊OpenAI！44頁(yè)報(bào)告押注25年三大技術(shù)前沿

用AI初創(chuàng)創(chuàng)始人Ole Lehmann的話說(shuō)，「我們正在見(jiàn)證2024年最大的科技轉(zhuǎn)變」。

如今，前方是捷報(bào)頻傳。

根據(jù)OpenRouterAI的數(shù)據(jù)，Google Gemini在開(kāi)發(fā)者中的市場(chǎng)份額從9月份的約5%，上升到了上周的>50%市場(chǎng)份額。

Google Gemini系列在OpenRouterAI的趨勢(shì)排行中獨(dú)占鰲頭，遠(yuǎn)超其他模型。

在被公認(rèn)是下一個(gè)AI前沿的智能體領(lǐng)域，谷歌的Project Mariner，可以直接讓Gemini控制我們的瀏覽器，自行執(zhí)行任務(wù)！直接一步跨越到人機(jī)交互的未來(lái)。

驚人之處在于，Mariner是一個(gè)真正可以在瀏覽器上完成復(fù)雜任務(wù)而不會(huì)失敗的AI。預(yù)定航班、定餐館，它都可以通過(guò)在屏幕上看到的內(nèi)容完成操作。

此外，谷歌的Project Astra的早期測(cè)試報(bào)告結(jié)果也令人興奮不已。

受邀參加項(xiàng)目測(cè)試的Linus Ekenstam表示，這一天很快就會(huì)到來(lái)：人手一個(gè)AI私人助理，而且它們無(wú)所不在。

我們會(huì)嚴(yán)重依賴這些AI助手，甚至在2025年，人類發(fā)展格局都會(huì)被帶來(lái)重大改變。

更不用說(shuō)，就在昨天放出的AI視頻模型Veo 2.0，無(wú)論是在物理學(xué)、質(zhì)量還是指令遵循上，效果都妥妥吊打Sora，全網(wǎng)測(cè)試，為之瘋狂。

有人實(shí)測(cè)Veo 2和Sora后直言：這是自行車和宇宙飛船的區(qū)別

現(xiàn)在，市場(chǎng)已經(jīng)給出了反應(yīng)，在過(guò)去一個(gè)月內(nèi)，谷歌的市值直接上漲了14%。

不再追逐頭條，而是集中精力做產(chǎn)品、注重實(shí)用性的谷歌，已經(jīng)成為了OpenAI真正的可怕對(duì)手。

突然逆襲，重拳反擊OpenAI

曾被認(rèn)為遙遙領(lǐng)先的OpenAI，正面臨著來(lái)自谷歌的迎頭痛擊。

網(wǎng)友Chubby做了一篇長(zhǎng)文分析，指出兩個(gè)AI巨頭的對(duì)戰(zhàn)潮流正在轉(zhuǎn)向。

聲明：目前一切都還未定論，我的分析僅是對(duì)現(xiàn)狀的一瞥

早在2017年，Sam Altman在一次郵件交流中就明確表示，谷歌DeepMind是在AGI競(jìng)爭(zhēng)中最大的對(duì)手。

當(dāng)時(shí)，他還未能預(yù)見(jiàn)其他玩家會(huì)加入這場(chǎng)競(jìng)爭(zhēng)。不過(guò)，估值180億美金Anthropic的崛起，證明了新玩家也能翻身成巨頭。

Meta通過(guò)「開(kāi)源」（雖然并非真正的開(kāi)源）另辟蹊徑，避免了與谷歌占據(jù)主導(dǎo)地位路線的直接競(jìng)爭(zhēng)。

ChatGPT如同一匹黑馬，自2022年橫空出世以來(lái)，OpenAI一直牢牢掌握著AI的話語(yǔ)權(quán)。與此同時(shí)，ChatGPT成為了「AI」的代名詞。

憑借此，奧特曼帶領(lǐng)著團(tuán)隊(duì)迅速征服消費(fèi)市場(chǎng)，甚至直接帶飛了微軟。

然而，谷歌卻在這場(chǎng)競(jìng)賽中措手不及，連連敗北。

最初的幾輪交鋒中，谷歌試圖通過(guò)Gemini去挽救落下的成績(jī)，并期望以此獲得市場(chǎng)青睞，但總是未能如意。

此前，AI Overview總結(jié)能力大翻車，遭到網(wǎng)友連連的吐槽。

比如，建議孕婦吸煙、建議自殺跳橋、建議用膠水將膠水和披薩固定在一起....

各種荒謬的建議，簡(jiǎn)直震碎三觀。

上半場(chǎng)的比賽中，谷歌徹底輸?shù)袅恕?/span>

更耐人尋味的是，OpenAI幾乎毫不費(fèi)力，每次都能在谷歌發(fā)布新產(chǎn)品前后搶盡風(fēng)頭。即便在模型推理能力上，到目前為止，OpenAI也一直是遙遙領(lǐng)先。

人們不理解的是，谷歌DeepMind擁有世界上最好的資源，為什么會(huì)在這場(chǎng)競(jìng)爭(zhēng)中略顯得倉(cāng)促和被動(dòng)？

與OpenAI不同，他們有大量用于訓(xùn)練推理的TPU、更多的訓(xùn)練數(shù)據(jù)（比如YouTube），以及DeepMind這個(gè)世界級(jí)研究機(jī)構(gòu)和頂尖人才。

DeepMind團(tuán)隊(duì)也在努力用實(shí)力，去證明這一切。在科學(xué)領(lǐng)域，AlphaFold、GenCast等等，取得了難以置信的成就。

但這些研究成果，在消費(fèi)市場(chǎng)上并沒(méi)有給谷歌帶去任何實(shí)質(zhì)性的幫助。

甚至，就連Anthropic這樣后來(lái)者，也贏得了AI社區(qū)更多關(guān)注和支持。

然而，這種局勢(shì)在12月發(fā)生了戲劇性的逆轉(zhuǎn)。突然間，谷歌發(fā)力給OpenAI來(lái)了當(dāng)頭一棒。

就在OpenAI接連獻(xiàn)上12天產(chǎn)品秀之際，谷歌推出了兩款驚艷的模型——Gemini 2.0 Flash和Veo 2。

Gemini 2.0 Flash在所有基準(zhǔn)測(cè)試中，超越了GPT-4。

AI視頻模型Veo 2直接吊打Sora，展現(xiàn)出令人驚嘆的物理世界理解能力。

它還能根據(jù)提示中的方程式2x-1=0，直接生成出得到解答x=1/2的視頻。

相較之下，Sora的生成簡(jiǎn)直一言難盡。

關(guān)于新模型的亮相，谷歌并沒(méi)有做任何事先的炒作和預(yù)熱，用低調(diào)有力的方式做出了反擊。

而對(duì)于，過(guò)去一年總結(jié)，和未來(lái)一年技術(shù)預(yù)測(cè)，谷歌也有話要說(shuō)。

谷歌AI年，2025年三大技術(shù)向

今天，Google Cloud發(fā)布的一份44頁(yè)「2024 數(shù)據(jù)和AI趨勢(shì)報(bào)告」，直指AI智能體、多模態(tài)AI，企業(yè)搜索將成為2025年三大主導(dǎo)技術(shù)。

報(bào)告地址：https://services.google.com/fh/files/misc/data_ai_trends_report.pdf

多智能體將催生出一個(gè)巨大的市場(chǎng)機(jī)會(huì)

當(dāng)前，智能體已經(jīng)能夠獨(dú)立完成多步驟任務(wù)，而只有約10%的大公司已經(jīng)采用，另外82%公司計(jì)劃三年內(nèi)將智能體整合到工作流中。

谷歌云全球GenAI副總Oliver Parker表示，「不久的將來(lái)，你會(huì)看到不同智能體之間相互頻繁地交流協(xié)作」。

在谷歌，他們將智能體劃分為六個(gè)類：

- 面向客戶的智能體：用于了解客戶需求、回答與解決問(wèn)題并推薦相應(yīng)的產(chǎn)品和服務(wù)。它們支持跨多模態(tài)工作，可以分析語(yǔ)音與視頻內(nèi)容

- 員工智能體：有助于簡(jiǎn)化流程、管理重復(fù)性任務(wù)、解答問(wèn)題和文檔編輯與翻譯。

- 創(chuàng)意智能體：生成有助于設(shè)計(jì)、營(yíng)銷、文案等項(xiàng)目的內(nèi)容、圖像，提供靈感

- 數(shù)據(jù)智能體：可以在確保準(zhǔn)確性的基礎(chǔ)上，通過(guò)檢索與數(shù)據(jù)處理來(lái)協(xié)助研究和數(shù)據(jù)分析。

- 代碼智能體：支持代碼生成與提供輔助編碼

- 安全智能體：降低網(wǎng)絡(luò)攻擊的危害，或者加快安全漏洞的篩查速度

然而，Parker指出，過(guò)多的智能體同時(shí)處理多個(gè)流程，可能會(huì)導(dǎo)致系統(tǒng)的混亂。

他看到了這一現(xiàn)象背后蘊(yùn)藏著巨大的機(jī)遇，這將催生出全新的平臺(tái)——智能體治理。

「我們認(rèn)為一個(gè)巨大的機(jī)會(huì)即將到來(lái)，那就是一個(gè)能夠管理協(xié)調(diào)你各種智能體的平臺(tái)」，他講道，這將會(huì)催動(dòng)「智能體管理」或者需要一個(gè)支持「在不同系統(tǒng)中的任何地方都能提供不同服務(wù)的智能體層」。

人工智能發(fā)展的五大趨勢(shì)

多模態(tài)AI將會(huì)帶來(lái)千億美元市場(chǎng)

全球多模態(tài)人工智能市場(chǎng)在2025年估值為24億美元，預(yù)計(jì)到2037年底將達(dá)到989億美元。

多模態(tài)人工智能將人工智能的理解能力提升到一個(gè)新的水平，使模型能夠解讀和處理一系列數(shù)據(jù)源，不僅包括文本，還包括圖像、視頻和音頻。

目前一些主要的供應(yīng)商和前沿的初創(chuàng)公司已經(jīng)發(fā)布了許多功能強(qiáng)大的多模態(tài)工具，例如谷歌自己的Gemini 2.0 Flash、Mistral的Pixtral 12B或Cohere的Embed 3。谷歌預(yù)測(cè)，多模態(tài)人工智能的爆發(fā)將支持復(fù)雜的數(shù)據(jù)分析，并為人們帶來(lái)對(duì)于事物更深刻的基本認(rèn)識(shí)和更個(gè)性化的見(jiàn)解。

Parker指出，在過(guò)去的12個(gè)月里，企業(yè)已經(jīng)從單一模型轉(zhuǎn)變?yōu)獒槍?duì)不同的場(chǎng)景去部署多個(gè)模型，如Gemini、Anthropic、Mistral、Cohere、Llama等，而不僅僅是OpenAI模型。

雖然當(dāng)前谷歌云的重點(diǎn)依然大多在開(kāi)發(fā)上，但2025年的目標(biāo)則是讓企業(yè)級(jí)用戶自己掌握生成式人工智能能力。

目前企業(yè)已經(jīng)不僅僅只是關(guān)注模型本身，而且開(kāi)始分析不同的部署平臺(tái)并制定人工智能和智能體的規(guī)劃發(fā)展路線圖。Parker對(duì)此表示，這些通常是幾年內(nèi)才能看到的趨勢(shì)，但在12個(gè)月內(nèi)就快速呈現(xiàn)了，令人驚嘆。

企業(yè)級(jí)搜索大幅提高信息獲取效率

你是否還在苦惱于查詢工作文檔卻因忘記對(duì)應(yīng)關(guān)鍵詞而無(wú)法入手項(xiàng)目？

現(xiàn)在結(jié)合了生成式人工智能的企業(yè)搜索，再也不用局限于僅基于關(guān)鍵詞的查詢了。

你可以使用圖像、音頻、視頻或者是對(duì)話提示來(lái)快速查詢?cè)L問(wèn)企業(yè)內(nèi)部數(shù)據(jù)。毫無(wú)疑問(wèn)，這將讓搜索變得極其絲滑。

在實(shí)際工作中，人們往往是搜尋到相應(yīng)信息并將其整合以獲得見(jiàn)解，做出相應(yīng)決策，進(jìn)而采取行動(dòng)。由于許多組織的不同信息通常分散在不同的應(yīng)用程序中，而人工智能搜索可以快速跨越這些應(yīng)用程序?qū)?shù)據(jù)整合在一起，這就彰顯了結(jié)合生成式人工智能的企業(yè)搜索的巨大優(yōu)勢(shì)。

Gemini 2.0加持編碼助手，一鍵打通軟件開(kāi)發(fā)全流程

上周，谷歌發(fā)布的Gemini 2.0 Flash在編程基準(zhǔn)SWE-bench Verified上，刷新了SOTA。

它的性能完全碾壓滿血版o1、Claude 3.5 Sonnet，成為公認(rèn)的最強(qiáng)編碼AI。

就在今天，谷歌宣布在Gemini Code Assist中，集成最新模型Gemini 2.0 Flash，并推出了一系列工具。

由此，開(kāi)發(fā)者們可以將外部系統(tǒng)加入IDE，直接與GitHub、GitLab、Sentry、Google Chrome和Atlassian交互。

在此之前，Gemini Code Assist已經(jīng)接入了VS Code和JetBrains。

谷歌云產(chǎn)品管理高級(jí)總監(jiān)Ryan J. Salva表示，這個(gè)想法是為編碼任務(wù)擴(kuò)展更多的上下文，而不中斷工作流程。

開(kāi)發(fā)者只需進(jìn)入Code Assist聊天頁(yè)面，說(shuō)明需要處理的數(shù)據(jù)，然后LLM可以自動(dòng)從數(shù)據(jù)源查詢并對(duì)其分析。

為了給開(kāi)發(fā)者們提供便捷，谷歌計(jì)劃未來(lái)還將更多工具，直接集成到Gemini Code Assist中，比如可觀察性工具、安全軟件以及數(shù)據(jù)庫(kù)。

從ChatGPT可以協(xié)助編碼之后，人工智能編碼助手是GenAI的首批重要用例。GitHub、甲骨文、Harness紛紛推出了以企業(yè)為重點(diǎn)的編碼助手。

與此同時(shí)，OpenAI和Anthropic對(duì)外提供API接口，讓程序員直接在聊天平臺(tái)上編程。

比如，我們可以直接在ChatGPT中的Canvas運(yùn)行Python代碼，還能進(jìn)行交互性的編輯生成。

Anthropic推出的Claude Artifacts，與Canvas產(chǎn)品理念相同，皆是便于開(kāi)發(fā)者們生成、編輯和運(yùn)行代碼。

另外，OpenAI還在ChatGPT MacOS桌面應(yīng)用程序中添加了與VS Code、XCode、Terminal和iTerm 2等工具的集成。

據(jù)Gartner估計(jì)，「截止2028年，90%的企業(yè)軟件工程師將使用AI編碼助手，這一比例在2024年初還不到14%」。

谷歌宣稱，Gemini Code Assist企業(yè)版已超越了IDE中的AI編碼輔助功能，不僅可以理解本地代碼庫(kù)，還可以定制代碼，提供代碼建議。

它的定制功能可索引來(lái)自GitHub和GitLab的repos，并將于2025年初支持其他源碼控制系統(tǒng)和自托管的內(nèi)部repos。

同時(shí)，它還能完成復(fù)雜的任務(wù)，如在整個(gè)軟件包中升級(jí)Java版本。此外，企業(yè)版提供了企業(yè)級(jí)安全以及法律賠償條款。

在推出Gemini 2.0時(shí)，谷歌同步發(fā)布了編碼工具 Jules。

Salva表示Code Assist與其完全隔離，Code Assist仍是唯一由Gemini支持的通用企業(yè)級(jí)編碼工具。

參考資料：

https:///ai/google-ai-agents-multimodal-ai-enterprise-search-will-dominate-in-2025/

https:///ai/google-upgrades-its-programming-agent-code-assist-with-gemini-2-0-adds-source-integrations/

https:///kimmonismus/status/1869111765700853779

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：萬(wàn)皇之皇 > 《IT互聯(lián)》

舉報(bào)/認(rèn)領(lǐng)