編輯:編輯部 【新智元導(dǎo)讀】在這場(chǎng)如火如荼的AI軍備競(jìng)賽中,谷歌在年底徹底打響翻身仗,成功逆襲!Google Cloud于近日也發(fā)布了一份44頁(yè)「2024 數(shù)據(jù)和AI趨勢(shì)報(bào)告」,直指AI智能體、多模態(tài)AI,企業(yè)搜索將成為2025年三大主導(dǎo)技術(shù)。逆襲之戰(zhàn)開(kāi)啟,谷歌用90天重回巔峰! 短短90天,谷歌就從業(yè)內(nèi)笑柄,逆襲成突破最大、產(chǎn)品最顛覆的科技大公司。 用AI初創(chuàng)創(chuàng)始人Ole Lehmann的話說(shuō),「我們正在見(jiàn)證2024年最大的科技轉(zhuǎn)變」。 如今,前方是捷報(bào)頻傳。 根據(jù)OpenRouterAI的數(shù)據(jù),Google Gemini在開(kāi)發(fā)者中的市場(chǎng)份額從9月份的約5%,上升到了上周的>50%市場(chǎng)份額。 Google Gemini系列在OpenRouterAI的趨勢(shì)排行中獨(dú)占鰲頭,遠(yuǎn)超其他模型。 在被公認(rèn)是下一個(gè)AI前沿的智能體領(lǐng)域,谷歌的Project Mariner,可以直接讓Gemini控制我們的瀏覽器,自行執(zhí)行任務(wù)!直接一步跨越到人機(jī)交互的未來(lái)。 驚人之處在于,Mariner是一個(gè)真正可以在瀏覽器上完成復(fù)雜任務(wù)而不會(huì)失敗的AI。預(yù)定航班、定餐館,它都可以通過(guò)在屏幕上看到的內(nèi)容完成操作。 此外,谷歌的Project Astra的早期測(cè)試報(bào)告結(jié)果也令人興奮不已。 受邀參加項(xiàng)目測(cè)試的Linus Ekenstam表示,這一天很快就會(huì)到來(lái):人手一個(gè)AI私人助理,而且它們無(wú)所不在。 我們會(huì)嚴(yán)重依賴這些AI助手,甚至在2025年,人類發(fā)展格局都會(huì)被帶來(lái)重大改變。 更不用說(shuō),就在昨天放出的AI視頻模型Veo 2.0,無(wú)論是在物理學(xué)、質(zhì)量還是指令遵循上,效果都妥妥吊打Sora,全網(wǎng)測(cè)試,為之瘋狂。 有人實(shí)測(cè)Veo 2和Sora后直言:這是自行車和宇宙飛船的區(qū)別 現(xiàn)在,市場(chǎng)已經(jīng)給出了反應(yīng),在過(guò)去一個(gè)月內(nèi),谷歌的市值直接上漲了14%。 不再追逐頭條,而是集中精力做產(chǎn)品、注重實(shí)用性的谷歌,已經(jīng)成為了OpenAI真正的可怕對(duì)手。 突然逆襲,重拳反擊OpenAI 曾被認(rèn)為遙遙領(lǐng)先的OpenAI,正面臨著來(lái)自谷歌的迎頭痛擊。 網(wǎng)友Chubby做了一篇長(zhǎng)文分析,指出兩個(gè)AI巨頭的對(duì)戰(zhàn)潮流正在轉(zhuǎn)向。 聲明:目前一切都還未定論,我的分析僅是對(duì)現(xiàn)狀的一瞥 早在2017年,Sam Altman在一次郵件交流中就明確表示,谷歌DeepMind是在AGI競(jìng)爭(zhēng)中最大的對(duì)手。 當(dāng)時(shí),他還未能預(yù)見(jiàn)其他玩家會(huì)加入這場(chǎng)競(jìng)爭(zhēng)。不過(guò),估值180億美金Anthropic的崛起,證明了新玩家也能翻身成巨頭。 Meta通過(guò)「開(kāi)源」(雖然并非真正的開(kāi)源)另辟蹊徑,避免了與谷歌占據(jù)主導(dǎo)地位路線的直接競(jìng)爭(zhēng)。 ChatGPT如同一匹黑馬,自2022年橫空出世以來(lái),OpenAI一直牢牢掌握著AI的話語(yǔ)權(quán)。與此同時(shí),ChatGPT成為了「AI」的代名詞。 憑借此,奧特曼帶領(lǐng)著團(tuán)隊(duì)迅速征服消費(fèi)市場(chǎng),甚至直接帶飛了微軟。 然而,谷歌卻在這場(chǎng)競(jìng)賽中措手不及,連連敗北。 最初的幾輪交鋒中,谷歌試圖通過(guò)Gemini去挽救落下的成績(jī),并期望以此獲得市場(chǎng)青睞,但總是未能如意。 此前,AI Overview總結(jié)能力大翻車,遭到網(wǎng)友連連的吐槽。 比如,建議孕婦吸煙、建議自殺跳橋、建議用膠水將膠水和披薩固定在一起.... 各種荒謬的建議,簡(jiǎn)直震碎三觀。 上半場(chǎng)的比賽中,谷歌徹底輸?shù)袅恕?/span> 更耐人尋味的是,OpenAI幾乎毫不費(fèi)力,每次都能在谷歌發(fā)布新產(chǎn)品前后搶盡風(fēng)頭。即便在模型推理能力上,到目前為止,OpenAI也一直是遙遙領(lǐng)先。 人們不理解的是,谷歌DeepMind擁有世界上最好的資源,為什么會(huì)在這場(chǎng)競(jìng)爭(zhēng)中略顯得倉(cāng)促和被動(dòng)? 與OpenAI不同,他們有大量用于訓(xùn)練推理的TPU、更多的訓(xùn)練數(shù)據(jù)(比如YouTube),以及DeepMind這個(gè)世界級(jí)研究機(jī)構(gòu)和頂尖人才。 DeepMind團(tuán)隊(duì)也在努力用實(shí)力,去證明這一切。在科學(xué)領(lǐng)域,AlphaFold、GenCast等等,取得了難以置信的成就。 但這些研究成果,在消費(fèi)市場(chǎng)上并沒(méi)有給谷歌帶去任何實(shí)質(zhì)性的幫助。 甚至,就連Anthropic這樣后來(lái)者,也贏得了AI社區(qū)更多關(guān)注和支持。 然而,這種局勢(shì)在12月發(fā)生了戲劇性的逆轉(zhuǎn)。突然間,谷歌發(fā)力給OpenAI來(lái)了當(dāng)頭一棒。 就在OpenAI接連獻(xiàn)上12天產(chǎn)品秀之際,谷歌推出了兩款驚艷的模型——Gemini 2.0 Flash和Veo 2。 Gemini 2.0 Flash在所有基準(zhǔn)測(cè)試中,超越了GPT-4。 AI視頻模型Veo 2直接吊打Sora,展現(xiàn)出令人驚嘆的物理世界理解能力。 它還能根據(jù)提示中的方程式2x-1=0,直接生成出得到解答x=1/2的視頻。 相較之下,Sora的生成簡(jiǎn)直一言難盡。 關(guān)于新模型的亮相,谷歌并沒(méi)有做任何事先的炒作和預(yù)熱,用低調(diào)有力的方式做出了反擊。 而對(duì)于,過(guò)去一年總結(jié),和未來(lái)一年技術(shù)預(yù)測(cè),谷歌也有話要說(shuō)。 谷歌AI年,2025年三大技術(shù)向 今天,Google Cloud發(fā)布的一份44頁(yè)「2024 數(shù)據(jù)和AI趨勢(shì)報(bào)告」,直指AI智能體、多模態(tài)AI,企業(yè)搜索將成為2025年三大主導(dǎo)技術(shù)。 報(bào)告地址:https://services.google.com/fh/files/misc/data_ai_trends_report.pdf 多智能體將催生出一個(gè)巨大的市場(chǎng)機(jī)會(huì)當(dāng)前,智能體已經(jīng)能夠獨(dú)立完成多步驟任務(wù),而只有約10%的大公司已經(jīng)采用,另外82%公司計(jì)劃三年內(nèi)將智能體整合到工作流中。 谷歌云全球GenAI副總Oliver Parker表示,「不久的將來(lái),你會(huì)看到不同智能體之間相互頻繁地交流協(xié)作」。 在谷歌,他們將智能體劃分為六個(gè)類: - 面向客戶的智能體:用于了解客戶需求、回答與解決問(wèn)題并推薦相應(yīng)的產(chǎn)品和服務(wù)。它們支持跨多模態(tài)工作,可以分析語(yǔ)音與視頻內(nèi)容 - 員工智能體:有助于簡(jiǎn)化流程、管理重復(fù)性任務(wù)、解答問(wèn)題和文檔編輯與翻譯。 - 創(chuàng)意智能體:生成有助于設(shè)計(jì)、營(yíng)銷、文案等項(xiàng)目的內(nèi)容、圖像,提供靈感 - 數(shù)據(jù)智能體:可以在確保準(zhǔn)確性的基礎(chǔ)上,通過(guò)檢索與數(shù)據(jù)處理來(lái)協(xié)助研究和數(shù)據(jù)分析。 - 代碼智能體:支持代碼生成與提供輔助編碼 - 安全智能體:降低網(wǎng)絡(luò)攻擊的危害,或者加快安全漏洞的篩查速度 然而,Parker指出,過(guò)多的智能體同時(shí)處理多個(gè)流程,可能會(huì)導(dǎo)致系統(tǒng)的混亂。 他看到了這一現(xiàn)象背后蘊(yùn)藏著巨大的機(jī)遇,這將催生出全新的平臺(tái)——智能體治理。 「我們認(rèn)為一個(gè)巨大的機(jī)會(huì)即將到來(lái),那就是一個(gè)能夠管理協(xié)調(diào)你各種智能體的平臺(tái)」,他講道,這將會(huì)催動(dòng)「智能體管理」或者需要一個(gè)支持 「在不同系統(tǒng)中的任何地方都能提供不同服務(wù)的智能體層」。 人工智能發(fā)展的五大趨勢(shì) 多模態(tài)AI將會(huì)帶來(lái)千億美元市場(chǎng)全球多模態(tài)人工智能市場(chǎng)在2025年估值為24億美元,預(yù)計(jì)到2037年底將達(dá)到989億美元。 多模態(tài)人工智能將人工智能的理解能力提升到一個(gè)新的水平,使模型能夠解讀和處理一系列數(shù)據(jù)源,不僅包括文本,還包括圖像、視頻和音頻。 目前一些主要的供應(yīng)商和前沿的初創(chuàng)公司已經(jīng)發(fā)布了許多功能強(qiáng)大的多模態(tài)工具,例如谷歌自己的Gemini 2.0 Flash、Mistral的Pixtral 12B或Cohere的Embed 3。谷歌預(yù)測(cè),多模態(tài)人工智能的爆發(fā)將支持復(fù)雜的數(shù)據(jù)分析,并為人們帶來(lái)對(duì)于事物更深刻的基本認(rèn)識(shí)和更個(gè)性化的見(jiàn)解。 Parker指出,在過(guò)去的12個(gè)月里,企業(yè)已經(jīng)從單一模型轉(zhuǎn)變?yōu)獒槍?duì)不同的場(chǎng)景去部署多個(gè)模型,如Gemini、Anthropic、Mistral、Cohere、Llama等,而不僅僅是OpenAI模型。 雖然當(dāng)前谷歌云的重點(diǎn)依然大多在開(kāi)發(fā)上,但2025年的目標(biāo)則是讓企業(yè)級(jí)用戶自己掌握生成式人工智能能力。 目前企業(yè)已經(jīng)不僅僅只是關(guān)注模型本身,而且開(kāi)始分析不同的部署平臺(tái)并制定人工智能和智能體的規(guī)劃發(fā)展路線圖。Parker對(duì)此表示,這些通常是幾年內(nèi)才能看到的趨勢(shì),但在12個(gè)月內(nèi)就快速呈現(xiàn)了,令人驚嘆。 企業(yè)級(jí)搜索大幅提高信息獲取效率你是否還在苦惱于查詢工作文檔卻因忘記對(duì)應(yīng)關(guān)鍵詞而無(wú)法入手項(xiàng)目? 現(xiàn)在結(jié)合了生成式人工智能的企業(yè)搜索,再也不用局限于僅基于關(guān)鍵詞的查詢了。 你可以使用圖像、音頻、視頻或者是對(duì)話提示來(lái)快速查詢?cè)L問(wèn)企業(yè)內(nèi)部數(shù)據(jù)。毫無(wú)疑問(wèn),這將讓搜索變得極其絲滑。 在實(shí)際工作中,人們往往是搜尋到相應(yīng)信息并將其整合以獲得見(jiàn)解,做出相應(yīng)決策,進(jìn)而采取行動(dòng)。由于許多組織的不同信息通常分散在不同的應(yīng)用程序中,而人工智能搜索可以快速跨越這些應(yīng)用程序?qū)?shù)據(jù)整合在一起,這就彰顯了結(jié)合生成式人工智能的企業(yè)搜索的巨大優(yōu)勢(shì)。 Gemini 2.0加持編碼助手,一鍵打通軟件開(kāi)發(fā)全流程 上周,谷歌發(fā)布的Gemini 2.0 Flash在編程基準(zhǔn)SWE-bench Verified上,刷新了SOTA。 它的性能完全碾壓滿血版o1、Claude 3.5 Sonnet,成為公認(rèn)的最強(qiáng)編碼AI。 就在今天,谷歌宣布在Gemini Code Assist中,集成最新模型Gemini 2.0 Flash,并推出了一系列工具。 由此,開(kāi)發(fā)者們可以將外部系統(tǒng)加入IDE,直接與GitHub、GitLab、Sentry、Google Chrome和Atlassian交互。 在此之前,Gemini Code Assist已經(jīng)接入了VS Code和JetBrains。 谷歌云產(chǎn)品管理高級(jí)總監(jiān)Ryan J. Salva表示,這個(gè)想法是為編碼任務(wù)擴(kuò)展更多的上下文,而不中斷工作流程。 開(kāi)發(fā)者只需進(jìn)入Code Assist聊天頁(yè)面,說(shuō)明需要處理的數(shù)據(jù),然后LLM可以自動(dòng)從數(shù)據(jù)源查詢并對(duì)其分析。 為了給開(kāi)發(fā)者們提供便捷,谷歌計(jì)劃未來(lái)還將更多工具,直接集成到Gemini Code Assist中,比如可觀察性工具、安全軟件以及數(shù)據(jù)庫(kù)。 從ChatGPT可以協(xié)助編碼之后,人工智能編碼助手是GenAI的首批重要用例。GitHub、甲骨文、Harness紛紛推出了以企業(yè)為重點(diǎn)的編碼助手。 與此同時(shí),OpenAI和Anthropic對(duì)外提供API接口,讓程序員直接在聊天平臺(tái)上編程。 比如,我們可以直接在ChatGPT中的Canvas運(yùn)行Python代碼,還能進(jìn)行交互性的編輯生成。 Anthropic推出的Claude Artifacts,與Canvas產(chǎn)品理念相同,皆是便于開(kāi)發(fā)者們生成、編輯和運(yùn)行代碼。 另外,OpenAI還在ChatGPT MacOS桌面應(yīng)用程序中添加了與VS Code、XCode、Terminal和iTerm 2等工具的集成。 據(jù)Gartner估計(jì),「截止2028年,90%的企業(yè)軟件工程師將使用AI編碼助手,這一比例在2024年初還不到14%」。 谷歌宣稱,Gemini Code Assist企業(yè)版已超越了IDE中的AI編碼輔助功能,不僅可以理解本地代碼庫(kù),還可以定制代碼,提供代碼建議。 它的定制功能可索引來(lái)自GitHub和GitLab的repos,并將于2025年初支持其他源碼控制系統(tǒng)和自托管的內(nèi)部repos。 同時(shí),它還能完成復(fù)雜的任務(wù),如在整個(gè)軟件包中升級(jí)Java版本。此外,企業(yè)版提供了企業(yè)級(jí)安全以及法律賠償條款。 在推出Gemini 2.0時(shí), 谷歌同步發(fā)布了編碼工具 Jules。 Salva表示Code Assist與其完全隔離,Code Assist仍是唯一由Gemini支持的通用企業(yè)級(jí)編碼工具。 參考資料: https:///ai/google-ai-agents-multimodal-ai-enterprise-search-will-dominate-in-2025/ https:///ai/google-upgrades-its-programming-agent-code-assist-with-gemini-2-0-adds-source-integrations/ https:///kimmonismus/status/1869111765700853779 |
|
來(lái)自: 萬(wàn)皇之皇 > 《IT互聯(lián)》