核心結(jié)論 1、OpenAI、谷歌、微軟分別召開生態(tài)大會(huì)公布 AI 智能終端的最新進(jìn)展,海外多模態(tài)能力進(jìn)展基本符合預(yù)期。三家公司發(fā)布會(huì)集中在智能手機(jī)上進(jìn)行應(yīng)用演示,預(yù)示著消費(fèi)級端側(cè)AI應(yīng)用今年有望爆發(fā)。谷歌、微軟特別強(qiáng)調(diào)推出端側(cè)小模型。 2、OpenAI GPT-4o 通過手機(jī)展示了實(shí)時(shí)圖像生成、音頻描述和情緒識(shí)別功能,Google Project Astra通過Gemini Live展示了實(shí)時(shí)視頻輸入處理和對話功能。多模態(tài)能力將以更加擬人化的功能改變PC端、移動(dòng)端用戶的交互方式,C端殺手級應(yīng)用形態(tài)將聚焦為多模態(tài) AI 助手,徹底顛覆用戶的目前的交互方式。 3、蘋果首次推出M4的移動(dòng)版芯片,是目前第一塊采用臺(tái)積電 N3E 3nm 工藝加工的消費(fèi)級芯片產(chǎn)品。本年度硬件廠商持續(xù)加碼移動(dòng)端芯片性能提升,打響移動(dòng)Soc算力的軍備競賽,今年N3E工藝將成為各大芯片廠商本年度產(chǎn)能競爭的焦點(diǎn)。 OpenAI、谷歌、微軟發(fā)布會(huì)齊推端側(cè)AI新進(jìn)展OpenAI OpenAI在2024年的發(fā)布會(huì)上,展示了其在AI領(lǐng)域的最新進(jìn)展,特別是在智能手機(jī)等智能設(shè)備方面的應(yīng)用。以下是一些與AI智能設(shè)備相關(guān)的亮點(diǎn): 1、GPT-4o模型:OpenAI宣布推出了GPT-4o,這是一個(gè)性能顯著提升的模型,它在理解自然語言的復(fù)雜性和細(xì)微差別方面取得了進(jìn)步。這可能包括更好的理解雙關(guān)語、俚語、文化參照和上下文,這對于智能手機(jī)中的語音助手和智能交互功能來說是一個(gè)巨大的提升。 2、多模態(tài)能力:GPT-4o可能集成了圖像識(shí)別能力,使其能夠處理和理解視覺信息,這在多媒體內(nèi)容生成和分析方面具有巨大潛力。對于智能手機(jī)而言,這意味著更高級的圖像和視頻處理能力,以及更豐富的視覺交互體驗(yàn)。 3、集成至OpenAI產(chǎn)品生態(tài):GPT-4o的集成將提升OpenAI現(xiàn)有產(chǎn)品的智能化水平,并可能被用于開發(fā)新的應(yīng)用,如改進(jìn)的客戶服務(wù)聊天機(jī)器人、內(nèi)容創(chuàng)作助手等。這表明智能手機(jī)等設(shè)備將能夠提供更加個(gè)性化和精準(zhǔn)的服務(wù)。 谷歌 多模態(tài)和長文本是此次谷歌發(fā)布會(huì)的關(guān)鍵詞,5 月 15 日谷歌公司 I / O 2024 開發(fā)者大會(huì)核心要點(diǎn)如下: 1、推出了Gemini 1.5系列,包含Nano、Flash、Pro三個(gè)版本。Gemini 1.5 Pro長文本方面進(jìn)行了升級,擴(kuò)充了支持分析的數(shù)據(jù)量規(guī)模,上下文窗口將擴(kuò)展到200萬個(gè)token。 為適應(yīng)端側(cè)小模型,谷歌宣布安卓AI at the core計(jì)劃,積極將AI技術(shù)融入安卓系統(tǒng),集成Gemini Nano這一專為移動(dòng)設(shè)備打造的 Google 生成式AI的最小版本。Gemini Nano完全可在設(shè)備上運(yùn)行,實(shí)時(shí)監(jiān)聽“與詐騙常見的對話模式”。現(xiàn)場還演示了當(dāng)用戶收到不明詐騙電話時(shí),AI系統(tǒng)將自動(dòng)發(fā)出警報(bào),保障用戶免受詐騙風(fēng)險(xiǎn)。Gemini Nano在安卓系統(tǒng)中部署形態(tài),與三星S24中 AI 功能類似。 Gemini 1.5 Flash是次輕量級模型,F(xiàn)lash 與 Pro一樣強(qiáng)大,但是針對“狹窄,高頻,低延遲的任務(wù)”進(jìn)行了優(yōu)化??梢愿咝实夭渴?,上下文窗口可達(dá)100萬token。Gemini Flash 1.5相比于GPT-4o具有極高的性價(jià)比,其定價(jià)為每100萬個(gè)token35美分,遠(yuǎn)低于GPT-4o 5美元的價(jià)格。極低的調(diào)用成本無疑將大幅開發(fā)者的開發(fā)成本,一定程度上能夠加速AI消費(fèi)級應(yīng)用的出現(xiàn)。 2、多模態(tài)方面,推出原生多模態(tài)大模型項(xiàng)目 Project Astra。聯(lián)動(dòng) google 眼鏡,不折不扣的AI智能助手;Google同時(shí)新推出Gemini Live,類似GPT-4o支持語音對話;Google search,AI overview功能,支持視頻、文本多模態(tài)信息輸入。 3、AIGC 劍指 Sora,谷歌推出 Veo 文生視頻模型。利用prompt連續(xù)60s的高度一致性視頻。2D靜態(tài)圖片生成方面,更逼真的圖像生成模型Imagen 3發(fā)布 微軟 1、推出端側(cè)小模型 Phi-3:Phi-3 小模型專為移動(dòng)設(shè)備優(yōu)化,能夠輕松在手機(jī)和平板等移動(dòng)設(shè)備上高效運(yùn)行。Phi-3 系列中新增的 Phi-3-vision 是首個(gè)多模態(tài)模型,支持文本、圖像、視頻等多種數(shù)據(jù)類型的綜合處理,提供更加智能和多樣化的應(yīng)用體驗(yàn)。 2、推出搭載高通驍龍X系列芯片的 Copilot+PC:這款新設(shè)備支持高效的本地 AI 應(yīng)用運(yùn)行,無需依賴云端處理,處理能力達(dá)到每秒 40 萬億次操作,顯著提升了計(jì)算效率和響應(yīng)速度。這一進(jìn)展標(biāo)志著微軟和 Windows 正式開始擁抱 Arm 架構(gòu)的 CPU,開啟了 PC 端 AI 應(yīng)用的新紀(jì)元。Copilot+PC 集成了超過 40 個(gè)本地人工智能模型,其中包括 8 個(gè)用于生成式人工智能的小語言模型,這些模型為用戶提供了更強(qiáng)大的 AI 處理能力和更智能的使用體驗(yàn)。 3、軟件方面的持續(xù)升級:針對 Copilot 系統(tǒng)進(jìn)行了多次升級,新增了插件擴(kuò)展功能,使其應(yīng)用范圍更加廣泛。推出的 Team Copilot 大大提升了團(tuán)隊(duì)協(xié)作的效率,用戶可以更方便地共享和協(xié)同處理任務(wù)。此外,新增的自定義 Agent(AI 工程師)功能,能夠根據(jù)用戶的使用習(xí)慣和需求進(jìn)行自我學(xué)習(xí)和調(diào)整,提供個(gè)性化和智能化的服務(wù)。這些升級不僅增強(qiáng)了 Copilot 的功能,也為用戶帶來了更加便捷和智能的使用體驗(yàn)。 AI 助手對于手機(jī)、PC等端側(cè)設(shè)備的交互方式的變革具有劃時(shí)代意義AI智能終端預(yù)期大出貨量將在今年出現(xiàn)增長。根據(jù)Gartner的預(yù)測,到2024年,生成式AI智能手機(jī)的出貨量將占到基礎(chǔ)和高級智能手機(jī)出貨量的22%。這表明AI技術(shù)在智能手機(jī)領(lǐng)域的應(yīng)用正迅速增長,并將在未來幾年內(nèi)變得更加普及。Gartner還預(yù)計(jì)2024年P(guān)C的總出貨量將達(dá)到2.504億臺(tái),較2023年增長3.5%,而智能手機(jī)出貨量將增長4.2%,達(dá)到年度總量12億臺(tái)。這一增長反映了AI技術(shù)在個(gè)人計(jì)算設(shè)備中的日益重要性。 “端云結(jié)合”或?qū)⒖焖偾袚Q至端側(cè)AI在之前的文章我我們提到:“端云結(jié)合”成 AI 手機(jī)技術(shù)實(shí)現(xiàn)的高可靠性路徑,但是近期行業(yè)的進(jìn)展似乎預(yù)示著純端側(cè)AI即將到來。因此我們認(rèn)為,隨著Soc AI算力提升軍備競賽持續(xù),芯片算力與大模型體量正在逐漸適配,端側(cè)AI應(yīng)用即將爆發(fā)。 硬件側(cè)芯片廠商發(fā)力不斷延展Soc算力性能,臺(tái)積電N3E產(chǎn)能將成寶貴資源 近期的標(biāo)志性事件是蘋果最新的M4芯片發(fā)布,該芯片基于臺(tái)積電第二代3nm工藝打造,架構(gòu)上M4具有10個(gè)CPU(4性能+6效能)+10個(gè)GPU核心+16個(gè)NPU。NPU算力達(dá)到了38TOPS,相較M3提升了110%,統(tǒng)一內(nèi)存帶寬達(dá)到了120GB/s。Geekbench 數(shù)據(jù)庫網(wǎng)站顯示M4(10-CPU)版主頻最高為4.41GHz,極客灣測試M4大核頻率最高達(dá)4.5GHz,接近 Intel Core Ultra 5的水平,單核性能已經(jīng)能夠與 i9-14900K 進(jìn)行較量。據(jù)官方稱,M4具備高效運(yùn)行70B大模型的能力。 盡管發(fā)布驍龍8gen3以及X elite芯片后,高通的移動(dòng)端芯片市占率維持不斷上升。但是此次蘋果M4的發(fā)布,一定程度上也為高通帶來壓力。盡管目前移動(dòng)端需求前景仍然模糊,但是端側(cè)算力的“軍備競賽”仍未停止。據(jù)消息源 Jasonwill101 透露,高通公司目前正在重新設(shè)計(jì)驍龍 8 Gen 4 處理器,新的目標(biāo)頻率為 4.26GHz,這一變化主要是為了應(yīng)對蘋果 M4 / A18 / Pro 處理器。據(jù)悉,高通公司對重新設(shè)計(jì)的處理器保持樂觀,他們認(rèn)為得益于臺(tái)積電的 3 納米“N3E”工藝,驍龍 8 Gen 4 的確有望能夠達(dá)到相關(guān)目標(biāo)頻率。今年臺(tái)積電N3E工藝將成為下游芯片廠商競爭競爭的焦點(diǎn)。 端側(cè)小模型發(fā)展的加速 不僅是谷歌在降低大模型調(diào)用售價(jià),近期618預(yù)熱期間,中國大模型廠商紛紛調(diào)低大模型售價(jià)。阿里通義大模型降價(jià)最高幅度達(dá)97%。 谷歌推出Gemini Nano & Flash,微軟推出端側(cè)小模型 Phi-3甚至包括OpenAI的GPT-4o都將推進(jìn)小模型側(cè)著重發(fā)力,與智能終端深度結(jié)合,加之大模型接口成本由于價(jià)格戰(zhàn)在不斷下降、端側(cè)小模型的持續(xù)涌現(xiàn),應(yīng)用側(cè)高性能 AI 助手軟件落地將獲得三個(gè)方向的加速。 未來,端側(cè) AI 應(yīng)用將更快到來,“端云結(jié)合”模式也將逐漸向純端側(cè)AI過渡,至少端側(cè) AI 的成分占比將越來越大。隨著SoC AI算力的提升,端側(cè)AI應(yīng)用場景將不斷豐富,智能終端將能夠獨(dú)立完成更多復(fù)雜的任務(wù)。各大公司在端側(cè)小模型上的發(fā)力,為用戶帶來更加智能和便捷的體驗(yàn)。 AI手機(jī)同質(zhì)化嚴(yán)重,缺乏創(chuàng)新力,交互方式的變化將是解法之一近期 VIVO 發(fā)布旗艦超大杯 X100 Ultra,主打的硬件性能仍然是1英寸主攝。目前各家旗艦手機(jī)攝像頭仍然在不斷迭代。這實(shí)際上表明著一種手機(jī)廠商的情緒,將影像性能仍然是優(yōu)于 AI 功能之前的。 這種狀況其實(shí)從2019年開始就已經(jīng)開始持續(xù),新款手機(jī)之間的比較實(shí)際上就是在比影像性能,手機(jī)需求似乎等同于影像需求。顯然影像需求不會(huì)是終極需求,影像的規(guī)格總有一天會(huì)觸及到極限。 過去幾年,全球智能手機(jī)的換機(jī)周期有所延長。大約在2015年左右,智能手機(jī)的平均換機(jī)周期大約是2年左右,這主要是受到運(yùn)營商合約和技術(shù)更新的影響。然而,隨著智能手機(jī)技術(shù)的成熟和市場飽和,更新?lián)Q代的驅(qū)動(dòng)力減弱,加之經(jīng)濟(jì)因素的考慮,這個(gè)周期逐漸延長。根據(jù)TechInsights測算,2023 年全球智能手機(jī)的換機(jī)率可能會(huì)跌至 23.5%(換機(jī)周期為 51 個(gè)月)的最低點(diǎn)。一些市場研究機(jī)構(gòu)報(bào)告指出,到2020年,美國用戶的平均手機(jī)更換周期已接近3年。 24年初從三星S24開始,AI 手機(jī)的概念開始廣泛普及開來。 然而在當(dāng)下5月份這個(gè)時(shí)間節(jié)點(diǎn),市場面對的一個(gè)問題就是 AI 手機(jī)功能的同質(zhì)化問題,隨著端側(cè) AI 應(yīng)用場景的模糊愈發(fā)明顯。這其中包含的模糊不僅僅是手機(jī)與手機(jī)間的,還包含端側(cè)與云端、硬件與軟件之間的功能同質(zhì)化。究其主要原因還是算力與創(chuàng)新性的不足,算力的不足導(dǎo)致云側(cè)、端側(cè)體驗(yàn)類似;創(chuàng)新性不足導(dǎo)致不同品牌之間的差距不大。 這種狀態(tài)的持續(xù),造成了用戶對于所謂“AI功能”已經(jīng)感到鈍化和疲倦。Gartner分析師Atwal認(rèn)為,AIGC功能隨著大眾化的普及,用戶期待將被進(jìn)一步拉高。在沒有任何突破性應(yīng)用的情況下,用戶不太可能為生成式AI智能手機(jī)支付額外的費(fèi)用。 目前的觀點(diǎn)是:AI 助手對于手機(jī)、PC等端側(cè)設(shè)備的意義體現(xiàn)在交互方式的變化。智能終端AI助手最終會(huì)促進(jìn)語音、眼神注意等新型交互方式落地,在關(guān)鍵應(yīng)用場景下(通話、娛樂、生產(chǎn)力)情形下,無延遲、高效取代當(dāng)前的手勢、鍵鼠交互方式,將總體用戶體驗(yàn)提升到一個(gè)新的高度。 谷歌在發(fā)布會(huì)上宣布將重新構(gòu)建以人工智能為中心的安卓系統(tǒng),讓Gemini在安裝系統(tǒng)中具有感知上下文能力,預(yù)測你正在嘗試做什么,并立即給出有用的建議。谷歌此次發(fā)布會(huì)一個(gè)細(xì)節(jié)的點(diǎn)是谷歌開放了官方的視覺攝像頭接口,能夠供開發(fā)者調(diào)用,其直接的影響就是促進(jìn)視覺交互的產(chǎn)生,這將會(huì)是AI助手的一種形態(tài)。 安卓系統(tǒng)將全面布局 AI,Google 最新的設(shè)備端模型:Gemini Nano 多模態(tài)模型,它可以處理文本、圖像、音頻和語音,在保證存儲(chǔ)在設(shè)備上的信息私密性的同時(shí)解鎖新的體驗(yàn)。 到目前為止,安卓陣營在AI軟硬件層面相較蘋果仍然保持領(lǐng)先地位。然而回望彼時(shí)的蘋果第一代 iPhone ,其劃時(shí)代的意義就是開辟了與以往手機(jī)不同的交互方式,滑動(dòng)解鎖、手勢操作驚艷眾人,實(shí)現(xiàn)了智能手機(jī)真正意義上的跨代。此時(shí),我們認(rèn)為隨著 AI 助手的落地,新的交互方式將是真正促成AI手機(jī)出貨量爆發(fā)的重要?jiǎng)右颉?/span> |
|