硬件是中國的主場 在今年前9個月見過的108個團隊中,具身智能項目有14個,AI硬件項目8個,XR相關(guān)5個,共占25%。相較于軟件,偏硬件的賽道國內(nèi)團隊優(yōu)勢更加明顯,特別是AI硬件方向大多圍繞深圳世界領(lǐng)先的供應(yīng)鏈生態(tài)打造團隊。我們也正與兩家企業(yè)深入接洽。 點擊關(guān)注,每天更新深度 AI 行業(yè)洞察 01AI 硬件需要明確的基本原則原則#1 這一波AI硬件將由軟件驅(qū)動 我在上一篇分享中提到新交互方式出現(xiàn)前現(xiàn)階段AI應(yīng)用依然是移動互聯(lián)網(wǎng)邏輯?;仡櫼苿踊ヂ?lián)網(wǎng)時代,4G/5G的成熟在底層技術(shù)架構(gòu)上為短視頻等高信息密度應(yīng)用的新形態(tài)打下了基礎(chǔ),而iPhone開創(chuàng)的觸控交互體驗真正為應(yīng)用的繁榮打開了大門。 蘋果也因為在交互模式上的創(chuàng)新獲得了移動互聯(lián)網(wǎng)時代最大的紅利,時至今日依然可以向軟件生態(tài)征收“蘋果稅”。強如Meta,幾乎盤踞了海外C端流量和廣告收入,也因為缺乏硬件設(shè)備而如鯁在喉。Zuckerberg近年來在Reality Labs上的激進投入,狂燒500億美金就是為了占據(jù)下一個時代的硬件入口/計算中心。 在當(dāng)前格局下, Google ,Meta,蘋果和字節(jié)跳動等移動互聯(lián)網(wǎng)巨頭從硬件到軟件牢牢把持了用戶生態(tài),并基于計算中心/物理空間、流量/網(wǎng)絡(luò)效應(yīng)、時間/用戶習(xí)慣這幾個核心要素形成了深厚的壁壘。如果這個局面不被打破,AI大模型技術(shù)將停留在更先進的生產(chǎn)工具('enabler”)定位,從結(jié)果上豐富了移動互聯(lián)網(wǎng)生態(tài)的內(nèi)容供給和用戶體驗,“為他人做嫁衣”。科技巨頭依然是最大受益者,過去5年強者恒強的局面將會延續(xù)。 過去五年科技巨頭市場份額不斷提升 因此針對AI大模型重新設(shè)計的硬件和交互將是GenAI時代挑戰(zhàn)者必須攻克的堡壘。這也是為什么Sam Altman很早就聯(lián)系傳奇設(shè)計師Jony Ive開始在硬件方向進行探索。 事實上這樣的嘗試對挑戰(zhàn)者來說從未停止。在硬件層面,智能手表、TWS耳機成為體量可觀的新硬件品類,但沒有擺脫手機配件的定位。在軟件層面,前兩年大熱的crypto在某種意義上創(chuàng)造了新的獲客貨幣,在高企的流量紅海中提供了一種bootstrap的可能性,但因為缺乏后續(xù)承接能力而已失敗告終。直到AI大模型技術(shù)在最近兩年取得突破,特別是GPT4o在多模態(tài)領(lǐng)域的進展讓人們看到了一絲希望:軟件突破帶來的智慧和擬人感如同一道「魔法」給硬件賦予生命。 軟件帶來的變量主要體現(xiàn)在以下兩個方面 AI硬件的三層架構(gòu) 在原生多模態(tài)AI大模型出現(xiàn)后,結(jié)合硬件會出現(xiàn)新的信息交互和處理模式,大體上可以分為三個層次(為表述方便下稱“AI硬件三層架構(gòu)”):
在這三層架構(gòu)中,計算中心(如手機)將為AI大模型提供端側(cè)和云端運行能力,而AI大模型技術(shù)的能力進步驅(qū)動整個閉環(huán)用戶體驗的提升,具體表現(xiàn)為讓硬件在原有功能的基礎(chǔ)上拓展能力邊界,在第三層輸出更好的效果。反過來中間層需要硬件作為傳感器獲得更多context來更好地輸出模型運算結(jié)果。 現(xiàn)階段AI硬件,特別是新品類新團隊的機會大多在第一層,即新式傳感器,但長期中如果不能將價值向第二和第三層延伸,則會陷入消費電子卷成本的深淵無限競爭(參考激光雷達(dá)之于自動駕駛)。 LUI是否能成為下一代交互方式 「The UI of AGI」是AI硬件從業(yè)者需要思考的圣杯問題。 “套殼”其實就是一種最直接的嘗試,Arc瀏覽器,Perplexity,Monica.im都在各個方向積極探索。但LUI(Language User Interface)或者基于語音的交互方式(Voice-first UI)是否能取代觸控時代主流的GUI(Graphical User Interface)是在行業(yè)內(nèi)被討論最多的問題。 我認(rèn)為GPT4o為代表的低延遲、多情感、高智能原生多模態(tài)模型雖然為LUI的落地提供了技術(shù)支持,并在某些特定場景有較好的體驗,但現(xiàn)在看起來LUI并不能獨立成為最主流的交互方式。我認(rèn)為思考這個問題的關(guān)鍵因素是I/O密度。I即input,指在人機交互中用戶向系統(tǒng)輸入信息。O即output,指系統(tǒng)向用戶反饋信息。 在I端,LUI能很好地解決當(dāng)下信息輸入門檻過高的問題,陣列麥克風(fēng)技術(shù)的發(fā)展配合AI大模型的多語言識別和總結(jié)能力,讓用戶在I端更加輕松自如(flowvoice.ai等公司已經(jīng)有產(chǎn)品落地)。 但在O端,LUI的信息密度有很大的局限,特別是與GUI相比。Vela在「Voice-first,閉關(guān)做一款語音產(chǎn)品的思考」中做了詳細(xì)的解析。 聲音在交互上的局限性主要表現(xiàn)在: 1. 輸出線性
2. 記不住
在音頻自身限制和AI大模型現(xiàn)階段長程推理能力缺失的情況下,LUI目前只適合做目標(biāo)明確的單點任務(wù),且輸出結(jié)果信息密度不宜過高。從數(shù)據(jù)上看,天貓精靈使用最多的場景是詢問天氣和設(shè)定鬧鐘。鋼鐵俠的Javis形態(tài)目前在技術(shù)邊界之外。 因此,LUI配合GUI結(jié)合使用我認(rèn)為是能將I/O密度最大化的交互體驗。 原則#3「Less is more」 在確定產(chǎn)品方向時,務(wù)必要遵守「less is more」的原則,能用一個產(chǎn)品覆蓋的功能,絕不做兩個設(shè)備,特別是在個人便攜設(shè)備品類。理想的方式是做品類和功能之間的整合,如在智能眼鏡中整合耳機和音頻功能,而不是在用戶有限的褲兜/手包里再裝進一個產(chǎn)品。 另一方面,特別是對可穿戴設(shè)備,輕量化是最重要的設(shè)計標(biāo)準(zhǔn),在現(xiàn)有電池密度和芯片功耗有限的邊界下,每添加一項功能都會造成額外的配重和續(xù)航消耗。取舍是產(chǎn)品定義中最重要的課題。 02方向1:「手機 傳感器」 生態(tài)iPhone取代了諾基亞的歷史地位,但并沒有從本質(zhì)上改變手機的物理形態(tài)。類似的,在短期內(nèi),搭載端測模型能力后手機將繼續(xù)占據(jù)雙手的使用場景,依然是主要的核心生態(tài)位。 實踐中也有很明確的例證:
手機在AI硬件三層架構(gòu)可以在一定程度上覆蓋所有三個維度,并占據(jù)計算中心的核心價值位。現(xiàn)階段對其他硬件設(shè)備的主要機會在于成為手機的傳感器,收集手機目前尚不能覆蓋的細(xì)分場景信息 - 主要是息屏、用戶雙手被占用無法拿起手機、無法快速開啟手機內(nèi)置傳感器(為描述方便,下文統(tǒng)稱“手機空白場景”)- 并嘗試探索新的交互體驗。 在這樣的系統(tǒng)設(shè)定下,可穿戴設(shè)備最適合扮演傳感器的角色。而人本身的信號傳感器 – 眼、耳、鼻都集中位于頭部 – 圍繞頭部的可穿戴設(shè)備必將成為必爭之地。今年5月,我在社交媒體即刻上轉(zhuǎn)發(fā)了下面這張圖,非常生動地展示了這個事實。 但需要明確的是,由于輕量化和目前硬件技術(shù)的瓶頸,可穿戴設(shè)備都難以獨立支撐好的用戶體驗(包括眼鏡在內(nèi)),需要和手機配合使用。 輕量化是穿戴設(shè)備成功的金標(biāo)準(zhǔn)。 因為要補充手機空白場景,長時間使用(“always on/available”)是對穿戴設(shè)備作為傳感器功能的核心要求。同等條件下,用手機能更快地捕獲信息并進行輸入,穿戴設(shè)備就會變成累贅。因此,輕量化無感佩戴是這類產(chǎn)品能否普及必須實現(xiàn)的目標(biāo)。在圍繞頭的穿戴品類中,主要有手表、耳機、眼鏡、掛件、戒指、手環(huán)等。這些產(chǎn)品大多都是成熟品類,在好的基礎(chǔ)體驗上創(chuàng)新也符合「 AI」的策略。 久謙咨詢對這些品類的市場規(guī)模做了如下估算: 在個人便攜式設(shè)備中,數(shù)碼相機和運動相機較難滿足長時間無感佩戴(一定程度上可以被眼鏡覆蓋),且市場集中度高。對AI硬件團隊來說,市場足夠大的品類依次是耳機、智能手表、眼鏡和配飾類設(shè)備。 整個智能穿戴設(shè)備生態(tài)都脫離不了一個主題:Survival is the name of the game 第一種路線考驗的是團隊的執(zhí)行力,需要面對的競爭包括:
在可穿戴設(shè)備的眾多品類中,我最看好眼鏡這個品類,因此獨立一個小節(jié)進行分析。 智能眼鏡:連接人類與機器的第三只眼? 在展開討論之前,需要明確的是,這里討論的智能眼鏡主要是Rayban Meta的形態(tài)。這不是一款A(yù)I眼鏡(至少現(xiàn)在不是),而是以攝像為核心功能的智能音頻眼鏡,且需要和手機配合使用。而VST方案的眼鏡會在XR章節(jié)中展開討論。 智能眼鏡的優(yōu)勢和機會 近期Rayban Meta意外大賣,增強了Zuckerberg對智能眼鏡這個形態(tài)的信心。Connect大會上,Meta發(fā)布了研發(fā)9年之久的AR眼鏡原型機Orion。小扎對此如此篤定不無道理,因為眼鏡作為傳感器定位的智能穿戴設(shè)備確實有得天獨厚的優(yōu)勢
此外,攝像眼鏡在傳播上也有天生的優(yōu)勢,從目前用戶的行為來看,攝影攝像是主要的使用場景。Rayban Meta在內(nèi)容創(chuàng)作者和大V中非常受歡迎,他們創(chuàng)作的POV視角的內(nèi)容在社交媒體傳播容易形成潮流效應(yīng),從而形成自傳播。 在Rayban Meta取得成功后,海外大廠已經(jīng)形成共識:Google決定與硬件合作伙伴三星探索類似形態(tài),落地在Google I/O上驚鴻一瞥的Project Astra,蘋果也開始重新審視自己的Vision產(chǎn)品線。 Rayban Meta:偶然的爆款,這一次不一樣? 這并不是科技公司在眼鏡上的第一次嘗試,實際上這是一個命途多舛的品類。從Magic Leap,HoloLens一直到Meta Orion,鋼鐵俠Javis形態(tài)的智能眼鏡一直是大家心目中的終極形態(tài)。 在諸多落地挑戰(zhàn)中,最核心的問題是無法達(dá)到輕量化要求。具體到眼鏡,行業(yè)普遍認(rèn)為超過60g的眼鏡(普通眼鏡20g左右)無法提供長時間無感的舒適體驗,而Rayban Meta在保持足夠好的基礎(chǔ)體驗的前提下,將重量控制在50g左右。 另外,近年來TikTok和Instagram等視覺系社交軟件的風(fēng)靡也為智能眼鏡的普及掃清了障礙:在公共場景使用攝像頭拍攝變得司空見慣。這曾是阻礙Google Glass普及的最大原因(Google Glass也極致輕量化)。 然而與Rayban的聯(lián)名更像是一個計劃外的產(chǎn)物,更準(zhǔn)確地說是Orion做減法得到的產(chǎn)物。Meta負(fù)責(zé)研發(fā)硬件的Reality Labs由CTO Andrew 'Boz' Bosworth負(fù)責(zé),這是一個超過15,000人的龐大部門。Boz是Zuckerburg最信任的親信之一,但在產(chǎn)品方向上Zuckerburg兩次親自做出了與Boz意見相左的決定,一次是在早期決定Quest走無線的一體機頭顯方案,另一次則是在2019年在評估Orion短期內(nèi)無法量產(chǎn)后,要求轉(zhuǎn)變方向與Rayban合作探索新的產(chǎn)品形態(tài)。 從科技角度來說,Rayban Meta是Orion技術(shù)的一次下放,但這樣的功能取舍和組合,卻意外地在重量、功能、設(shè)計和成本之間達(dá)到了消費者能接受的平衡。 從產(chǎn)品定義上,這與傳統(tǒng)意義上通過視覺顯示增強現(xiàn)實(“AR”)的定位不同,這是一款定位“l(fā)iving in the moment”,以攝影攝像為主要功能的產(chǎn)品。Rayban Meta是第二代產(chǎn)品,相比第一代產(chǎn)品Rayban Stories(第一代產(chǎn)品并沒有AI功能),由于高通AR1芯片升級,在攝像(5MP提升至12MP)和音頻上(3陣列到5陣列麥克風(fēng),加入空間音頻;音量提升50%)都有明顯的提升,并加入AI功能。此外,EssilorLuxottica也為Rayban Meta提供了更多的線下渠道覆蓋。 智能眼鏡形態(tài)的主要劃分和優(yōu)劣勢 智能眼鏡根據(jù)功能組合和視場角(“FOV”)大致可以分為以下幾類: 1. 不帶顯示的智能眼鏡(已經(jīng)能將重量控制在50g以內(nèi),符合輕量化要求)
2. 帶顯示的智能眼鏡(能控制在100g以內(nèi),但在輕量化上還有提升空間)
03方向2:硬件為AI陪伴提供物理載體AI智能玩具 玩具是搭載LUI的理想硬件載體。一方面,小朋友需要的信息密度和精度要求相對不高,且語音的流式交互也可以被硬件一部分承載。另一方面,相比于純軟件的形態(tài),通過硬件具象化也更方便用戶代入情感寄托,提供更高的情緒價值。這個品類也符合“熟悉的陌生感”邏輯,用戶教育門檻低,基本上手即可使用。 需要注意的是玩具的使用者和購買決策者分離,團隊需要在軟件后臺針對家長的訴求(主要是安全控制和成長記錄)有相對應(yīng)的設(shè)計。 國內(nèi)的躍然創(chuàng)新Haivivi和海外的Curio都陸續(xù)推出了產(chǎn)品,且獲得不錯的市場反響。Haivivi的第一款產(chǎn)品Bubble Pal取巧地采用了掛件的設(shè)計,一方面硬件形態(tài)相對簡單容易快速量產(chǎn),另一方面“蹭”了用戶現(xiàn)有玩具的形象設(shè)計,規(guī)避了冷啟動時外形設(shè)計的風(fēng)險。但長期中,IP的授權(quán)和綁定將是這個品類的核心競爭力。 同樣,針對成年人類似豆包的AI個人助理也可以被賦予硬件的“肉身”,將情緒和陪伴價值進一步延伸和固化。Looi是一款可移動手機支架形態(tài)的桌面機器人,在搭載基礎(chǔ)AI大模型交互功能的基礎(chǔ)上,團隊還開發(fā)了配合物理移動的表情設(shè)計及世界觀設(shè)定。這類產(chǎn)品在軟件AI個人助理的基礎(chǔ)上更進一步,通過與用戶的物理交互建立更深層的情感連接。本質(zhì)上這類產(chǎn)品是對桌面智能音箱、時鐘等硬件的整合和體驗提升。同時Looi的設(shè)計巧妙的將攝像傳感器轉(zhuǎn)移給手機,在一定程度上規(guī)避了這個品類中潛在的數(shù)據(jù)收集和隱私風(fēng)險。 同樣的思路也可以延伸至家庭地面機器人。三星的Ballie就是這個方向的一個代表,這個形態(tài)的產(chǎn)品可以結(jié)合掃地機器人和智能音箱的功能,甚至在某種程度上分擔(dān)了寵物的部分情感陪伴功能。 04XR:頭號玩家是否ready?影視作品「頭號玩家 Ready Player One」生動地描繪了人類對XR產(chǎn)品的想象。從早期的Oculus Rift,HTC Vive到Magic Leap, HoloLens,再到現(xiàn)在的Quest,Vision Pro和Pico。XR產(chǎn)品的發(fā)展在過去10年,已經(jīng)走過了“10個元年”,在技術(shù)程度曲線(the hype curve)上經(jīng)過了從「過高期望的峰值」跌落「去泡沫的谷底」的過程,目前正處于線性穩(wěn)步向前的階段,但離大規(guī)模普及實現(xiàn)指數(shù)性增長的階段尚有距離。除了軟件和硬件的技術(shù)邊界之外,XR設(shè)備本身具有單次使用門檻/儀式感高、佩戴和使用體驗高度個人化且不易分享的特性,使得產(chǎn)品入門閾值一直較高。總的來說,VR方向硬件產(chǎn)業(yè)鏈、光學(xué)方案和軟件生態(tài)的方向都已經(jīng)基本確定,在Vision Pro指明OS和交互邏輯后,未來3年行業(yè)將持續(xù)穩(wěn)步打磨產(chǎn)品。而在AR方向,光學(xué)方案尚未收斂,產(chǎn)業(yè)鏈也處在早期階段,雖然夢想美好,但現(xiàn)實很殘酷。就算是天頂星的Orion,在3-5年之內(nèi)都不會量產(chǎn)。 行業(yè)在AR領(lǐng)域的迷茫,一部分原因是現(xiàn)階段硬件技術(shù)邊界的限制,但我認(rèn)為也有很大一部分原因是從業(yè)者被對顯示的執(zhí)念束縛。AR(augmented reality)現(xiàn)實增強的定義簡單可以概括為:增強能力,解放雙手。視頻顯示固然能帶來最強的現(xiàn)實增強,但人有五感(即多模態(tài)),通過音頻等其他形式帶來的能力增強,雙手解放,廣義上也是AR。Rayban Meta因為不帶顯示不被部分從業(yè)者認(rèn)為是AR眼鏡(包括Meta CTO Boz一度也這么認(rèn)為),但在廣義下,卻實現(xiàn)了AR的目標(biāo)。 蘋果和Meta無疑是過去5年為爭奪「頭號玩家」投入最多的兩家廠商。兩家分別采用了不同的戰(zhàn)略路徑,這里做一個簡要的總結(jié)和現(xiàn)狀的分析。 蘋果 戰(zhàn)略側(cè)重VST的MR方向,閉源路徑,高端定位,希望從效率場景切入。 從目前的情況來看,萬眾期待的首款產(chǎn)品Vision Pro已經(jīng)失敗,失敗的核心點不在于銷量(本身也沒有很高的預(yù)期),而是沒有在先鋒人群中形成時尚效應(yīng)。在過往新品類發(fā)布中,無論是Apple Watch還是AirPods,蘋果都能通過頂尖的廣告和推廣在最酷的人群中產(chǎn)生示范效應(yīng)從而帶動后續(xù)更大眾系列的普及,但在Vision Pro上并沒有成功。 但這款產(chǎn)品也并非一無是處,其出色的交互設(shè)計和空間定位,為行業(yè)指明方向。 Meta 同時布局OST方向AR產(chǎn)品(Orion)和VST方向VR產(chǎn)品(Quest) Quest以游戲主機定位起步,無論從定價還是內(nèi)容供給都進行強錨定以帶動銷量和用戶覆蓋。Quest2取得階段性成功步入千萬量級銷量。從Quest3開始加入彩透功能開始向MR結(jié)合的更多場景拓展,在Vision Pro發(fā)布后,明確OS和交互模式將會向蘋果靠攏。Quest4的主要定位預(yù)計是無限靠近Vision Pro的體驗,但有明顯價格優(yōu)勢。 AR方向產(chǎn)品Orion 3-5年內(nèi)不會量產(chǎn)落地。 比較可惜的是國內(nèi)的PICO,在被字節(jié)收購后被沒有得到應(yīng)有的整合。砸出100億人民幣后,便戰(zhàn)略收縮。最可惜的是研發(fā)并未占投入大頭,且沒有像蘋果和Meta一樣形成技術(shù)體系(研發(fā)成果可以在多款產(chǎn)品繼承)。 總的來說,未來3年的主力機型(Meta Quest3/3s/4和Apple Vision/Pro)都無法將用戶基數(shù)帶過指數(shù)級增長的拐點,而只能在千萬級別線性增長。這個級別的用戶體量可能對游戲之外的應(yīng)用品類來說相對有限,但在XR用戶的價值在于對低齡用戶的滲透:無論是海外的Gorilla Tag,VRChat還是國內(nèi)的輕世界都有比例相當(dāng)大的低齡用戶。隨著這個年齡XR原生用戶的發(fā)展壯大和購買力增強,長期滲透率的拐點將可能出現(xiàn)。 另外,AI大模型技術(shù)的出現(xiàn)可能也會在VST方案的設(shè)備中引入新的趨勢。在內(nèi)容生產(chǎn)端,AI多模態(tài)內(nèi)容生成工具將有效降低VR內(nèi)容制作門檻(特別是3D內(nèi)容),長期中可能會出現(xiàn)Roblox、蛋仔派對形態(tài)的UGC平臺。更為重要的是在交互端,顯示渲染系統(tǒng)與AI內(nèi)容生成技術(shù)天然易結(jié)合,可能出現(xiàn)一個重要的交互場景變化,即將內(nèi)容創(chuàng)作者的攝像頭向另一端投射 - 「POV視角」- 的創(chuàng)作,而AI內(nèi)容生成技術(shù)將讓「世界濾鏡」成為可能,從而衍生出更多的玩法,在真正意義上實現(xiàn)現(xiàn)實增強 ('AR') 的體驗。Snapchat Spectacles的宣傳片中已經(jīng)demo了這種場景,蘋果內(nèi)部對這個方向的確定性也非常篤定。 目前已有一些GenAI公司嘗試在這條路線探索,AI圖像生成公司Midjourney因為創(chuàng)始團隊Magic Leap的背景更是對此深信不疑,據(jù)我了解團隊目前在同時研發(fā)VR設(shè)備在內(nèi)的多條技術(shù)路線。但目前的主要挑戰(zhàn)是:
05具身智能:更近還是更遠(yuǎn)?受篇幅限制,不在這里展開討論現(xiàn)階段具身智能方向的投資價值。主要談一談兩個問題:1) 造成目前行業(yè)投資熱情的原因;2)當(dāng)下需要面對的主要技術(shù)挑戰(zhàn)具身智能同時在中美兩個市場掀起熱潮,無疑是今年國內(nèi)市場融資最活躍的賽道。背后的核心原因是資本需求和項目供給的關(guān)系。 在資本需求端,海外市場明星項目Tesla Optimus,F(xiàn)igure,1X等在市場制造聲量,一定程度上起到示范科普作用,黃仁勛在英偉達(dá)GTC大會上和一眾機器人的同框亮相更是將市場的熱情拉滿。另一方面,我國的政策也十分支持機器人相關(guān)的高端制造業(yè)。結(jié)果上導(dǎo)致美元和人民幣背景的基金都有配置的興趣和需求。 在項目供給端,具身智能主要包括大腦、小腦和本體三個系統(tǒng),分別要求團隊在機器視覺、AI大模型、通用移動、運動控制、硬件機械等多個跨學(xué)科交叉領(lǐng)域都有深厚的技術(shù)儲備。根據(jù)我們對人才庫的梳理,在具身智能創(chuàng)業(yè)方向可以獨當(dāng)一面的頂級華人人才不超過30人。具身智能是最近幾年興起的前沿研究方向,更多的人才還在學(xué)界和業(yè)界做研究,或者對產(chǎn)業(yè)缺乏經(jīng)營上的認(rèn)識和經(jīng)驗。而從機器視覺、自動駕駛等領(lǐng)域跨界創(chuàng)業(yè)的團隊還在學(xué)習(xí)適應(yīng)中。 雖然與自動駕駛相比,具身智能資本投入需求相對可控,但機器人自由度之多控制之復(fù)雜,讓實現(xiàn)更擬人的智能這件事的難度不亞于任何一項復(fù)雜的系統(tǒng)工程。 高質(zhì)量團隊稀缺和資本配置興趣旺盛之間供不應(yīng)求的關(guān)系直接造成了目前行業(yè)火熱的氛圍。 大語言和多模態(tài)模型的技術(shù)突破,讓具身智能在大腦和小腦控制上得到大幅提升,但我們也應(yīng)該正視需要攻克的技術(shù)難點:
此外,合成數(shù)據(jù)在具身智能訓(xùn)練上的有效性和通用性也需要進一步證明。 硬件的選型和適配 |
|