除了手機(jī)之外,AI 硬件最大的機(jī)會(huì)是什么? Meta 雷朋眼鏡銷量破百萬(wàn)之后,AI 眼鏡越來(lái)越成為共識(shí)。 超過(guò) 1/4 的用戶,每天佩戴 10 小時(shí)以上,每人每天媒體使用時(shí)間超過(guò) 7 小時(shí)?!?strong>眼鏡(作為產(chǎn)品形態(tài))不需要證明什么了。」蜂巢科技的夏勇峰說(shuō)。 參與創(chuàng)辦小米生態(tài)鏈的夏勇峰,親眼見(jiàn)證了數(shù)百種硬件產(chǎn)品的誕生,他確信,「百鏡大戰(zhàn)」很快就會(huì)發(fā)生,然后迅速教育市場(chǎng),接下來(lái),「考驗(yàn)的一是資源能力,二是對(duì)于 AI 和硬件的理解力,三是這個(gè)組織的效率。」 8 月 8 日,在「界環(huán) AI 音頻眼鏡」發(fā)布會(huì)之后,蜂巢科技創(chuàng)始人 & CEO 夏勇峰做客 Founder Park 的直播間,與極客公園創(chuàng)始人 & 總裁張鵬進(jìn)行了一場(chǎng)關(guān)于 AI 智能硬件的對(duì)話。文章基于直播整理,F(xiàn)ounder Park 略有調(diào)整。01 短時(shí)間內(nèi),AR 硬件很難變成大眾消費(fèi)品 張鵬:先講一講,蜂巢科技是怎么誕生的,包括你自己過(guò)去的一些經(jīng)歷吧。 夏勇峰:從我作為極客公園的一份子開(kāi)始聊起吧。早些年,我是極客公園最早期的創(chuàng)始員工之一,后來(lái)為了圓自己做硬件的夢(mèng),在張鵬的同意下,我受邀加入了小米。 在小米,我最開(kāi)始是做小米路由器,后來(lái)加入了小米生態(tài)鏈的組建。那時(shí)候,小米生態(tài)鏈剛剛起步,只有三個(gè)員工,包括老板在內(nèi)。小米生態(tài)鏈的成立時(shí)間是以我 14 年 1 月 8 日到崗的時(shí)間為準(zhǔn)的。我參與了小米手環(huán)、掃地機(jī)器人等一系列產(chǎn)品的發(fā)布,還參與創(chuàng)辦了米家品牌。剛開(kāi)始的米家品牌的各種發(fā)布會(huì)其實(shí)都是我來(lái)做的。 到了 2018 年,小米生態(tài)鏈已經(jīng)投了 70 多家公司,每年做 300 多個(gè)產(chǎn)品。那個(gè)時(shí)候,我感覺(jué)我離當(dāng)初做硬件產(chǎn)品經(jīng)理的想法越來(lái)越遠(yuǎn)了,我的日常工作已經(jīng)變成了管理工作,離真正做產(chǎn)品的工作已經(jīng)有點(diǎn)遠(yuǎn)了。 張鵬知道我是一個(gè)相對(duì)比較理想主義的人,比如早年間我只想當(dāng)記者,不想當(dāng)編輯,要堅(jiān)持在一線。所以,18 年我跟雷總溝通之后,就離開(kāi)生態(tài)鏈加入了小米手機(jī)部,開(kāi)始做手機(jī)。做到 2020 年,我就覺(jué)得我給小米帶來(lái)的價(jià)值也差不多了,該去實(shí)現(xiàn)一些自己的夢(mèng)想了。 于是,2020 年我創(chuàng)辦了蜂巢科技。我們有一個(gè)新的定義,就是頭戴式可穿戴智能硬件,我想做這個(gè)方向的產(chǎn)品??赡茉谥笫?、二十年、三十年,我們所有的產(chǎn)品都會(huì)圍繞著這個(gè)方向來(lái)做。后來(lái)我們先后推出了眼鏡、相機(jī)、米家音頻眼鏡等產(chǎn)品,包括今天剛剛發(fā)布的「界環(huán)」AI音頻眼鏡,這是我們的一系列的產(chǎn)品。 張鵬:2020 年創(chuàng)立蜂巢時(shí),做的第一代產(chǎn)品是一個(gè)眼睛相機(jī),第二代是一個(gè)藍(lán)牙音頻眼鏡,你現(xiàn)在在做「界環(huán)」這個(gè)產(chǎn)品,這之間的思路看起來(lái)也有一些變化。能不能復(fù)盤(pán)一下,這三四年你是怎么走過(guò)來(lái)的?夏勇峰 :3 年時(shí)間很短,但對(duì)我來(lái)說(shuō),真的特別漫長(zhǎng)。我們一開(kāi)始想做頭戴式智能硬件,是因?yàn)楫?dāng)時(shí)做完手機(jī)后,發(fā)現(xiàn)大趨勢(shì)是手機(jī)每年的全球銷量都在下滑。手機(jī)質(zhì)量越來(lái)越好,性能也完全足夠了,所以大家的手機(jī)更換頻率比以前降低了。當(dāng)時(shí)我們和很多手機(jī)重要技術(shù)的合作伙伴聊,包括做屏幕的、做芯片的、做相機(jī)的,很多人都呈現(xiàn)出一種長(zhǎng)期焦慮感,產(chǎn)業(yè)大到一定的程度之后,其實(shí)找不到新的落點(diǎn)。當(dāng)時(shí)我覺(jué)得,可能有手機(jī)技術(shù)溢出的機(jī)會(huì)。除了汽車,手機(jī)就應(yīng)該是人類硬件的皇冠上的明珠,還帶來(lái)了一系列技術(shù)的持續(xù)提升,比如說(shuō)低功耗、高性能、結(jié)構(gòu)堆疊等等。我就開(kāi)始思考,手機(jī)技術(shù)溢出之后,有什么新的硬件產(chǎn)品可以承載這個(gè)趨勢(shì)。直觀上來(lái)講,如果技術(shù)持續(xù)發(fā)展,目前手持設(shè)備跟數(shù)字世界與真實(shí)世界交互的效果還不夠好。長(zhǎng)期交互,應(yīng)該就是五感,這些五感通過(guò)某個(gè)硬件,比如戒指,直接去跟現(xiàn)實(shí)世界交互就好了,手就該干嘛干嘛。所以我覺(jué)得未來(lái),必定有一個(gè)頭部的設(shè)備可能會(huì)取代手機(jī),成為隨身最重要的智能終端。頭戴式智能硬件里會(huì)涌現(xiàn)非常多的機(jī)會(huì),我就把它設(shè)為了我們公司一個(gè)超長(zhǎng)期的目標(biāo)。當(dāng)時(shí)正好元宇宙處于起起落落的新的一波,自然而然就想把 AR 作為我的第一階段,現(xiàn)在聽(tīng)起來(lái)有一點(diǎn)狂妄,因?yàn)?AR 到現(xiàn)在其實(shí)還沒(méi)有非常好的產(chǎn)品。但當(dāng)時(shí)我比較樂(lè)觀,通過(guò)各種渠道和信息,知道好些大廠在研究 AR 硬件,有些大廠在立項(xiàng),一些代工廠也在做各種各樣的嘗試。所以當(dāng)時(shí)預(yù)計(jì) 5-10 年,AR 有可能會(huì)成為主流硬件。當(dāng)時(shí)的技術(shù)還不夠成熟,就先做了一個(gè)眼鏡相機(jī),它是我認(rèn)為頭戴的最小可運(yùn)行模型。有一個(gè)近眼顯示的最小屏幕,配置了足夠好的相機(jī)。我做了一個(gè)相對(duì)比較完善的一體機(jī)體系,可以聯(lián)網(wǎng),同時(shí)還能夠支持開(kāi)發(fā)者在上面充分開(kāi)發(fā)。系統(tǒng)基于安卓,但是還是有很多的調(diào)整。這款眼鏡相機(jī)確實(shí)給一些人帶來(lái)了價(jià)值,但是這個(gè)產(chǎn)品有一個(gè)很大的問(wèn)題,我覺(jué)得未來(lái)的 AR 眼鏡短期內(nèi)都無(wú)法解決,就是用戶所支付的代價(jià)遠(yuǎn)遠(yuǎn)大于他們能獲得的回報(bào)??赡苤挥杏钟绣X(qián)又向往科技,愿意為信仰充值的人,才會(huì)成為早期用戶。基本上在 22 年左右,我就意識(shí)到這一點(diǎn),AR很難在相對(duì)比較短的時(shí)間內(nèi),變成一個(gè)大眾的電子消費(fèi)品。張鵬:今天我依然認(rèn)為長(zhǎng)期來(lái)看 AR 這件事肯定有價(jià)值,但這個(gè)「長(zhǎng)期」究竟有多長(zhǎng),確實(shí)是個(gè)值得探討的問(wèn)題。你剛才提到了一個(gè)關(guān)鍵點(diǎn),認(rèn)為現(xiàn)在如果要做一款真正的 AR 設(shè)備,還是不太成熟。但隨著 AI 的興起,很多人認(rèn)為 AR 可能又重新熱起來(lái)了。但你今天的這款眼鏡,既沒(méi)有攝像頭,也沒(méi)有屏幕,是基于音頻接入 AI 的。為什么不在產(chǎn)品里加屏幕呢?AR 的路線為什么你不堅(jiān)持走下去?在過(guò)去兩年里,有什么因素影響了你的決策?夏勇峰:我在發(fā)布會(huì)上也提到了,有些非??岬闹悄苎坨R在傳統(tǒng)眼鏡的基礎(chǔ)上邁出了巨大的步伐。但我認(rèn)為,哪怕是一小步,也可能帶來(lái)眼鏡行業(yè)的革命性變化。如果這一步走得不夠穩(wěn)健,那么后面的大步可能在短期內(nèi)也不會(huì)出現(xiàn)。比如說(shuō),我們提到了 Ray-Ban Meta,這是一款相當(dāng)不錯(cuò)的墨鏡。我們也是希望努力做出一款優(yōu)秀的眼鏡。你可以看到,我們的產(chǎn)品與傳統(tǒng)眼鏡行業(yè)非常接近。正是這種接近,滿足了大家的基本需求,為我們提供了一個(gè)相對(duì)較大的市場(chǎng)基礎(chǔ)。如果在這個(gè)時(shí)候,我們急于推出一個(gè)過(guò)于創(chuàng)新的產(chǎn)品,反而可能會(huì)破壞傳統(tǒng)眼鏡的基本需求。比如,佩戴可能不夠舒適,或者配近視鏡片不夠方便,這樣我們就需要去創(chuàng)造全新的需求,然后告訴大家,盡管眼鏡的基本需求沒(méi)有得到很好的滿足,但我們能滿足其他需求。事實(shí)上,至少在目前這個(gè)階段,我還沒(méi)有發(fā)現(xiàn)真正能夠成立的需求。張鵬:我挺認(rèn)同你的觀點(diǎn),戴這個(gè)眼鏡,我沒(méi)有付出太大的代價(jià)。但你不加顯示屏這件事,是一個(gè)挺有意思的選擇。你的一代產(chǎn)品拍照眼鏡,還是有屏幕的,這次不加屏幕背后的邏輯是什么?夏勇峰: 選擇不加屏幕的核心邏輯是,加了屏幕能帶來(lái)什么實(shí)際用途?首先單色 Micro LED 技術(shù)已經(jīng)非常成熟了,但關(guān)鍵是,它能用來(lái)做什么?打個(gè)比方,如果你前面加了一個(gè)顯示屏幕,價(jià)格貴了 1500 到 2000 塊錢(qián),你覺(jué)得你用它來(lái)做什么,能夠讓你心甘情愿地多掏這筆錢(qián)?張鵬:現(xiàn)在市場(chǎng)上的驗(yàn)證是,大家拿它當(dāng)顯示屏,比如看視頻等等,其實(shí)就是個(gè)大屏。夏勇峰:大屏單色顯示是不夠的,你提到的那個(gè)更貴,1500 塊錢(qián)搞不定?,F(xiàn)在大屏 Micro LED 技術(shù)還沒(méi)有完全成熟,我們現(xiàn)在所有的商務(wù)大屏,市面上大部分知名公司用的是 Birdbath 的方案,那個(gè)方案成本相對(duì)可控。最終的 AR 設(shè)備需要的其實(shí)是一個(gè)非常好的 Micro LED 技術(shù)加上衍射光波導(dǎo)的鏡片,但那個(gè)技術(shù)還不成熟。去年有出 640x480 分辨率的,據(jù)說(shuō)刷抖音很爽,相當(dāng)于一個(gè)小電視。到明年,我估計(jì)它可以提升到 1080P,但保守估計(jì),成本至少要提高兩倍以上。即便如此,我覺(jué)得它也不能很好地替代手機(jī)或筆記本。張鵬:核心問(wèn)題是,今天我付出了很高的成本在眼鏡前加了個(gè)屏幕,但它依舊不能全面替代手機(jī)或筆記本,所以這個(gè)時(shí)候去搶占它們的屏幕使用場(chǎng)景并不明智。所以這個(gè)決策并不可行,對(duì)吧?夏勇峰:嗯,它只能作為一個(gè)筆記本或手機(jī)的擴(kuò)展屏,就像個(gè)配件。張鵬:如果強(qiáng)行讓這個(gè)人自此不再用筆記本和手機(jī),用戶要付出的代價(jià)就會(huì)比較大。所以你今天反而從之前 AR 的路線走向了音頻眼鏡。02 Ray-Ban Meta 的核心,是做好了一款墨鏡
張鵬:我其實(shí)挺好奇你看到大模型領(lǐng)域出現(xiàn)后,當(dāng)時(shí)是個(gè)什么心情?是怎么找到跟這個(gè)技術(shù)浪潮結(jié)合點(diǎn)的?夏勇峰:首先我覺(jué)得產(chǎn)品越接近傳統(tǒng)眼鏡,它就越能替代它們。這會(huì)帶來(lái)明顯的好處,因?yàn)橛脩舻幕拘枨蟮玫綕M足,產(chǎn)品佩戴時(shí)間就會(huì)非常長(zhǎng)。如果你能做出一款能替代傳統(tǒng)墨鏡的眼鏡,基本上你就錨定了人們每一天戴墨鏡的時(shí)間。如果你的產(chǎn)品特別接近傳統(tǒng)眼鏡,比如近視鏡,那么產(chǎn)品的使用時(shí)間就會(huì)接近傳統(tǒng)眼鏡的使用時(shí)間。我們的后臺(tái)數(shù)據(jù)顯示,用戶使用我們產(chǎn)品的時(shí)間很長(zhǎng),前 25% 的用戶每天佩戴超過(guò) 10 個(gè)小時(shí),每人每天媒體的平均使用時(shí)長(zhǎng)超過(guò) 7 個(gè)小時(shí)。這是一個(gè)非常長(zhǎng)的時(shí)間。AI 來(lái)了之后,如果用戶在手機(jī)或筆記本旁邊,他們肯定會(huì)使用手機(jī)和電腦上的 AI,用來(lái)做 PPT、寫(xiě)稿子、加字幕、外文翻譯等等。因?yàn)橛脩魰?huì)直接在現(xiàn)有硬件上使用 AI,所以我們開(kāi)發(fā)新的 AI 硬件,要抓住手機(jī)和筆記本使用時(shí)間之外的時(shí)間。開(kāi)發(fā)的硬件要能隨身在用戶旁邊,并且與用戶進(jìn)行交互。張鵬:你的意思是,今天不應(yīng)該去嘗試搶占手機(jī)和筆記本的使用時(shí)間,那是不可能的。相反,我們應(yīng)該在它們之外找到對(duì)用戶有價(jià)值的事情,并且這種價(jià)值足以讓用戶愿意長(zhǎng)時(shí)間佩戴。比如VR眼鏡就不行,通常只在看電影時(shí)佩戴,之后我們就摘下來(lái)了。所以這個(gè)產(chǎn)品是推理出來(lái)的嗎?夏勇峰:那也不是。最初我們是先開(kāi)發(fā)了音頻眼鏡,后來(lái) AI 技術(shù)興起,我們就發(fā)現(xiàn) AI 非常適合這種產(chǎn)品,特別是在用戶不在使用手機(jī)和筆記本的時(shí)候,比如開(kāi)車、騎行或跑步等場(chǎng)景,通過(guò)音頻眼鏡使用 AI 是一種更自然的方式。如果他們?cè)谶@些時(shí)刻需要 AI,可能可供選擇的硬件很少。除了眼鏡,我認(rèn)為還有兩個(gè)設(shè)備非常適合集成 AI,那就是汽車,還有手表或高續(xù)航的手環(huán)。在特殊場(chǎng)景下,人們無(wú)法使用手機(jī)或筆記本,這些設(shè)備就能發(fā)揮作用。張鵬:手環(huán)和手表傳遞價(jià)值的方式可能只能是振動(dòng),發(fā)出聲音感覺(jué)不太合理。眼鏡的位置我覺(jué)得比較好,因?yàn)樗梢远Z(yǔ),這就很合理。一個(gè)大家可能都很關(guān)心的問(wèn)題是,現(xiàn)在很多人覺(jué)得 Ray-Ban Meta 眼鏡不錯(cuò),前面有兩個(gè)大大的攝像頭。之前討論了為什么不加屏幕,那你覺(jué)得未來(lái)你的眼鏡會(huì)加攝像頭嗎?這一代沒(méi)有攝像頭,未來(lái)會(huì)有嗎?你是怎么考慮的?夏勇峰:我也知道現(xiàn)在市面上其實(shí)有很多人在做類似的,無(wú)意冒犯大家,我講講純個(gè)人觀點(diǎn)。我認(rèn)為 Ray-Ban Meta 的核心是做好了一款墨鏡。它是一個(gè)與人的社交距離較遠(yuǎn)的設(shè)備、在一些地廣人稀的地方,人的社交距離遠(yuǎn),你在墨鏡上加一個(gè)攝像頭,不管用來(lái)做什么,至少是合理的。在遠(yuǎn)處人們帶一個(gè)攝像頭不會(huì)對(duì)別人構(gòu)成冒犯,但如果在人口密集的地方,每天帶著配備攝像頭的東西,從早帶到晚。我試過(guò),感覺(jué)非常尷尬,給別人帶來(lái)的社交壓力,會(huì)回到我自己身上。張鵬:從別人的眼神里你能觀察到,他們覺(jué)得這個(gè)東西有點(diǎn)可怕。夏勇峰:對(duì),所以我認(rèn)為加攝像頭的 AI 眼鏡,和我們現(xiàn)在做的 AI 音頻眼鏡本質(zhì)上是兩個(gè)完全不同的產(chǎn)品。攝像頭 AI 眼鏡更適合在一些短時(shí)場(chǎng)景里給用戶提供更高的價(jià)值,但具體能提供多少,還得看后續(xù)的發(fā)展。它替代墨鏡還可以,但大部分中國(guó)人其實(shí)是不戴墨鏡的,老外才帶。這不是武斷,是從百分比來(lái)看的,中國(guó)的近視人群相對(duì)較多,如果他們要戴墨鏡,要么就是戴隱形,要么就是配一個(gè)帶度數(shù)的墨鏡,或者戴一個(gè)套鏡,但總體來(lái)講,墨鏡的總量百分比遠(yuǎn)低于歐美。在美國(guó)很多地方墨鏡是剛需,是每個(gè)人必須要買的東西,在這個(gè)時(shí)候 AI 眼鏡替代墨鏡,群眾基礎(chǔ)會(huì)比較好一些。墨鏡天然適合加攝像頭,AI 又需要攝像頭,這個(gè)故事就閉環(huán)了。張鵬:如果按照這個(gè)邏輯來(lái)看,你今天選擇的道路并不是從墨鏡的角度出發(fā),而是我們?nèi)粘E宕鞯难坨R,對(duì)吧?它本質(zhì)上就是我們?nèi)粘K宕鞯溺R框,只是換成了近視眼鏡,這樣確實(shí)能有效解決問(wèn)題。既然我們談到了 AI,AI 領(lǐng)域現(xiàn)在大家都很關(guān)注,從去年開(kāi)始,AI 已經(jīng)從純語(yǔ)言模型發(fā)展到了更加多模態(tài)的階段。AI 的演進(jìn)意味著如果你有攝像頭,你就具備了多模態(tài)的能力。你可以通過(guò)視覺(jué)去理解很多東西,進(jìn)而幫助解決很多問(wèn)題,比如看到某個(gè)東西能翻譯成英文,或者識(shí)別出這是什么,這本質(zhì)上就像是攝像頭變成了傳感器。所以產(chǎn)品如果加上攝像頭,一個(gè)明顯的、用于拍攝視頻的攝像頭,這已經(jīng)變成了另一個(gè)品類。你現(xiàn)在的產(chǎn)品是智能音頻眼鏡,如果未來(lái)要運(yùn)用AI的智能,實(shí)現(xiàn)多模態(tài),增加傳感器是否必要?在什么情況下會(huì)考慮增加?夏勇峰:我確實(shí)考慮過(guò)這樣的問(wèn)題,甚至和一些大公司探討過(guò)制作 demo 的可能性。我認(rèn)為可能有兩種方式。第一種方式是,攝像頭前面的鏡片通常是玻璃的,你可以把它做成電子變色的,由 AI 控制何時(shí)需要開(kāi)啟。平時(shí)它就像是「閉著眼睛」,需要時(shí)就「睜開(kāi)眼睛」,這樣或許能緩解一些隱私問(wèn)題。另一種情況是,你帶一個(gè)攝像頭,AI 能分辨圖像,但不能拍照,也不強(qiáng)調(diào)畫(huà)質(zhì),并且要讓所有人都知道這不是用來(lái)拍照的,而是一個(gè)傳感器。因?yàn)?AI 需要的分辨率并不高,600x400 的分辨率基本上已經(jīng)夠用了,不需要像 Ray-Ban Meta 那樣高分辨率的攝像頭和高級(jí)芯片,以及加載那么多拍照算法。張鵬:所以,如果從智能的角度來(lái)看,確實(shí)有必要加入有效的傳感器,但這一代產(chǎn)品還沒(méi)有加。我相信你肯定在這方面做了技術(shù)儲(chǔ)備,剛才提到的加「眼皮」,或者明確告訴大家這是傳感器,沒(méi)有拍攝功能,只是識(shí)別,才能解決隱私問(wèn)題。我覺(jué)得很有道理。夏勇峰:需要考慮在人群密度較高的場(chǎng)景下,能否正常無(wú)障礙地使用它,這可能和它本身實(shí)現(xiàn)的功能同等重要。張鵬:那么,如果這種傳感器加入之后,這副眼鏡會(huì)實(shí)現(xiàn)一些超越我們想象的能力嗎?夏勇峰:可以稍微透露一點(diǎn)。與其說(shuō)它能實(shí)現(xiàn)什么具體功能,不如說(shuō)它能讓 AI 更加了解人的意圖。我們之前討論過(guò),未來(lái)可能是 AI 接管一切,你只需要做自己,因?yàn)?AI 機(jī)器非常聰明,當(dāng)你做自己的時(shí)候,AI 基本上就能知道你想要做什么,你的意圖是什么。它可能會(huì)取代一些現(xiàn)有的圖形用戶界面(GUI)的功能。我認(rèn)為它能夠幫助機(jī)器更好地識(shí)別人的意圖。張鵬:所以,它實(shí)際上是一種用于識(shí)別意圖的傳感器,我們不應(yīng)該將其理解為傳統(tǒng)意義上的攝像頭拍攝功能。這一點(diǎn)可能是核心。03先做好一款好用的音頻眼鏡,然后加入 AI
張鵬:加入了AI之后,這一代產(chǎn)品有哪些特點(diǎn),會(huì)帶來(lái)與之前音頻眼鏡不同的體驗(yàn)?夏勇峰:我們其實(shí)設(shè)定了目標(biāo)。第一是要做世界上最好看的眼鏡,顏值即正義。第二,我們要做世界上用起來(lái)最舒服的眼鏡。第三,我們要做這個(gè)世界上最聰明的眼鏡。第一個(gè)目標(biāo):最好看。我們的眼鏡像傳統(tǒng)眼鏡一樣有很多框型,8 框 14 色,對(duì)人顏值提升還是蠻有用的。你戴眼鏡出去,給人的感覺(jué)還是挺好的。第二個(gè)目標(biāo):最好用。我們已經(jīng)開(kāi)發(fā)了三代音頻眼鏡,這一代在實(shí)際使用體驗(yàn)、人體工程學(xué)設(shè)計(jì)以及鏡框方面都有明顯的提升,最輕的只有 30.7 克,整體佩戴舒適度都有顯著提高。為了制作優(yōu)質(zhì)的眼鏡,我們還提供定制鏡片服務(wù),性價(jià)比相當(dāng)不錯(cuò)。如果你不確定要購(gòu)買什么樣的鏡片,可以直接在我們這里購(gòu)買眼鏡并配備鏡片,性價(jià)比還可以的。我們的變色鏡片特別好,在室內(nèi)可以防藍(lán)光,在室外則自動(dòng)變?yōu)槟R,能防紫外線,當(dāng)然也相對(duì)比較貴一點(diǎn)。現(xiàn)在鏡片已經(jīng)正式納入了我們的眼鏡業(yè)務(wù),變成了一個(gè)正經(jīng)的事兒,會(huì)統(tǒng)一給大家提供服務(wù)。第三塊最聰明,其實(shí)就是說(shuō) AI。張鵬:講講 AI 吧,你的 AI 音頻眼鏡叫智能眼鏡,這個(gè)智能體現(xiàn)在哪里?夏勇峰:我們的 AI,你可以將其簡(jiǎn)單理解為是語(yǔ)音助手的升級(jí)版。從 ChatGPT 開(kāi)始,到現(xiàn)在我們的國(guó)產(chǎn) AI 模型,在大眾端還沒(méi)有出現(xiàn)非常核心、為大眾帶來(lái)顯著價(jià)值的應(yīng)用,但它擁有無(wú)限的可能性,基本上能夠?qū)崿F(xiàn)從文本到文本,語(yǔ)音到語(yǔ)音的轉(zhuǎn)換,這是 AI 從 1.0 到現(xiàn)在能夠?yàn)榇蠹規(guī)?lái)的功能。對(duì)我們來(lái)說(shuō),什么是語(yǔ)音助手的升級(jí)版呢?當(dāng)你向它提出一個(gè)問(wèn)題后,它能夠識(shí)別出你的意圖和不同需求,并將這些需求分配給不同的 AI 代理(agent)去執(zhí)行。執(zhí)行完畢后,再匯總回答給你。我們稱這些不同的 AI 代理為「AI 小人」,它們?cè)谀愕难坨R后面不停地為你工作。比如你說(shuō):「明天我想聽(tīng)聽(tīng)法國(guó)媒體對(duì)奧運(yùn)會(huì)的評(píng)價(jià),請(qǐng)?jiān)诿魈焱砩?8 點(diǎn)前給我一個(gè)總結(jié)?!孤?tīng)到的 AI 小人就會(huì)告訴工作小人:「你明天要產(chǎn)出這個(gè)內(nèi)容?!沟诙焱砩?8 點(diǎn),工作小人會(huì)把總結(jié)交給負(fù)責(zé)與你對(duì)話的小人,然后這個(gè)小人會(huì)念給你聽(tīng)。與你對(duì)話的小人,我們稱之為 VUI,即基于語(yǔ)音的用戶界面。當(dāng)基于語(yǔ)音的交互因?yàn)?AI 能產(chǎn)生越來(lái)越多的價(jià)值時(shí),它就會(huì)變成一個(gè)交互界面。這是利用 AI 核心目標(biāo)的一部分,我們希望在跨平臺(tái)上讓用戶擁有一個(gè)統(tǒng)一的 VUI 體驗(yàn)。張鵬:我嘗試?yán)斫庖幌拢绻f(shuō)這副眼鏡帶來(lái)的根本性改變,那就是通過(guò)它,你能夠調(diào)用無(wú)所不能的 AI,圍繞你的目標(biāo)去解決問(wèn)題,通過(guò)這個(gè)眼鏡用語(yǔ)音的方式給你完成合適的任務(wù)。背后的技術(shù)是大模型,也就是你用語(yǔ)音就可以調(diào)動(dòng) AI,這是交互的核心節(jié)點(diǎn)。我們不用像原來(lái)拿著手機(jī)一樣,跟手機(jī)發(fā)消息,我覺(jué)得這個(gè)是關(guān)鍵的改變。夏勇峰:如果看背后的架構(gòu),我們是通過(guò)眼鏡以及與眼鏡長(zhǎng)期連接的手機(jī) APP 進(jìn)行第一道處理,處理完后,再將用戶的日常生活習(xí)慣與服務(wù)器上的需求進(jìn)行匹配。在我們服務(wù)器上,有預(yù)設(shè)的 prompt,還有 AI Hub,它連接著許多服務(wù),當(dāng)然還有很多 AI agent。我們會(huì)整體打包,指導(dǎo)它找到適合處理這個(gè)事情的大模型,大模型完成工作后結(jié)果返回服務(wù)器,再通過(guò)手機(jī)端返回到眼鏡上,基本上的工作邏輯是這樣的。張鵬:有人說(shuō)這類似第一代小愛(ài),現(xiàn)在用上大模型,有什么優(yōu)點(diǎn)?夏勇峰:關(guān)鍵是,第一代小愛(ài)發(fā)布的時(shí)候,根本沒(méi)有大模型啊。張鵬:小愛(ài)其實(shí)并不具備今天我們說(shuō)的這種無(wú)所不能的能力,對(duì)吧?夏勇峰:舉個(gè)例子,我們有一個(gè)功能叫做 AI 通知播報(bào)。比如我在飛書(shū)上收到了同事發(fā)來(lái)的圖片,如果是傳統(tǒng)的通知播報(bào),它沒(méi)有任何能力告訴你具體內(nèi)容,你只能掏出手機(jī)來(lái)查看飛書(shū)。現(xiàn)在有了 AI 通知播報(bào),我還沒(méi)掏出手機(jī),就聽(tīng)到信息:「xxx 剛才給你發(fā)了一張圖片,可能需要你確認(rèn)?!惯@就是 AI 通知播報(bào)的一個(gè)例子。當(dāng)然,我們同事也在考慮,是否加入圖像識(shí)別,但目前我們還沒(méi)打算做。還有一個(gè)例子,這是我真實(shí)遇到的情況,有時(shí)候你會(huì)突然被拉進(jìn)一個(gè)微信群,在設(shè)置免打擾之前,這個(gè)群會(huì)一直發(fā)出通知聲。如果你戴了這個(gè)眼鏡,你不必立刻查看并回應(yīng),甚至不用掏出手機(jī),AI 會(huì)先自動(dòng)給你一個(gè)小結(jié)。如果你發(fā)現(xiàn)確實(shí)與你相關(guān),再進(jìn)行回復(fù)。AI 為你提供了一層篩選,確保你不會(huì)錯(cuò)過(guò)重要信息,同時(shí)也不會(huì)被信息過(guò)度打擾。大家現(xiàn)在不得不經(jīng)常查看手機(jī),一看到微信通知就得解鎖手機(jī)。使用 AI 后,這樣的動(dòng)作大大減少了。有些人可能認(rèn)為這不是剛需,但根據(jù)我們之前的數(shù)據(jù)統(tǒng)計(jì),打開(kāi)通知播報(bào)的用戶比例非常高。我們之前有近 10 萬(wàn)用戶,超過(guò) 36% 的人開(kāi)啟了通知播報(bào),即便通知播報(bào)有非常多垃圾信息在騷擾他,他還是打開(kāi)了。這個(gè)確實(shí)是一個(gè)蠻高頻的需求。張鵬:我在發(fā)布之前用了測(cè)試版,一上來(lái)就發(fā)現(xiàn)有通知播報(bào),就打開(kāi)了微信和飛書(shū)這兩個(gè) APP 的通知播報(bào)。我發(fā)現(xiàn)它不是簡(jiǎn)單地把那個(gè)通知給我念一遍,其實(shí)會(huì)做一下概括,我后來(lái)發(fā)現(xiàn)這一點(diǎn)很好。這個(gè)功能,反而讓我更及時(shí)地收到信息,以前我是隔一個(gè)小時(shí)打開(kāi)手機(jī)看看有什么事,通知功能對(duì)我沒(méi)用,因?yàn)槲沂謾C(jī)都放不放在邊上,我也不看,但現(xiàn)在可能有一些比較緊急的事,我可以快速響應(yīng)。經(jīng)常有人給我發(fā)對(duì)話的截圖,發(fā)圖是想給我一些背景信息,讓我看看他們是怎么聊的。未來(lái)要是能幫我把圖識(shí)別了,直接幫我總結(jié)一下,我就不用看截圖里的對(duì)話了,那我會(huì)非常期待。夏勇峰:不過(guò)識(shí)別圖片會(huì)有新的問(wèn)題,它屬于多模態(tài)識(shí)別,我們還在討論,還沒(méi)有確定要加這個(gè)。但是 AI 通知播報(bào)我們已經(jīng)優(yōu)化了兩個(gè)月了,現(xiàn)在可用性其實(shí)蠻高的。張鵬:如果讓我推薦一個(gè)功能,肯定也是通知播報(bào)。我用了大概一周吧,感覺(jué)是,在這種比較智能的 summary 播報(bào)中,我能明顯感覺(jué)到有 AI 在里面起作用。感覺(jué)未來(lái)我甚至可以讓它去給我做簡(jiǎn)報(bào),把我要看的內(nèi)容都先概括一下。張鵬:AI 通知播報(bào)這個(gè)功能是我現(xiàn)在用得比較多的,可能未來(lái)還會(huì)有新的功能。有沒(méi)有新功能的可能性可以給我們透露一下?夏勇峰:年底我們會(huì)推出「界環(huán)愛(ài)聽(tīng)」,AI cast 這個(gè)功能。因?yàn)槲覀冇泻芏嗟挠脩舳际侵囟鹊亩鷻C(jī)用戶,或者說(shuō)重度的音頻內(nèi)容消費(fèi)用戶。舉個(gè)例子,我們的用戶里聽(tīng)小宇宙和喜馬拉雅的用戶占比是非常高的,遠(yuǎn)高于互聯(lián)網(wǎng)的平均占比,他們是重度播客用戶,經(jīng)常會(huì)一邊聽(tīng)播客,一邊干其他的事。我們做了一款短音頻的應(yīng)用。但是它和短視頻應(yīng)用最大的區(qū)別就是,它不需要那么多的 up 主,不需要那么多的真人,每一個(gè) up 主都是一個(gè) AI 小人兒。比如說(shuō),有一個(gè) AI 小人兒專門(mén)給你講東周的歷史,有一個(gè)小人專門(mén)給你講三國(guó),有個(gè)小人專門(mén)給你講笑話,也有小人專門(mén)給你去總結(jié)新聞,像這樣的會(huì)非常多,我們會(huì)關(guān)注到播客里有哪些內(nèi)容是比較受歡迎的。張鵬:就是用 agent 替代了所謂的 up 主,對(duì)吧?夏勇峰:對(duì),它跟短視頻的區(qū)別在于,我們的短音頻的時(shí)間會(huì)稍微長(zhǎng)一些。生成內(nèi)容之后有一個(gè) AI 小人兒當(dāng)內(nèi)容審核官,質(zhì)量差的打回去改,質(zhì)量好的就放出來(lái)。剛開(kāi)始的數(shù)量可能會(huì)少一點(diǎn),目前我試用的這個(gè)版本每天大概只有 20 個(gè)左右的短音頻,但是未來(lái)它會(huì)有很多。用戶使用它就像聽(tīng)播客一樣,不感興趣,往后滑,它就跳到下一個(gè),覺(jué)得又不感興趣,再往下滑,當(dāng)你滑得足夠快,你就會(huì)發(fā)現(xiàn)你討厭的內(nèi)容漸漸不會(huì)出現(xiàn)在你的「界環(huán)愛(ài)聽(tīng)」里面了,然后它逐漸就會(huì)知道應(yīng)該給你放什么。這是我們會(huì)在今年冬天上線的一個(gè)功能。張鵬:有人問(wèn),是覺(jué)得 up 主還不夠多,還是 AI 比人強(qiáng)?我說(shuō)一下我的理解,這些 agent 本質(zhì)上是要更無(wú)限貼合用戶想要的東西,倒不是說(shuō) up 主不夠,也可以說(shuō)是,完全跟你貼合的 up 主是不夠的,但不一定說(shuō)是 AI 比人強(qiáng)。因?yàn)?up 主再多,也是你在尋找能夠匹配你需求的 up 主,而且也不是真人 up 主的每個(gè)作品你都覺(jué)得特別好,人家也不會(huì)只為你創(chuàng)造內(nèi)容,但這個(gè) AI 是只為你創(chuàng)造內(nèi)容。所以我覺(jué)得,理論上如果這些平臺(tái)有 API,你其實(shí)也可以直接去聽(tīng)那個(gè) up 主的內(nèi)容,up 主內(nèi)容也是可以接進(jìn)來(lái)。但是如果覺(jué)得不夠匹配,AI 可以再圍繞你的需求去生成內(nèi)容,那這個(gè)其實(shí)就叫真正的大規(guī)模個(gè)性化。夏勇峰:如果覺(jué)得這個(gè)東西不好,還可以聽(tīng)小宇宙,我們就當(dāng)一個(gè)音頻眼鏡用,你如果覺(jué)得這個(gè)功能好,你就會(huì)用。我們逐漸會(huì)把它越做越好的,因?yàn)楫吘刮抑恍枰?AI 小人,我不需要 UGC。張鵬:這個(gè)挺好,用戶只要先帶上,先用通知的功能,覺(jué)得挺好,長(zhǎng)期帶上了,然后哪天你告訴我你有短音頻,如果我本身就是有短音頻消費(fèi)習(xí)慣,那我可能就用上了,一開(kāi)始就是消費(fèi)一些我原來(lái)認(rèn)識(shí)的 up 主,逐漸發(fā)現(xiàn),不夠的話你還能給我生成。你這個(gè)意圖叫滴水穿石,緩慢滲透。04 不是接了 api 就叫 AI 智能硬件張鵬:真的把大模型塞到硬件里去,還是要做一些基礎(chǔ)功能的,比如怎么搭架構(gòu)、怎么用。AI 語(yǔ)音播報(bào)這個(gè)功能的背后,架構(gòu)怎么搭的,是端側(cè)有模型嗎?還是都是在云端?為什么不直接調(diào)小愛(ài)大模型?夏勇峰:我們現(xiàn)在眼鏡沒(méi)有端側(cè)大模型,其實(shí)也沒(méi)有必要。一定程度上我們參考了 Meta 的一些做法,就是通過(guò)眼鏡加手機(jī)的 App 端,一起去做第一道處理。如果未來(lái)手機(jī)開(kāi)放了一些大模型語(yǔ)音的能力,包括分享、通知的權(quán)限、甚至 NPU,可以讓我們?cè)谏厦媾芤粋€(gè)小模型的話,肯定會(huì)部署端側(cè)的。為了加快本地的處理速度,實(shí)現(xiàn)更多的功能。但現(xiàn)在還沒(méi)有,現(xiàn)在我們是通過(guò) App 直連到服務(wù)器。首先在 App 端做了所有基于語(yǔ)音的一些分析,包括 TTS、 ASR、音色這些。在服務(wù)器端,首先跟你對(duì)話的 Agent,性格、情緒都是用戶自己設(shè)定的。第二是 RAG,第三是 AI Hub,我們連了十幾個(gè)大模型。我們還有一個(gè) AI 的長(zhǎng)期記憶的功能,也就是有更長(zhǎng)時(shí)間的歷史信息的上下文,由此來(lái)更準(zhǔn)確地判斷你的意圖。把這些實(shí)現(xiàn)了之后,我們還做了內(nèi)容質(zhì)量審核 AI,提交給用戶的內(nèi)容質(zhì)量過(guò)關(guān)了才能發(fā)給用戶。同時(shí),我們?cè)诜?wù)器端還做了關(guān)于大模型調(diào)度的 prompt,不同的應(yīng)用哪個(gè)大模型最好用?把它交給大模型,然后再回來(lái)做一些類似的工作,最后推到手機(jī)端,推到眼鏡端。張鵬:所謂的 AI 的智能硬件,如果只是接個(gè) API,是不能交付足夠好的結(jié)果的。它確實(shí)要站在用戶價(jià)值上,要做一套比較完整的、合理的架構(gòu),然后去合理的調(diào)用。你們已經(jīng)涉及到了不同模型的調(diào)用,甚至涉及到更長(zhǎng)期的記憶如何存儲(chǔ)、如何調(diào)用、如何配合。在不同的場(chǎng)景、交付的不同的價(jià)值下,可能都要考慮怎么去更合理地運(yùn)用 AI,這個(gè)我覺(jué)得會(huì)成為未來(lái) AI 智能硬件里很重要的一點(diǎn),它真的不是只接個(gè) API 就能解決的問(wèn)題。因?yàn)槲易罱戳撕脦讉€(gè)產(chǎn)品,說(shuō)「我是 AI 硬件」,「接了某某的 api」。這個(gè)不能叫 AI 硬件,不能很好解決問(wèn)題。為什么花了很長(zhǎng)時(shí)間在探討怎么定義這個(gè)產(chǎn)品?很重要的一點(diǎn)是,小夏同學(xué)非常明確的沒(méi)有認(rèn)為這個(gè)眼鏡能替代手機(jī),他其實(shí)是在手機(jī)的邊緣,來(lái)交付一個(gè)更好的體驗(yàn)。我覺(jué)得這個(gè)是核心點(diǎn),因?yàn)閯偛盼覀冋f(shuō)到很多東西,其實(shí)手機(jī)就能實(shí)現(xiàn)。但有一點(diǎn)很重要,前端的指令和意圖是通過(guò)眼鏡來(lái)的,而不是收入到手機(jī)里,也不是直接跟手機(jī)對(duì)話。交互的時(shí)候,用戶不需要拿出手機(jī),音頻就能交互。這就是剛才你說(shuō)的 VUI。我們理解 GUI,剛才你也說(shuō)到 VUI,還說(shuō)到 NUI,這本質(zhì)上就是未來(lái)的交互。未來(lái)的交付并不是要替代手機(jī)和電腦,但是它有可能會(huì)增加一種更接近用戶的自然體驗(yàn)的交互和交付,交互和交付都因?yàn)樗鼤?huì)有所不同。你怎么去定義和理解所謂的 GUI、VUI、NUI?夏勇峰:GUI 其實(shí)就是我們熟知的圖形用戶界面,當(dāng)時(shí)對(duì)計(jì)算機(jī)來(lái)講是一次非常重要的革命,因?yàn)橐寵C(jī)器知道人想干什么,其實(shí)是一件很困難的事。計(jì)算機(jī)早期的匯編語(yǔ)言都是一些非常標(biāo)準(zhǔn)化的東西,這個(gè)時(shí)候規(guī)定了一種范式,到后來(lái)就到了智能手機(jī)這個(gè)時(shí)代,但是它其實(shí)仍然是一種范式,比如說(shuō)屏幕,你需要告訴這個(gè)機(jī)器,你點(diǎn)到哪了。這就是為什么早期有一些老年人,使用智能手機(jī)其實(shí)有很高的門(mén)檻,因?yàn)檫€是需要學(xué)習(xí),雖然學(xué)習(xí)的成本比以前你學(xué)文字輸入、學(xué) QWERTY 的鍵盤(pán)要簡(jiǎn)單一些,但它還是有門(mén)檻。未來(lái)整體的交互,很多朋友都認(rèn)為,會(huì)進(jìn)入一個(gè) NUI 自然用戶界面。你只需要做自己就好了,該說(shuō)什么話說(shuō)什么話,該做什么動(dòng)作做什么動(dòng)作,機(jī)器變得越來(lái)越聰明了。你做自己,機(jī)器就知道你想干啥,然后就給你相應(yīng)的服務(wù),這個(gè)是我們認(rèn)為未來(lái)的交互,它可能形成了一種形態(tài),特別是在通用大模型出現(xiàn)之后,可能我們沒(méi)辦法很快出現(xiàn)通用人工智能,但是讓機(jī)器能夠識(shí)別到你的自然行為,這件事情會(huì)容易很多。我認(rèn)為這個(gè)也是我們未來(lái)眼鏡要實(shí)現(xiàn)的一個(gè)目標(biāo),當(dāng)然同時(shí)也是因?yàn)椋绻朐谘坨R上用鍵盤(pán)打字,或者要用觸摸操作,這基本上也實(shí)現(xiàn)不了。張鵬:舉個(gè)例子,假如說(shuō)我旁邊有個(gè)助理,我用手指這里,跟助理說(shuō)「把這個(gè)關(guān)掉」,這是我們正常的情況,但如果在今天我要去跟小愛(ài)同學(xué)交流,我恐怕還得說(shuō)「小愛(ài)同學(xué),把我臥室里的空調(diào)往下調(diào)低多少度」。但理論上,未來(lái)如果你有這樣的一個(gè)設(shè)備,假定它是能夠開(kāi)眼看世界的,有一個(gè)傳感器,我說(shuō)把這個(gè)關(guān)掉有點(diǎn)冷,它應(yīng)該就能識(shí)別我在哪個(gè)空間,同時(shí)知道我說(shuō)的是空調(diào),我不需要去指出具體的要求,這是我具象化一下你說(shuō)的那個(gè)場(chǎng)景。按照這個(gè)推理來(lái)講,我越來(lái)越覺(jué)得,真的不考慮加上攝像頭輸入交互嗎?夏勇峰:攝像頭看了之后,如果還是需要自己去輸入指令給機(jī)器的話,其實(shí)還是 VUI,但是機(jī)器有一個(gè)攝像頭,可以減少你的輸入成本。張鵬:就像我說(shuō),「把這個(gè)關(guān)掉」,而不是說(shuō)「把臥室的空調(diào)下調(diào)幾度」,這個(gè)其實(shí)就降低了我的輸入成本。這個(gè)攝像頭本質(zhì)是意圖傳感器,我猜未來(lái)肯定會(huì)加的。夏勇峰:我先把 VUI 做好,其實(shí)對(duì)我來(lái)說(shuō) VUI 是 NUI 的一個(gè)前置階段,VUI 做好的價(jià)值就非常大了。05AI 不會(huì)憑空創(chuàng)造需求,只能無(wú)限提升體驗(yàn)張鵬:前段時(shí)間字節(jié)買了個(gè)耳機(jī)的公司,耳機(jī)看起來(lái)也是可以在 VUI 上走的。為啥你做的不是耳機(jī),而是眼鏡呢?夏勇峰:我覺(jué)得耳機(jī)跟墨鏡基本上是一類產(chǎn)品。用戶不是每天無(wú)感的,或者從早到晚的戴,它是一個(gè)有了需求才會(huì)戴上,需求結(jié)束馬上摘掉的產(chǎn)品。VUI 需要有很多交互,但你需要用這個(gè)交互的時(shí)候,它可能根本不在你的耳朵上。張鵬:本質(zhì)上還是用戶使用時(shí)長(zhǎng)不夠。夏勇峰:你不可能戴一天的耳機(jī),否則走路很危險(xiǎn),開(kāi)車也用不了。有人問(wèn)我們,為什么不做充電盒?因?yàn)槲覀儧](méi)有「不用了就把它摘下來(lái)」這樣的一個(gè)場(chǎng)景。如果是耳機(jī)不用了,你會(huì)把它摘下來(lái),放到充電盒里,它可以繼續(xù)充電,這是很自然的。但是眼鏡就得用一天,所以我們的續(xù)航一定要能用一天,不可能說(shuō),我是一個(gè)近視的用戶,下午 2 點(diǎn)鐘就把它摘下來(lái)了,這個(gè)不太可能。對(duì) AI 來(lái)說(shuō),有主動(dòng)發(fā)出指令,也有被動(dòng)收到 AI 通知的場(chǎng)景。比如說(shuō)通知,主動(dòng)給你小結(jié)的這種,當(dāng)你耳機(jī)在充電盒里的時(shí)候,沒(méi)有任何作用,但是如果戴的是一個(gè)眼鏡,基本上每天是無(wú)縫無(wú)感地在使用,這是它最大的一個(gè)區(qū)別。張鵬:這個(gè)視角也對(duì),我覺(jué)得要從讓用戶能帶上且能長(zhǎng)期帶上出發(fā),才能讓 AI 在需要發(fā)揮作用的時(shí)候真的就能起到作用。不能把它變成一個(gè)「目的地」型的東西,什么時(shí)候要用 AI 了再戴上。這個(gè)設(shè)備終于不用再提醒我,你戴了一個(gè)智能設(shè)備。它出現(xiàn)一些耳語(yǔ)的時(shí)候是給到我驚喜的,因?yàn)槲矣X(jué)得就是戴了個(gè)眼鏡而已。這里也涉及到一個(gè)考慮,它叫智能音頻眼鏡,很重要的一個(gè)功能也確實(shí)就是耳機(jī)的功能,所以你到底是在革新眼鏡還是在革新耳機(jī)?夏勇峰:我們有一句 slogan 叫「科技革新傳統(tǒng)眼鏡」,因?yàn)槲覀冎暗挠脩衾铮?9% 都是矯正用戶,近視或者老花用戶。他們用了這個(gè)眼鏡之后,如果是長(zhǎng)期戴眼鏡的人,基本上是近乎 100% 替代了自己平常使用的傳統(tǒng)眼鏡,傳統(tǒng)眼鏡就變成了它的備用鏡,所以它的替代性是很明顯的。但是我們其實(shí)沒(méi)有替代耳機(jī)。因?yàn)楝F(xiàn)在有對(duì)耳機(jī)有很多需求,比如說(shuō)想安靜的時(shí)候,有降噪的需求,我們做不到。打游戲的時(shí)候有低延時(shí)的需求,這個(gè)我們未來(lái)可能可以做到,但是現(xiàn)在肯定沒(méi)有游戲類的專業(yè)耳機(jī)好。比如說(shuō)客服戴的耳機(jī),需要一個(gè)離嘴非常近的麥克風(fēng)??傊褪?,耳機(jī)的多樣性非常多,不可能用我們這樣一個(gè)音頻類的產(chǎn)品就能 cover 掉所有的耳機(jī)需求,但是基本上 cover 了他們眼鏡的需求,這個(gè)是數(shù)據(jù)統(tǒng)計(jì)的結(jié)果。張鵬:有道理,而且如果真的要讓科技革新傳統(tǒng)眼鏡,我就能理解為什么需要考慮很多不同的款型,不能說(shuō)一出門(mén),發(fā)現(xiàn)大家怎么戴的都是一個(gè)款型的眼鏡。夏勇峰:傳統(tǒng)眼鏡的歷史已經(jīng)證明了,單一款型不 work。張鵬:所以它其實(shí)是需要更多個(gè)性化的選擇,但同時(shí)又要做到讓大家先能戴上,而且長(zhǎng)時(shí)間的戴上。這一點(diǎn)我覺(jué)得還挺重要的,我們判斷互聯(lián)網(wǎng)的一個(gè)產(chǎn)品有沒(méi)有在未來(lái)做越來(lái)越多的能力,核心就是用戶得有時(shí)長(zhǎng)。如果這個(gè)眼鏡我一天能戴 10 個(gè)小時(shí),隨著未來(lái)傳感能力不斷升級(jí),對(duì)我意圖的理解更徹底,那它能幫我干的事一定會(huì)更多。如果就一天一拿出來(lái)用三次,這個(gè)硬件我覺(jué)得沒(méi)前途,就是賣點(diǎn)硬件的錢(qián),甚至你的模型、你所有的功能都無(wú)法成長(zhǎng)。所以有可能存在這么一個(gè)點(diǎn),我可能說(shuō)的有點(diǎn)武斷,就是未來(lái)的 AI 智能硬件的佩戴時(shí)長(zhǎng)得有個(gè)三五個(gè)小時(shí)起步,否則這個(gè) AI 硬件可能最后就還是賣了個(gè) AI 噱頭,沒(méi)有真正長(zhǎng)期的成長(zhǎng)性。夏勇峰:AI 硬件就是使用 AI 的硬件??傮w來(lái)說(shuō),人們從早到晚都在用的有兩大巨頭——電腦和手機(jī),它首先要從兩大巨頭之外找到自己生存的空間,在這個(gè)空間里,它要成為大家使用 AI 的第一優(yōu)先級(jí),這個(gè)可能是它的一個(gè)最基礎(chǔ)的生存條件。張鵬:今天得到的一個(gè)啟發(fā)就是怎么去看 AI 硬件,有一個(gè)很重要的維度,就是到底是拿 AI 當(dāng)賣點(diǎn)去賣硬件,還是硬件未來(lái)能順著 AI 的能力持續(xù)成長(zhǎng),釋放更大價(jià)值。這個(gè)核心的分界點(diǎn)就是,用戶到底有多少使用時(shí)長(zhǎng),要做到這一點(diǎn),就得先解決用戶的某個(gè)確定問(wèn)題,把它解決好,才可能會(huì)有這個(gè)資格。夏勇峰:我也做了幾百種不同的硬件了,越來(lái)越感覺(jué)到,人的需求能夠不斷地被滿足得更好,但是想要?jiǎng)?chuàng)造一個(gè)需求其實(shí)是非常難的。我覺(jué)得 AI 不會(huì)憑空給人創(chuàng)造一個(gè)之前本身就不存在的需求,它只會(huì)讓人的某些需求能夠被滿足得更好,或者是提高某些效率,或者是讓人聽(tīng)什么東西聽(tīng)得更爽,看什么東西看得更爽。以前某些場(chǎng)景下滿足不了的需求,現(xiàn)在因?yàn)?AI 可以滿足了,基本上只能是對(duì)需求的進(jìn)一步滿足,不太可能出現(xiàn)之前不存在的需求。比如說(shuō)需要一個(gè)外腦,像上帝一樣天天在你旁邊,來(lái)分析你所有的每天從早到晚的事情,我覺(jué)得它太寬泛,或者說(shuō)太理想化了,它得具體到人本身的需求。可能這一點(diǎn)我也有一些武斷,我覺(jué)得需求只會(huì)被滿足得更好,但是不可憑空創(chuàng)造需求。我發(fā)現(xiàn)某一些 AI 硬件,它覺(jué)得有了 AI 可以憑空創(chuàng)造出之前不存在的需求,這一點(diǎn)我持比較謹(jǐn)慎的看法。張鵬:Ray-Ban Meta 的這個(gè)眼鏡,大家之所以這么關(guān)心,核心就是,這是所謂的科技眼鏡產(chǎn)品中,第一個(gè)賣過(guò)百萬(wàn)臺(tái)的,除了之前的 VR 這種被大平臺(tái)狂推的東西,這是用戶自己主動(dòng)去買的設(shè)備。你會(huì)怎么判斷它未來(lái)可能的走向?自己內(nèi)部肯定也分析過(guò),今天國(guó)內(nèi)至少有幾十家公司要復(fù)刻 Ray-Ban Meta。它之所以具有這個(gè)所謂的階段性成功,是因?yàn)槭裁矗克磥?lái)的發(fā)展會(huì)遇到什么樣的挑戰(zhàn)?會(huì)有可能往哪走?夏勇峰:海外有一些關(guān)于 Ray-Ban Meta 的用戶調(diào)研報(bào)告,超過(guò) 40% 的用戶對(duì)它的第一的訴求其實(shí)是第一視角拍攝視頻質(zhì)量 OK,而不是 AI。張鵬:肯定不是,因?yàn)樗鰜?lái)的時(shí)候還沒(méi)有什么 AI 相關(guān)的東西。夏勇峰:然后我們?cè)僮⒁獾?,有很多用戶,其?shí)首先是需要一個(gè)墨鏡,Ray-Ban 又是一個(gè)足夠好的牌子。我有個(gè)朋友跟我說(shuō),他走進(jìn)了一家 Ray-Ban 的店,需要去買一個(gè)墨鏡,他發(fā)現(xiàn)有普通墨鏡和 Ray-Ban Meta,中間的差價(jià)非常少,應(yīng)該是在幾十美元這樣的一個(gè)程度,一個(gè)是傳統(tǒng)的,一個(gè)帶了很多功能,然后用戶就選了 Ray-Ban Meta。張鵬:所以科技幾乎是贈(zèng)品對(duì)吧?是一個(gè)讓你覺(jué)得很合算的贈(zèng)品,有點(diǎn)這種感覺(jué)?夏勇峰:反正我是覺(jué)得,因?yàn)?AI 去買 Ray-Ban Meta 的人,在目前它的用戶群里應(yīng)該是相對(duì)的少數(shù)。如果沒(méi)有 AI,它做了非常好的一個(gè)智能的墨鏡,我覺(jué)得他也能賣到跟今天相差不遠(yuǎn)的數(shù)量。張鵬:所以它其實(shí)并不是因?yàn)?AI 才火的。本質(zhì)上是一個(gè)好的品牌,然后加了科技感和一些有意思的功能的產(chǎn)品,大家一看差價(jià)也不太多,原來(lái)買個(gè)普通 Ray-Ban 也得這個(gè)錢(qián),那就買了。夏勇峰:但是話說(shuō)回來(lái),如果 AI 持續(xù)升級(jí),它有可能從現(xiàn)在的第二賣點(diǎn)上升,直到某一天基于它的用戶群免費(fèi)(眼鏡的 AI 使用是免費(fèi)的,沒(méi)有訂閱費(fèi)),它變成了一個(gè)非常高價(jià)值的點(diǎn),這個(gè)時(shí)候它可能會(huì)完成從一個(gè)足夠好的智能墨鏡到一個(gè)真正的 AI 眼鏡的轉(zhuǎn)變,這是有可能會(huì)發(fā)生的。其實(shí)我的觀點(diǎn)跟你很一致,我也認(rèn)為最開(kāi)始的核心的賣點(diǎn)絕大部分來(lái)自于眼鏡本身。但它未來(lái)的價(jià)值,可能 70% 會(huì)來(lái)自于 AI。所以順著這個(gè)角度去看,美國(guó)目前的狀態(tài)還是比較領(lǐng)先的,他們的技術(shù)能力,整個(gè)硅谷的生態(tài)都非常領(lǐng)先。06越是無(wú)限可能,越要約束自己的想象
張鵬:我最近在美國(guó)也看了一些硬件的團(tuán)隊(duì)。感覺(jué)那邊其實(shí)已經(jīng)有非常多的團(tuán)隊(duì)在思考新形態(tài)的硬件,結(jié)合非常 advance 的模型,當(dāng)然他們也同時(shí)在思考,怎樣做好一個(gè)對(duì)應(yīng)的架構(gòu)。以前我們都說(shuō),要搞硬件還得看中國(guó),過(guò)去這些年有哪個(gè)海外團(tuán)隊(duì)搞硬件能真正火起來(lái)的?基本都是中國(guó)的團(tuán)隊(duì)。但這一波你怎么看?結(jié)合大模型這件事,有沒(méi)有可能,海外會(huì)有一些硬件團(tuán)隊(duì),會(huì)順著這波新的技術(shù)浪潮做出一些超級(jí)品類的產(chǎn)品,會(huì)有這種可能性嗎?還是說(shuō)這個(gè)未來(lái)還是屬于咱們中國(guó)團(tuán)隊(duì)的?夏勇峰:從經(jīng)驗(yàn)主義的角度來(lái)看,我不看好美國(guó)會(huì)有新的創(chuàng)業(yè)團(tuán)隊(duì)做出一個(gè)風(fēng)靡全球的 AI base 的硬件。當(dāng)時(shí)在小米生態(tài)鏈的時(shí)候,其實(shí)我也見(jiàn)了非常非常多美國(guó)硬件的團(tuán)隊(duì),東海岸、西海岸都有。比如說(shuō) Lily 無(wú)人機(jī),這是當(dāng)年非?;鸬囊粋€(gè)號(hào)稱創(chuàng)新的無(wú)人機(jī),這些團(tuán)隊(duì)的創(chuàng)始成員大部分沒(méi)有硬件背景,甚至沒(méi)有關(guān)于硬件的很多粗淺的概念。美國(guó)大部分的硬件創(chuàng)業(yè)者,之前都是算法工程師或者是軟件產(chǎn)品經(jīng)理,當(dāng)然也不絕對(duì),可能也有從 Tesla,從蘋(píng)果的硬件團(tuán)隊(duì)出來(lái)的,也有設(shè)計(jì)師出身的。夏勇峰:我覺(jué)得不是容易犯什么錯(cuò),他們會(huì)把硬件理解得過(guò)于簡(jiǎn)單,因?yàn)橛布蛙浖虚g的這個(gè)墻一直都沒(méi)有被完全打破,除非你已經(jīng)是一個(gè)巨大的成功的公司。他們會(huì)認(rèn)為,他們?cè)O(shè)想了一個(gè)產(chǎn)品,只需要在中國(guó)找一個(gè)工廠就能完全幫他做出來(lái)。但是硬件里,需要去修改產(chǎn)品定義或者妥協(xié)的部分,他們一般都不會(huì)很在意。前段時(shí)間有一個(gè)非?;鸬膰?guó)外團(tuán)隊(duì),找我們的一個(gè)世界 500 強(qiáng)的合作伙伴,給他們 ODM 了一款硬件產(chǎn)品,全程好像一共通過(guò) 10 次郵件。他們不談?dòng)布募?xì)節(jié),我覺(jué)得這點(diǎn)是有比較大的缺失,他們對(duì)于硬件的設(shè)想也會(huì)相對(duì)理想化一點(diǎn)。當(dāng)然因?yàn)樗麄兊拇竽P秃?AI,包括他們的 AI 應(yīng)用、agents 都會(huì)比較先進(jìn)一些,所以他們對(duì)于 AI 未來(lái)的一些模型應(yīng)用,硬件上會(huì)比我們的更先進(jìn)一些。有一個(gè)詞兒可能不太恰當(dāng),我覺(jué)得他們更像是 AI 的原教旨主義者,他們認(rèn)為 AI 能改變一切,能創(chuàng)造一切,這是我跟他們當(dāng)中的一些人溝通時(shí)的感覺(jué)。所以,我覺(jué)得中國(guó)團(tuán)隊(duì)還是有機(jī)會(huì)的,但如果只是中國(guó)擅長(zhǎng)硬件或者供應(yīng)鏈的團(tuán)隊(duì),恐怕不行。特別是在 AI 上,恐怕是不行的。我們的缺點(diǎn)也非常明顯。在硅谷,我還是聽(tīng)到了很多,不管是做設(shè)計(jì)出身的,還是做軟件產(chǎn)品經(jīng)理出身的人,他們對(duì)他們市場(chǎng)中用戶的一些洞察,包括如何運(yùn)用 AI 解決問(wèn)題,都是挺有創(chuàng)新性的,但確實(shí)是,到最后落到硬件還是有這么一攤事。如果從我的視角來(lái)看,這個(gè)產(chǎn)品放在海外,大家就會(huì)覺(jué)得你不夠猛,比如,怎么可能上來(lái)不加傳感器呢?但是我覺(jué)得你會(huì)關(guān)注的是,它怎樣成為一個(gè)穩(wěn)定的、能交付、能滿足用戶的需求的東西,用戶不用為我的創(chuàng)新付出過(guò)大的代價(jià),我不去押注在什么上面,然后用戶就愿意付出很大的代價(jià),或者獲得一個(gè)超級(jí)大的收獲。先讓大家戴上它,解決問(wèn)題,然后軟件和 AI 是可以往上疊加的,功能是可以越做越多的。再追問(wèn)一下,今年在一開(kāi)始火起來(lái)就是 AI Pin,后來(lái)也遇到了很多吐槽,它的問(wèn)題到底在哪?夏勇峰:他實(shí)現(xiàn)不了想要的那個(gè)感覺(jué),如果他自己的硬件概念更多一些的話,就會(huì)知道,不管是投影還是固定的方式,根本不能夠支撐他作為一個(gè)哪怕是手機(jī)的備用品這件事,投影就得有流明的概念,就會(huì)設(shè)想它在室外和室內(nèi)的使用問(wèn)題,其實(shí)通過(guò)非常簡(jiǎn)單的一些數(shù)據(jù)和參數(shù)的推導(dǎo),就會(huì)知道這個(gè)產(chǎn)品會(huì)存在問(wèn)題。張鵬:我記得小夏應(yīng)該記得這句話,在 2013 年初,我們倆一起去見(jiàn)張小龍,被龍哥啟發(fā)過(guò)。當(dāng)時(shí)我們聊到一個(gè)結(jié)論,那時(shí)候微信看起來(lái)有非常好的勢(shì)頭,當(dāng)時(shí)龍哥說(shuō),「越是無(wú)限可能,越要約束自己的想象」。你看微信今天已經(jīng)成為了能干這么多事的東西,但在那個(gè)時(shí)刻,其實(shí)我們跟他說(shuō)了無(wú)數(shù)個(gè),你可以干這個(gè),也可以干那個(gè)。龍哥就是特別沉靜,不著急,一步一步地來(lái)。我突然想起了這個(gè)場(chǎng)景,這個(gè)讓我回憶起來(lái)還是印象蠻深的。所以 AI 智能硬件這件事還真的要一步一個(gè)腳印的來(lái)。張鵬:據(jù)我所知,中國(guó)已經(jīng)有大量團(tuán)隊(duì)在這種所謂智能眼鏡的賽道上聚集了,你怎么看?是不是很快會(huì)有百鏡大戰(zhàn)了?在這里,最終要想能夠活下來(lái),能夠創(chuàng)造更大的價(jià)值,你會(huì)覺(jué)得核心在考驗(yàn)什么?夏勇峰:我知道的創(chuàng)業(yè)團(tuán)隊(duì)和有一些公司的項(xiàng)目大部分類似于 Ray-Ban Meta,然后也有一部分是基于現(xiàn)有的一些智能眼鏡,直接把攝像頭往上加的,你知道它能夠幫你識(shí)別內(nèi)容,但是大部分人其實(shí)就是問(wèn)一下這是什么,然后得到一個(gè)回答,嘗嘗鮮。可能是我了解不夠,現(xiàn)在我還沒(méi)有看到更深入的一些應(yīng)用。未來(lái)的百鏡大戰(zhàn),我覺(jué)得它會(huì)快速產(chǎn)生,然后快速教育市場(chǎng),然后會(huì)出現(xiàn)非??焖俚奶蕴偷倪^(guò)程。夏勇峰:如果出現(xiàn)真正創(chuàng)新的東西,它的崛起也會(huì)非??臁2粫?huì)給慢性子的人留時(shí)間、留空間。要么就是忽然長(zhǎng)出來(lái)一個(gè),要么就是掛得非常快,基本上會(huì)出現(xiàn)這樣的一個(gè)情況。所以我覺(jué)得,考驗(yàn)的一是資源能力,二是對(duì)于 AI 和硬件的理解力,三是這個(gè)組織的效率?;旧暇褪强简?yàn)這幾點(diǎn),以現(xiàn)在我們所知道的信息,類似這樣的局面應(yīng)該在不久的將來(lái)就會(huì)到來(lái)。張鵬:我們說(shuō)百鏡大戰(zhàn)在路上,但是可能也是一場(chǎng)快速的戰(zhàn)役,記得當(dāng)年無(wú)人機(jī)曾經(jīng)也有過(guò)一波熱潮,后來(lái)就全消退了,沒(méi)有人跟大疆一起搞了,能夠看到這種感覺(jué),今天應(yīng)該是很多人都在關(guān)注、在做,但把這事做對(duì)、做到位,變得很關(guān)鍵。最后我再追問(wèn)個(gè)問(wèn)題,蜂巢這樣的一個(gè)公司,在界環(huán)這樣的一個(gè)品牌下,未來(lái)想實(shí)現(xiàn)的是一個(gè)什么樣的目標(biāo)?也許可能不是一下就改變個(gè)人計(jì)算,但你階段性想實(shí)現(xiàn)的目標(biāo)到底是什么?你覺(jué)得大概會(huì)用一個(gè)多長(zhǎng)的周期去實(shí)現(xiàn)它,實(shí)現(xiàn)的時(shí)候可能會(huì)是個(gè)什么樣子?夏勇峰:所謂界環(huán),就是世界之環(huán)的意思。什么叫世界之環(huán)呢?就是自我和世界,他人即世界,你自己和世界中間的界限,我們想要倡導(dǎo)的理念是「融入世界而不喪失自我,取悅自己而不是自我封閉」。最早我說(shuō)為什么不做 VR,我覺(jué)得 VR 是一個(gè)把自己完全封閉起來(lái)的一個(gè)東西。我希望做開(kāi)放的、在自己日常的行動(dòng)中、在你日常完成自己目標(biāo)的這個(gè)過(guò)程中,它能夠幫助到你,在旁邊給你一個(gè)附加的東西,我希望做這類的產(chǎn)品。所以眼鏡相機(jī)和現(xiàn)在的音頻眼鏡,其實(shí)目標(biāo)是一致的,就是你自己有你自己的目標(biāo),然后不要封閉,但是也不要喪失自我。這是界環(huán)還想傳達(dá)的一個(gè)理念,我希望現(xiàn)在第一階段能夠?qū)崿F(xiàn)的目標(biāo)就是,音頻眼鏡能夠以每年兩倍、三倍的銷量的增速去替代傳統(tǒng)眼鏡。反正今年是實(shí)現(xiàn)了,我覺(jué)得明年大概率也能實(shí)現(xiàn),用 3 到 4 年的時(shí)間,每年超過(guò) 100 萬(wàn)臺(tái),我覺(jué)得它會(huì)迎來(lái)一些質(zhì)變。目前我的核心還是在滿足傳統(tǒng)眼鏡需求的同時(shí),逐漸去對(duì)傳統(tǒng)眼鏡產(chǎn)生一些替代性的作用,然后同時(shí)能夠在每個(gè)人的耳機(jī)使用時(shí)間上占到比其他的類型的耳機(jī)更多的時(shí)間,這個(gè)是我現(xiàn)在這個(gè)階段的努力,是比較艱難的目標(biāo)。我覺(jué)得一個(gè)優(yōu)秀的創(chuàng)業(yè)者往往是,能夠在無(wú)限可能的時(shí)候約束想象,把每一步走扎實(shí)。聚焦這個(gè)階段是什么問(wèn)題,然后把它解決好。因?yàn)榧夹g(shù)永遠(yuǎn)能給你帶來(lái)無(wú)限的可能性,只要你把這個(gè)東西做扎實(shí),那這些新的東西永遠(yuǎn)不缺。但容易犯的錯(cuò)誤是,一上來(lái)說(shuō)了一個(gè)恢弘的東西,但最后折在了那些該做好的基本功上。尤其是在硬件上,軟件還可以改代碼,但硬件就沒(méi)機(jī)會(huì)了,一旦做不成就完蛋了。
|