影智科技創(chuàng)始人唐沐認為:具身智能在產(chǎn)品設(shè)計上應(yīng)該解決特定需求,而非單純追求形式上的“人形”。具身智能的真正價值,在于以具體問題為導(dǎo)向,讓機器人能夠靈活適應(yīng)環(huán)境、精準滿足需求。 | 馬斯克、黃仁勛等人的站臺,讓具身智能迅速躥升為2024年最受資本追捧的賽道之一。復(fù)盤具身智能賽道過去一年融資事件,人形機器人是出現(xiàn)頻率最高的詞。或許是受《機械姬》、《西部世界》等科幻作品的影響,人們本能地認為具身智能應(yīng)該擁有雙手雙腳、面部表情等設(shè)計。但影智科技創(chuàng)始人唐沐對此并不認同:“具身智能在產(chǎn)品設(shè)計上應(yīng)該解決特定需求,而非單純追求形式上的’人形’。當(dāng)前市場對人形機器人的追捧更多是概念化,而非實用主義。”作為QQ頭像、微信表情包等現(xiàn)象級符號的締造者,小米路由器、小愛智能音箱等億級爆款產(chǎn)品的掌舵人,唐沐以其敏銳的洞察力和創(chuàng)新的產(chǎn)品思維,打造了一系列國民級產(chǎn)品。與那些還處于實驗室狀態(tài)、“吊著威亞”展示的人形機器人不同,影智科技的xbot咖啡機器人已經(jīng)是各種科技展會上的明星,每次體驗機器人制作咖啡的觀眾都排起了長隊。具身智能為什么必須回歸需求導(dǎo)向?這種理念為機器人帶來了哪些顛覆性的改變?又有哪些成功落地的應(yīng)用場景?帶著這些問題,我和影智科技創(chuàng)始人唐沐進行了一場深度對話,嘗試打破外界的刻板印象,找到通往具身智能正確答案。2023年走進大眾視野的具身智能,正處于“八仙過?!?的時期,吸引了一大批用人形機器人求解具身智能的創(chuàng)業(yè)者。而支撐他們投身人形機器人的動機,可能只是一場不確定的“風(fēng)”:當(dāng)馬斯克開始做人形機器人之后,市場、資本機構(gòu)都認為必須加快入場,不能等特斯拉真正做出來了大家再去追。有著20多年產(chǎn)品經(jīng)驗的唐沐,并不茍同這種追風(fēng)現(xiàn)象。2003年,唐沐加入騰訊,著手組建了騰訊用戶研究與體驗設(shè)計中心(CDC),負責(zé)QQ、QQ電腦管家、QQ音樂、QQ空間等億級用戶的產(chǎn)品體驗設(shè)計。外界所熟悉的QQ頭像、微信表情包等均出自唐沐之手。2013年,本著“做一款自己的產(chǎn)品”的想法,唐沐加入小米,歷任智能產(chǎn)品部總經(jīng)理、小米生態(tài)鏈副總裁,帶領(lǐng)團隊開創(chuàng)了小米路由器、小愛音箱兩條億級產(chǎn)品線,以及VR、AR、機器人等領(lǐng)域的技術(shù)探索。多年后,唐沐離開小米創(chuàng)辦了影智科技,天使投資人名單中不乏微信之父張小龍、小米聯(lián)合創(chuàng)始人林斌、黎萬強、黃江吉、洪鋒等外界耳熟能詳?shù)娜宋铩?/span>影智科技的標桿產(chǎn)品,正是前面提到的xbot咖啡機器人。彼時,唐沐就意識到,機器人需要遵循技術(shù)的底層邏輯,在正確的時間做正確的事,而非奔著一個遙遠的目標給投資人畫餅。這樣的履歷,讓唐沐有足夠的底氣選擇不盲目追風(fēng),堅持自己對具身智能趨勢的理解和洞察。當(dāng)其他創(chuàng)業(yè)者為人形機器人枕戈待旦時,堪稱“國內(nèi)具身智能消費機器人第一人”的唐沐,沒有沉溺于對人形機器人的空洞想象,理性地講述了自己對機器人演進路徑的獨到見解:X1階段是工業(yè)機器人,強調(diào)動作的人工編排,用于工廠內(nèi)的高度結(jié)構(gòu)化任務(wù);X2階段是消費機器人,結(jié)合人工與AI進行任務(wù)編排,比如學(xué)習(xí)咖啡師的技藝訓(xùn)練機器人的拉花技巧;X3階段是具身智能消費機器人,擁有視覺、聽覺、觸覺等多模態(tài)感知能力,可以基于用戶的個性化信息,結(jié)合消費場景和用戶進行深層次互動,進一步提升服務(wù)質(zhì)量和靈活性;和人形機器人廣泛而模糊的目標不同,唐沐認為:機器人的進化路徑,不是從'像人’開始,而是從'更有用’出發(fā)。具身智能的真正價值,在于以具體問題為導(dǎo)向,讓機器人能夠靈活適應(yīng)環(huán)境、精準滿足需求,這才是技術(shù)發(fā)展的正確方向,就像讓機器人做咖啡。相比人形機器人在舞臺上比心、跳舞等“炫技”,影智科技的xbot咖啡機器人讓人記住的,是實打?qū)嵉摹靶沦|(zhì)生產(chǎn)力”:能夠在75秒內(nèi)復(fù)刻大師級的拉花咖啡技藝。2021年舉辦的黑杯咖啡大師競技賽上,xbot咖啡機器人和世界級拉花咖啡師同臺競技,并最終摘得了冠軍。由于人類咖啡師的集體抗議,xbot咖啡機器人在第二年“被迫”當(dāng)了評委。主辦方先讓xbot咖啡機器人做一杯拉花咖啡,然后讓人類咖啡師還原,并根據(jù)完成度評分。現(xiàn)在,xbot咖啡機器人已經(jīng)不單單是效率上的降維打擊,在大模型的賦能下重新定義了服務(wù)邊界——從生產(chǎn)力工具躍升為兼具情感互動與個性化服務(wù)的咖啡智能體。在星巴克的品牌故事里,有一個重要的理念是“將顧客作為朋友”,咖啡師熟悉每一位顧客的名字和喜好,甚至在顧客進門前就準備好了他們常點的飲品,以此給予顧客在家和工作之外的歸屬感。但在中國市場,這種歸屬感早已輸給了人效二字:被一杯杯訂單忙到喘不過氣的咖啡師們,很難有精力和顧客建立有感情的溝通??Х鹊昶吹氖浅鰡瘟亢瓦\營效率,而非顧客的體驗感。在唐沐看來,這正是具身智能的現(xiàn)實價值。“X2階段的機器人已在效率上實現(xiàn)對人工的降維碾壓,而大模型的多模態(tài)感知與認知推理能力,將重新定義咖啡消費,不僅賦予了咖啡人情味兒,還拓展出了全新的消費場景?!?/span>影智科技自研的xbot咖啡大模型已經(jīng)應(yīng)用到三類消費場景中,完美詮釋了唐沐的理念:除了大師級的拉花技藝,xbot咖啡大模型帶來了獨一無二的咖啡體驗:顧客可以掃碼上傳自己感興趣的照片,通過AIGC技術(shù)生成自己喜歡的圖像風(fēng)格,讓咖啡機器人用焦糖在奶泡上打印出相應(yīng)的圖案。一杯咖啡滿足的不再只是“提神”的需求,也是一種社交資本:情人節(jié)給女朋友買一杯印有玫瑰花圖案的咖啡,在景點打卡時咖啡上印有剛拍的風(fēng)景……讓喝咖啡更有儀式感,并激發(fā)出消費者的社交需求。當(dāng)顧客走到咖啡機器人前點單時,可以智能識別用戶身份和口味偏好,自動切換到顧客喜歡的數(shù)字人形象,而且數(shù)字人會主動和顧客打招呼,并推薦顧客可能感興趣的咖啡品類。在用戶允許的情況下,咖啡機器人甚至可以通過聲音和表情實時感知顧客的情緒狀態(tài),比如顧客表現(xiàn)出疲倦或情緒低落時,建議顧客多加一些糖來保持好心情,或者調(diào)整咖啡因濃度幫助用戶提神。得益于xbot咖啡大模型的認知推理能力,基于顧客消費數(shù)據(jù)的個性化消費知識圖譜,顧客只需要一個類似“做一杯熱帶風(fēng)情”咖啡的指令,咖啡機器人能夠自動創(chuàng)作出符合顧客需求的咖啡,讓顧客的需求不再局限于已有的菜單,而且能夠根據(jù)自己的想法個性化定制。xbot咖啡大模型還能為顧客制定健康管理方案,比如了解到顧客連喝了三杯咖啡后,推薦喝一杯有利于健康的烏龍茶。如果說人形機器人追求的是形態(tài)上像人,唐沐的理念是思維上像人,讓具身智能機器人像人一樣和顧客打招呼,像人一樣關(guān)心顧客的情緒。唐沐進一步解釋稱:“具身智能還沒有終極的答案,不代表沒有可以參考的路徑,譬如十年前的自動駕駛,如果按照當(dāng)時預(yù)期的終極目標,到現(xiàn)在也沒有實現(xiàn),但并不妨礙L2.5、L3級別的自動駕駛能力上車。具身智能從發(fā)展到成熟的過程中,也存在大量可落地的場景。”擺脫了“炫技”等表面追求的xbot咖啡機器人,可能不如人形機器人有話題性,卻構(gòu)建了更貼近消費場景的具身智能生態(tài),打造出了更貼近當(dāng)前社會需求高度契合的真實圖景。高盛曾預(yù)測稱,在理想狀態(tài)下,軟硬件成本年均下降達到20%的話,人形機器人市場規(guī)模有望在2035年達到1540億美元。黃仁勛在媒體采訪中坦言,“100年后大街上將到處都是人形機器人”,馬斯克也在X上默契地回復(fù),“人形機器人普及程度將是汽車10倍”。面對具身智能的商業(yè)化問題,有別于動輒十年后、百年后的長遠敘事,唐沐用一組擲地有聲的真實數(shù)據(jù)給出了答案:“目前xbot咖啡機器人在全球部署超過300臺,包括博物館、景區(qū)、商場、展會、圖書館等場所,兩周前剛落地到70家萬達影城。每臺咖啡機器人日均制作的咖啡在200杯以上,最高的時候超過了350杯。僅在過去一個月,我們的營收已經(jīng)超過2000萬元?!?/span>正在大規(guī)模量產(chǎn)的xbot咖啡機器人唐沐對具身智能機器人的商業(yè)化構(gòu)想,也隨著xbot咖啡機器人的落地得到了充分驗證。比如在2023年成都大運會期間,成都的一家公司將xbot咖啡機器人“搬”到了大運會的運動員餐廳,24小時不間斷運營。期間吸引了不少運動員拍照打卡,不乏意大利、巴西等對咖啡要求很高的國家的運動員。后臺統(tǒng)計數(shù)據(jù)顯示,xbot咖啡機器人在12天里做了4000多杯咖啡,主辦方全程只安排了一個志愿者負責(zé)換料。
|