隨著馬斯克在2022年AI Day發(fā)布了第一款人形機(jī)器人Optimus,以及隨后ChatGPT 為代表的 AI 大模型取得突破。“機(jī)器人+生成式AI大腦”的具身智能組合,讓人看到了廣闊的發(fā)展前景,具身智能賽道成為AI創(chuàng)新最火爆的方向之一。 但過(guò)去兩年,具身智能產(chǎn)業(yè)落地卻一直很緩慢。 機(jī)器人+AI大模型,并未誕生提升物理世界生產(chǎn)力的產(chǎn)品。 機(jī)器人除了在發(fā)布會(huì)上表演跳舞,炒概念、拉股價(jià),并未誕生成功的產(chǎn)品。所以才會(huì)有那些AI在畫(huà)畫(huà)作詩(shī),人類繼續(xù)在搬磚的段子。 然而藏身于北京北苑路的具身智能企業(yè)影智科技,將可能改變這一狀況。 這家由多位業(yè)界大佬,如微信之父張小龍,小米聯(lián)合創(chuàng)始人林斌、黎萬(wàn)強(qiáng)、黃江吉、洪鋒共同投資的具身智能企業(yè),正在改變消費(fèi)產(chǎn)業(yè)的生產(chǎn)方式。 影智科技推出的xbot咖啡機(jī)器人,75秒就可以制作出20年咖啡大師做的拉花咖啡,精度達(dá)到正負(fù) 0.1 毫米。 在盲測(cè)中,專業(yè)評(píng)委也無(wú)法分辨哪杯是國(guó)際級(jí)咖啡大師制作,哪杯是xbot咖啡機(jī)器人制作。 咖啡拉花此前在餐飲業(yè)就像AlphaGO出現(xiàn)前的圍棋一樣,是大家公認(rèn)機(jī)器人不可能攻破的領(lǐng)域。xbot咖啡機(jī)器人一雙精巧機(jī)械臂,可以做出和咖啡大師一模一樣的咖啡,讓許多餐飲業(yè)內(nèi)人感到震驚——意味著只要稍加改造,這雙機(jī)械臂就可以做出各大菜系大廚學(xué)習(xí)多年才能做出的菜品。一家國(guó)內(nèi)知名烤鴨品牌創(chuàng)始人看到xbot咖啡機(jī)器人后,興奮的通過(guò)朋友找到影智科技創(chuàng)始人唐沐,想花費(fèi)數(shù)千萬(wàn)定制xbot的具身智能機(jī)器人,他認(rèn)為xbot機(jī)器人可以完成片烤鴨、雕花等熟練工才能完成的工作。而國(guó)內(nèi)某頂級(jí)咖啡品牌也希望與xbot合作,因?yàn)閾碛衳bot咖啡機(jī)器人就可以無(wú)限開(kāi)拓?zé)o人咖啡店,做出的咖啡甚至比普通咖啡師還好,成本還低,這將大大提升開(kāi)店效率。xbot咖啡機(jī)器人在全球試點(diǎn)布局了300個(gè)咖啡點(diǎn)位,每天賣出數(shù)萬(wàn)杯咖啡。在成都會(huì)學(xué)生運(yùn)動(dòng)大,天安門(mén)景區(qū)都有xbot咖啡機(jī)器人的身影。科大訊飛因?yàn)樾寂c影智科技等具身智能公司合作,而受二級(jí)市場(chǎng)資本追捧。不少機(jī)構(gòu)主動(dòng)找到xbot咖啡機(jī)器人尋求合作,在科大訊飛展廳、聯(lián)想總部,在70多家萬(wàn)達(dá)影城,xbot咖啡機(jī)器人炫酷的機(jī)械臂拉出精巧的拉花,就是新質(zhì)生產(chǎn)力的象征。 一、被業(yè)內(nèi)稱為“具身智能消費(fèi)機(jī)器人第一人”,頂級(jí)產(chǎn)品經(jīng)理唐沐眼中的具身智能發(fā)展 “可能每個(gè)國(guó)人都用過(guò)唐沐做的產(chǎn)品”,影智科技的員工如此形容自己的創(chuàng)始人。(影智科技創(chuàng)始人唐沐)唐沐是中國(guó)最頂級(jí)的產(chǎn)品經(jīng)理之一。他在2003年加入騰訊,是騰訊“用戶研究與體驗(yàn)設(shè)計(jì)中心”組建人,陪伴我們長(zhǎng)大的QQ表情、QQ秀就是唐沐的作品。很長(zhǎng)一段時(shí)間,馬化騰的QQ頭像是唐沐所設(shè)計(jì)的“廚師男”。2013年唐沐加入小米做智能硬件,其推出的小米路由器一經(jīng)發(fā)布便成為智能硬件第一爆品,銷量快速突破千萬(wàn)臺(tái),定義了新一代路由器。2017年作為小米探索實(shí)驗(yàn)室的負(fù)責(zé)人,他設(shè)計(jì)推出了小米 AI 智能音箱(小愛(ài)音箱)。唐沐大學(xué)學(xué)的是會(huì)計(jì),后來(lái)輔修了工業(yè)設(shè)計(jì),2001年畢業(yè)之后就加入了當(dāng)時(shí)剛創(chuàng)立不久的金山,跟著黎萬(wàn)強(qiáng)做設(shè)計(jì),是中國(guó)最早一批從事 UI 設(shè)計(jì)的人員。之后一次次在重要產(chǎn)品戰(zhàn)役的成功,讓他逐漸成長(zhǎng)為科技大廠產(chǎn)品王牌。(金山云早期設(shè)計(jì)團(tuán)隊(duì),左:唐沐,右:黎萬(wàn)強(qiáng)) 會(huì)計(jì)出身的唐沐很會(huì)算賬,同時(shí)做設(shè)計(jì)又讓他充滿想象力。唐沐善于在一個(gè)新興行業(yè)從無(wú)到有打造國(guó)民級(jí)產(chǎn)品,是雷軍、馬化騰等大佬公認(rèn)的,能把設(shè)計(jì)感和實(shí)用性結(jié)合最好的產(chǎn)品經(jīng)理之一。 多年后唐沐為了追求理想,進(jìn)入機(jī)器人領(lǐng)域創(chuàng)業(yè)。如今在具身智能領(lǐng)域,不少專業(yè)人士都認(rèn)為唐沐是“具身智能消費(fèi)機(jī)器人第一人”,他能打造最好的具身智能產(chǎn)品,領(lǐng)導(dǎo)行業(yè)創(chuàng)新。 對(duì)具身智能消費(fèi)機(jī)器人產(chǎn)品,唐沐有著極深的認(rèn)知。他認(rèn)為具身智能消費(fèi)機(jī)器人演進(jìn)將會(huì)經(jīng)歷四大階段: X1工業(yè)機(jī)器人階段,機(jī)器動(dòng)作由人工編排,用于工廠內(nèi)的高度結(jié)構(gòu)化、自動(dòng)化的任務(wù)。X2階段是消費(fèi)機(jī)器人,通過(guò)積累消費(fèi)場(chǎng)景的行為數(shù)據(jù),人工結(jié)合AI進(jìn)行任務(wù)編排,讓機(jī)器人復(fù)刻某種能力,比如讓機(jī)器人學(xué)會(huì)咖啡拉花等;X3階段是具身智能消費(fèi)機(jī)器人,擁有視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多模態(tài)感知能力,可以基于用戶的個(gè)性化信息,結(jié)合場(chǎng)景和用戶進(jìn)行深層次互動(dòng),比如機(jī)器人看到用戶一臉疲憊,主動(dòng)詢問(wèn)是否需要更濃一點(diǎn)的咖啡; X4階段就是全能型AGI消費(fèi)機(jī)器人,但是AGI目前仍然處于理論階段。目前影智科技推出的xbot咖啡機(jī)器人處于X3階段,也是唯一能達(dá)到這階段的具身智能消費(fèi)機(jī)器人。大模型熱潮誕生了三個(gè)主要?jiǎng)?chuàng)業(yè)方向——多模態(tài)、智能體、具身智能。唐沐用自身極強(qiáng)的產(chǎn)品能力,把這些方向都整合進(jìn)了咖啡機(jī)器人這個(gè)場(chǎng)景。 xbot咖啡機(jī)器人通過(guò)多模態(tài)交互了解用戶需求,如用戶說(shuō) “我要一杯熱帶風(fēng)情的咖啡”,大模型能認(rèn)知推理,結(jié)合知識(shí)庫(kù)和拼配算法,分析出飲品制作的 SOP 并轉(zhuǎn)化為機(jī)器人可理解的語(yǔ)言,實(shí)現(xiàn)自動(dòng)制作。 xbot咖啡機(jī)器人配備數(shù)字人,可實(shí)現(xiàn)多種功能,如人臉識(shí)別,能認(rèn)出每一位顧客,為顧客提供個(gè)性化服務(wù),還能根據(jù)顧客喜好選擇數(shù)字人服務(wù)員,增強(qiáng)與顧客的互動(dòng)和情感連接,提供更人性化的服務(wù)。 二、一雙機(jī)械臂,顛覆消費(fèi)產(chǎn)業(yè)生產(chǎn)方式一個(gè)新產(chǎn)業(yè)從概念到落地,往往需要現(xiàn)象級(jí)產(chǎn)品的出現(xiàn)進(jìn)行定義——產(chǎn)品本身要非常強(qiáng),又要能規(guī)?;褂?。像iPhone之于智能手機(jī),特斯拉之于電動(dòng)汽車。而具身智能此前一直缺這樣的定義行業(yè)的產(chǎn)品。 過(guò)去的具身智能一直沒(méi)有突破,處于一味跟風(fēng)的狀態(tài)。大部分具身智能企業(yè)不去思考可行的落地方案,不在產(chǎn)品細(xì)節(jié)打磨,只為了做得更像馬斯克發(fā)布會(huì)上的人形機(jī)器人。與其他跟風(fēng)者不同,唐沐有著自己對(duì)具身智能產(chǎn)品獨(dú)特的理解?!案懔诉@么多年機(jī)器人,為什么只有掃地機(jī)器人是唯一商業(yè)上成功的機(jī)器人產(chǎn)品?” 唐沐表示能在商業(yè)中成功的產(chǎn)品,必然是在某個(gè)應(yīng)用場(chǎng)景中極致性價(jià)比的。 唐沐分享自己具身智能產(chǎn)品打造,有三個(gè)特征:①?gòu)膶?shí)際的場(chǎng)景出發(fā),確保產(chǎn)品能切實(shí)解決用戶在特定場(chǎng)景下的問(wèn)題,而不是憑空想象;②極致基礎(chǔ)體驗(yàn) + OTA 迭代,注重產(chǎn)品的基礎(chǔ)性能,使其足夠穩(wěn)定和流暢,同時(shí)通過(guò) OTA 迭代不斷優(yōu)化和升級(jí)功能;③追求增值服務(wù),通過(guò)拓展服務(wù)領(lǐng)域?yàn)楫a(chǎn)品創(chuàng)造更多的價(jià)值空間。 唐沐認(rèn)為具身智能不一定要做成 “人的形狀”,人形機(jī)器人在很多場(chǎng)景下反而可能是一種累贅。 唐沐的觀點(diǎn)和許多機(jī)器人業(yè)內(nèi)大咖一致。中國(guó)具身智能專家,北航機(jī)器人研究所名譽(yù)所長(zhǎng)王田苗認(rèn)為,現(xiàn)在具身智能企業(yè)創(chuàng)業(yè),應(yīng)該從“具身技能”入手(不必追求人形,而是打造解決某方面需求的能力),只有在應(yīng)用場(chǎng)景和客戶需求獲得成功,企業(yè)才能真正成功。波士頓動(dòng)力機(jī)器人創(chuàng)始人,麻省理工教授馬克?雷伯特(Marc Raibert)也在近期提出了自己的觀點(diǎn)。他認(rèn)為人形機(jī)器人的實(shí)現(xiàn)還需要很長(zhǎng)的路要走,人形外形不等于人形內(nèi)在,人們需要更清晰地思考目標(biāo)。未來(lái) 2 - 5 年,為盈利應(yīng)設(shè)計(jì)能出色完成特定任務(wù)的機(jī)器人,而非通用形態(tài)的機(jī)器人。三、影智科技啟示錄,“非人形”具身智能已處于爆發(fā)前夜一個(gè)現(xiàn)象級(jí)產(chǎn)品造成的轟動(dòng),往往先從業(yè)內(nèi)開(kāi)始。 許多敏銳的餐飲老板都在唐沐的視頻號(hào)下留言求合作。我在拜訪唐沐的過(guò)程中,有國(guó)內(nèi)互聯(lián)網(wǎng)巨頭正在排隊(duì)等待約見(jiàn)唐沐。 目前不少夜經(jīng)濟(jì)場(chǎng)景,旅游地都在尋求和影智科技合作。xbot機(jī)器人處于供不應(yīng)求階段,最近一個(gè)月內(nèi)銷售了2000萬(wàn)訂單的機(jī)器人。 (大規(guī)模量產(chǎn)的xbot咖啡機(jī)器人) xbot機(jī)器人爆發(fā)有跡可循。深耕機(jī)器人領(lǐng)域三十多年,投資了多家機(jī)器人企業(yè)的王田苗指出如今具身智能有兩大難點(diǎn):一、靈巧手目前在技術(shù)和成本上有難點(diǎn)。二、適合機(jī)器人的通用大模型和垂直專業(yè)模型還在攻堅(jiān)階段。而影智科技恰恰突破了這兩個(gè)難點(diǎn)。唐沐做咖啡機(jī)器人追求像“掃地機(jī)器人商業(yè)上一樣成功”,他認(rèn)為首先要在一個(gè)場(chǎng)景中,把自己的核心產(chǎn)品做到“爆”、做到極致。影智科技和國(guó)內(nèi)頂級(jí)機(jī)械臂企業(yè)遨博聯(lián)合研發(fā)消費(fèi)機(jī)器人,唐沐待在工廠里每天打磨產(chǎn)品。影智科技的具身智能消費(fèi)機(jī)器人機(jī)械臂精度達(dá)到正負(fù) 0.1 毫米,這個(gè)級(jí)別的機(jī)械臂之前只出現(xiàn)在汽車、芯片等專精設(shè)備生產(chǎn)的智能工廠中。唐沐認(rèn)為沒(méi)必要做成人形,就只留下一雙機(jī)械臂,認(rèn)為機(jī)械臂不必做成五指就留下三指。這讓xbot的機(jī)器人成本越來(lái)越低。 xbot機(jī)器人出現(xiàn)在消費(fèi)行業(yè)是爆炸性的。 未來(lái)xbot機(jī)器人甚至?xí)恳慌_(tái)低至10萬(wàn)元以下。這意味著,一個(gè)普通員工的年薪,就可以購(gòu)買(mǎi)一臺(tái)xbot咖啡機(jī)器人,而這個(gè)機(jī)器人可以在任何地方24小時(shí)做出品質(zhì)優(yōu)良的個(gè)性化拉花咖啡,還能與客戶互動(dòng)提供個(gè)性化的咖啡,以及情緒價(jià)值,秒殺一眾高端咖啡廳。另一方面,影智科技機(jī)器人垂直模型訓(xùn)練也做得很扎實(shí)。投資大佬朱嘯虎在私董會(huì)中和創(chuàng)業(yè)者們交流,他提到如今科技公司做AI最有價(jià)值的就是行業(yè)垂直數(shù)據(jù),創(chuàng)業(yè)者一定要保護(hù)好自己的數(shù)據(jù)。而影智科技垂直行業(yè)數(shù)據(jù)采集,是目前AI企業(yè)里面最成體系的。唐沐曾經(jīng)涉及過(guò)影視文娛產(chǎn)業(yè),他用游戲產(chǎn)業(yè)中“動(dòng)作捕捉”的思路,專門(mén)打造了一個(gè)數(shù)據(jù)采集咖啡制作的好萊塢級(jí)別“影棚”。影智科技邀請(qǐng)頂級(jí)咖啡師在“影棚”進(jìn)行拉花操作,多次重復(fù)制作同一拉花款式,在操作過(guò)程中,以高頻率(如每秒多次)采集動(dòng)作數(shù)據(jù)點(diǎn),全面記錄咖啡師手部動(dòng)作的空間位置、力度變化、速度等信息,形成豐富的原始數(shù)據(jù)。xbot機(jī)器人的數(shù)據(jù)訓(xùn)練全面融合了大模型技術(shù),使用數(shù)字孿生與虛實(shí)同步技術(shù),能夠?qū)W會(huì)所有高難度的咖啡拉花??Х葞?個(gè)月才能研發(fā)創(chuàng)作出的拉花,xbot咖啡機(jī)器人6小時(shí)就可以掌握。整套的行業(yè)數(shù)據(jù)大模型采集體系,可以快速的采集咖啡的行業(yè)數(shù)據(jù),同時(shí)也可以快速的復(fù)制到其他餐飲領(lǐng)域,例如影智科技最近也同時(shí)推出了冰淇淋機(jī)器人。影智科技的咖啡機(jī)器人仍然不斷在打磨精進(jìn)。只要產(chǎn)能足夠,xbot咖啡機(jī)器人就可以短時(shí)間內(nèi)全國(guó)鋪開(kāi)數(shù)千甚至上萬(wàn)個(gè)點(diǎn)位,它既不需要訓(xùn)練員工,甚至不需要裝修店面和選址。它只需要一塊幾平米的空地,就能提供不輸于中高端咖啡精品店的體驗(yàn)。 最近有一些聲音在質(zhì)疑AI熱潮是不是過(guò)去了,然而和影智科技這樣的公司深入接觸,你才會(huì)感覺(jué)到AI+產(chǎn)業(yè)正在大爆發(fā)的前夜。xbot咖啡機(jī)器人有潛力顛覆咖啡業(yè)態(tài),甚至改變?cè)S多餐飲領(lǐng)域的生產(chǎn)方式。 (作者韋少用xbot咖啡機(jī)器人做了一杯“頭像咖啡”)
|