如果說人類對(duì)于人工智能有什么終極幻想,那肯定是擁有和人類一模一樣的機(jī)器人,它會(huì)自我思考、反饋、行動(dòng),會(huì)像人類一樣在現(xiàn)實(shí)世界中自由自在地生活和工作。 這樣的幻想在今天,被稱為具身智能(Embodied Intelligence)。2023年世界人工智能大會(huì),首次將目光聚焦在這一前沿領(lǐng)域。 絕知此事要躬行 “紙上得來終覺淺,絕知此事要躬行?!标懹螏装倌昵暗囊痪湓娫~,像極了具身智能的寫照。 具身,并不只是指具有物理身體,而是指人工智能在這一物理身體中,具有與人一樣的身體體驗(yàn)?zāi)芰?,可以感知環(huán)境,并與周邊進(jìn)行交互,還能通過學(xué)習(xí)、理解和推理,完成各種決策和行為。換句話說,就是為人工智能的“大腦”,配備一副聽其指揮的“身體”。 與之相對(duì)的,就是非具身,要么是沒有物理身體與現(xiàn)實(shí)環(huán)境互動(dòng),只能被動(dòng)接受人類采集數(shù)據(jù)的數(shù)字人,比如AI語音助手,要么是擁有物理身體,但沒有匹配高階人工智能的工具,比如工業(yè)機(jī)器人。 那么,什么樣的產(chǎn)品算是具身智能呢? 人形機(jī)器人無疑是一個(gè)最具代表性的產(chǎn)品。清華大學(xué)交叉信息研究院助理教授陳建宇解釋,人類社會(huì)的種種事物都按照人類的生理結(jié)構(gòu)進(jìn)行設(shè)計(jì),所以一個(gè)智能的人形機(jī)器人,可以最大程度像人類一樣去運(yùn)用各種工具,去各種地方,適應(yīng)種類多樣的任務(wù)。中國科學(xué)院院士、清華大學(xué)交叉信息研究院院長(zhǎng)姚期智表示,在ChatGPT之后,人工智能研究的下一個(gè)重要目標(biāo),是要讓有多重感知能力的機(jī)器人,在不同的環(huán)境下能夠自主學(xué)習(xí)新技能。 智能汽車,也是具身智能的另一個(gè)方向。云啟資本合伙人陳昱認(rèn)為,數(shù)字世界和物理世界的鏈接主要靠?jī)蓚€(gè)產(chǎn)品,除了通用機(jī)器人,就是智能汽車。目前,自動(dòng)駕駛技術(shù)已發(fā)展得如火如荼,在部分城市中,一輛智能汽車已經(jīng)可以在法規(guī)允許的條件下,自己“開”到目的地。只是要達(dá)到完全智能狀態(tài),不僅需要技術(shù)的進(jìn)一步迭代發(fā)展,還需要等待政策的放開。 今年世界人工智能大會(huì)的現(xiàn)場(chǎng),就有不少機(jī)器人和智能汽車一起亮相。盡管他們和具身智能的最終形態(tài)還有差距,但他們都有同樣的特點(diǎn),那就是開始嘗試帶著人工智能,走向現(xiàn)實(shí)世界。 浪潮還有多遠(yuǎn) 英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛不久前在公開場(chǎng)合表示,人工智能下一個(gè)浪潮將是具身智能。只是,這個(gè)浪潮還有多遠(yuǎn)? 2023年特斯拉股東大會(huì)上,特斯拉機(jī)器人展現(xiàn)了自身的進(jìn)化——末端關(guān)節(jié)在下落時(shí)可以控制力度不打碎雞蛋,雙手能夠輕松地抓取分類物品,這表明其末端肢體關(guān)節(jié)的力矩控制能力顯著提高。 這種硬件端的進(jìn)步讓人興奮,人們希望這些機(jī)械關(guān)節(jié)最終能像人一樣收放自如。而在軟件端,以ChatGPT為代表的多模態(tài)大模型,也為具身智能帶來了更大的想象空間。 在這屆世界人工智能大會(huì)上,與會(huì)嘉賓普遍認(rèn)為,多模態(tài)大模型與通用機(jī)器人進(jìn)行物理交互,再加上場(chǎng)景支持和數(shù)據(jù)反饋調(diào)優(yōu),可能是一個(gè)具身智能發(fā)展的較好路徑。優(yōu)必選科技首席技術(shù)官熊友軍感覺,過去人形機(jī)器人一直都圍繞著“如何更好地運(yùn)動(dòng)”在發(fā)展,但ChatGPT出現(xiàn)后,行業(yè)開始更加關(guān)注機(jī)器人與人之間的交互,競(jìng)爭(zhēng)百花齊放。 但上海期智研究院青年科學(xué)家高陽提醒,具身智能收集數(shù)據(jù)的難度要遠(yuǎn)遠(yuǎn)大于語言大模型,語言和視覺數(shù)據(jù)可以從網(wǎng)上大量收集,而機(jī)器人的數(shù)據(jù)則要靠它自己去探索解決。 的確,為人工智能加上眼睛與耳朵等敏銳的感官,配合靈活的四肢和身體,具備和現(xiàn)實(shí)世界更深層交互的大腦,這是一個(gè)美好的愿景。但在現(xiàn)實(shí)中,感知、驅(qū)動(dòng)、能源、運(yùn)算……具身智能的每一個(gè)關(guān)鍵環(huán)節(jié),都離理想狀態(tài)差得很遠(yuǎn)。就連做到像普通人一樣走路這件事,對(duì)于業(yè)界而言都是一個(gè)大難題。有人曾經(jīng)開玩笑:“ChatGPT將給具身智能帶來什么?信心,僅此而已?!?/div> 不過,只是這樣的信心,已經(jīng)足夠讓無數(shù)人在具身智能的路上前仆后繼。因?yàn)?,浪潮盡管再遠(yuǎn),終歸會(huì)來。 想要踏浪前行,就要搶占先機(jī)。2023世界人工智能大會(huì)上,多款具身智能產(chǎn)品就搶先亮相,其中不少是上海制造。 傅利葉智能發(fā)布了自主研發(fā)的通用人形機(jī)器人GR-1,并邀請(qǐng)國內(nèi)外高校、科研機(jī)構(gòu)和企業(yè)的人工智能和機(jī)器人研發(fā)團(tuán)隊(duì)與其合作,為GR-1植入AI大模型“大腦”,賦予它更多的功能。傅利葉智能董事長(zhǎng)兼首席執(zhí)行官顧捷設(shè)想:“這款機(jī)器人的運(yùn)動(dòng)能力很強(qiáng),'小腦’發(fā)達(dá)。有了AI'大腦’后,就有望實(shí)現(xiàn)具身智能。” 達(dá)闥最新一代的人形機(jī)器人Cloud Ginger 2.0也引來各方關(guān)注,它全身采用了新一代智能柔性關(guān)節(jié)-SCA2.0和多種傳感器,實(shí)現(xiàn)了高精度智能抓取,同時(shí)具備視覺和激光定位導(dǎo)航能力,更接入了“云端大腦”RobotGPT大模型。在達(dá)闥創(chuàng)始人兼CEO黃曉慶看來,未來海量的不同類型的機(jī)器人都能有效接入云端大腦,從而形成類似于互聯(lián)網(wǎng)時(shí)代的產(chǎn)業(yè)生態(tài):由運(yùn)營商、應(yīng)用開發(fā)商、人工智能提供商和機(jī)器人本體制造商形成的云端機(jī)器人生態(tài)。 位列鎮(zhèn)館之寶,西井科技的新能源智能無人駕駛卡車Q-Truck也有些絕活。它采用新一代融合感知架構(gòu),搭載工業(yè)級(jí)超遠(yuǎn)視距高精雙目AI攝像頭、激光雷達(dá)等多種傳感器,融合智能算法和整套全棧式系統(tǒng),據(jù)稱像人一樣具備強(qiáng)大的感知和決策。重要的是,這一產(chǎn)品已先后在泰國、阿聯(lián)酋、英國、馬來西亞、墨西哥等多個(gè)國家商業(yè)落地。就在6月,英國第一大港費(fèi)利克斯托港剛剛新增了100輛Q-Truck。 這些上海制造的背后,是通往具身智能美好愿景的階梯,是一個(gè)龐大的市場(chǎng),更是一個(gè)完整的產(chǎn)業(yè)鏈。梅卡曼德機(jī)器人創(chuàng)始人邵天蘭則認(rèn)為,因?yàn)槿瞬拧a(chǎn)業(yè)鏈和客戶的基礎(chǔ),中國在具身智能領(lǐng)域有獨(dú)特的發(fā)展優(yōu)勢(shì)。特別是發(fā)展所需要的產(chǎn)業(yè)鏈基礎(chǔ),中國的響應(yīng)速度很快,也有眾多供應(yīng)商愿意陪著公司成長(zhǎng)。 在這樣的前沿領(lǐng)域取得突破,上海責(zé)無旁貸。上海市經(jīng)濟(jì)信息化委主任吳金城表示,上海將持續(xù)關(guān)注具身智能研究和應(yīng)用,重點(diǎn)攻關(guān)機(jī)器視覺、自然語言處理、大模型訓(xùn)練機(jī)器人等技術(shù),提升智能機(jī)器人多模態(tài)環(huán)境交互感知能力和自主學(xué)習(xí)、訓(xùn)練能力包括認(rèn)知能力,促進(jìn)智能機(jī)器人實(shí)現(xiàn)自主規(guī)劃、決策、行動(dòng)、執(zhí)行,提升人機(jī)交互能力、打造人機(jī)協(xié)同工作模式。
|
|