大模型和生成式人工智能引領(lǐng)的全球新一輪人工智能(AI)科技新浪潮持續(xù)升溫,國內(nèi)外大模型技術(shù)的進(jìn)步一浪高過一浪,產(chǎn)業(yè)競爭日趨激烈,落地應(yīng)用不斷深化。進(jìn)入2024年,我國人工智能發(fā)展表現(xiàn)出一系列新現(xiàn)象、新趨勢,值得我們重視和持續(xù)關(guān)注。 一、近期國內(nèi)人工智能發(fā)展的幾個新現(xiàn)象
我國大模型發(fā)展早期重心主要集中在基礎(chǔ)模型能力追趕,2024年以來產(chǎn)業(yè)化落地開始成為各界關(guān)注的新熱點,在垂類大模型、數(shù)字人、具身智能、AI for Science(人工智能驅(qū)動的科學(xué)研究)等方向上新進(jìn)展新成效不斷涌現(xiàn),同時,更好地平衡發(fā)展與治理,推動人工智能治理落地也成為新時期的關(guān)注重點。 (一)垂類大模型應(yīng)用呈現(xiàn)明顯加快趨勢 當(dāng)前,大模型大規(guī)模商業(yè)化的難題在國內(nèi)外都還沒有得到完全破解。中國的大模型產(chǎn)業(yè)化之路與美國有很大不同,產(chǎn)業(yè)垂類模型的發(fā)展更快。2024年以來,眾多大模型研發(fā)團(tuán)隊開始投入力量,利用與特定場景相關(guān)的專業(yè)知識通過對基礎(chǔ)模型進(jìn)一步訓(xùn)練或“微調(diào)”,提供針對特定業(yè)務(wù)場景的高質(zhì)量專業(yè)化解決方案,可以更好地完成特定任務(wù)。如華為和湘潭鋼鐵集團(tuán)聯(lián)合開發(fā)的盤古鋼鐵大模型獲得國際電信聯(lián)盟(ITU)全球人工智能優(yōu)秀創(chuàng)新大獎,這個模型賦能寶武鋼鐵數(shù)字化轉(zhuǎn)型,實現(xiàn)降本增效,一年單煉鐵環(huán)節(jié)就能節(jié)省10億元。國家電網(wǎng)研發(fā)的配網(wǎng)視覺大模型已經(jīng)在無人機(jī)巡檢、通道可視化等幾十個配網(wǎng)場景應(yīng)用,完成30萬公里巡檢,平均識別效率提升10%。除此之外,一大批工業(yè)大模型、礦山大模型、物流大模型、港口大模型,還有醫(yī)療大模型,已經(jīng)開始在各自領(lǐng)域不斷深化落地,發(fā)揮其領(lǐng)域縱深優(yōu)勢,將對中國的產(chǎn)業(yè)特別是制造業(yè)進(jìn)步帶來重大影響。 (二)數(shù)字人初登舞臺發(fā)展迅速、涉及面廣,這是AI應(yīng)用中的新事物 大模型推動數(shù)字內(nèi)容生成能力和圖像、語言、文本多模態(tài)處理能力加速成熟,數(shù)字人在人物形象、語音生成、動畫生成、音視頻合成顯示、人機(jī)交互等方面帶來了驚艷體驗,活躍在教育教學(xué)、看病就醫(yī)、金融服務(wù)、電商購物、線上直播、客服推銷等商業(yè)場景,也在名人紀(jì)念等大規(guī)模場景中應(yīng)用。比如,2024年“6·18”京東啟動了超過18位品牌總裁數(shù)字人分身亮相直播間,螞蟻靈境數(shù)字人平臺助力央視財經(jīng)打造兩會AI主播,中國科學(xué)技術(shù)出版社研發(fā)醫(yī)學(xué)領(lǐng)域的數(shù)字人開展科普宣傳等。《2024年中國虛擬數(shù)字人產(chǎn)業(yè)發(fā)展白皮書》預(yù)計,到2025年我國“數(shù)字人”帶動的產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模將分別超過6 400億元、480億元,比2023年增長超過90%、130%。 (三)具身智能在人工智能發(fā)展進(jìn)程中的地位明顯上升 2024年以來具身智能成為國內(nèi)各類重要論壇討論的熱點,成為各類研究機(jī)構(gòu)布局的優(yōu)先考慮,成為人工智能相關(guān)企業(yè)和風(fēng)投機(jī)構(gòu)投入的重點。多模態(tài)大模型是具身智能發(fā)展的關(guān)鍵動力,實現(xiàn)與環(huán)境互動和交互式學(xué)習(xí)進(jìn)化能力。在語言對話、數(shù)字內(nèi)容生成之后,進(jìn)一步挖掘Transformer大模型在多任務(wù)學(xué)習(xí)和多模態(tài)方面的潛力,將多模態(tài)大模型、強(qiáng)化學(xué)習(xí)與機(jī)器人的感知、行動和環(huán)境交互等能力結(jié)合,實現(xiàn)與周邊環(huán)境進(jìn)行自然交互并完成各種任務(wù)的具身智能,正在成為后大模型時代的人工智能新形態(tài),也被很多人認(rèn)為是通向通用人工智能的必經(jīng)之路。國內(nèi)一批具身大模型快速涌現(xiàn),比如達(dá)闥科技率先推出的多模態(tài)具身大模型RobotGPT、有鹿機(jī)器人研發(fā)的第二代具身智能技術(shù)LPLM大模型,以及若愚科技推出的若愚·九天機(jī)器人大腦,均利用多模態(tài)大模型實現(xiàn)人類意圖理解、高頻人機(jī)交互和復(fù)雜任務(wù)規(guī)劃等功能。高級別自動駕駛、仿人機(jī)器人等都將受益于具身智能的突破而實現(xiàn)新的能力飛躍。 (四)人形機(jī)器人率先出現(xiàn)發(fā)力提速態(tài)勢 人形機(jī)器人是具身智能的典型產(chǎn)品概念,也是具身智能技術(shù)發(fā)展的載體,大模型的場景泛化能力以及具身智能技術(shù)的爆發(fā)對功能更加通用的人形機(jī)器人發(fā)展帶來巨大驅(qū)動力。盡管國內(nèi)外人形機(jī)器人都還處于低版本的具身智能狀態(tài),但技術(shù)迭代很快。人形機(jī)器人在大腦、小腦、空間智能、肢體與上游核心部件等熱點方向并行前進(jìn),機(jī)器人本體、核心零部件、軟件算法方面的國產(chǎn)廠商涌現(xiàn),正在不斷形成創(chuàng)新成果。比如宇樹科技的Unitree G1人形機(jī)器人采取具身智能路線擺脫了預(yù)先算法編程,增強(qiáng)與物理世界互動能力,斯坦福大學(xué)以宇樹科技的國產(chǎn)硬件平臺為基底研發(fā)了HumanPlus人形機(jī)器人;智元機(jī)器人“遠(yuǎn)征”系列通用型具身智能機(jī)器人開啟了商用量產(chǎn),結(jié)合臨港集團(tuán)等制造場景探索人形機(jī)器人商業(yè)化落地。清華大學(xué)、上海交通大學(xué)、浙江大學(xué)等一批研發(fā)團(tuán)隊也在人形機(jī)器人領(lǐng)域快速跟進(jìn),形成一批前沿性技術(shù)成果。 (五)人工智能驅(qū)動的科學(xué)研究關(guān)注度快速提升 以大模型為代表的人工智能技術(shù)的復(fù)雜問題求解能力將突破傳統(tǒng)科學(xué)研究的瓶頸。近年來,采用人工智能解決科學(xué)研究問題受到越來越多的關(guān)注,人工智能驅(qū)動的科學(xué)研究(AI for Science)在基礎(chǔ)研究和醫(yī)療、材料、生物、化合物等領(lǐng)域的研發(fā)和應(yīng)用在我國快速展開,科研人員沿多條路徑探索大模型在科學(xué)研究領(lǐng)域的落地應(yīng)用,尤其是結(jié)合大模型技術(shù)潛力開展各領(lǐng)域科研知識增強(qiáng)和設(shè)計增強(qiáng)的進(jìn)展引人注目。比如,鄂維南院士團(tuán)隊研發(fā)了國際首個覆蓋元素周期表近90種元素的多體系統(tǒng)一高精度預(yù)訓(xùn)練模型(DPA-2),北京深勢科技發(fā)布了通用三維分子表征預(yù)訓(xùn)練模型Uni-Mol+,中國石化研發(fā)的“天樞”智研化工大模型可完成分子智能化學(xué)檢索、分子逆合成設(shè)計和反應(yīng)條件推薦與優(yōu)化等場景研發(fā)任務(wù)。 (六)人工智能治理從倡議走向落地 新一輪人工智能浪潮推動人工智能新技術(shù)更快速地進(jìn)入社會生活,巨大的能力也帶來潛在的風(fēng)險,正在對倫理、安全、隱私、公平等各方面治理提出迫切需求。中國不斷發(fā)出呼聲倡議,明顯促進(jìn)了國與國之間共識的形成,帶動了研究機(jī)構(gòu)和學(xué)者交流的增強(qiáng)。如2024年3月在北京舉辦“北京AI安全國際對話”、5月中法兩國聯(lián)合發(fā)布《關(guān)于人工智能和全球治理的聯(lián)合聲明》、7月《人工智能全球治理上海宣言》在上海發(fā)表等。同時,政、產(chǎn)、學(xué)、研各界加快推動倡議落實,上海人工智能實驗室開拓治理落地新思路,實驗室主任周伯文提出探索人工智能45°平衡律,主張在推動AI技術(shù)性能提升時同步構(gòu)建更強(qiáng)的安全技術(shù)體系;學(xué)術(shù)界提出多份人工智能立法建議方案,探索建立人工智能治理制度的中國路徑;人工智能領(lǐng)軍企業(yè)積極落實倡議要求,推動人工智能治理在產(chǎn)業(yè)實踐中落地。 二、對這些新現(xiàn)象的進(jìn)一步思考
隨著大模型技術(shù)日新月異、迭代發(fā)展,人工智能技術(shù)和產(chǎn)業(yè)形態(tài)將加速演化,通用人工智能的路徑正在變得更加清晰,人工智能新場景新實踐將在我國大量涌現(xiàn),為新質(zhì)生產(chǎn)力發(fā)展注入強(qiáng)大動能,同時我國人工智能治理的對外影響力也將不斷提升。 (一)“基礎(chǔ)-垂類”協(xié)同并進(jìn)、“大型-小型”融通適配、“中心-邊緣”梯次接續(xù)的模型體系正在形成 基礎(chǔ)大模型的通用泛化性與專用大模型的高度專業(yè)性各顯優(yōu)勢,融合互補將成為未來趨勢,“兩條腿走路”的方式已經(jīng)有了共識。下一步大模型將沿不同方向多元化發(fā)展。首先,領(lǐng)軍企業(yè)和研究機(jī)構(gòu)繼續(xù)拓展基礎(chǔ)模型規(guī)模,提升數(shù)理、因果推理等高階能力,探尋Scaling Law的科學(xué)邊界,比如2024年9月OpenAI發(fā)布的o1-preview被認(rèn)為再次推高了大模型規(guī)劃推理能力的天花板;其次,更多的企業(yè)會面向特定任務(wù)或場景打造垂直模型,在泛化性與專業(yè)性方面實現(xiàn)更好的平衡,加快大模型的產(chǎn)品化和落地;最后,2024年以來國內(nèi)外大模型“小型化”競爭已經(jīng)開啟,發(fā)揮效果、性能和成本綜合優(yōu)勢,小模型將開拓手機(jī)、PC、耳機(jī)、音箱以及其他可穿戴式終端等廣泛場景。中國大模型產(chǎn)業(yè)化已經(jīng)形成通用類大模型與專業(yè)類大模型并行發(fā)展的態(tài)勢,面壁智能、百度等陸續(xù)發(fā)布一批小模型并快速迭代成熟,下一步有望發(fā)掘豐富場景和專業(yè)領(lǐng)域數(shù)據(jù)潛力,在“基礎(chǔ)-垂類”協(xié)同并進(jìn)、“大型-小型”融通適配、“中心-邊緣”梯次接續(xù)的模型體系方面走出優(yōu)勢,并率先催生實體經(jīng)濟(jì)領(lǐng)域代表性模型的落地應(yīng)用。 (二)具身智能有望成為打通物理AI的突破口 人工智能對實體經(jīng)濟(jì)的深度賦能需要打通數(shù)字智能與物理智能的橋梁,應(yīng)用到工廠、交通、通信、電網(wǎng)等各類物理設(shè)備和基礎(chǔ)設(shè)施,提升其自動化和智能化水平,連通數(shù)字世界與物理世界。未來五年內(nèi),自動駕駛將成為物理(具身)智能領(lǐng)域中最重要的應(yīng)用之一,有望成為第一個通過“新圖靈測試”的具身智能系統(tǒng)。按照這個趨勢,自動駕駛汽車、人形機(jī)器人、低空智能運載工具,也可能成為未來5~10年自主智能領(lǐng)域的“新三樣”。從離身智能走向具身智能的過程中,高級認(rèn)知能力也將逐步露出苗頭。人類智能、離身智能、具身智能協(xié)調(diào)發(fā)展是今后人工智能發(fā)展的主線,人工智能可控可信發(fā)展必須把人機(jī)協(xié)調(diào)貫穿于始終。這一方面需要不斷地研發(fā)和技術(shù)迭代,另一方面也需要政府、企業(yè)、社會保持良性溝通互動形成共識。發(fā)展具身智能體將成為我國新質(zhì)生產(chǎn)力建設(shè)的一個戰(zhàn)略通道。 (三)實現(xiàn)通用人工智能的路徑變得更加清晰明確 大模型技術(shù)改變了語音、視覺、自然語言處理等多個人工智能細(xì)分領(lǐng)域的研究范式,符號主義、連接主義、行為主義有望在大模型及具身智能體的框架下實現(xiàn)融合統(tǒng)一,對通用人工智能的能力走向及下一步發(fā)展路線的討論也正在成為學(xué)術(shù)界新的熱點話題。比如OpenAI提出了人工智能發(fā)展的五個級別:一是聊天機(jī)器人,即對應(yīng)當(dāng)前AI水平,可以與人類對話的人工智能;二是推理者,即像博士一樣解決問題,無需工具的人工智能;三是智能體,即可以代表用戶采取行動的人工智能代理;四是創(chuàng)新者,即可以創(chuàng)造新事物的人工智能;五是組織者,即可以完成整個組織工作的人工智能。其新發(fā)布的O1-preview正是OpenAI沿這一路徑研發(fā)的第二級產(chǎn)品。國內(nèi)姚期智、潘云鶴、張鈸等領(lǐng)軍科學(xué)家也對未來人工智能的研究和發(fā)展方向做出了判斷和預(yù)測,北京智源人工智能研究院理事長黃鐵軍提出新的通用人工智能水平和風(fēng)險分級方法。盡管視角有所差異,但反映出業(yè)界對于通用人工智能的理解更加清晰明確,行業(yè)引領(lǐng)者也開始把長遠(yuǎn)的雄心階段化、具象化甚至產(chǎn)品化,這將加速通用人工智能的實現(xiàn)。 (四)大模型場景創(chuàng)新將開創(chuàng)一批智能產(chǎn)業(yè)新機(jī)會 大模型技術(shù)進(jìn)步加速了人工智能場景創(chuàng)新,深度改變行業(yè)生產(chǎn)力,有望激發(fā)新一輪人工智能產(chǎn)業(yè)化浪潮。大模型已經(jīng)率先在AIGC領(lǐng)域產(chǎn)生大規(guī)模產(chǎn)業(yè)應(yīng)用,未來將影響金融、媒體、法律、市場研究、教育、客服等十余個行業(yè);Agent智能體將取代搜索網(wǎng)站、取代很多軟件和應(yīng)用程序;網(wǎng)絡(luò)操作系統(tǒng)面臨一次大改造,智能操作系統(tǒng)會逐步孕育成形;人工智能向手機(jī)、平板和PC產(chǎn)品的滲透率將快速提升,穩(wěn)定多年的信息通信產(chǎn)業(yè)將面臨重構(gòu)。人工智能驅(qū)動的科學(xué)研究(AI for Science)在生物、醫(yī)學(xué)、氣象、化學(xué)等基礎(chǔ)研究方面的巨大潛力已經(jīng)在學(xué)術(shù)界得到高度共識,隨著大模型等前沿技術(shù)與AI for Science場景的進(jìn)一步融合,人工智能有望加速重大科學(xué)問題研究和知識發(fā)現(xiàn),在產(chǎn)業(yè)界技術(shù)創(chuàng)新和工程創(chuàng)新中釋放變革性價值,推動工業(yè)設(shè)計、流程優(yōu)化調(diào)度、智能工廠等形成新的能力突破,將大幅度提升我國制造、醫(yī)藥、材料、能源等眾多行業(yè)的創(chuàng)新效能和創(chuàng)新水平。 (五)人工智能發(fā)展還將迎來更強(qiáng)技術(shù)范式 當(dāng)前大模型仍面臨一系列能力瓶頸,可重復(fù)性、幻覺等問題制約了大模型向具有更高穩(wěn)定性要求的場景拓展和商業(yè)化落地,探索更加可信可靠的技術(shù)形態(tài)將助力大模型下一步落地應(yīng)用。盡管目前大模型規(guī)模效應(yīng)依然奏效,推動大模型能力曲線持續(xù)攀升,但很多專家并不認(rèn)為僅僅依靠當(dāng)前架構(gòu)就能夠?qū)崿F(xiàn)世界模型,如學(xué)者張亞勤提出未來五年內(nèi)會在AI技術(shù)架構(gòu)上有大的突破,Transformer會被逐步重構(gòu)。創(chuàng)新性神經(jīng)網(wǎng)絡(luò)和學(xué)習(xí)方法正不斷被科學(xué)界提出,有可能為通用人工智能發(fā)展提供新的理論范式。隨著大模型計算需求飛速增長,人們對量子計算等新型計算給予的期望越來越高,量子計算納入人工智能視野并得到重視,量子人工智能的新范式正在吸引國內(nèi)越來越多的研發(fā)力量,未來有望不斷取得新進(jìn)展。光計算也在為人工智能發(fā)展開辟更多新路徑,戴瓊海院士課題組提出了新型光計算架構(gòu),提供了大規(guī)模神經(jīng)網(wǎng)絡(luò)精準(zhǔn)、高效的光計算訓(xùn)練方法,并推出了“太極-II”通用光訓(xùn)練芯片。 (六)中國在人工智能治理合作中的引領(lǐng)角色將進(jìn)一步提升 人工智能不僅是改變?nèi)祟惿畹男录夹g(shù),更引領(lǐng)了一場前所未有的具有強(qiáng)大沖擊力的社會革命,深度影響人們的認(rèn)知,深度改變新聞、科研、教育等領(lǐng)域的工作模式,需要新的治理理念、制度設(shè)計和治理規(guī)則引導(dǎo)和規(guī)范技術(shù)發(fā)展,而人工智能技術(shù)自身所獨有的自主性、涌現(xiàn)性等技術(shù)新特性,以及治理問題的多樣性、融合性使得人工智能監(jiān)管治理面臨諸多難題。有效化解人工智能治理安全風(fēng)險、為人類帶來更大的福祉需要各國共同努力,形成更加公正、普惠、包容的全球人工智能治理秩序。中國人工智能治理倡議體現(xiàn)的中華文明創(chuàng)新性、包容性和和平性的獨特底色,以及下一步中國基于豐富的人工智能場景實踐積累的更加成熟的治理經(jīng)驗,必將為全球人工智能治理實踐賦予中國智慧,推動全球人工智能治理體系朝著更加公正合理的方向發(fā)展。 (七)誰將在人工智能的競賽中最終勝出? 在智能愿景逐步聚焦、智能形態(tài)日益具身化的共識下,AI競賽的勝負(fù)在兩個方面很關(guān)鍵:底座智能涌現(xiàn)能力與制造業(yè)整體能力。其一是大模型的智能涌現(xiàn)能力,誰家的大模型智能涌現(xiàn)能力強(qiáng)、幻覺少,同時能耗低,誰就更有技術(shù)優(yōu)勢,這方面決定勝負(fù)的關(guān)鍵更多在于人才;其二是具身智能體的制造能力,這方面決定勝負(fù)的關(guān)鍵是高效能低成本的制造體系。 從目前大模型產(chǎn)業(yè)競爭態(tài)勢來看,誰會率先突破高認(rèn)知能力的基礎(chǔ)模型還有很大的不確定性,而硬件技術(shù)和成本將成為決定產(chǎn)品落地的重要因素。比如,人形機(jī)器人作為具身智能體的代表性產(chǎn)品,需要多項核心技術(shù)的綜合集成以實現(xiàn)機(jī)器人的感知、規(guī)劃、行動能力,能夠與周邊環(huán)境進(jìn)行自然交互并完成各項任務(wù)。這就需要依靠基礎(chǔ)大模型的認(rèn)知涌現(xiàn)實現(xiàn)跨場景下的邏輯推理,需要3D多模態(tài)感知能力實現(xiàn)與真實世界的交互理解,也需要高性能的軟硬件技術(shù)實現(xiàn)精準(zhǔn)靈巧的運動操作。以中美兩國為例,在產(chǎn)業(yè)化的第一階段,中國企業(yè)將依靠更完備、更成熟的工業(yè)制造體系取得美國企業(yè)所不能及的優(yōu)勢。也就是說,能不能“具身”取決于大模型在與物理世界互動過程中能否鞏固已經(jīng)創(chuàng)造的智能和實現(xiàn)新智能涌現(xiàn)能力,而有沒有人形功能則取決于設(shè)計水平和制造能力,即能否實現(xiàn)高水平的控制、傳感、自由度、驅(qū)動、連接及材料可靠性等。因此,既不能是“思想上的巨人、行動上的矮子”,也不能“四肢發(fā)達(dá)、頭腦簡單”。頭腦和本體之間還要整體性、協(xié)調(diào)性好,協(xié)同好了作用才能發(fā)揮好。 這就是取勝的兩個關(guān)鍵因素。中美兩國企業(yè)在這兩個方面各有優(yōu)勢,底座智能涌現(xiàn)能力關(guān)鍵靠人才,智能體的制造能力關(guān)鍵看制造業(yè)水平,這是一個體系能力問題。美國拔尖人才優(yōu)勢非常明顯,在高端制造業(yè)上也有優(yōu)勢;中國具有完整的產(chǎn)業(yè)體系、龐大的市場規(guī)模,強(qiáng)大的制造體系和配套生產(chǎn)能力極具優(yōu)勢,中國人才隊伍特別是青年科學(xué)家和工程師隊伍也有一定優(yōu)勢。從最終落地的角度來講,誰的制造業(yè)體系能力強(qiáng)大誰最終勝出的幾率就大。能在實體經(jīng)濟(jì)領(lǐng)域廣泛深化應(yīng)用的技術(shù)才會更有生命力,這也是過去80年來人工智能發(fā)展出現(xiàn)幾起幾落的一個因素。當(dāng)然,大模型理論和技術(shù)在快速發(fā)展中,優(yōu)勢劣勢也處在快速變化與轉(zhuǎn)化之中,作為后發(fā)國家我們要樹立信心但絕不能掉以輕心。 在人工智能的競賽中,不能追求單方勝出,世界共贏才是正道。因為人工智能大國面臨著共同問題和責(zé)任,就是如何確保人工智能造福世界造福人民,防止出現(xiàn)脫離“智能向善”的軌道。想靠封鎖打壓、“小院高墻”之類限制一方發(fā)展不會有長時效果,在建設(shè)人類命運共同體的地球村里,人類探索未知的思想是鎖不住的,科學(xué)前沿之門決不會只對一家開放。 |
|