AIGC的風已經(jīng)刮到了實時互動(RTE)領(lǐng)域,并且已經(jīng)有企業(yè)乘風起勢。 提到RTE,亦或是實時音視頻(RTC),可能很多人感覺到陌生,但其實,在視頻會議、線上直播、網(wǎng)上課堂等場景中,正是RTC與RTE支撐起了低時延、高清晰、深度沉浸的互動體驗。 從2015年前后,短視頻、直播興起,才令人們對于實時音視頻有了更加具象的認知。隨后,疫情爆發(fā)之下“全民宅家”所催生的視頻會議、在線教育、電商直播也使得實時音視頻需求迅速爆發(fā)。 據(jù)36氪研究院發(fā)布的數(shù)據(jù)顯示,實時音視頻在國內(nèi)360、華為、小米三大安卓應用市場的近10,000個App中的滲透率,2015年還不到1%,2021年已突破30%。業(yè)界認為,在未來幾年,實時音視頻技術(shù)在關(guān)鍵行業(yè)的滲透率可能將超過50%。 對于很多消費者而言,RTC、RTE作為默默耕耘在應用背后的重要技術(shù),或許并沒有得到頗高的關(guān)注,但在產(chǎn)業(yè)端,這個能夠迸發(fā)出創(chuàng)新應用的領(lǐng)域卻是在持續(xù)成長中逐漸與越來越多的場景結(jié)合。 這也令筆者想起了此前與聲網(wǎng)相關(guān)負責人的一次訪談——“即便你過去沒有聽說過聲網(wǎng),但你一定用過聲網(wǎng)的服務”。的確,作為最早一批入局實時音視頻領(lǐng)域的企業(yè),聲網(wǎng)雖然在C端并不似生態(tài)繁榮的大廠那般名頭響亮,但其全球注冊應用在2022年9月就已超過 51.1 萬,在行業(yè)內(nèi)的影響力可見一斑。 就在今天上午,RTE 2023第九屆實時互聯(lián)網(wǎng)大會在北京召開,這個由聲網(wǎng)從2015年搭建而成的交流平臺,也逐漸成為了RTC的行業(yè)聚會,而在今天上午的主論壇上,AIGC無疑成為了主旋律。 AIGC+RTE,玩出什么新花樣 從去年年底開始,ChatGPT異軍突起,甚至被黃仁勛稱為人工智能的“iPhone時刻”。時至今日,這場圍繞大模型、AIGC的狂歡還在持續(xù),并且有更多相關(guān)的技術(shù)、行業(yè)參與其中,RTE其實并不是最早加入的,但應該算得上是極富創(chuàng)造力的。 首先來了解一下什么是RTE。 據(jù)悉,2020年,聲網(wǎng)在上市招股書中首次公開提出“RTE(Real-Time Engagement)”概念,此后這一概念逐漸被全行業(yè)認可和使用。此前,更多被業(yè)內(nèi)所熟知的RTC更多是強調(diào)對語義信息進行高質(zhì)量和高效率的傳遞,而RTE則是更聚焦用戶所需要的共享時空,即場景。 換言之,RTC是從信息傳遞的角度出發(fā),而實時音視頻也僅僅提供語音溝通,能夠滿足單一的場景和通話標準。而隨著實時互動的創(chuàng)新場景涌現(xiàn),加之人們對于通話質(zhì)量的要求提升,低時延、高清晰的實時互動需求恰恰是RTE的專長。 而火爆的AIGC自然是不需要過多介紹了,從聊天機器人到AI助理,再到到虛擬女友,再到復刻親人形象,其已經(jīng)多次展示了驚人的創(chuàng)造力。 那么,RTE又能夠與AI擦出哪些火花呢? 聲網(wǎng)創(chuàng)始人兼CEO趙斌在RTE大會上展示了聲網(wǎng)鳳鳴AI引擎優(yōu)化線上課程噪聲的案例,以及利用AI算法提升實時視頻清晰度的案例,進一步介紹了AI對于RTE行業(yè)的顛覆式改造。此外,面向社交和泛娛樂場景的實時互動,AIGC相較傳統(tǒng)的AI對話機器人,還能夠提供更加接近于真人的情感價值和情緒價值。 趙斌還表示,AIGC對于RTE行業(yè)的另一個影響便是可以大幅提高應用開發(fā)效率。從編程、自動化測試再到文檔生產(chǎn)以及低代碼平臺進化,都將得到一定的促進。雖然很多影響和變化還都處于早期階段,但未來值得釋放的空間仍非常值得期待,還有很多想象仍未被實現(xiàn)。 例如,AIGC能否徹底顛覆低代碼形成的方式,以對話的形式指令機器來生成代碼,甚至不光是生成代碼,而是生成完整的應用,從而實現(xiàn)新一代的無代碼能力。 至于聲網(wǎng),作為RTE賽道的開創(chuàng)者,其也率先推出了AIGC RTE能力模塊,可以和任何大模型平臺對接,將現(xiàn)有的文字交流的互動方式和溝通方式轉(zhuǎn)化成更加自然的語音對話,同時也保障了接近人與人對話的低時延體驗。 據(jù)介紹,目前聲網(wǎng)RTE x AIGC一站式解決方案,可以將 AI 對話端到端響應延時控制在1.9秒以內(nèi),并且支持API快速調(diào)用,提供開箱即用的場景化demo,最快3個小時即可實現(xiàn)方案驗證。 趙斌也表示,除了社交、直播、泛娛樂場景等,企業(yè)用戶近年來開始積極擁抱實時互動所帶來的一系列變化,開始基于RTE進行效率優(yōu)化。企業(yè)也意識到如今的實時互動能力已經(jīng)遠遠超出了企業(yè)內(nèi)部視頻會議的需求,而實時互動平臺也不僅僅是視頻會議平臺,其所提供的無所不答的實時網(wǎng)絡(luò)以及無所不及的音視頻能力,正在成為企業(yè)數(shù)字化轉(zhuǎn)型的一個重要支撐。 對于幾萬、甚至幾十萬人的大企業(yè)而言,往往需要構(gòu)建全域一張網(wǎng)、全業(yè)務一張網(wǎng)、全設(shè)備一網(wǎng)通、全業(yè)務多形態(tài)連接的基礎(chǔ)能力。聲網(wǎng)也可以配合企業(yè)構(gòu)建音視頻實時互動平臺,用統(tǒng)一中臺的方式,改造企業(yè)內(nèi)部過去做一個應用就要重新建一套系統(tǒng)、重新部署網(wǎng)絡(luò)的低效、重復建設(shè)模式,從而極大地提高企業(yè)在業(yè)務上的靈活度和效率。 值得注意的是,在演講的最后,趙斌也帶了one more thing——聲網(wǎng)在RTE行業(yè)里面首次實現(xiàn)了廣播級的4K超高清實時互動體驗。 5G能與實時音視頻擦出什么火花? 雖然RTE 2023大會的主論壇主要聚焦在了AIGC與RTE的結(jié)合,但其實圍繞實時互動的通信技術(shù)升級也是不容忽視的重要底座。過去,業(yè)內(nèi)一直在期待5G能夠幫助RTE領(lǐng)域?qū)崿F(xiàn)4G所未能達到的體驗。 一方面,5G的超大帶寬、超低時延等特征,可大幅降低音視頻信息的延遲和緩沖時間,提高端到端毫秒級傳輸時延的滿足率,為RTC的數(shù)據(jù)傳輸?shù)於藞詫嵉幕A(chǔ)。另一方面,5G的商用之于不斷涌現(xiàn)的實時音視頻場景而言也是恰逢其時。 例如,在智慧醫(yī)療領(lǐng)域,無論是5G遠程會診,還是遠程手術(shù)示教、遠程教學等場景,都需要低時延、高清晰的實時音視頻系統(tǒng)。 此外,以聲網(wǎng)的超低延時平行駕駛和平行控制方案為例,該方案面向以無人車、機器人為代表的智能設(shè)備遠程運維、人工接管和遠程控制場景。針對于同城遠程控制,聲網(wǎng)解決方案通過標記優(yōu)先級優(yōu)化路由調(diào)度策略和同節(jié)點轉(zhuǎn)化方式,保障該場景下的延時傳輸質(zhì)量。 同時還結(jié)合了多運營商物聯(lián)網(wǎng)卡場景下,通過Multipath多路徑融合的技術(shù),保證網(wǎng)絡(luò)質(zhì)量的可用性和弱網(wǎng)對抗能力。據(jù)悉,實測數(shù)據(jù)顯示,從無人駕駛車輛攝像頭畫面采集,到遠程控制臺顯示,聲網(wǎng)能做實時音視頻端到端時延最低百毫秒內(nèi),5G公網(wǎng)平均160ms;可靠信令可以做到端到端25ms之內(nèi),5G公網(wǎng)平均50ms,可以保障低速自動駕駛車輛在30公里時速下,擁有相對可靠、安全和高效沉浸式的體驗,來完成所有的遠程作業(yè)。 未來,隨著AIGC的進一步融合,加之5G提供更加穩(wěn)定、高可靠的通道,RTE勢必將帶來更多創(chuàng)新應用,讓我們拭目以待。 參考資料:1.《全球音視頻社交市場規(guī)模達1813億美元,60%以上用聲網(wǎng)》,36氪產(chǎn)業(yè)創(chuàng)新2.《加速邁入“真實時”物聯(lián)網(wǎng) RTC成智能設(shè)備“硬指標”》,砍柴網(wǎng)3.《聲網(wǎng)CEO趙斌:生成式 AI 技術(shù)將顛覆式改造社交和泛娛樂行業(yè)|鈦媒體焦點》,鈦媒體APP |
|