在過(guò)去的十年里,人工智能技術(shù)迅速崛起,從實(shí)驗(yàn)室走向產(chǎn)業(yè)化,引領(lǐng)著一場(chǎng)前所未有的變革。這場(chǎng)AI技術(shù)革命不僅席卷了各個(gè)行業(yè),也在深刻地改變著人們的生活方式和商業(yè)模式。人工智能不再是理論探討的領(lǐng)域,而是成為了推動(dòng)社會(huì)進(jìn)步的強(qiáng)大引擎。在這個(gè)過(guò)程中,從傳統(tǒng)的交換機(jī)到高性能的AI服務(wù)器,再到云計(jì)算和數(shù)據(jù)中心,各種技術(shù)不斷地推陳出新。與此同時(shí),AI技術(shù)也在不斷演進(jìn),從“1”到“10”掀起“千模大戰(zhàn)”的AI革命,將首先在軟件和應(yīng)用領(lǐng)域展開(kāi)。算法作為關(guān)鍵驅(qū)動(dòng)力,基礎(chǔ)軟件則為其提供了支撐和平臺(tái)。隨著算力性能逐漸同質(zhì)化,數(shù)據(jù)的多樣性和企業(yè)需求的多樣性也逐漸凸顯出來(lái)。因此,“AI基礎(chǔ)軟件”作為決定模型訓(xùn)練效率和算力使用效率的核心要素,其地位顯得愈發(fā)重要,該領(lǐng)域的發(fā)展將創(chuàng)造出更為獨(dú)特和有價(jià)值的社會(huì)及經(jīng)濟(jì)效益。 弗若斯特沙利文(Frost & Sullivan,簡(jiǎn)稱“沙利文”)持續(xù)關(guān)注中國(guó)AI基礎(chǔ)軟件的發(fā)展創(chuàng)新,正式發(fā)布《中國(guó)AI基礎(chǔ)軟件市場(chǎng)研究報(bào)告(2023)》。 該報(bào)告旨在明晰AI基礎(chǔ)軟件的基本概念和分類,通過(guò)對(duì)行業(yè)發(fā)展歷程及產(chǎn)業(yè)鏈的梳理探究行業(yè)核心驅(qū)動(dòng)因素,剖析當(dāng)下AI基礎(chǔ)軟件行業(yè)市場(chǎng)趨勢(shì),并基于應(yīng)用、產(chǎn)品及生態(tài)三大關(guān)鍵維度構(gòu)建廠商競(jìng)爭(zhēng)力體系,評(píng)估主流玩家的核心競(jìng)爭(zhēng)優(yōu)勢(shì)及綜合壁壘,形成對(duì)中國(guó)市場(chǎng)AI基礎(chǔ)軟件發(fā)展情況的客觀評(píng)價(jià),并為行業(yè)未來(lái)發(fā)展提供參照建議與關(guān)鍵啟發(fā)。 本文深入技術(shù)和行業(yè)發(fā)展,解析AI基礎(chǔ)軟件產(chǎn)業(yè)體系和其價(jià)值創(chuàng)造。 1 中國(guó)AI基礎(chǔ)軟件發(fā)展背景 01 平臺(tái)型機(jī)會(huì):AI2.0 AI2.0是由大數(shù)據(jù)、云計(jì)算和人工智能技術(shù)等多種技術(shù)的融合所構(gòu)成的,是一個(gè)巨大的平臺(tái)式機(jī)會(huì),將會(huì)在未來(lái)為各行業(yè)提供更加深入和全面的解決方案。隨著AI 2.0 時(shí)代的到來(lái),基礎(chǔ)模型不再需要人工標(biāo)注數(shù)據(jù),也可以自行學(xué)習(xí)和閱讀海量的文本。而且模型通過(guò)微調(diào)就能以低成本訓(xùn)練適應(yīng)不同領(lǐng)域的任務(wù)。其中,AI2.0相關(guān)的應(yīng)用、平臺(tái)和基礎(chǔ)設(shè)施,將會(huì)成為包括產(chǎn)業(yè)及投資在內(nèi)的熱點(diǎn)。AI基礎(chǔ)軟件作為AI大模型訓(xùn)練、管理、應(yīng)用的重要平臺(tái)將會(huì)在AI2.0的長(zhǎng)風(fēng)中順勢(shì)演化出巨大的產(chǎn)業(yè)機(jī)會(huì)。 來(lái)源:沙利文報(bào)告 02 AI大模型發(fā)展根基:龐大數(shù)據(jù)基礎(chǔ) 一方面,數(shù)據(jù)量的爆發(fā)推動(dòng)了基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的發(fā)展和拓展基礎(chǔ)數(shù)據(jù)服務(wù)提供的服務(wù)范圍。中國(guó)的數(shù)據(jù)量在2017年到2021年,從2.3ZB(十萬(wàn)億億字節(jié))增長(zhǎng)到23.88ZB,預(yù)計(jì)在2026年達(dá)到76.6ZB,將位居全球第一,且未來(lái)依然保持爆發(fā)式增長(zhǎng)。隨著大數(shù)據(jù)的爆炸式增長(zhǎng),企業(yè)和組織對(duì)于處理、管理和分析這些數(shù)據(jù)的需求也在急劇增加。這為基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)帶來(lái)了巨大的市場(chǎng)需求,推動(dòng)了行業(yè)的發(fā)展。 另一方面,合成數(shù)據(jù)加速高質(zhì)量數(shù)據(jù)供給,為AI大模型發(fā)展提供基礎(chǔ),合成數(shù)據(jù)有望解除AI的數(shù)據(jù)掣肘,推動(dòng)人工智能邁向2.0階段。在此階段,合成數(shù)據(jù)不僅可以訓(xùn)練AI模型,通過(guò)數(shù)據(jù)仿真AI可以完成自我學(xué)習(xí)和進(jìn)化。 來(lái)源:沙利文報(bào)告 2 AI基礎(chǔ)軟件市場(chǎng)概覽 01 AI基礎(chǔ)軟件市場(chǎng)定義與解讀 AI基礎(chǔ)軟件包含一系列企業(yè)級(jí)AI應(yīng)用所需的平臺(tái)軟件產(chǎn)品及解決方案,是為大模型應(yīng)用落地的最主要的效率支撐,AI基礎(chǔ)軟件的發(fā)展決定了人工智能發(fā)展的深度、高度、廣度,其催化大模型應(yīng)用快速發(fā)展,推動(dòng)政府和企業(yè)AI規(guī)?;瘧?yīng)用。 AI2.0時(shí)代的到來(lái),讓各行業(yè)對(duì)大模型應(yīng)用的需求日漸提升,對(duì)大模型對(duì)于業(yè)務(wù)的支撐力也更為重視,但大多數(shù)企業(yè)都會(huì)面臨工程、技術(shù)等能力不足的問(wèn)題。 AI基礎(chǔ)軟件作為AI基礎(chǔ)設(shè)施的重中之重,為企業(yè)客戶提供全方位的AI調(diào)度以及模型服務(wù),包含機(jī)器學(xué)習(xí)平臺(tái)等一站式模型平臺(tái),以及數(shù)據(jù)智能平臺(tái)、實(shí)時(shí)決策中心、數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)等服務(wù)于AI的數(shù)據(jù)平臺(tái),從而降低各行業(yè)客戶訓(xùn)練自己人工智能模型的門檻,實(shí)現(xiàn)降本增效。 來(lái)源:沙利文報(bào)告 02 AI基礎(chǔ)軟件市場(chǎng)需求:“千模百態(tài)”蓬勃發(fā)展 在數(shù)據(jù)層面,模型訓(xùn)練數(shù)據(jù)的質(zhì)量和規(guī)模對(duì)模型迭代的效果至關(guān)重要,尤其是目前內(nèi)外數(shù)據(jù)共享和數(shù)據(jù)共創(chuàng)、數(shù)據(jù)類別不均衡、極端場(chǎng)景數(shù)據(jù)缺失等問(wèn)題,呼喚業(yè)內(nèi)對(duì)AIGC結(jié)構(gòu)化數(shù)據(jù)合成領(lǐng)域的技術(shù)探索。 在技術(shù)層面,生成式AI模型的推理能力愈發(fā)重要,同時(shí)對(duì)AI的可信度、可解釋度的需求也在提升,呼喚自動(dòng)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、因果學(xué)習(xí)等領(lǐng)域的基礎(chǔ)軟件性能提升。 在商業(yè)模式層面,隨著大模型的逐漸成熟,通用大模型 行業(yè)小模型會(huì)成為越來(lái)越多企業(yè)采用的落地模式,因此,幫助企業(yè)自建AI模型的AI基礎(chǔ)軟件成為大勢(shì)所趨。 來(lái)源:沙利文報(bào)告 03 AI基礎(chǔ)軟件政策驅(qū)動(dòng):利好政策 在國(guó)家監(jiān)管層面,中國(guó)積極布局人工智能產(chǎn)業(yè),競(jìng)跑“未來(lái)賽道”。隨著各行業(yè)、各領(lǐng)域?qū)θ斯ぶ悄苄枨蟮娜找嬖鲩L(zhǎng),與實(shí)體經(jīng)濟(jì)深度融合的新模式不斷涌現(xiàn),形成了具有中國(guó)特色的研發(fā)體系和應(yīng)用生態(tài)。以“大模型”為代表的技術(shù)爆發(fā),加速了人工智能產(chǎn)業(yè)的發(fā)展。國(guó)家及地方出臺(tái)的多項(xiàng)AI產(chǎn)業(yè)支持政策將給產(chǎn)業(yè)發(fā)展帶來(lái)助推力,更進(jìn)一步推動(dòng)數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)的融合發(fā)展。 04 AI基礎(chǔ)軟件開(kāi)源生態(tài):開(kāi)放源代碼 開(kāi)源生態(tài)的建設(shè)、完善對(duì)AI基礎(chǔ)軟件領(lǐng)域的影響和推動(dòng)是巨大的,它不僅推動(dòng)了技術(shù)的創(chuàng)新和進(jìn)步,也促使了更廣泛的合作和知識(shí)分享。具體表現(xiàn)在開(kāi)源降低AI基礎(chǔ)軟件的開(kāi)發(fā)門檻,同時(shí)能促進(jìn)開(kāi)發(fā)者的知識(shí)共享和協(xié)作,此外也擴(kuò)大AI基礎(chǔ)軟件的應(yīng)用領(lǐng)域,開(kāi)源為廣大開(kāi)發(fā)者提供了高度靈活和可定制的基礎(chǔ)。 來(lái)源:沙利文報(bào)告 05 AI基礎(chǔ)軟件產(chǎn)業(yè)生態(tài):價(jià)值創(chuàng)造 AI基礎(chǔ)軟件主要位于產(chǎn)業(yè)鏈的中游。其產(chǎn)業(yè)鏈由上游基礎(chǔ)設(shè)施與資源提供商、中游AI基礎(chǔ)軟件與一站式AI開(kāi)發(fā)平臺(tái)和下游應(yīng)用領(lǐng)域企業(yè)構(gòu)成。 上游是人工智能軟件部署的基礎(chǔ),為AI基礎(chǔ)軟件提供算力支撐。中游是產(chǎn)業(yè)鏈的核心,以模擬人的智能相關(guān)特征為出發(fā)點(diǎn),構(gòu)建應(yīng)用技術(shù)路徑,主要包括AI基礎(chǔ)軟件以及一站式AI開(kāi)發(fā)平臺(tái)。下游主要為AI基礎(chǔ)軟件在各細(xì)分場(chǎng)景的應(yīng)用,主要包括制造、安防、金融、醫(yī)療、零售、交通、等領(lǐng)域。 云廠商傾向于向客戶提供端到端的整體解決方案,期望整體捆綁客戶。相比之下,目前領(lǐng)先的AI基礎(chǔ)軟件能夠以模塊化的方式嵌入客戶云的體系中,能夠充分滿足客戶的自主性和可控性的要求。 來(lái)源:沙利文報(bào)告 3 AI基礎(chǔ)軟件市場(chǎng)代表企業(yè)簡(jiǎn)析 九章云極DataCanvas 九章云極DataCanvas是領(lǐng)先的AI基礎(chǔ)軟件供應(yīng)商,其核心產(chǎn)品系列AIFS人工智能基礎(chǔ)軟件和DataPilot數(shù)據(jù)領(lǐng)航員具有創(chuàng)新性、靈活性及可擴(kuò)展性;AIFS賦能用戶“自主構(gòu)建大 小模型”的AI能力,包含DataCanvas Alaya九章元識(shí)“通識(shí) 產(chǎn)業(yè)”白盒大模型矩陣、APS機(jī)器學(xué)習(xí)平臺(tái)、BAP面向業(yè)務(wù)的自動(dòng)建模平臺(tái)、DAT自動(dòng)機(jī)器學(xué)習(xí)軟件、YLearn因果學(xué)習(xí)軟件等一整套全開(kāi)放、高自動(dòng)、高協(xié)同的軟件工具,加速實(shí)現(xiàn)用戶亟需的自主AI能力積累和模型規(guī)?;?;DataPilot數(shù)據(jù)領(lǐng)航作為基于自研大模型的新一代數(shù)據(jù)架構(gòu)工具產(chǎn)品,包含DingoDB多模向量數(shù)據(jù)庫(kù)和RT實(shí)時(shí)決策中心平臺(tái)等工具,幫助用戶自主構(gòu)建安全可控的“向量?!?,實(shí)現(xiàn)全鏈路的智能化與自動(dòng)化,賦能用戶擁有面向未來(lái)的多模態(tài)實(shí)時(shí)數(shù)據(jù)處理能力。 亞馬遜云科技 亞馬遜云旗下的機(jī)器學(xué)習(xí)平臺(tái)Amazon SageMaker提供完整、豐富的功能供開(kāi)發(fā)人員、數(shù)據(jù)科學(xué)家和ML工程師使用。Amazon SageMaker Studio Lab提供免費(fèi)資源,Amazon SageMaker Jumpstart和Amazon SageMaker Canvas提供低代碼/無(wú)代碼的快速上手功能、Amazon SageMaker Pipelines構(gòu)建全自動(dòng)ML流程、Amazon SageMaker Ground Truth Plus提供智能標(biāo)注服務(wù)、Amazon SageMaker Data Wrangler內(nèi)置300多種數(shù)據(jù)轉(zhuǎn)換、Amazon SageMaker Autopilot自動(dòng)執(zhí)行AutoML,具備完備的AI開(kāi)發(fā)軟硬全棧供應(yīng)水平,從專用基礎(chǔ)設(shè)施、AI平臺(tái)到各類場(chǎng)景開(kāi)箱即用的AI服務(wù)解決方案,結(jié)合亞馬遜云科技的系列云上服務(wù),滿足各類型客戶的不同需求。 華為云 華為云AI開(kāi)發(fā)平臺(tái)ModelArts是面向開(kāi)發(fā)者的一站式AI開(kāi)發(fā)平臺(tái),可快速創(chuàng)建和部署模型,管理全周期AI工作流,為機(jī)器學(xué)習(xí)與深度學(xué)習(xí)提供海量數(shù)據(jù)預(yù)處理及半自動(dòng)化標(biāo)注、大規(guī)模分布式Training、自動(dòng)化模型生成,助力千行百業(yè)智能化升級(jí)。華為云AI開(kāi)發(fā)平臺(tái)ModelArts具有提供模型開(kāi)發(fā)、訓(xùn)練、推理端到端工具鏈,以及高性價(jià)比AI算力、支持萬(wàn)卡大規(guī)模集群,支持故障容錯(cuò)及訓(xùn)練作業(yè)故障自動(dòng)恢復(fù)等優(yōu)勢(shì)。 阿里云 阿里云旗下相關(guān)產(chǎn)品包含機(jī)器學(xué)習(xí)平臺(tái)PAI、模型在線服務(wù)PAI-EAS等。其中,機(jī)器學(xué)習(xí)平臺(tái)PAI是面向開(kāi)發(fā)者和企業(yè)的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)工程平臺(tái),提供包含數(shù)據(jù)標(biāo)注、模型構(gòu)建、模型訓(xùn)練、模型部署、推理優(yōu)化在內(nèi)的AI開(kāi)發(fā)全鏈路服務(wù),內(nèi)置140 種優(yōu)化算法以及豐富的場(chǎng)景插件,為用戶提供低門檻、高性能的云原生AI工程化能力。 騰訊云 騰訊云AI開(kāi)放平臺(tái)包括騰訊云TI 平臺(tái)、TI-Matrix應(yīng)用平臺(tái)等,是基于騰訊生態(tài)與AI開(kāi)發(fā)經(jīng)驗(yàn),面向開(kāi)發(fā)者、政企提供的全棧式人工智能開(kāi)發(fā)服務(wù)平臺(tái),打通包含從數(shù)據(jù)獲取、數(shù)據(jù)處理、算法構(gòu)建、模型訓(xùn)練、模型評(píng)估、模型部署到AI應(yīng)用開(kāi)發(fā)的產(chǎn)業(yè) AI落地全流程鏈路,幫助用戶快速創(chuàng)建和部署AI應(yīng)用,管理全周期AI解決方案,推動(dòng)政企加速數(shù)字化轉(zhuǎn)型并促進(jìn)AI行業(yè)生態(tài)共建。 Databricks Databricks旗下Lakehouse平臺(tái)結(jié)合了數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)的元素,它具有數(shù)據(jù)湖的靈活性、成本效益和規(guī)模,同時(shí)還提供數(shù)據(jù)管理事務(wù)。用戶可以在所有數(shù)據(jù)上啟用商業(yè)智能和機(jī)器學(xué)習(xí)。Databricks Lakehouse平臺(tái)為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)提供了一個(gè)統(tǒng)一的環(huán)境,可實(shí)現(xiàn)商業(yè)智能和SQL分析、數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)、實(shí)時(shí)數(shù)據(jù)應(yīng)用等功能。在Databricks Lakehouse平臺(tái)上企業(yè)可較易攝取和轉(zhuǎn)換批處理和流數(shù)據(jù),編排可靠的生產(chǎn)工作流,通過(guò)內(nèi)置的數(shù)據(jù)質(zhì)量測(cè)試和對(duì)軟件開(kāi)發(fā)最佳實(shí)踐的支持,提高企業(yè)生產(chǎn)力。 百度云 百度的AI開(kāi)發(fā)平臺(tái)由千帆大模型平臺(tái)、全功能AI開(kāi)發(fā)平臺(tái)(BML),零門檻AI開(kāi)發(fā)平臺(tái)(EasyDL),AI開(kāi)發(fā)實(shí)訓(xùn)平臺(tái)(AI Studio)組成,由百度自主研發(fā)的飛槳平臺(tái)統(tǒng)一進(jìn)行賦能。百度AI開(kāi)發(fā)平臺(tái)覆蓋不同需求的開(kāi)發(fā)者,涵蓋數(shù)據(jù)處理,算法開(kāi)發(fā), 模型訓(xùn)練,預(yù)測(cè)服務(wù)部署,以及資源管理等貫穿模型全生命周期的能力。 |
|