追蹤AI技術(shù)這么長時(shí)間,我們親眼見到了許許多多的職業(yè),工作環(huán)境因AI而變得更好。 昔日在高空連續(xù)工作的吊車司機(jī),變成了可以遠(yuǎn)程操作的“空調(diào)哥”“空調(diào)姐”;曾經(jīng)風(fēng)里來水里去的巡檢工,工作強(qiáng)度因?yàn)橹悄鼙O(jiān)控系統(tǒng)而輕松了不少…… 然而,還有一種隱形的重復(fù)類工作很容易被忽視,那就是IT運(yùn)維。 可能在很多人眼里,運(yùn)維人員只需要在系統(tǒng)宕機(jī)、電腦壞了的時(shí)候擔(dān)任“救火隊(duì)員”即可。但隨著IT系統(tǒng)規(guī)模越來越大、網(wǎng)絡(luò)復(fù)雜度越來越高,傳統(tǒng)的運(yùn)維工作正在變成了高強(qiáng)度且枯燥的工種。運(yùn)維人員在日常巡檢中需要重復(fù)上千次抄表,每天要面對(duì)并處理成百上千次告警通知…… 據(jù)說每個(gè)運(yùn)維人入職時(shí)的期待,就是喝著咖啡做運(yùn)維,蹺著二郎腿就把工作做好了。然而年復(fù)一年,盡管運(yùn)維輔助工具也在迭代,但始終趕不上數(shù)字化進(jìn)程快、企業(yè)業(yè)務(wù)變化大,別說“咖啡運(yùn)維”了,晚上能少收到幾個(gè)告警工單就謝天謝地了。那么,AI能為他們帶來改變嗎? 剛剛過去的華為全聯(lián)接大會(huì)上,華為就為企業(yè)運(yùn)維人斟上了一杯“咖啡”,發(fā)布了AIOps服務(wù)。 AIOps(智能運(yùn)維)一直被看作是下一代運(yùn)維模式,這杯由華為調(diào)制的運(yùn)維“咖啡”,又是什么味道的呢? 品味一番會(huì)發(fā)現(xiàn),前調(diào)是智能,與AI相結(jié)合的AIOps帶來了顛覆傳統(tǒng)運(yùn)維的體驗(yàn);中調(diào)是場景,智能技術(shù)與業(yè)務(wù)場景的有機(jī)結(jié)合,讓AIOps服務(wù)品起來更加和諧絲滑;后調(diào)是生態(tài),要能兼容各種網(wǎng)絡(luò)協(xié)議、設(shè)備,才能讓不同口味的運(yùn)維人員都收獲驚喜。 通過這杯咖啡,我們來一起品一品數(shù)字時(shí)代的運(yùn)維之變。 前調(diào):氤氳智能的香氣 我們都知道,AI尤其是機(jī)器學(xué)習(xí)算法,非常適合處理重復(fù)性、預(yù)測型、大數(shù)據(jù)的工作,恰好指向了當(dāng)前運(yùn)維工作的核心挑戰(zhàn): 1.ICT網(wǎng)絡(luò)不斷迭代發(fā)展,系統(tǒng)日趨復(fù)雜,PB級(jí)海量數(shù)據(jù)成為常態(tài),有的運(yùn)營商甚至面臨2/3/4/5G四世同堂的網(wǎng)絡(luò)局面,運(yùn)維對(duì)象越來越多,運(yùn)維人員不得不忙于應(yīng)付大量告警和重復(fù)工作,而無法將時(shí)間放在運(yùn)維策略建構(gòu)等更有創(chuàng)造力和價(jià)值的工作上; 2.新服務(wù)、新技術(shù)帶來了更多的維護(hù)場景和要求,容器化、虛擬化、分布式服務(wù)、多云管理等等,讓運(yùn)維人員在故障定位、日常巡檢等工作中身心俱疲,面對(duì)問題時(shí)往往需要花費(fèi)很長時(shí)間來決策,要保證系統(tǒng)的高可用、高可靠、高效率十分困難; 3.萬物互聯(lián)、千行百業(yè)的數(shù)字化升級(jí),帶來了錯(cuò)綜復(fù)雜的IT設(shè)施種類,從硬件到軟件如果沒有整合監(jiān)控,運(yùn)維工具各自孤立,缺少統(tǒng)一集中的監(jiān)控管理機(jī)制,運(yùn)維專家在統(tǒng)籌決策時(shí)也容易出現(xiàn)混淆,不得不處于時(shí)刻待命的“救火狀態(tài)”。 因此, Gartner在2016年提出的AIOps概念,即 Artificial Intelligence for IT Operations,倡導(dǎo)將人工智能應(yīng)用于運(yùn)維領(lǐng)域。有以下好處: 第一,AI智能體能夠從日常的運(yùn)維大數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等)中總結(jié)規(guī)律,根據(jù)當(dāng)前的環(huán)境自動(dòng)分析; 第二,AI算法會(huì)在特定場景下,第一時(shí)間發(fā)現(xiàn)指標(biāo)異常,進(jìn)行故障精準(zhǔn)分析與定位,自動(dòng)觸發(fā)修復(fù)機(jī)制,將故障進(jìn)行恢復(fù),減輕運(yùn)維人員的工作負(fù)擔(dān); 第三,故障修復(fù)之后可以自動(dòng)復(fù)盤并沉淀為知識(shí)資產(chǎn),進(jìn)一步優(yōu)化迭代算法,形成千人千面的智能運(yùn)維工具。 由此,也就真正能將運(yùn)維人員從重復(fù)性工作中解脫出來,讓“咖啡運(yùn)維”的夢想照進(jìn)現(xiàn)實(shí)。 中調(diào):深入場景的甘甜 聽起來,AIOps簡直是運(yùn)維人員的明日之光。Gartner也曾預(yù)測,到2022年AIOps 的采用率將會(huì)達(dá)到 50%。然而現(xiàn)實(shí)中,落地速度卻并不像預(yù)期中那樣迅猛。是什么讓運(yùn)維人員“只聞其香,難嘗其味”?一個(gè)詞:開發(fā)。 AIOps離不開人工智能兩大要素:數(shù)據(jù)與算法。一般來說,支撐業(yè)務(wù)的AIOps工具,需要結(jié)合企業(yè)自身的運(yùn)維框架、策略,投入運(yùn)維大數(shù)據(jù),進(jìn)行針對(duì)性的模型開發(fā)和訓(xùn)練,才能保證算法的精準(zhǔn)度。 但現(xiàn)實(shí)很骨感,企業(yè)中具備AI專業(yè)知識(shí)的綜合性運(yùn)維人才十分稀缺,即便引進(jìn)了相關(guān)人才,也需要花費(fèi)大量時(shí)間來梳理多源異構(gòu)的大數(shù)據(jù),針對(duì)業(yè)務(wù)場景進(jìn)行編碼開發(fā),耗時(shí)不說,最終的模型效果還不一定理想,這些客觀問題都阻礙了AIOps在產(chǎn)業(yè)側(cè)的落地應(yīng)用。 因此在華為全聯(lián)接大會(huì)上,華為正式發(fā)布AIOps服務(wù),聚焦網(wǎng)絡(luò)智能運(yùn)維,降低AI開發(fā)門檻。此次發(fā)布的AIOps服務(wù)有三個(gè)特點(diǎn): 第一,扎根場景,適配需求。此次發(fā)布的AIOps服務(wù)結(jié)合了華為30多年的網(wǎng)絡(luò)運(yùn)維和場景理解經(jīng)驗(yàn),覆蓋MBB/FBB、園區(qū)網(wǎng)絡(luò)、數(shù)據(jù)中心網(wǎng)絡(luò)、IT應(yīng)用四大領(lǐng)域,和故障預(yù)測、檢測、診斷、識(shí)別等環(huán)節(jié),異常識(shí)別與故障診斷準(zhǔn)確率達(dá)90%,能夠滿足絕大多數(shù)企業(yè)的日常運(yùn)維需求; 第二,簡單易用,降低門檻。華為AIOps服務(wù)沉淀了10多個(gè)開箱即用的智能APP模板,用戶只需配置數(shù)據(jù)源,即可啟動(dòng)APP運(yùn)行,將AI應(yīng)用的開發(fā)部署過程縮短到分鐘級(jí);預(yù)集成了20多個(gè)高質(zhì)量的AI原子能力,覆蓋預(yù)測、檢測、診斷、識(shí)別等網(wǎng)絡(luò)運(yùn)維場景,只需要簡單拖拽,系統(tǒng)就能自動(dòng)完成節(jié)點(diǎn)間的數(shù)據(jù)銜接,自動(dòng)推薦下個(gè)節(jié)點(diǎn),不需要用戶從組件庫中反復(fù)篩選驗(yàn)證,大大降低了應(yīng)用開發(fā)門檻。 第三,可視化定制,提升效率。華為AIOps服務(wù)還提供了80多個(gè)2D/3D可視化組件,開發(fā)人員很輕松就能DIY出一個(gè)包含趨勢、報(bào)表、網(wǎng)絡(luò)關(guān)系等元素的可視化大屏,讓業(yè)務(wù)結(jié)果直觀、快速地呈現(xiàn)出來,有效減少運(yùn)維人員決策、處理的時(shí)間,并確保資產(chǎn)的整體管理和精細(xì)化運(yùn)維,可以提升業(yè)務(wù)系統(tǒng)的SLA,為企業(yè)降本增效,讓運(yùn)維數(shù)據(jù)這一重要資產(chǎn)發(fā)揮出更大的價(jià)值。 說了這么多,大家一定很好奇:AIOps到底怎么用?我們可以看一個(gè)真實(shí)的運(yùn)維案例,了解AIOps服務(wù)如何給企業(yè)和用戶帶來價(jià)值。 試想一下,如果一個(gè)用戶剛剛辦理了尊貴的5G套餐,卻突然間上不了網(wǎng),運(yùn)營商會(huì)不會(huì)就此損失一個(gè)高端客戶?隨著核心網(wǎng)承載量越來越大,監(jiān)控指標(biāo)多,傳統(tǒng)靜態(tài)閾值檢測存在漏報(bào)誤報(bào)的問題,一旦出現(xiàn)故障沒有及時(shí)排除,對(duì)用戶體驗(yàn)影響極大。 去年7月10日,某供應(yīng)商將DNS腳本的指向配置錯(cuò)誤,影響了某運(yùn)營商8個(gè)城市2000多5G用戶數(shù)據(jù)業(yè)務(wù)。幸好借助華為核心網(wǎng)KPI異常檢測APP,提前5小時(shí)發(fā)現(xiàn)了問題,并發(fā)送了告警短信,降低了業(yè)務(wù)損失,保證了5G高端用戶的網(wǎng)上沖浪體驗(yàn)。 異常檢測精度高,故障定位回復(fù)效率高,智能運(yùn)維應(yīng)用適配業(yè)務(wù)場景,變被動(dòng)響應(yīng)為主動(dòng)運(yùn)維……這正是華為AIOps服務(wù)的價(jià)值所在。 后調(diào):擴(kuò)散生態(tài)的溫度 而更進(jìn)一步,華為賦予了AIOps悠長的后調(diào),即建構(gòu)了值得長期品味的AI生態(tài)。 在本屆華為全聯(lián)接大會(huì)中,華為網(wǎng)絡(luò)人工智能產(chǎn)品部AI模型與訓(xùn)練服務(wù)部部長王晶提到,“華為AIOps旨在降低ICT領(lǐng)域AI應(yīng)用開發(fā)門檻,將AI技術(shù)帶入運(yùn)維預(yù)測、檢測、診斷、識(shí)別、優(yōu)化等每個(gè)環(huán)節(jié),賦能合作伙伴創(chuàng)新,共同建設(shè)智能運(yùn)維生態(tài),實(shí)現(xiàn)商業(yè)成功”。 這杯甄給運(yùn)維人的“咖啡”,為什么需要聚生態(tài)之力來打造?歸根結(jié)底源于華為對(duì)運(yùn)維行業(yè)的深度把脈:唯有眾智共創(chuàng),才能快速推動(dòng)智能運(yùn)維AIOps時(shí)代的到來。 運(yùn)維市場前景廣闊,根據(jù)艾瑞咨詢的預(yù)測,2021年中國IT服務(wù)有望突破萬億元大關(guān),其中IT運(yùn)維市場規(guī)模將達(dá)2941.2億元。這也就導(dǎo)致很多廠商看中了這塊“蛋糕”,紛紛進(jìn)入,行業(yè)創(chuàng)新和實(shí)踐不斷涌現(xiàn)。但跨廠家主流設(shè)備無法互通,多層次協(xié)同難以形成,最終影響的還是客戶體驗(yàn),從而延緩了智能運(yùn)維的落地部署。要解決這一問題,就需要以開放心態(tài)實(shí)現(xiàn)共享,以生態(tài)模式促進(jìn)共同獲益,進(jìn)而推動(dòng)智能運(yùn)維進(jìn)入良性發(fā)展階段。 所以我們注意到,華為AIOps服務(wù)另一個(gè)余韻悠長的操作就是:開放。 首先,向跨廠家設(shè)備開放。華為AIOps服務(wù)實(shí)現(xiàn)了主流設(shè)備的自動(dòng)對(duì)接,支持SFTP、Kafka、Rest等通用采集協(xié)議,支持華為30類網(wǎng)元、跨廠家100多種主流設(shè)備的自動(dòng)對(duì)接,可以滿足端管云的數(shù)據(jù)采集需求; 其次,向企業(yè)人才、合作伙伴開放。華為自身技術(shù)資源向全球企業(yè)、運(yùn)維開發(fā)工程師、合作伙伴開放,利用華為的技術(shù)、AI原子能力等,可以低門檻、零代碼地開發(fā)更多運(yùn)維應(yīng)用,構(gòu)建自身的運(yùn)維服務(wù)能力,開發(fā)獨(dú)特的運(yùn)維服務(wù),生機(jī)勃勃的應(yīng)用開發(fā)生態(tài)快速崛起,將為智能運(yùn)維的工具創(chuàng)新、能力擴(kuò)展,打下堅(jiān)實(shí)基礎(chǔ)。 今天,數(shù)字化轉(zhuǎn)型是中國經(jīng)濟(jì)發(fā)展、產(chǎn)業(yè)升級(jí)的最強(qiáng)音,少了高質(zhì)量、高效率的運(yùn)維能力,數(shù)字化就猶如沙上聚塔,顯得尤為脆弱。從這個(gè)角度看,運(yùn)維人員也早已不再是邊緣化的“救火隊(duì)員”,而是網(wǎng)絡(luò)安全穩(wěn)健運(yùn)行、系統(tǒng)性能最優(yōu)化、組織生產(chǎn)力最大化的“神助攻”。 而華為打造的智能底座,正有力地托舉著運(yùn)維人的智能憧憬,讓他們終于能夠放心地飲下這杯香氣四溢的“咖啡”。 |
|