文章來源:圖解源碼 換公司已經(jīng)有幾個(gè)月的時(shí)間,現(xiàn)在更多的時(shí)間是在思考公司的PAAS平臺(tái)的設(shè)計(jì),這里將最近的一些思考整理出來,分享下自己的一些胡思亂想, 歡迎各位大佬指正其中的不足,也算是對(duì)這一段時(shí)間的總結(jié)吧 1.Paas的運(yùn)行時(shí)與中間件(圖片取自網(wǎng)上,非本人原創(chuàng))這是從網(wǎng)上找到一個(gè)關(guān)于IAAS、PAAS、SAAS最典型的一張圖了,從圖上我們可以看出相對(duì)于IAAS層而言PAAS層多了兩個(gè)很重要的東西就是中間件和運(yùn)行時(shí),業(yè)務(wù)研發(fā)者只需要關(guān)注應(yīng)用和數(shù)據(jù),即可以完成對(duì)應(yīng)應(yīng)用的開發(fā) 1.1 運(yùn)行時(shí)在公司的PAAS平臺(tái)建設(shè)中通常會(huì)提供到一個(gè)基礎(chǔ)的平臺(tái)ARP(Applications Running Platform)即應(yīng)用運(yùn)行平臺(tái),通過該平臺(tái)支持公司的業(yè)務(wù)應(yīng)用的運(yùn)行,同時(shí)也是與公有云PAAS差異最大的地方,在這一層我們可以落地更多的公司的標(biāo)準(zhǔn)與規(guī)范,同時(shí)根據(jù)公司的需要進(jìn)行數(shù)據(jù)的整合,這才是私有PAAS最大的意義 看上去很簡單的運(yùn)行時(shí)個(gè)人理解才是paas平臺(tái)中最負(fù)責(zé)的設(shè)計(jì)之一,在PAAS里面有承上啟下的意義,對(duì)下運(yùn)行時(shí)的設(shè)計(jì)將底層的操作系統(tǒng)和服務(wù)器完全屏蔽掉,同時(shí)將各種基礎(chǔ)設(shè)施平臺(tái)細(xì)節(jié)進(jìn)行隱藏,對(duì)上提供面向應(yīng)用的環(huán)境,提供一鍵式的無感的運(yùn)行環(huán)境支持 1.2 中間件中間件泛指的就是各種基礎(chǔ)服務(wù),比如mysql、redis、mq、kafka、hbase等等,還包括公司自研的各種基礎(chǔ)服務(wù),通過這些服務(wù)應(yīng)用研發(fā)可以更關(guān)注業(yè)務(wù)代碼編寫本身,而不需要對(duì)底層的各種依賴進(jìn)行相應(yīng)的調(diào)研測(cè)試,只需要使用PAAS平臺(tái)提供的功能即可中間件的接入在很多人感覺來看就是crud的操作,其實(shí)這只是面向用戶使用層的方式,用戶通過購買或者工單來完成對(duì)應(yīng)基礎(chǔ)設(shè)施的訴求。PAAS里面的中間件個(gè)人理解還有兩層含義,1)穩(wěn)定性:中間件通常都會(huì)有著極高的可用性,對(duì)中間件的接入,運(yùn)維要關(guān)注其相應(yīng)的規(guī)范并將其服務(wù)化,同時(shí)觀測(cè)其穩(wěn)定性,畢竟運(yùn)維的核心工作之一就是穩(wěn)定性;2)IAC, 通過基礎(chǔ)設(shè)施即代碼的設(shè)計(jì),將應(yīng)用相關(guān)聯(lián)的服務(wù)組件配置進(jìn)行統(tǒng)一管理,后續(xù)如果要做遷移或者多環(huán)境部署,則就只需要重新拷貝一份即可 接下來我們聊另外的一個(gè)跟運(yùn)維相關(guān)的東西-Devops 2. DevOps中的全鏈路與數(shù)據(jù)Devops也是現(xiàn)在做運(yùn)維大家老生常談的一個(gè)東西了,我一直比較喜歡一個(gè)老師的觀點(diǎn),Devops本質(zhì)上其實(shí)就做三件事:1.解耦 2.研發(fā)效能提升3.管理,不過我們今天只聊兩個(gè):全鏈路與數(shù)據(jù)流動(dòng) 2.1 全鏈路(圖片取自網(wǎng)上,非本人原創(chuàng))Devops是一個(gè)很大的概念, 在大多數(shù)的devops產(chǎn)品和系統(tǒng)里面,都強(qiáng)調(diào)端到端、數(shù)據(jù)化、持續(xù)度量運(yùn)營的概念,首先是端到端,從需求提出開始,到設(shè)計(jì)、編碼、持續(xù)集成、持續(xù)交付、持續(xù)部署、持續(xù)運(yùn)營等全流程, 基本上也就涵蓋了運(yùn)維和研發(fā)的全流程 2.2 數(shù)據(jù)流動(dòng)數(shù)據(jù)流動(dòng)是Devops從工具到平臺(tái)的一個(gè)重要的衡量指標(biāo),根據(jù)階段我將Devops流程里面數(shù)據(jù)流動(dòng)分為了兩個(gè)階段:解耦與提升效能階段、管理階段。1)解耦與提升效能階段:這個(gè)階段主要是指的研發(fā)從接收到需求到持續(xù)集成、持續(xù)交付、持續(xù)部署三個(gè)核心階段,該階段數(shù)據(jù)流動(dòng)的主要價(jià)值是提升效率、保證穩(wěn)定性,同時(shí)最大程度進(jìn)行工程解耦2)管理階段:管理又可以細(xì)分為兩個(gè)小階段:運(yùn)營管理與需求管理,運(yùn)營管理是主要保證成本,即確保應(yīng)用的資源利用率在一個(gè)合理的范圍內(nèi),需求管理則是根據(jù)運(yùn)營數(shù)據(jù)來進(jìn)行需求迭代是否合理,從而避免因?yàn)镈evops帶來的研發(fā)效能提升的浪費(fèi) 3. 私有Paas平臺(tái)的思考平臺(tái)目前只完成了基礎(chǔ)的功能設(shè)計(jì), 3.1 應(yīng)用PAAS在進(jìn)行第一版Paas設(shè)計(jì)的時(shí)候,其實(shí)并沒有想設(shè)計(jì)成后來的樣子,更多的只是想做一個(gè)應(yīng)用管理PAAS, 結(jié)合上面的Devops思想,去構(gòu)建公司的CICD流水線,實(shí)現(xiàn)研發(fā)從應(yīng)用創(chuàng)建、環(huán)境部署、資源申請(qǐng)、中間件申請(qǐng)、持續(xù)集成、持續(xù)交付、持續(xù)部署的Devops的半個(gè)流程,然后通過oam進(jìn)行應(yīng)用元數(shù)據(jù)的管理姑且這個(gè)版本就叫做APAAS, 其實(shí)整個(gè)建設(shè)部分只做了Devops部分鏈路的打通但是并沒有做對(duì)應(yīng)的數(shù)據(jù)流動(dòng),不過同時(shí)也做到了應(yīng)用元數(shù)據(jù)管理、基礎(chǔ)服務(wù)的服務(wù)化,我相信很多基于k8s做這件事情的人,都覺得這事應(yīng)該并不是太難,筆者在此處思考時(shí)間3周+ 3.2 仿品思考現(xiàn)在的很多運(yùn)維產(chǎn)品都很成熟,比如像藍(lán)鯨、優(yōu)維這兩款產(chǎn)品一直陪伴著我做運(yùn)維開發(fā)的日子,不過我一直都明白一件事這兩個(gè)產(chǎn)品就只能拿過來用借鑒里面的思想,但是如果是要仿一個(gè),老大鐵定會(huì)先開掉我。 而且這兩款產(chǎn)品其實(shí)已經(jīng)是Saas了,根據(jù)公司的現(xiàn)狀已經(jīng)有了部分系統(tǒng),雖然沒有商業(yè)產(chǎn)品的成熟,但是如果想引進(jìn)一個(gè)外部的商業(yè)產(chǎn)品,則會(huì)直接顛覆現(xiàn)狀的運(yùn)維體系和生態(tài),我也一定會(huì)被開掉。這兩款產(chǎn)品的思考過程中其實(shí)讓我想明白一件事就是我一定要先交付一個(gè)可用的Saas,在兼容現(xiàn)有運(yùn)維體系下面,交付一個(gè)更上層的可用,而這個(gè)應(yīng)用要能完成我上面提到的Paas與Devops的關(guān)鍵點(diǎn):1)運(yùn)行時(shí):結(jié)合公司IAAS和容器平臺(tái),提供面向應(yīng)用的運(yùn)行時(shí)托管服務(wù)2) 全鏈路: 實(shí)現(xiàn)研發(fā)從應(yīng)用創(chuàng)建、環(huán)境部署、資源申請(qǐng)、中間件申請(qǐng)、持續(xù)集成、持續(xù)交付、持續(xù)部署的Devops的半個(gè)流程 3.3 思考誤區(qū)思考這件事本身是一個(gè)嘗試尋找結(jié)果的過程,思考PAAS本質(zhì)也是如此,之前一直是基于K8s的Paas來思考,可是慢慢發(fā)現(xiàn)這是一個(gè)極大的誤區(qū),K8s抹掉了太多在Paas平臺(tái)的東西(k8s底層設(shè)計(jì)),在這個(gè)基礎(chǔ)上如果再去思考PAAS其實(shí)就好比井底之蛙,其實(shí)看到的只是上層基于k8s的應(yīng)用,而不是PAAS平臺(tái)本身,我舉個(gè)例子,如果我們把K8s定位成一個(gè)Paas基座(其實(shí)也有Saas功能),那我們所有的ci、cd、Deployment、日志、監(jiān)控等等其實(shí)都可以理解為其上的一個(gè)應(yīng)用,我們將這些應(yīng)用進(jìn)行整合,構(gòu)建我們的應(yīng)用托管環(huán)境,那Paas平臺(tái)提供的彈性、按需使用、故障自愈等基礎(chǔ)功能,你還知道嘛? 3.4 平臺(tái)應(yīng)用在藍(lán)鯨里面用戶可以基于平臺(tái)完成上層Saas應(yīng)用的開發(fā),同時(shí)托管到藍(lán)鯨,藍(lán)鯨提供Paas的能力,而在優(yōu)維里面也有對(duì)標(biāo)的微應(yīng)用,從這個(gè)角度來看其實(shí)我們所有的運(yùn)維操作都可以分為平臺(tái)和應(yīng)用兩部分應(yīng)用在運(yùn)維PAAS平臺(tái)里面主要是完成某個(gè)業(yè)務(wù)功能的具體的服務(wù),應(yīng)用可以利用平臺(tái)提供的基礎(chǔ)服務(wù)和平臺(tái)服務(wù)構(gòu)建上層完成某個(gè)具體場(chǎng)景功能的構(gòu)建平臺(tái)在我理解可以分為兩層含義:1)Paas平臺(tái)即提供對(duì)應(yīng)的應(yīng)用托管和基礎(chǔ)服務(wù) 2)對(duì)底層基礎(chǔ)服務(wù)的封裝整合到當(dāng)前平臺(tái)中 3.5 數(shù)據(jù)流動(dòng)在進(jìn)行服務(wù)整合集中化存儲(chǔ)的時(shí)候,很大的一個(gè)問題就是數(shù)據(jù)一致性問題,因?yàn)闀?huì)涉及到多個(gè)系統(tǒng)多份數(shù)據(jù),那如何解決這個(gè)問題呢?借住分布式的思想,這個(gè)問題其實(shí)很好解決,就找個(gè)集中存儲(chǔ)哇,就跟你用zk/etcd進(jìn)行分布式協(xié)調(diào)一樣,然后將私有的狀態(tài)數(shù)據(jù)由各個(gè)服務(wù)自己進(jìn)行存儲(chǔ) 3.6 初版Paas在Paas設(shè)計(jì)的時(shí)候我并沒有按照組件來劃分,而是根據(jù)場(chǎng)景結(jié)合上面提到的平臺(tái)應(yīng)用的概念進(jìn)行設(shè)計(jì)的,首先我將整個(gè)系統(tǒng)建設(shè)分為三個(gè)服務(wù)體系:Devops服務(wù)、運(yùn)維服務(wù)、基礎(chǔ)服務(wù); Devops服務(wù):就是我們上面提到的第一個(gè)版本應(yīng)用PAAS,同時(shí)我們也只做這一部分,只有當(dāng)這部分達(dá)到穩(wěn)態(tài)的時(shí)候,才會(huì)進(jìn)行后續(xù)部分建設(shè); 基礎(chǔ)服務(wù):建設(shè)是提供Paas偏Saas的相關(guān)功能,即提供數(shù)據(jù)相關(guān)的功能,這樣后續(xù)就只需要進(jìn)行應(yīng)用開發(fā)即可,平臺(tái)提供基礎(chǔ)的數(shù)據(jù)能力 運(yùn)維服務(wù):將運(yùn)維能力服務(wù)化,同時(shí)對(duì)外提供平臺(tái)層和應(yīng)用層的功能,主要是為了滿足公司運(yùn)維的各種日常操作和運(yùn)維場(chǎng)景,通過標(biāo)準(zhǔn)化運(yùn)維將各種操作進(jìn)行統(tǒng)一標(biāo)準(zhǔn),減少誤操的概率,同時(shí)將運(yùn)維專家經(jīng)驗(yàn)進(jìn)行落地,并提供數(shù)據(jù)分析的功能,為運(yùn)維數(shù)字化轉(zhuǎn)型提供基礎(chǔ)的數(shù)據(jù) 在現(xiàn)在的設(shè)計(jì)中打亂了正常的Devops平臺(tái)的建設(shè),進(jìn)行一些細(xì)粒度的拆分,希望能夠讓老板們短時(shí)間看到對(duì)應(yīng)的產(chǎn)出,看到運(yùn)維數(shù)據(jù)化帶來的收益,希望未來能有效果,同時(shí)將對(duì)應(yīng)的規(guī)范和標(biāo)準(zhǔn)化落地到新的流程和系統(tǒng)中,將運(yùn)維的經(jīng)驗(yàn)進(jìn)行平臺(tái)化產(chǎn)出,推動(dòng)公司的運(yùn)維數(shù)字化轉(zhuǎn)型 4. 未完待續(xù)運(yùn)維數(shù)字化轉(zhuǎn)型最大的問題就是思維的轉(zhuǎn)變,很多運(yùn)維平臺(tái)建設(shè)都是煙囪式的,修修補(bǔ)補(bǔ)。數(shù)字化建設(shè)除了要解決這些眼前的問題還要思考未來,就像Devops中的不確定性與確定性一樣,為什么要快速交付,因?yàn)椴淮_定是否是市場(chǎng)要的,為什么要提高確定性,因?yàn)橐M可能保證安全、穩(wěn)定的產(chǎn)品,Paas平臺(tái)建設(shè)本質(zhì)也是這樣,快速向領(lǐng)導(dǎo)交付可用產(chǎn)品確定是不是領(lǐng)導(dǎo)要的產(chǎn)品 運(yùn)維數(shù)字化的結(jié)果是共贏,運(yùn)維開發(fā)團(tuán)隊(duì)提供基礎(chǔ)的平臺(tái)功能,運(yùn)維將自己的運(yùn)維經(jīng)驗(yàn)進(jìn)行場(chǎng)景化應(yīng)用落地,這樣就會(huì)有更多的數(shù)據(jù),更多的場(chǎng)景應(yīng)用,然后結(jié)合行業(yè)運(yùn)維經(jīng)驗(yàn),就可以構(gòu)建獨(dú)一無二的行業(yè)數(shù)字化平臺(tái),通過行業(yè)場(chǎng)景+數(shù)據(jù),才是私有Paas平臺(tái)真正的競爭力,所以在運(yùn)維PAAS平臺(tái)建設(shè)中,運(yùn)維可能才是最重要的推動(dòng)者,而不是研發(fā) 平臺(tái)建設(shè)的思考就先寫這一篇,后面還是會(huì)繼續(xù)分享一些云原生系統(tǒng)設(shè)計(jì)方面的東西,好好在思考下一些技術(shù)設(shè)計(jì)的實(shí)現(xiàn)與設(shè)計(jì),畢竟一切設(shè)計(jì)都得落地 |
|