能制作可視化報(bào)告的方式有千千萬(wàn)。 Excel控若能輕車熟路駕馭VBA,能玩出各種花來(lái),再不濟(jì)借助圖表插件外援也能秒殺一眾小白選手。 會(huì)編程的,Echarts幾十行代碼,分分鐘出秀;R語(yǔ)言玩得一手?jǐn)?shù)據(jù)挖掘,可視化自不在話下;Python爬數(shù)據(jù)達(dá)人,手握matplotlib包打天下。 這么多工具,從哪個(gè)入手較好?這也是很多人犯難的。 其實(shí),數(shù)據(jù)分析大家大可不必垂涎于工具。對(duì)于絕大多數(shù)的我們,需求在于從萬(wàn)千數(shù)據(jù)中統(tǒng)計(jì)出一些規(guī)律,或者某些業(yè)務(wù)問(wèn)題想通過(guò)分析數(shù)據(jù)的方法得到求證。 分析工具更多的價(jià)值在于輔助分析過(guò)程中數(shù)據(jù)的處理,能夠?qū)⒔Y(jié)論以可視化的方式直觀展,最終解決問(wèn)題。如果在功能上能做到避免寫(xiě)公式寫(xiě)代碼,易上手易用,那就更好了 筆者一直主張用BI分析,于數(shù)據(jù)分析師,節(jié)省時(shí)間提高效率。于入門,BI也是最簡(jiǎn)單最好上手的可視化分析工具。 之前分享了《這可能是今年最值得推薦的數(shù)據(jù)分析工具》,講解了FineBI的主要功能、特點(diǎn)和基本使用方法。 今天想著重于數(shù)據(jù)分析的過(guò)程,使用FineBI來(lái)打造數(shù)據(jù)分析師的Dashboard報(bào)表。 為了更好的幫助大家嘗試和實(shí)踐,文尾公開(kāi)了數(shù)據(jù)源及報(bào)告展現(xiàn)地址,供大家學(xué)習(xí)和練習(xí)。 一、數(shù)據(jù)分析的操作思路數(shù)據(jù)分析通常是這樣切入的,比方說(shuō)業(yè)務(wù)上發(fā)生了變化,流量下降20%,那么我們就要分析可能的原因,需要多方數(shù)據(jù)去驗(yàn)證假設(shè)。又或者拿到一份數(shù)據(jù),思考可以分析的規(guī)律點(diǎn)。無(wú)論哪種情況,一個(gè)完整的數(shù)據(jù)分析都需要經(jīng)歷數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與建模、可視化分析及報(bào)告撰寫(xiě)的過(guò)程。 FineBI的功能模塊也是依據(jù)這樣的分析流程來(lái)分的,分為數(shù)據(jù)連接、數(shù)據(jù)準(zhǔn)備、可視化分析、儀表板駕駛艙、分享儀表板等。 二、認(rèn)識(shí)這個(gè)工具——FineBI的工作區(qū)官網(wǎng)安裝好合適的版本,成功激活,設(shè)置初始賬號(hào)密碼后,會(huì)跳轉(zhuǎn)到這個(gè)web頁(yè)面。 左側(cè)是導(dǎo)航欄,類似于菜單欄。目錄類似首頁(yè),展現(xiàn)已完成的分析報(bào)告,這里默認(rèn)展現(xiàn)官方的內(nèi)置demo。 數(shù)據(jù)準(zhǔn)備是連接數(shù)據(jù)、準(zhǔn)備數(shù)據(jù),以及對(duì)數(shù)據(jù)進(jìn)行再加工處理的地方,可進(jìn)行業(yè)務(wù)包、數(shù)據(jù)表、關(guān)聯(lián)、多路徑、數(shù)據(jù)更新、自助數(shù)據(jù)集等管理。 儀表板即創(chuàng)建可視化分析。管理系統(tǒng)即對(duì)整個(gè)數(shù)據(jù)決策系統(tǒng)進(jìn)行管理的地方,包括目錄的設(shè)置、外觀設(shè)置、數(shù)據(jù)、報(bào)表、分享權(quán)限等管理配置。 創(chuàng)建是提供給用戶快捷新建數(shù)據(jù)連接、添加數(shù)據(jù)庫(kù)表、添加SQL數(shù)據(jù)集、添加EXCEL數(shù)據(jù)集、添加自助數(shù)據(jù)集、新建儀表板的地方。 三、連接/導(dǎo)入數(shù)據(jù)制作數(shù)據(jù)報(bào)告,第一步是導(dǎo)入數(shù)據(jù),F(xiàn)ineBI能從很多種數(shù)據(jù)源導(dǎo)入數(shù)據(jù):如Excel,CSV,XML,以及各類數(shù)據(jù)庫(kù)(SQL Server,Oracle,My SQL等),兩大主流開(kāi)源平臺(tái)(Hadoop,Spark)等等。最常用的方式是連接數(shù)據(jù)庫(kù)和導(dǎo)入excel數(shù)據(jù)。兩種方式因?yàn)樽畛S?,所以這里都演示操作一遍。 1、數(shù)據(jù)庫(kù)連接舉例:連接mysql 2、導(dǎo)入excel數(shù)據(jù) 同樣的數(shù)據(jù),用一份excel導(dǎo)入。 第一步:數(shù)據(jù)準(zhǔn)備—添加業(yè)務(wù)包,業(yè)務(wù)包是用來(lái)統(tǒng)一整理數(shù)據(jù)表的。這里創(chuàng)建一個(gè)臺(tái)風(fēng)數(shù)據(jù)包。點(diǎn)擊添加表,新建excel數(shù)據(jù)集。 就得到如下的數(shù)據(jù)明細(xì)。這里可以自動(dòng)識(shí)別數(shù)據(jù)的字段類型,也可以修改字段類型。(舉例:有些情況下將時(shí)間識(shí)別成文本類型,需要手動(dòng)切換成時(shí)間類型,不然會(huì)影響后續(xù)操作) 至此,數(shù)據(jù)就導(dǎo)入成功。 四、數(shù)據(jù)塑性—自助數(shù)據(jù)集自助數(shù)據(jù)集其實(shí)是數(shù)據(jù)加工的環(huán)節(jié)。一般我們拿到的數(shù)據(jù)往往是有空缺值有重復(fù),所謂臟數(shù)據(jù),臟數(shù)據(jù)需要清理,關(guān)于數(shù)據(jù)清洗的處理可以寫(xiě)5000字篇,這里就不多講了。更常見(jiàn)的情況是分析中需要新建一些字段,這是源數(shù)據(jù)所沒(méi)有的。這時(shí)候就可以根據(jù)需求對(duì)原數(shù)據(jù)進(jìn)行再加工處理,新建一個(gè)用于分析的數(shù)據(jù)集。再處理的操作包括:選擇字段、過(guò)濾、分組匯總、新增列、字段設(shè)置、排序、左右合并、上下合并、挖掘。 這里因?yàn)榉治龅谋容^簡(jiǎn)單,且原始數(shù)據(jù)已經(jīng)很規(guī)范,所以暫時(shí)還不需要對(duì)源數(shù)據(jù)表進(jìn)行這些操作,且一些過(guò)濾操作可以放到后面創(chuàng)建分析圖表的過(guò)程中去做。 其實(shí),在自助數(shù)據(jù)集之前,有個(gè)功能沒(méi)講到。FineBI有個(gè)管理員的說(shuō)法,這在企業(yè)部署中會(huì)涉及。管理員可以給不用人分配不同權(quán)限下的數(shù)據(jù),比如財(cái)務(wù)的只能看財(cái)務(wù)和銷售的數(shù)據(jù),或者一部分財(cái)務(wù)人員只能看到特定的業(yè)務(wù)包里的數(shù)據(jù),或者部分?jǐn)?shù)據(jù)表,這些都是出于數(shù)據(jù)安全以及流程管理考慮。在管理員準(zhǔn)備好數(shù)據(jù)后,就可以分配給不同人員賬號(hào),以及部分權(quán)限的數(shù)據(jù)。如果是個(gè)人使用,比如本文所要介紹的分析,BI系統(tǒng)是部署在自己本地的,那自己就是管理員,擁有最高權(quán)限。本文的分析暫時(shí)不需要用到權(quán)限功能,這里只做簡(jiǎn)單介紹。 五、可視化分析到這里數(shù)據(jù)準(zhǔn)備好了,接下來(lái)開(kāi)始正式分析。 先來(lái)觀察這份數(shù)據(jù),這份數(shù)據(jù)是我從網(wǎng)上當(dāng)下來(lái)的,展示了1945年——2015年登陸我國(guó)的臺(tái)風(fēng)信息,包括時(shí)間、登陸省市以及臺(tái)風(fēng)強(qiáng)度。 那么我們可以匯總統(tǒng)計(jì)下歷年來(lái)臺(tái)風(fēng)最常光顧的省份和城市有哪些,一年中哪個(gè)時(shí)間段是臺(tái)風(fēng)頻發(fā)日,以及臺(tái)風(fēng)強(qiáng)度分布。 1、 新建儀表板,即我們說(shuō)的可視化報(bào)告、dashboard,叫法很多。 2、 新建可視化組件,添加剛剛導(dǎo)入的數(shù)據(jù)集。(圖表、查詢篩選框等都叫組件,是finebi儀表板的組成元素。) 分析1:各年度登陸我國(guó)的臺(tái)風(fēng)數(shù)量 添加完數(shù)據(jù)集會(huì)進(jìn)入到這個(gè)分析界面。拖拽要分析的字段(記錄數(shù)—統(tǒng)計(jì)臺(tái)風(fēng)數(shù)量的指標(biāo),登陸時(shí)間——這里只展示年份這個(gè)維度) 這里要注意,源數(shù)據(jù)表中一個(gè)臺(tái)風(fēng)有多行記錄,那是因?yàn)榕_(tái)風(fēng)可能同時(shí)登陸兩個(gè)區(qū)域,記錄了兩條信息,所以記錄數(shù)要依賴CMA編號(hào)統(tǒng)計(jì)(記錄數(shù)右側(cè)小三角下拉),以免重復(fù)。 其次,這里又添加了一個(gè)統(tǒng)計(jì)每年臺(tái)風(fēng)平均數(shù)的指標(biāo)。 最后再對(duì)次圖表稍加美化,通常在圖形屬性和組件樣式中: ① 修改線條顏色:圖形屬性—顏色 ② 修改連線為平滑曲線,并且可調(diào)整有無(wú)標(biāo)記點(diǎn) ③ 修改該組件標(biāo)題:組件樣式—標(biāo)題,可調(diào)整字體樣式 最終得到如下成圖: 能明顯感覺(jué)到登陸我國(guó)的臺(tái)風(fēng)呈現(xiàn)一個(gè)2~4年的波動(dòng)變化,且2000年以來(lái),直擊我國(guó)的臺(tái)風(fēng)整體數(shù)量有略微下降。 分析2:臺(tái)風(fēng)登陸各省沿海城市分布—數(shù)據(jù)地圖 這里演示一下數(shù)據(jù)地圖的制作,用地圖直觀展現(xiàn)臺(tái)風(fēng)登陸我國(guó)沿海各省市的分布。 必須將維度創(chuàng)建成地圖角色,生成經(jīng)緯度。 匹配好數(shù)據(jù)后生成省份(經(jīng)度)、省份(緯度)字段。這里要注意檢查一些匹配是否正確,我就遇到把遼寧省匹配成寧夏的bug,匹配有問(wèn)題可以隨時(shí)調(diào)整。 然后將字段分別拖至橫軸和縱軸,會(huì)自動(dòng)生成一個(gè)填充地圖。除此之外還有點(diǎn)地圖、熱力地圖等,這里就用填充地圖舉例。 填充地圖顧名思義,就是用區(qū)域的顏色區(qū)分?jǐn)?shù)值大小。這里將記錄數(shù)拖拽到圖形屬性-顏色,即可看到區(qū)分,(顏色可在下拉框中自行選取)。再將記錄數(shù)拖拽到標(biāo)簽,即可顯示登陸該省市的臺(tái)風(fēng)數(shù)量。 在組件樣式——背景中,可以修改GIS地圖樣式,如下: 注:關(guān)于圖表組件的樣式,比如標(biāo)題名(字體大小顏色)、軸線、配色,圖表布局等都可在圖形屬性和組件樣式中選擇。選項(xiàng)非常多,請(qǐng)讀者們自行發(fā)揮自己的美學(xué)天賦吧!關(guān)于數(shù)值的計(jì)算、過(guò)濾排序等操作,都可在橫軸、縱軸的指標(biāo)維度下拉框中找到。 六、可視化報(bào)告其他分析大同小異,篇幅有限,以上只舉了兩個(gè)例子。 圖表分析組件完成之后,就是構(gòu)建可視化報(bào)告(dashboard)了。 儀表盤(pán)樣式中有預(yù)設(shè)的模板可以直接套用,以下是筆者隨便套用的一個(gè)模板,更具模板的風(fēng)格,后面調(diào)整了每個(gè)圖表的樣式和配色。好不好看全看個(gè)人審美了。 小結(jié)總的來(lái)說(shuō),使用FineBI制作可視化報(bào)表,最關(guān)鍵的還是在于數(shù)據(jù)處理,數(shù)據(jù)處理好了,報(bào)表繪制起來(lái)才能得心應(yīng)手。由于數(shù)據(jù)之前在excel里已經(jīng)做了一些處理,所以拿到的數(shù)據(jù)基本可以直接上手分析。 在充分掌握了數(shù)據(jù)處理技巧后,就可以將更多精力放在各種各樣的可視化圖形上。FineBI內(nèi)置了很多配色及風(fēng)格,接下來(lái)大家可以盡情發(fā)揮自己的想象力制作各種酷炫的可視化報(bào)表,盡量搞清楚可視化制作中所有內(nèi)置圖形的繪制方法,以及樣式調(diào)整。 最后,附學(xué)習(xí)資料 1、Mysql數(shù)據(jù)源
2、Excel資料可私心回復(fù)“可視化報(bào)告”獲得! |
|