Python作為一門(mén)優(yōu)秀的編程語(yǔ)言,近年來(lái)受到很多編程愛(ài)好者的青睞。 一是因?yàn)镻ython本身具有簡(jiǎn)捷優(yōu)美、易學(xué)易用的特點(diǎn);二是由于互聯(lián)網(wǎng)的飛速發(fā)展,我們正迎來(lái)大數(shù)據(jù)的時(shí)代,而Python無(wú)論是在數(shù)據(jù)的采集與處理方面,還是在數(shù)據(jù)分析與可視化方面都有獨(dú)特的優(yōu)勢(shì)。我們可以利用Python便捷地開(kāi)展與數(shù)據(jù)相關(guān)的項(xiàng)目,以很低的學(xué)習(xí)成本快速完成項(xiàng)目的研究。 Python被大量應(yīng)用在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域,其中使用極其廣泛的是IPython、Numpy、pandas、Matplotlib等庫(kù)。對(duì)于希望使用Python來(lái)完成數(shù)據(jù)分析工作的人來(lái)說(shuō),學(xué)習(xí)IPython、Numpy、pandas、Matplotlib這個(gè)組合是目前看來(lái)不錯(cuò)的方向。
(圖源:ipython.org) IPython是Python的加強(qiáng)型交互式解釋器。 IPython是使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的重要選擇之一。它是一個(gè)與Python科學(xué)計(jì)算包(主要包括Numpy、pandas、Matplotlib等)緊密聯(lián)系的交互式開(kāi)發(fā)環(huán)境,它同時(shí)也是Python科學(xué)計(jì)算包的一部分。 主要特點(diǎn)包括:
IPython加上一個(gè)文本編輯器是科學(xué)計(jì)算者使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的最佳選擇之一。 IPython主要包括:
IPyton殼 2017年最新發(fā)布的IPython殼以及內(nèi)核具有以下這些重要的特性:
(圖源:numpy.org) Numpy是Python科學(xué)計(jì)算庫(kù)的基礎(chǔ)。 主要包括:
Numpy提供了一個(gè)簡(jiǎn)潔的C語(yǔ)言接口,可以非常方便地使用C語(yǔ)言編寫(xiě)的代碼操作Numpy數(shù)組對(duì)象,反過(guò)來(lái)使用C語(yǔ)言生成的數(shù)組也可以輕松的轉(zhuǎn)化成Numpy數(shù)組對(duì)象;這一特性使得Python輕松地與其他編程語(yǔ)言C/C 粘結(jié)在一起。Numpy除了用作科學(xué)計(jì)算,也可以用作多維度普通數(shù)據(jù)的容器;并且可以定義任何類型的數(shù)據(jù),使得Numpy高效、無(wú)縫地與各種類型的數(shù)據(jù)分析庫(kù)連接起來(lái)。 Numpy的主要對(duì)象是一個(gè)多維度的、均勻的多維數(shù)組。Numpy提供了各種函數(shù)方法可以非常方便靈活的操作數(shù)組,熟練掌握數(shù)組的基本概念是使用數(shù)組這種數(shù)據(jù)結(jié)構(gòu)的基本要求。
(圖源:pandas.pydata.org) pandas是建立在Numpy基礎(chǔ)上的高效數(shù)據(jù)分析處理庫(kù),是Python的重要數(shù)據(jù)分析庫(kù)。 pandas提供了眾多的高級(jí)函數(shù),極大地簡(jiǎn)化了數(shù)據(jù)處理的流程,尤其是被廣泛地應(yīng)用于金融領(lǐng)域的數(shù)據(jù)分析。 pandas主要包括:
(圖源:matplotlib.org) Matplotlib是一個(gè)主要用于繪制二維圖形的Python庫(kù)。 數(shù)據(jù)可視化是數(shù)據(jù)分析的重要環(huán)節(jié),借助圖形能夠幫助更加直觀地表達(dá)出數(shù)據(jù)背后的”東西”。 Matplolib最初主要模仿Matlab的畫(huà)圖命令,但是它是獨(dú)立于Matlab的,可以自由、免費(fèi)使用的繪圖包。Matplotlib依賴于之前介紹的Numpy庫(kù)來(lái)提供出色的繪圖能力。Matplotlib項(xiàng)目是John Hunter在2002年發(fā)起的,目標(biāo)是建立一個(gè)具備以下特點(diǎn)的Python繪圖工具包:
經(jīng)過(guò)社區(qū)多年以來(lái)的努力,Matplotlib已經(jīng)具備了上面列出的所有特點(diǎn)。現(xiàn)在Matplotlib被廣泛地應(yīng)用于各種生產(chǎn)、科學(xué)研究等環(huán)境中,比如在網(wǎng)絡(luò)服務(wù)中動(dòng)態(tài)生成圖形、在IPython殼下交互使用Matplotlib繪圖等。 Matplotlib從概念上可以分為三層: matplotlib.pylab,這一層給主要給用戶提供一些簡(jiǎn)單的命令來(lái)生成圖形,語(yǔ)法風(fēng)格和Matlab非常接近。Matplotlib的API,這一層主要給用戶提供了直接創(chuàng)建圖形、線條、文本等的功能。這是一個(gè)抽象層,它并不關(guān)心圖形的輸出。最后一層是后端,主要是管理圖形的輸出等其他一些功能。 如果你已經(jīng)決定學(xué)習(xí)Python數(shù)據(jù)分析,但是之前沒(méi)有編程經(jīng)驗(yàn),那《Python數(shù)據(jù)分析從入門(mén)到精通》你絕不能錯(cuò)過(guò)。Python數(shù)據(jù)分析“四劍客”在本書(shū)上會(huì)進(jìn)行詳細(xì)深入的介紹。 本書(shū)詳細(xì)地介紹了IPython、Numpy、pandas、Matplotlib庫(kù)的組成與使用,為科學(xué)計(jì)算相關(guān)人員提供了有用的參考資料。采取循序漸進(jìn)的寫(xiě)作風(fēng)格,對(duì)于工具的安裝、使用步驟、方法技巧逐步展開(kāi),加以圖解和應(yīng)用場(chǎng)景,即使完全不懂Python和數(shù)據(jù)分析的人員,也可以流暢地讀完本書(shū)。 無(wú)論哪種語(yǔ)言,編程的方法、模式、數(shù)據(jù)結(jié)構(gòu)、算法都是相通的。本書(shū)將科學(xué)計(jì)算、數(shù)據(jù)結(jié)構(gòu)與各種工具和方法完美結(jié)合,讓非Python讀者也能融會(huì)貫通,讓學(xué)習(xí)統(tǒng)計(jì)的人能找到更適合的統(tǒng)計(jì)方法和數(shù)據(jù)分析處理方法。 本書(shū)最后的兩個(gè)實(shí)戰(zhàn)案例適合數(shù)據(jù)分析入門(mén)者,案例的步驟詳細(xì)、分析到位,能為讀者入手真實(shí)項(xiàng)目打下良好的基礎(chǔ)。 進(jìn)入小程序參與抽獎(jiǎng),3月22日自動(dòng)開(kāi)獎(jiǎng)。 本書(shū)目錄結(jié)構(gòu) 第1篇 Python數(shù)據(jù)分析語(yǔ)法入門(mén) 第1章 初識(shí)Python 1
第2章 Python起步必備 27
第3章 Python的數(shù)據(jù)類型與流程控制語(yǔ)句 41
第4章 可復(fù)用的函數(shù)與模塊 64
第5章 數(shù)據(jù)結(jié)構(gòu)與算法 82
第6章 面向?qū)ο蟮腜ython 101
第7章 異常處理與程序調(diào)試 120
第8章 pip軟件包管理 137
第2篇 Python數(shù)據(jù)分析工具入門(mén) 第9章 IPython科學(xué)計(jì)算庫(kù) 142
第10章 Numpy科學(xué)計(jì)算庫(kù) 174
第11章 pandas數(shù)據(jù)分析處理庫(kù) 216
第12章 Matplotlib數(shù)據(jù)可視化 260
第3篇 Python數(shù)據(jù)分析案例實(shí)戰(zhàn) 第13章 案例1:數(shù)據(jù)挖掘 288
第14章 案例2:玩轉(zhuǎn)大數(shù)據(jù) 305
博文視點(diǎn)您閱讀的專業(yè)智庫(kù) 喜歡請(qǐng)分享至朋友圈 |
|
來(lái)自: CHOK2620 > 《python數(shù)據(jù)分析》