小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

【數(shù)據(jù)分析丨主題周】Python數(shù)據(jù)分析四劍客:IPython、Numpy、pandas、Matpl...

 CHOK2620 2018-03-21

Python作為一門(mén)優(yōu)秀的編程語(yǔ)言,近年來(lái)受到很多編程愛(ài)好者的青睞。

一是因?yàn)镻ython本身具有簡(jiǎn)捷優(yōu)美、易學(xué)易用的特點(diǎn);二是由于互聯(lián)網(wǎng)的飛速發(fā)展,我們正迎來(lái)大數(shù)據(jù)的時(shí)代,而Python無(wú)論是在數(shù)據(jù)的采集與處理方面,還是在數(shù)據(jù)分析與可視化方面都有獨(dú)特的優(yōu)勢(shì)。我們可以利用Python便捷地開(kāi)展與數(shù)據(jù)相關(guān)的項(xiàng)目,以很低的學(xué)習(xí)成本快速完成項(xiàng)目的研究。

Python被大量應(yīng)用在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域,其中使用極其廣泛的是IPython、Numpy、pandas、Matplotlib等庫(kù)。對(duì)于希望使用Python來(lái)完成數(shù)據(jù)分析工作的人來(lái)說(shuō),學(xué)習(xí)IPython、Numpy、pandas、Matplotlib這個(gè)組合是目前看來(lái)不錯(cuò)的方向。

  • IPython

(圖源:ipython.org)

IPython是Python的加強(qiáng)型交互式解釋器。

IPython是使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的重要選擇之一。它是一個(gè)與Python科學(xué)計(jì)算包(主要包括Numpy、pandas、Matplotlib等)緊密聯(lián)系的交互式開(kāi)發(fā)環(huán)境,它同時(shí)也是Python科學(xué)計(jì)算包的一部分。

主要特點(diǎn)包括:

  • 提供給用戶一個(gè)強(qiáng)大的交互界面。

  • Jupter Notebook的內(nèi)核。

  • 高效的交互式處理、呈現(xiàn)數(shù)據(jù)(特別是與Matplotlib一起使用)。

  • 適合并行處理計(jì)算。

IPython加上一個(gè)文本編輯器是科學(xué)計(jì)算者使用Python進(jìn)行數(shù)據(jù)分析、處理、呈現(xiàn)的最佳選擇之一。

IPython主要包括:

  • 一個(gè)強(qiáng)大的、交互式的Python殼

  • Jupyter內(nèi)核,支持用戶在Jupyter Notebook以及其他終端與IPython的交互

IPyton殼

2017年最新發(fā)布的IPython殼以及內(nèi)核具有以下這些重要的特性:

  • 全面的對(duì)象檢查。

  • 記錄輸入歷史。

  • 緩存輸出結(jié)果。

  • 擴(kuò)展的<Tab>代碼補(bǔ)全功能,可以補(bǔ)全變量、關(guān)鍵字、文件名、函數(shù)名等。

  • 對(duì)系統(tǒng)“魔法”方法的擴(kuò)展,可以處理與操作系統(tǒng)相關(guān)的任務(wù)。

  • 豐富的配置系統(tǒng)支持不同狀態(tài)的切換。

  • 歷史信息登錄與重載。

  • 支持不同語(yǔ)法。

  • 輕松嵌入到其他Python程序中。

  • 對(duì)pdb調(diào)試器和Python測(cè)試工具的集成。

  • Numpy 

(圖源:numpy.org)

Numpy是Python科學(xué)計(jì)算庫(kù)的基礎(chǔ)。

主要包括:

  • 強(qiáng)大的N維數(shù)組對(duì)象和向量運(yùn)算

  • 一些復(fù)雜的功能

  • 與C/C 和Fortran代碼的集成

  • 實(shí)用的線形代數(shù)運(yùn)算、傅立葉變換、隨機(jī)數(shù)生產(chǎn)等

Numpy提供了一個(gè)簡(jiǎn)潔的C語(yǔ)言接口,可以非常方便地使用C語(yǔ)言編寫(xiě)的代碼操作Numpy數(shù)組對(duì)象,反過(guò)來(lái)使用C語(yǔ)言生成的數(shù)組也可以輕松的轉(zhuǎn)化成Numpy數(shù)組對(duì)象;這一特性使得Python輕松地與其他編程語(yǔ)言C/C 粘結(jié)在一起。Numpy除了用作科學(xué)計(jì)算,也可以用作多維度普通數(shù)據(jù)的容器;并且可以定義任何類型的數(shù)據(jù),使得Numpy高效、無(wú)縫地與各種類型的數(shù)據(jù)分析庫(kù)連接起來(lái)。

Numpy的主要對(duì)象是一個(gè)多維度的、均勻的多維數(shù)組。Numpy提供了各種函數(shù)方法可以非常方便靈活的操作數(shù)組,熟練掌握數(shù)組的基本概念是使用數(shù)組這種數(shù)據(jù)結(jié)構(gòu)的基本要求。

  • pandas

(圖源:pandas.pydata.org)

pandas是建立在Numpy基礎(chǔ)上的高效數(shù)據(jù)分析處理庫(kù),是Python的重要數(shù)據(jù)分析庫(kù)。

pandas提供了眾多的高級(jí)函數(shù),極大地簡(jiǎn)化了數(shù)據(jù)處理的流程,尤其是被廣泛地應(yīng)用于金融領(lǐng)域的數(shù)據(jù)分析。

pandas主要包括:

  • 帶有標(biāo)簽的數(shù)據(jù)結(jié)構(gòu),主要包括序列(Series)和數(shù)據(jù)框(DataFrame)等。

  • 允許簡(jiǎn)單索引和多級(jí)索引。

  • 整合了對(duì)數(shù)據(jù)集的集合和轉(zhuǎn)換功能。

  • 生成特定類型的數(shù)據(jù)。

  • 支持從Excel、CSV等文本格式中文導(dǎo)入數(shù)據(jù),以Pytables/HDF5格式高效地讀/寫(xiě)數(shù)據(jù)。

  • 能夠高效地處理帶有默認(rèn)值的數(shù)據(jù)集。

  • 能夠直接進(jìn)行常規(guī)的統(tǒng)計(jì)回歸分析。

  • Matplotlib

(圖源:matplotlib.org)

Matplotlib是一個(gè)主要用于繪制二維圖形的Python庫(kù)。

數(shù)據(jù)可視化是數(shù)據(jù)分析的重要環(huán)節(jié),借助圖形能夠幫助更加直觀地表達(dá)出數(shù)據(jù)背后的”東西”。

Matplolib最初主要模仿Matlab的畫(huà)圖命令,但是它是獨(dú)立于Matlab的,可以自由、免費(fèi)使用的繪圖包。Matplotlib依賴于之前介紹的Numpy庫(kù)來(lái)提供出色的繪圖能力。Matplotlib項(xiàng)目是John Hunter在2002年發(fā)起的,目標(biāo)是建立一個(gè)具備以下特點(diǎn)的Python繪圖工具包:

  • 能夠繪制出高質(zhì)量的圖形,并且圖形里面的鑲嵌的文本必需足夠美觀。

  • 能夠和Tex文檔一起輸出。

  • 能夠嵌入到GUI(圖形用戶界面)應(yīng)用程序中。

  • 代碼足夠簡(jiǎn)潔并且可擴(kuò)展性強(qiáng)。

  • 繪圖命令足夠方便。

經(jīng)過(guò)社區(qū)多年以來(lái)的努力,Matplotlib已經(jīng)具備了上面列出的所有特點(diǎn)。現(xiàn)在Matplotlib被廣泛地應(yīng)用于各種生產(chǎn)、科學(xué)研究等環(huán)境中,比如在網(wǎng)絡(luò)服務(wù)中動(dòng)態(tài)生成圖形、在IPython殼下交互使用Matplotlib繪圖等。

Matplotlib從概念上可以分為三層:

matplotlib.pylab,這一層給主要給用戶提供一些簡(jiǎn)單的命令來(lái)生成圖形,語(yǔ)法風(fēng)格和Matlab非常接近。Matplotlib的API,這一層主要給用戶提供了直接創(chuàng)建圖形、線條、文本等的功能。這是一個(gè)抽象層,它并不關(guān)心圖形的輸出。最后一層是后端,主要是管理圖形的輸出等其他一些功能。

如果你已經(jīng)決定學(xué)習(xí)Python數(shù)據(jù)分析,但是之前沒(méi)有編程經(jīng)驗(yàn),那《Python數(shù)據(jù)分析從入門(mén)到精通》你絕不能錯(cuò)過(guò)。Python數(shù)據(jù)分析“四劍客”在本書(shū)上會(huì)進(jìn)行詳細(xì)深入的介紹。

本書(shū)詳細(xì)地介紹了IPython、Numpy、pandas、Matplotlib庫(kù)的組成與使用,為科學(xué)計(jì)算相關(guān)人員提供了有用的參考資料。采取循序漸進(jìn)的寫(xiě)作風(fēng)格,對(duì)于工具的安裝、使用步驟、方法技巧逐步展開(kāi),加以圖解和應(yīng)用場(chǎng)景,即使完全不懂Python和數(shù)據(jù)分析的人員,也可以流暢地讀完本書(shū)。

無(wú)論哪種語(yǔ)言,編程的方法、模式、數(shù)據(jù)結(jié)構(gòu)、算法都是相通的。本書(shū)將科學(xué)計(jì)算、數(shù)據(jù)結(jié)構(gòu)與各種工具和方法完美結(jié)合,讓非Python讀者也能融會(huì)貫通,讓學(xué)習(xí)統(tǒng)計(jì)的人能找到更適合的統(tǒng)計(jì)方法和數(shù)據(jù)分析處理方法。

本書(shū)最后的兩個(gè)實(shí)戰(zhàn)案例適合數(shù)據(jù)分析入門(mén)者,案例的步驟詳細(xì)、分析到位,能為讀者入手真實(shí)項(xiàng)目打下良好的基礎(chǔ)。

進(jìn)入小程序參與抽獎(jiǎng),3月22日自動(dòng)開(kāi)獎(jiǎng)。


本書(shū)目錄結(jié)構(gòu)


第1篇  Python數(shù)據(jù)分析語(yǔ)法入門(mén)

第1章  初識(shí)Python  1

  • 1.1  Python是什么  2

  • 1.2  Python有什么優(yōu)點(diǎn)  3

  • 1.3  其他程序設(shè)計(jì)語(yǔ)言中的Python  5

  • 1.4  快速搭建Python開(kāi)發(fā)環(huán)境  7

  • 1.5  第一個(gè)Python程序  22

第2章  Python起步必備  27

  • 2.1  Python代碼的組織形式和注釋方式  27

  • 2.2  Python的基本輸入/輸出函數(shù)  31

  • 2.3  Python對(duì)中文的支持  33

  • 2.4  簡(jiǎn)單實(shí)用的Python計(jì)算器  37

第3章  Python的數(shù)據(jù)類型與流程控制語(yǔ)句  41

  • 3.1  Python數(shù)據(jù)類型:數(shù)字  42

  • 3.2  Python數(shù)據(jù)類型:字符串  45

  • 3.3  Python數(shù)據(jù)類型:列表和元組  52

  • 3.4  Python數(shù)據(jù)類型:字典  54

  • 3.5  Python數(shù)據(jù)類型:文件  55

  • 3.6  Python數(shù)據(jù)類型:布爾值  56

  • 3.7  Python的流程控制語(yǔ)句  56

第4章  可復(fù)用的函數(shù)與模塊  64

  • 4.1  Python自定義函數(shù)  65

  • 4.2  參數(shù)讓函數(shù)更有價(jià)值  67

  • 4.3  變量的作用域  71

  • 4.4  最簡(jiǎn)單的函數(shù):使用lambda表達(dá)式定義函數(shù)  72

  • 4.5  可重用結(jié)構(gòu):Python模塊  73

  • 4.6  用包來(lái)管理多個(gè)模塊  80

第5章  數(shù)據(jù)結(jié)構(gòu)與算法  82

  • 5.1  表、棧和隊(duì)列  82

  • 5.2  樹(shù)和圖  88

  • 5.3  查找與排序  95

第6章  面向?qū)ο蟮腜ython  101

  • 6.1  面向?qū)ο缶幊谈攀? 101

  • 6.2  在Python中定義和使用類  103

  • 6.3  類的屬性和方法  106

  • 6.4  類的繼承  111

  • 6.5  在類中重載方法和運(yùn)算符  114

  • 6.6  在模塊中定義類  117

第7章  異常處理與程序調(diào)試  120

  • 7.1  異常的處理  120

  • 7.2  用代碼引發(fā)異常  125

  • 7.3  使用pdb模塊調(diào)試Python腳本  128

  • 7.4  在PythonWin中調(diào)試腳本  134

第8章  pip軟件包管理  137

  • 8.1  安裝pip  137

  • 8.2  更新pip  138

  • 8.3  pip常用操作  138

  • 8.4  本章小結(jié)  141


第2篇  Python數(shù)據(jù)分析工具入門(mén)

第9章  IPython科學(xué)計(jì)算庫(kù)  142

  • 9.1  IPython簡(jiǎn)介  143

  • 9.2  安裝IPython及其他相關(guān)庫(kù)  144

  • 9.3  IPython殼基礎(chǔ)  146

  • 9.4  融合Matplotlib庫(kù)和Pylab模型  156

  • 9.5  輸入和輸出變量  157

  • 9.6  交互式調(diào)試器  158

  • 9.7  計(jì)時(shí)功能  159

  • 9.8  重新載入模塊  160

  • 9.9  配置IPython  161

  • 9.10  Jupyter  162

  • 9.11  IPython和Jupyter Notebook的關(guān)系  170

第10章  Numpy科學(xué)計(jì)算庫(kù)  174

  • 10.1  Numpy基礎(chǔ)  174

  • 10.2  數(shù)組的基本操作  184

  • 10.3  基本的分片和索引操作  186

  • 10.4  高級(jí)索引  189

  • 10.5  改變數(shù)組的形狀  193

  • 10.6  組裝、分割數(shù)組  195

  • 10.7  數(shù)組的基本函數(shù)  196

  • 10.8  復(fù)制和指代  198

  • 10.9  線性代數(shù)  199

  • 10.10  使用數(shù)組來(lái)處理數(shù)據(jù)  201

  • 10.11  Numpy的where()函數(shù)和統(tǒng)計(jì)函數(shù)  203

  • 10.12  輸入與輸出  206

  • 10.13  生成隨機(jī)數(shù)  208

  • 10.14  數(shù)組的排序和查找  210

  • 10.15  擴(kuò)充轉(zhuǎn)換  213

第11章  pandas數(shù)據(jù)分析處理庫(kù)  216

  • 11.1  pandas數(shù)據(jù)結(jié)構(gòu)介紹  217

  • 11.2  索引對(duì)象  226

  • 11.3  核心的基本函數(shù)  227

  • 11.4  索引和旋轉(zhuǎn)  229

  • 11.5  算術(shù)運(yùn)算與對(duì)齊  232

  • 11.6  處理默認(rèn)值  233

  • 11.7  多級(jí)索引  237

  • 11.8  讀/寫(xiě)數(shù)據(jù)  239

  • 11.9  組合數(shù)據(jù)  243

  • 11.10  數(shù)據(jù)分組操作  247

  • 11.11  時(shí)間序列  249

第12章  Matplotlib數(shù)據(jù)可視化  260

  • 12.1  Pyplot模塊介紹  261

  • 12.2  應(yīng)用Pyplot模塊  269

  • 12.3  Artist模塊  275

  • 12.4  使用pandas繪圖  283


第3篇  Python數(shù)據(jù)分析案例實(shí)戰(zhàn)

第13章  案例1:數(shù)據(jù)挖掘  288

  • 13.1  貝葉斯理論介紹  288

  • 13.2  貝葉斯分類器的實(shí)現(xiàn)  290

  • 13.3  協(xié)同過(guò)濾推薦系統(tǒng)  295

第14章  案例2:玩轉(zhuǎn)大數(shù)據(jù)  305

  • 14.1  案例概述  306

  • 14.2  日志文件的分割  309

  • 14.3  編寫(xiě)Map()函數(shù)處理小文件  311

  • 14.4  編寫(xiě)Reduce()函數(shù)  313



 

博文視點(diǎn)

您閱讀的專業(yè)智庫(kù)

喜歡請(qǐng)分享至朋友圈

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多