小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程! | 易學(xué)教程

 ly88 2018-08-19

---恢復(fù)內(nèi)容開(kāi)始---

1.選取行名、列名、值   進(jìn)群:125240963   即可獲取數(shù)十套PDF哦!

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.以標(biāo)簽(行、列的名字)為索引選擇數(shù)據(jù)—— x.loc[行標(biāo)簽,列標(biāo)簽] 私信小編007即可獲取數(shù)十套PDF哦!

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

3.以位置(第幾行、第幾列)為索引選擇數(shù)據(jù)—— x.iloc[行位置,列位置]

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

4.同時(shí)根據(jù)標(biāo)簽和位置選擇數(shù)據(jù)——x.ix[行,列]

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

5.選擇連續(xù)的多行多列——切片

起點(diǎn)索引:終點(diǎn)索引 這種用法叫做一個(gè)切片,指從起點(diǎn)索引到終點(diǎn)索引。看實(shí)際用法就懂了。

如果起點(diǎn)索引省略代表從頭開(kāi)始,終點(diǎn)索引省略代表直到最后,都省略就代表全部了。

切片在.loc、.iloc、.ix三種方法中都可以應(yīng)用

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

由上例可見(jiàn),當(dāng)以位置為索引時(shí),切片是不包括終點(diǎn)的,是左閉右開(kāi)的。即第1列到第3列不是寫(xiě)作0:2而是0:3。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

6.選擇不連續(xù)的某幾行或某幾列

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

備注:當(dāng)以標(biāo)簽名選取不連續(xù)的某幾行的時(shí)候在這個(gè)例子中如df.loc['2016-02-02','2016-02-04',:]這樣寫(xiě)會(huì)出錯(cuò),,是時(shí)間格式的原因,這樣寫(xiě)就可以了df.ix[[pd.Timestamp('2016-02-02'), pd.Timestamp('2016-02-04')]]

7.簡(jiǎn)便地獲取行或列

直接用切片獲取行,直接用標(biāo)簽名獲取列。注意不要錯(cuò)亂。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

8.如何返回一個(gè)dataframe的單列或單行

如上,此時(shí)返回的是一個(gè)series,而不是dataframe。有時(shí)單獨(dú)只獲取一行的時(shí)候也會(huì)返回一個(gè)series,如df.ix[0,:]。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

若要返回dataframe,可用中括號(hào)把索引括上,如下。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

9.按條件選取數(shù)據(jù)——df[邏輯條件]

邏輯條件支持&(與)、|(或)、~(非)等邏輯運(yùn)算

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

這個(gè)方法有個(gè)常用情景,即按條件修改數(shù)據(jù):

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

02. dataframe轉(zhuǎn)置、排序

1.轉(zhuǎn)置 df.T

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.按行名或列名排序——df.sort_index

df.sort_index(axis=0,ascending=True)

  • axis= 0 為按行名排序;1 為按列名排序
  • ascending= True 為升序; False 為降序
Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

3.按值排序——df.sort_index

df.sort(by=, ascending=True)

  • by= 按哪一列的值排序,默認(rèn)是按行標(biāo)簽排序
  • ascending= True 為升序; False 為降序
Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

03. dataframe增刪行或列

1.獲得一個(gè)datframe數(shù)據(jù)類(lèi)型的樣例

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.增加一列或一行

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

3.刪除行或列——df.drop

df.drop(labels,axis=0,inplace=Flase)

  • labels 行或列的標(biāo)簽名,寫(xiě)在第一個(gè)可省略。
  • axis= 0 刪除行;1 刪除列
  • inplace= False 生成新dataframe;True 不生成新的dataframe,替換原本dataframe。默認(rèn)是False。
  • 該操作默認(rèn)返回的是另一個(gè)新的dataframe,以至于原來(lái)的沒(méi)有變,如在下面第一個(gè)例子中刪除的列,在第二個(gè)例子中還有。要替換原來(lái)的請(qǐng)調(diào)整inplace參數(shù)
Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

04.鏈接多個(gè)dataframe

1.concat,concat([df1,df2,...],axis=0)

  • axis= 0 縱向;1 橫向。
  • 使用前需導(dǎo)入過(guò)pandas模塊
  • 使用時(shí)要注意連接的dataframe行列對(duì)齊
  • 可以同時(shí)拼接多個(gè)dataframe
  • 拼接是強(qiáng)制的,允許連接后存在同名的行或列,見(jiàn)縱向連接的第二個(gè)例子
Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.橫向連接

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

3.縱向連接

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

05.組建dataframe

1.組建方法——pd.DataFrame

pd.DataFrame(data=None, index=None, columns=None)

  • data= 數(shù)據(jù)
  • index= 索引,即行名、行表頭
  • columns= 列名、列表頭

使用前要執(zhí)行前面的import pandas as pd

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.用字典型數(shù)據(jù)組建——pd.DataFrame

方法基本同上,因?yàn)樽值湫妥詭б粋€(gè)標(biāo)簽,所以就不用寫(xiě)列名了。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

3.簡(jiǎn)便地獲得聚寬數(shù)據(jù)中的時(shí)間索引

有時(shí)建立一個(gè)dataframe時(shí),為了和平臺(tái)數(shù)據(jù)保持一致,需要使用相同的時(shí)間行索引,但時(shí)間數(shù)據(jù)操作復(fù)雜,而且涉及到節(jié)假日、非交易日等問(wèn)題,直接建立比較困難,這里介紹一種簡(jiǎn)單的方法,快速獲得跟平臺(tái)數(shù)據(jù)一致的時(shí)間索引。原理就是直接把平臺(tái)數(shù)據(jù)的時(shí)間索引拿出來(lái)。例子如下:

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

06.dataframe的缺失值處理

1.去掉缺失值——df.dropna

df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

  • axis= 0 按行檢查缺失;1 按列檢查缺失。不寫(xiě)默認(rèn)為0
  • how= 'any' 有一個(gè)缺失值就算缺失;'all' 行或列(根據(jù)axis參數(shù))全缺失才算缺失。不寫(xiě)默認(rèn)為'any'
  • thresh= x,x為一個(gè)整數(shù),含義為行或列(根據(jù)axis參數(shù))中非缺失數(shù)值個(gè)數(shù)大于等于x則不算缺失,即小于x則算缺失,會(huì)被去除。
  • subset= 標(biāo)簽名。選擇要對(duì)哪個(gè)列或行(與axis中的相反)進(jìn)行檢查缺失,沒(méi)寫(xiě)的則不檢查。即限制檢查范圍。

相對(duì)復(fù)雜,請(qǐng)看例子和與例子注釋。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.對(duì)缺失值進(jìn)行填充——df.fillna

df.fillna(value=None,axis=None)

  • value= 替換缺失值的值??梢允菃蝹€(gè)值、字典、dataframe等,但不能是list。區(qū)別請(qǐng)看例子。
Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

3.判斷數(shù)據(jù)是否為缺失——df.isnull

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

為什么要這樣用這個(gè)方法判斷是否為缺失?

因?yàn)閚an不等于nan(如下例),即用類(lèi)似x == nan條件為真 這樣的判斷方法無(wú)法判斷一個(gè)值x是否為nan。

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

07.常用統(tǒng)計(jì)函數(shù)

常用統(tǒng)計(jì)函數(shù)

  • describe 針對(duì)Series或個(gè)DataFrame列計(jì)算匯總統(tǒng)計(jì)
  • count 非na值的數(shù)量
  • min、max 計(jì)算最小值和最大值
  • idxmin、idxmax 計(jì)算能夠獲取到最大值和最小值得索引值
  • quantile 計(jì)算樣本的分位數(shù)(0到1)
  • sum 值的總和
  • mean 值得平均數(shù)
  • median 值得算術(shù)中位數(shù)(50%分位數(shù))
  • mad 根據(jù)平均值計(jì)算平均絕對(duì)離差
  • var 樣本值的方差
  • std 樣本值的標(biāo)準(zhǔn)差
  • skew 樣本值得偏度(三階矩)
  • kurt 樣本值得峰度(四階矩)
  • cumsum 樣本值得累計(jì)和
  • cummin,cummax 樣本值得累計(jì)最大值和累計(jì)最小值
  • cumprod 樣本值得累計(jì)積
  • diff 計(jì)算一階差分
  • pct_change 計(jì)算百分?jǐn)?shù)變化

查看函數(shù)的詳細(xì)信息

08.panel類(lèi)型數(shù)據(jù)分解成dataframe

1.panel的取用方法

panel類(lèi)型的的取用方法類(lèi)似與dataframe,看下例子也就明白了。一般要做統(tǒng)計(jì)方面的工作,也是如下分解成dataframe進(jìn)行操作,基本滿足日常需求。了解更多panel的操作可參考:http://pandas./pandas-docs/stable/api.html#panel

2.panel類(lèi)型數(shù)據(jù)分解成dataframe方法

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

09.研究?jī)?nèi)存取dataframe

1.把dataframe存成csv文件——df.to_csv()

用法如下,文件都是存到研究空間中的,如果不寫(xiě)路徑是默認(rèn)是存在根目錄,如df.to_csv('df.csv')

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

2.讀取被存成csv文件的dataframe——pd.read_csv()

Pandas是數(shù)據(jù)分析必須要學(xué)的庫(kù)!這是我見(jiàn)過(guò)最詳細(xì)最牛逼的教程!

 

文章來(lái)源于:JoinQuant聚寬

聚寬,國(guó)內(nèi)最大Python量化平臺(tái),提供從數(shù)據(jù)、回測(cè)、模擬、實(shí)盤(pán)等全流程產(chǎn)品。聚寬已匯聚超過(guò)15w量化愛(ài)好者,與數(shù)十家機(jī)構(gòu)合作,聚寬公眾號(hào)會(huì)定期更新量化干貨,教你用Python寫(xiě)出好策略。

---恢復(fù)內(nèi)容結(jié)束---

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多