小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

python數(shù)據(jù)分析pandas包入門學(xué)習(xí)(四)處理缺失數(shù)據(jù)

 啊冬個(gè)哩咚 2019-01-23

本文參考《利用Python進(jìn)行數(shù)據(jù)分析》的第五章 pandas入門

4 處理缺失數(shù)據(jù)
缺失數(shù)據(jù)(missing data)在大部分?jǐn)?shù)據(jù)分析應(yīng)用中都很常見。Pandas的設(shè)計(jì)目標(biāo)之一就是讓缺失數(shù)據(jù)的處理任務(wù)盡量輕松。例如,pandas對象上的所有描述統(tǒng)計(jì)都排除了缺失數(shù)據(jù)。
pandas使用NaN表示缺失數(shù)據(jù)。

Python內(nèi)置的None也會(huì)被當(dāng)做NaN處理:


濾除缺失數(shù)據(jù)
對series,可以使用dropna()方法和布爾型索引達(dá)到濾除缺失數(shù)據(jù):

對于DataFrame,就有點(diǎn)復(fù)雜了,你可能希望丟棄全部是NAN或含有NAN的行或列。
dropna默認(rèn)丟棄任何含有缺失值的行,傳入how='all'則之丟棄全為NaN的行或列:

另一個(gè)參數(shù)是thresh,該參數(shù)的類型為整數(shù),它的作用是,比如 thresh=3,會(huì)在一行中至少有 3 個(gè)非 NA 值時(shí)將其保留。

填充缺失數(shù)據(jù)
有的時(shí)候可能不想濾除缺失數(shù)據(jù),而是希望通過其他方式填補(bǔ)那些“空洞”。對于大多數(shù)情況,fillna方法是最主要的函數(shù):


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多