有些時候數(shù)據(jù)的離散程度能夠讓我們數(shù)據(jù)分析得出一些其他信息,理想情況下數(shù)據(jù)越集中那么效果越好。那么有沒有指標來衡量?答案是有得,今天主要學習一下數(shù)據(jù)離散程度的衡量指標。 1.極差 極差就是對一組數(shù)據(jù)的最大值減去最小值。但是因為極差是采用兩頭的數(shù)據(jù),沒有考慮中間的數(shù)據(jù),所以代表性差。 2.四分位差 即數(shù)據(jù)樣本的上四分之一位和下四分之一位的差值,放映了數(shù)據(jù)中間50%部分的離散程度,其數(shù)值越小表明數(shù)據(jù)越集中,數(shù)值越大表明數(shù)據(jù)越離散,同時由于中位數(shù)位于四分位數(shù)之間,故四分位差也放映出中位數(shù)對于數(shù)據(jù)樣本的代表程度,越小代表程度越高,越大代表程度越低。但是取四分位數(shù)據(jù)的時候會因為數(shù)據(jù)的偏向問題影響,有可能上四分位和下四分位數(shù)據(jù)值相差太大,所以做為離散程度指標也欠妥。 3.方差 4.標準差 基于均值和標準差就可以大致明確數(shù)據(jù)集的中心及數(shù)值在中心周圍的波動情況,也可以計算正態(tài)總體的置信區(qū)間等統(tǒng)計量 5.平方差 方差用取平方的方式消除數(shù)值偏差的正負,平均差用絕對值的方式消除偏差的正負性。平均差可以用均值作為參考系,也可以用中位數(shù),這里使用均值。 平均差相對標準差而言,更不易受極端值的影響,因為標準差是通過方差的平方計算而來的,但是平均差用的是絕對值,其實是一個邏輯判斷的過程而并非直接計算的過程,所以標準差的計算過程更加簡單直接。 參考:https://blog.csdn.net/qsir/article/details/94619194?utm_medium=distribute.pc_relevant.none-task-blog-baidulandingword-6&spm=1001.2101.3001.4242
|
|
來自: 常熟老李jlr5mr > 《待分類》