在統(tǒng)計(jì)中常用極差來(lái)刻畫一組數(shù)據(jù)的離散程度,以及反映的是變量分布的變異范圍和離散幅度,在總體中任何兩個(gè)單位的標(biāo)準(zhǔn)值之差都不能超過(guò)極差。同時(shí),它能體現(xiàn)一組數(shù)據(jù)波動(dòng)的范圍。極差越大,離散程度越大,反之,離散程度越小。 極差只指明了測(cè)定值的最大離散范圍,而未能利用全部測(cè)量值的信息,不能細(xì)致地反映測(cè)量值彼此相符合的程度,極差是總體標(biāo)準(zhǔn)偏差的有偏估計(jì)值,當(dāng)乘以校正系數(shù)之后,可以作為總體標(biāo)準(zhǔn)偏差的無(wú)偏估計(jì)值,它的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,含義直觀,運(yùn)用方便,故在數(shù)據(jù)統(tǒng)計(jì)處理中仍有著相當(dāng)廣泛的應(yīng)用。 但是,它僅僅取決于兩個(gè)極端值的水平,不能反映其間的變量分布情況,同時(shí)易受極端值的影響。 極差 最直接也是最簡(jiǎn)單的方法,即最大值-最小值(也就是極差)來(lái)評(píng)價(jià)一組數(shù)據(jù)的離散度。這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體應(yīng)用。 2.離均差的平方和 由于誤差的不可控性,因此只由兩個(gè)數(shù)據(jù)來(lái)評(píng)判一組數(shù)據(jù)是不科學(xué)的。所以人們?cè)谝蟾叩念I(lǐng)域不使用極差來(lái)評(píng)判。其實(shí),離散度就是數(shù)據(jù)偏離平均值的程度。因此將數(shù)據(jù)與均值之差(我們叫它離均差)加起來(lái)就能反映出一個(gè)準(zhǔn)確的離散程度。和越大離散度也就越大。 但是由于偶然誤差是成正態(tài)分布的,離均差有正有負(fù),對(duì)于大樣本離均差的代數(shù)和為零的。為了避免正負(fù)問(wèn)題,在數(shù)學(xué)有上有兩種方法:一種是取絕對(duì)值,也就是常說(shuō)的離均差絕對(duì)值之和。而為了避免符號(hào)問(wèn)題,數(shù)學(xué)上最常用的是另一種方法--平方,這樣就都成了非負(fù)數(shù)。因此,離均差的平方和成了評(píng)價(jià)離散度一個(gè)指標(biāo)。 3.方差(S2) 由于離均差的平方和與樣本個(gè)數(shù)有關(guān),只能反應(yīng)相同樣本的離散度,而實(shí)際工作中做比較很難做到相同的樣本,因此為了消除樣本個(gè)數(shù)的影響,增加可比性,將離均差的平方和求平均值,這就是我們所說(shuō)的方差成了評(píng)價(jià)離散度的較好指標(biāo)。 我們知道,樣本量越大越能反映真實(shí)的情況,而算數(shù)均值卻完全忽略了這個(gè)問(wèn)題,對(duì)此統(tǒng)計(jì)學(xué)上早有考慮,在統(tǒng)計(jì)學(xué)中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當(dāng)選到只剩一個(gè)時(shí),它不可能再有自由了,所以自由度是n-1。 ① 離散程度的通俗解釋——波動(dòng)大小, ② 為什么要研究一組數(shù)據(jù)的離散程度。 全面認(rèn)識(shí)一組數(shù)據(jù)的兩個(gè)特征: 探索平均數(shù)的代表性。 實(shí)際問(wèn)題的需要。 ③探索如何表示一組數(shù)據(jù)的離散程度——方差的形 成過(guò)程。 首先,極差——比較粗略; 其次,平均差,比極差更全面,不常用; 再次,選擇方差,但數(shù)值的單位與原數(shù)據(jù)單位不 一致。 最后,常用標(biāo)準(zhǔn)差。 δ = S2 ④統(tǒng)計(jì)含義的解釋——方差全面地平均地反映, 標(biāo)準(zhǔn)差全面地直接地反映。 偏離平均數(shù)——指與平均數(shù)的離差。 平均的——指離差的平均數(shù)的平均值。 全面的——指考慮了每個(gè)數(shù)據(jù)的離差。 直接的——指數(shù)值單位與原數(shù)據(jù)單位一致。 ⑤應(yīng)用條件——平均數(shù)相同。特殊情況,平均數(shù)相 差很小、近似相等時(shí)也可以用,不 受兩組數(shù)據(jù)個(gè)數(shù)的差異限制。 ⑥實(shí)際作用: 1°直接比較: 同一時(shí)間事物或現(xiàn)象的整齊性、均勻性、一致性的差異; 不同時(shí)間過(guò)程的穩(wěn)定性、均衡性、一致性的差異; 2°比較平均數(shù)的代表性: 3°與平均數(shù)配合作統(tǒng)計(jì)分析:如:Vδ = 4°樣本估計(jì)總體。樣本比較估計(jì)總體的差異,用樣本 標(biāo)準(zhǔn)差,估計(jì)總體標(biāo)準(zhǔn)差。 *樣本估計(jì)總體的方法有兩個(gè):點(diǎn)估計(jì)和區(qū)間估計(jì)。 只要求會(huì)點(diǎn)估計(jì),即直接用樣本的特征數(shù)作為總體 相應(yīng)參數(shù)的估計(jì)值。 4.標(biāo)準(zhǔn)差(SD) 由于方差是數(shù)據(jù)的平方,與檢測(cè)值本身相差太大,人們難以直觀的衡量,所以常用方差開根號(hào)換算回來(lái)這就是我們要說(shuō)的標(biāo)準(zhǔn)差。 5.變異系數(shù)(CV) 標(biāo)準(zhǔn)差能很客觀準(zhǔn)確的反映一組數(shù)據(jù)的離散程度,但是對(duì)于不同的項(xiàng)目,或同一項(xiàng)目不同的樣本,標(biāo)準(zhǔn)差就缺乏可比性了,因此對(duì)于方法學(xué)評(píng)價(jià)來(lái)說(shuō)又引入了變異系數(shù)CV。 不過(guò)日常的質(zhì)控工作檢測(cè)的都是同一質(zhì)控物所以有標(biāo)準(zhǔn)差就足以反應(yīng)了,同時(shí)質(zhì)控的目的是發(fā)現(xiàn)有沒(méi)有實(shí)驗(yàn)錯(cuò)誤,要設(shè)制警報(bào)線,并不是要評(píng)價(jià)檢測(cè)方法,所以只可能使用標(biāo)準(zhǔn)差,而不用變異系數(shù)。 頻數(shù)分布: ①頻數(shù)的通俗解釋:頻數(shù)出現(xiàn)的次數(shù),小組里數(shù)據(jù)的個(gè) 數(shù)。 ②數(shù)據(jù)的分組整理——分三個(gè)步驟: 一是確實(shí)分組的方法,先分組,這是整理的難點(diǎn),分 組的方法,根據(jù)需要確定。分組的方法確定《課 標(biāo)》不作要求。 二是累計(jì)各小組的頻數(shù),并計(jì)算相應(yīng)的頻率,用頻數(shù) 分布表表示整理的結(jié)果。 三是根據(jù)頻數(shù)分布表畫出頻數(shù)分布直方圖。 ③觀察頻數(shù)分布表和分布圖,獲得數(shù)據(jù)分布的信息和分布 特征。 1°數(shù)據(jù)分布最多,最集中(眾數(shù)組)和最少的小組; 2°數(shù)據(jù)分布(頻數(shù))的變化趨勢(shì)與分布狀態(tài); 3°中位數(shù)和平均數(shù)在哪個(gè)小組,是否是偏態(tài)分布; 4°獲取所需要的其他數(shù)據(jù)信息。 |
|