假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)中用來判斷樣本與樣本、樣本與總體之間的差異是由抽樣誤差帶來還是本質(zhì)差異帶來的一種方法。根據(jù)這個(gè)思路,只要算出來抽樣誤差發(fā)生的概率,根據(jù)這個(gè)概率就能判斷是否由抽樣誤差帶來,如果概率很小則否定由抽樣誤差帶來,接受差異是本質(zhì)差異帶來。其基本思想是“小概率事件”:小概率事件在一次試驗(yàn)中基本不會(huì)發(fā)生。由于咱們不知道有沒有差異,所以先提出來假設(shè): 然后計(jì)算出來H0假設(shè)發(fā)生的概率,統(tǒng)計(jì)學(xué)上命名為P值(得到H0假設(shè)這種極端情況,甚至更極端情況的概率)。 一般來說P值<5%,就定義為小概率事件(根據(jù)實(shí)際情況來定,有的時(shí)候是1%),如果滿足該條件,則說明“兩者之間沒有本質(zhì)差異,當(dāng)前的差異由抽樣誤差帶來”是小概率事件,也就是說差異不是抽樣誤差帶來,兩者之間存在本質(zhì)差異,這種方法就是顯著性檢驗(yàn),顯著性檢驗(yàn)是假設(shè)檢驗(yàn)中最常用的一種方法。 常用的顯著性檢驗(yàn)的方法有Z檢驗(yàn),T檢驗(yàn),卡方檢驗(yàn)、F檢驗(yàn)等, 到底要用哪種檢驗(yàn)方法去解決實(shí)際問題,取決于樣本量的大小,總體方差是否已知,總體的分布等。本文先來介紹Z檢驗(yàn)。(T檢驗(yàn)、卡方檢驗(yàn)和F檢驗(yàn)展開又是很多內(nèi)容,后續(xù)單獨(dú)來介紹) 第一步、評(píng)估當(dāng)前數(shù)據(jù)情況是否適合用Z檢驗(yàn)。Z檢驗(yàn)適用條件:大樣本量(n>30),樣本來自正態(tài)分布,且總體標(biāo)準(zhǔn)差已知。第二步、計(jì)算Z值:Z=(x-μ)/σ。其中:x-某一特征值;μ-總體均值;σ-總體的標(biāo)準(zhǔn)差。翻譯一下: Z值用 總體標(biāo)準(zhǔn)差 為單位來衡量某個(gè)值距離總體均值的距離, 知道了距離可以干什么,就可以算出來這個(gè)距離范圍內(nèi)對(duì)應(yīng)的概率, 反向就可以算出來出現(xiàn)這種情況以及更極端情況的概率(即H0發(fā)生的概率)。 第三步、算出來z值后,查正態(tài)分布表或者直接用excel的公式即可得到對(duì)應(yīng)的概率。抓來200只小白鼠,隨機(jī)均分成2組(每組100只),測(cè)試某種藥物對(duì)小白鼠的反應(yīng)時(shí)間的影響。A組未注射藥物(平均反應(yīng)時(shí)間1.2s,標(biāo)準(zhǔn)差s=0.5s),B組注射藥物(平均反應(yīng)時(shí)間1.05s),請(qǐng)問:藥物有效果嗎?解答:采用假設(shè)檢驗(yàn)的方法來論證,原假設(shè)H0:藥物無效果;備擇假設(shè)H1:藥物有效科普: 總體標(biāo)準(zhǔn)差δ,樣本標(biāo)準(zhǔn)差s, 總體標(biāo)準(zhǔn)差未知,只能用最好的估計(jì)值代替總體標(biāo)準(zhǔn)差, 而最好的估計(jì)值就是用樣本的標(biāo)準(zhǔn)差去估計(jì),估計(jì)方法為δ=s/√n;n為樣本容量。
旁白: 我們要計(jì)算的是什么? 根據(jù)上文介紹,要計(jì)算的是“藥物無效果,兩組小白鼠的反應(yīng)時(shí)間均值差異是抽樣誤差帶來的”概率p值, p值怎么求? 小白鼠對(duì)藥物的反應(yīng)時(shí)間由很多影響因素造成, 根據(jù)之前正態(tài)分布的介紹,“當(dāng)一個(gè)事物由很多原因造成,并且沒有一個(gè)主要原因,那大概率成正態(tài)分布”,也就是小白鼠對(duì)藥物的反應(yīng)總體呈正態(tài)分布。 總體樣本為正態(tài)分布,樣本容量100>30,總體標(biāo)準(zhǔn)差未知但是可以用樣本標(biāo)準(zhǔn)差來估計(jì), 那不就滿足Z檢驗(yàn)的條件了嘛,哈哈哈,算起來~ 第一步、求總體標(biāo)準(zhǔn)差 δ= s/√n=0.5/√100=0.05s第二步、總體均值,用A組小白鼠平均值來代替=1.2s第三步、計(jì)算Z統(tǒng)計(jì)量,z=(x-μ)/σ=|1.05-1.2|/0.05=3,根據(jù)經(jīng)驗(yàn)法則,這個(gè)距離范圍內(nèi)的出現(xiàn)的總概率是99.7%,p值=1-99.7%=0.3%,也就是正常情況下B組小白鼠反應(yīng)平均時(shí)間1.2s及以上的概率是0.3%(即H0發(fā)生的概率是0.3%),p=0.3%<5%,判定為小概率事件,小概率事件單次試驗(yàn)基本不會(huì)出現(xiàn),進(jìn)而判定為藥物有效。四、單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)- 單側(cè)檢驗(yàn):藥有正效果的概率,或者藥有負(fù)效果的概率。
- 雙側(cè)檢驗(yàn):不管藥有正效果還是負(fù)效果,兩者有差別的概率。
|