統(tǒng)計顯著性的提法最早應該是由英國統(tǒng)計學家 Ronald A Fisher(1890-1962) 提出來的,一個相關(guān)的概念是值。值是假設原假設正確情況下,得到觀測數(shù)量或統(tǒng)計量的極端可能性。用數(shù)學公式表示: 值越大,說明數(shù)據(jù)來自于假設總體的可能性越大,越不能拒絕,相反,越小,我們越傾向于拒絕,但即使拒絕也不一定說明就是錯的,這個是要注意的。 顯著性檢驗類似于反證法。為了證明一個命題,我們先假設一個相反的命題正確,然后推出矛盾的結(jié)果,從而否定相反的命題。這里也是一樣,不過是概率意義上的。我們通常想否定,但我們先假設正確,然后計算觀測數(shù)據(jù)或統(tǒng)計量在假設總體中抽取到的極端可能性,即值,若值很小,我們發(fā)現(xiàn)矛盾,概率意義上的,即若正確,我們的數(shù)據(jù)或統(tǒng)計量來自該假設總體的可能性應該很高,但現(xiàn)在很小,所以我們傾向于懷疑我們的數(shù)據(jù)或統(tǒng)計量不是來自于原假設的總體,我們傾向于拒絕,但我們并不是100%的確定是錯誤的。因為,盡管概率很小,卻仍然是有可能的,所以,這里我們需要謹慎。我們拒絕了,并不是說一定錯了,只是說明我們的數(shù)據(jù)與兼容的可能性太低,我們傾向于否定。要證明是否錯誤,除了剛剛的統(tǒng)計證據(jù)之外,還需要其他證據(jù),包括研究者的經(jīng)驗或其他先驗知識。 檢驗的時候,通常取一個臨界值,比如5%,p值若小于0.05,說明數(shù)據(jù)與$H_0$的兼容程度太低,我們通常拒絕$H_0$,通常稱為是統(tǒng)計顯著的。因而,0.05的標準也是很武斷的,研究者根據(jù)自己的研究需要而設定。但我們要記住的就是,即使p值低于這一門檻,我們選擇拒絕$H_0$,并沒有說明$H_0$一定是錯的。下面舉兩個例子。 女士品茶和章魚保羅女士品茶女士品茶,大家可能都比較熟悉,最早來源于Fisher的經(jīng)典著作《實驗設計》一書中,故事是講Fisher和其同事一起吃下午茶,其中一位女同事說奶茶制作中,加茶和奶的次序會影響奶茶的口味,F(xiàn)isher就構(gòu)造了一個隨機化實驗去檢驗該女士的說法。他提出制作8杯奶茶,其中4杯先奶后茶,另外4杯先茶后奶,然后隨機拿出讓該女士品嘗。結(jié)果該女士正確的判斷出了各杯奶茶的制作方法。請問該女士是否有鑒別能力,在統(tǒng)計上顯著嗎?
這里70是所有可能的分配向量數(shù),即8杯奶茶,隨機選擇4杯先奶后茶,另外4杯先茶后奶,共,而女士完全猜對的對應次序只有1種,所以瞎猜猜對的可能性是。p值應該比較小了,所以,我們傾向于拒絕原假設,認為該女士具有鑒別能力。但這個結(jié)論我們不是100%的確定的,畢竟,就算原假設正確,該女士仍然有可能碰巧猜對的。那怎么辦?在這個例子中,倒是比較好辦,多做幾次實驗就可以了,如果每次實驗該女士都能猜對,我們基本上就能確定拒絕原假設了。比如說做2次,兩次實驗時,該女士都猜對的概率將減小到1/4900。 章魚保羅我們再看一個例子,章魚保羅的故事。 2008年1月26日,在英國出生的章魚保羅在德國成長,居住在德國奧伯豪海洋生物館。2010年6月起,章魚保羅就德國隊在出戰(zhàn)南非世界杯小組賽及淘汰賽的所有賽事均成功“預測”出勝出隊伍。同年7月9日,章魚保羅成功地“預測”出西班牙為南非世界杯冠軍隊伍,也是它首次為非德國隊參賽的賽事進行“預測”(更詳細的故事,大家自行網(wǎng)絡搜索)。 (來自維基百科) 我們可以用同樣地方法進行檢驗
統(tǒng)計上非常顯著,我們傾向于拒絕,認為章魚保羅具有預測能力,你會接受這一結(jié)論嗎?為什么?你的判斷是不是使用了顯著性檢驗以外的知識或其他先驗知識? 其實,章魚保羅2008年就做過一次預測,那次準確率差點。6次對了4次,也相當高了,也可以計算出p值,兩次綜合起來,統(tǒng)計上也是相當顯著的。我們是否就會根據(jù)統(tǒng)計顯著性拒絕呢?我相信各位的答案都應該是否定的。 對于章魚保羅是否具有預測能力的判斷,大家肯定不只是看上述實驗的統(tǒng)計顯著性的,還會利用其他的先驗知識。 啟示經(jīng)濟學研究中也是如此,統(tǒng)計顯著性最多是給我們提供了一定的統(tǒng)計證據(jù),但我們不能完全依靠它,我們還需要其他的先驗知識,而這些先驗知識,對于經(jīng)濟學而言,很多可能是深入的調(diào)查,對所研究問題的深入理解,才能使我們得到更準確的判斷,從而獲得基本有用的知識。 下次進行實證分析的時候,遇到你估計的系數(shù)統(tǒng)計顯著或統(tǒng)計不顯著時,你該怎么辦呢?從這篇小文章中你有沒有什么啟示?歡迎在下面留言發(fā)表你的看法。 |
|