在臨床實(shí)驗(yàn)研究中,無論是實(shí)驗(yàn)組還是對照組都需要有一定數(shù)量的受試對象。這是因?yàn)橥环N實(shí)驗(yàn)處理在不同的受試對象身上表現(xiàn)出的實(shí)驗(yàn)效應(yīng)是存在著變異的。僅憑一次實(shí)驗(yàn)觀測結(jié)果或單個(gè)受試者所表現(xiàn)出來的實(shí)驗(yàn)效應(yīng)說明不了什么問題。必須通過一定數(shù)量的重復(fù)觀測才能把研究總體真實(shí)的客觀規(guī)律性顯示出來,并且可以對抽樣誤差做出客觀地估計(jì)。但重復(fù)觀測次數(shù)越多(即樣本含量越大)試驗(yàn)所要消耗的人力、物力、財(cái)力和時(shí)間越多,可能會(huì)使試驗(yàn)研究成為不可能。而且,樣本含量過大還會(huì)增加控制試驗(yàn)觀測條件的難度,有可能引入非隨機(jī)誤差,給觀測結(jié)果帶來偏性(bias)。所以在實(shí)驗(yàn)設(shè)計(jì)中落實(shí)重復(fù)原則的一個(gè)重要問題就是如何科學(xué)合理確定樣本量。由于在各對比組例數(shù)相等時(shí)進(jìn)行統(tǒng)計(jì)推斷效能最高,因此多數(shù)情況下都是按各組樣本含量相等來估計(jì)。但在個(gè)別情況下,也可能要求各組樣本含量按一定比例來估計(jì)。 1 與樣本含量估計(jì)有關(guān)的幾個(gè)統(tǒng)計(jì)學(xué)參數(shù) 在估計(jì)樣本含量之前,首先要對以下幾個(gè)統(tǒng)計(jì)學(xué)參數(shù)加以確定或作出估計(jì)。 1.1 規(guī)定有專業(yè)意義的差值δ,即所比較的兩總體參數(shù)值相差多大以上才有專業(yè)意義。δ是根據(jù)實(shí)驗(yàn)?zāi)康娜藶橐?guī)定的,但必須有一定專業(yè)依據(jù)。習(xí)慣上把δ稱為分辨力或區(qū)分度。δ值越小表示對二個(gè)總體參數(shù)差別的區(qū)分度越強(qiáng),因而所需樣本含量也越大。 1.2 確定作統(tǒng)計(jì)推斷時(shí)允許犯Ⅰ類錯(cuò)誤(“棄真”的錯(cuò)誤)的概率α,即當(dāng)對比的雙方總體參數(shù)值沒有差到δ。但根據(jù)抽樣觀測結(jié)果錯(cuò)誤地得出二者有差別的推斷結(jié)論的可能性,α確定的越小,所需樣本含量越大。在確定α?xí)r還要注意明確是單側(cè)檢驗(yàn)的α,還是雙側(cè)檢驗(yàn)的α。在同樣大小的α條件下;雙側(cè)檢驗(yàn)要比單側(cè)檢驗(yàn)需要更大的樣本含量。 1.3 提出所期望的檢驗(yàn)效能power,用1-β表示。β為允許犯Ⅱ類錯(cuò)誤(“取偽”的錯(cuò)誤)的概率。檢驗(yàn)效能就是推斷結(jié)論不犯Ⅱ類錯(cuò)誤的概率1-β稱把握度。即當(dāng)對比雙方總體參數(shù)值間差值確實(shí)達(dá)到δ以上時(shí),根據(jù)抽樣觀測結(jié)果在規(guī)定的α水準(zhǔn)上能正確地作出有差別的推斷結(jié)論的可能性。在科研設(shè)計(jì)中常把1-β定為0.90或0.80。一般來說1-β不宜低于0.75,否則可能出現(xiàn)非真實(shí)的陰性推斷結(jié)論。 1.4 給出總體標(biāo)準(zhǔn)差σ或總體率π的估計(jì)值。它們分別反映計(jì)量數(shù)據(jù)和計(jì)數(shù)數(shù)據(jù)的變異程度。一般是根據(jù)前人經(jīng)驗(yàn)或文獻(xiàn)報(bào)道作出估計(jì)。如果沒有前人經(jīng)驗(yàn)或文獻(xiàn)報(bào)道作為依據(jù),可通過預(yù)實(shí)驗(yàn)取得樣本的標(biāo)準(zhǔn)差s或樣本率P分別作為σ和π的估計(jì)值。σ的估計(jì)值越大,π的估計(jì)值越接近0.5,所需樣本含量越大。 在對以上統(tǒng)計(jì)學(xué)參數(shù)作出規(guī)定或估計(jì)的前提下,就可以根據(jù)不同的推斷內(nèi)容選用相應(yīng)的公式計(jì)算出所需樣本含量。由于在同樣的要求和條件下完全隨機(jī)設(shè)計(jì)(成組設(shè)計(jì))所需樣本含量最大,故一般都要按完全隨機(jī)設(shè)計(jì)作出樣本含量的估計(jì)。 2 常用的估計(jì)樣本含量的方法 2.1 兩樣本均數(shù)比較時(shí)樣本含量估計(jì)方法 (1)兩樣本例數(shù)要求相等時(shí)可按下列公式估算每組需觀察的例數(shù)n。 n=2*[(α+β)σ/δ]^2 (公式1) 式中δ為要求的區(qū)分度,σ為總體標(biāo)準(zhǔn)差或其估計(jì)值s,α、β分別是對應(yīng)于α和β的u值,可由t界值表,自由度υ=∞-行查出來,α有單側(cè)、雙側(cè)之分,β只取單側(cè)值。 例1:某醫(yī)師研究一種降低高血脂患者膽固醇藥物的臨床療效,以安慰劑作對照。事前規(guī)定試驗(yàn)組與對照組相比,平均多降低0.5 mmol/L以上,才有推廣應(yīng)用價(jià)值。而且由有關(guān)文獻(xiàn)中查到高血脂患者膽固醇值的標(biāo)準(zhǔn)差為0.8 mmol/L,若要求犯Ⅰ類錯(cuò)誤的的概率不超過5%,犯Ⅱ類錯(cuò)誤的概率不超過10%,且要兩組例數(shù)相等則每組各需觀察多少例? 本例δ=0.5 mmol/L,σ=0.8mmol/L,α=0.05,β=0.10,1-β=0.90,查t界值表自由度為∞一行得單側(cè)t0.05=1.645,t0.1=1.282,代入公式(1) n=2*[(1.645+1.282)×0.8/0.5]^2=44 故要達(dá)到上述要求,兩組至少各需觀察44例。 (2)兩樣本例數(shù)要求呈一定比例(n2/n1=c)時(shí),可按下列公式求出n1,再按比例求出n2=c*n1。 n1=[(α+β)σ/δ]^2*(1+C)/C (公式2) 例2:對例1資料如一切要求都維持不變,但要求試驗(yàn)組與對照組的例數(shù)呈2∶1比例(即C=2),問兩組各需觀察多少例? n1=[(1.645+1.282)×0.8/0.5]^2×(1+2)/2 =33(例)(對照組所需例數(shù)) n2=2×33=66(例)(試驗(yàn)組所需例數(shù)。) 兩組共需觀察99例多于兩組例數(shù)相等時(shí)達(dá)到同樣要求時(shí)兩組所需觀察的總例數(shù)2×44=88。 2.2 配對設(shè)計(jì)計(jì)量資料樣本含量(對子數(shù))估計(jì)方法 配對設(shè)計(jì)包括異體配對、自身配對、自身前后配對及交叉設(shè)計(jì)的自身對照,均可按下列公式進(jìn)行樣本含量估計(jì)。 n=[(α+β)σd/δ]^2 (公式3) 式中δ、α、β的含義同前,σd為每對差值的總體標(biāo)準(zhǔn)差或其估計(jì)值sd。 例3:某醫(yī)院采用自身前后配對設(shè)計(jì)方案研究某治療矽肺藥物能否有效地增加矽肺患者的尿矽排出量。事前規(guī)定服藥后尿矽排出量平均增加35.6 mmol/L以上方能認(rèn)為有效,根據(jù)預(yù)試驗(yàn)得到矽肺患者服藥后尿矽排出量增加值的標(biāo)準(zhǔn)差 sd=89.0 mmol/L,現(xiàn)在要求推斷時(shí)犯Ⅰ類錯(cuò)誤的概率控制在0.05以下(單側(cè)),犯Ⅱ類錯(cuò)誤的概率控制在0.1以下,問需觀察多少例矽肺病人? 本例δ=35.6 mmol/L, sd=89.0 mmol/L,α=0.05,β=0.10。1-β=0.90,單側(cè)t0.05=1.645,t0.1=1.282,代入公式(3)得到。 n=[(1.645+1.282)×89/35.6]^2=54(例) 故可認(rèn)為如該藥確實(shí)能達(dá)到平均增加尿矽排出量在35.6 mmol/L以上,則只需觀察54例病人就能有90%的把握,按照α=0.05的檢驗(yàn)水準(zhǔn)得出該藥有增加矽肺病人尿矽作用的正確結(jié)論。 2.3 樣本均數(shù)與總體均數(shù)比較時(shí)樣本含量估計(jì)方法 可按下式估算所需樣本含量n。 n=[(α+β)σ/δ]^2 (公式4) 例4:已知血吸蟲病人血紅蛋白平均含量為90g/L,標(biāo)準(zhǔn)差為25g/L,現(xiàn)欲觀察呋喃丙胺治療后能否使血紅蛋白增加,事先規(guī)定血紅蛋白增加10g/L以上才能認(rèn)為有效,推斷結(jié)論犯Ⅰ類錯(cuò)誤的概率α(雙側(cè))不得超過0.05,犯Ⅱ類錯(cuò)誤的概率β不得超過0.10,問需觀察多少例病人? 本例δ=10g/L,σ=25g/L,0.05=1.96(雙側(cè)),0.10=1.282代入公式(4)得: n=[(1.960+1.282)×25/10]^2=66(例) 故如果呋喃丙胺確實(shí)能使血吸蟲病人血紅蛋白平均含量增加10g/L以上,則只需觀察66例就可以有90%的把握在α=0.05檢驗(yàn)水準(zhǔn)上得出有增加血吸蟲病人血紅蛋白平均含量的結(jié)論。 (摘自疑難病雜志網(wǎng)站)
|
|