名詞解釋?zhuān)?/p> 醫(yī)學(xué)統(tǒng)計(jì)學(xué):用統(tǒng)計(jì)學(xué)的原理和方法研究生物醫(yī)學(xué)問(wèn)題的一門(mén)學(xué)科。 變量(variable):觀察單位的某項(xiàng)特征如身高,體重,薪資,物價(jià), 變量值(value of variable):變量的觀察結(jié)果(測(cè)量值) 總體(population):是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,確切的說(shuō)是同質(zhì)的所有的觀察單位某種變量值的集合。 樣本(sample)從總體中隨機(jī)抽取部分由代表性的觀察單位,其測(cè)量值的集合稱(chēng)為樣本。 隨機(jī)抽樣(random sample):按隨機(jī)化原則從總體中抽取部分觀察單位的過(guò)程。 同質(zhì)(homogeneity):是針對(duì)被研究指標(biāo)來(lái)講,其影響因素相同。簡(jiǎn)單地理解就是指對(duì)研究指標(biāo)影響大約可以控制的主要因素應(yīng)盡可能相同。 變異(variation):指在自然地狀態(tài)下,個(gè)體測(cè)量結(jié)果在同質(zhì)基礎(chǔ)上的差異。 等級(jí)資料(ordinal data):將觀察單位按測(cè)量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位稱(chēng)為等級(jí)資料,如患者的治療結(jié)果可分為治愈,好轉(zhuǎn),有效,無(wú)效,死亡。有序變量(定性變量的一種)。 概率(probability):是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值,記為P(A),P(A)越大,說(shuō)明A事件發(fā)生的可能性越大,0<P(A)<1,小概率事件。 頻率(frequency):在相同的條件下,獨(dú)立重復(fù)做n次實(shí)驗(yàn),事件A出現(xiàn)了m次,比值m/n稱(chēng)為隨機(jī)事件A在n次實(shí)驗(yàn)中出現(xiàn)的頻率。 隨機(jī)誤差(random error):排除了系統(tǒng)誤差后的尚存的誤差,受多種因素影響,使觀察值不按照方向性和系統(tǒng)性而隨機(jī)的變化,誤差變量一般服從正態(tài)分布,可以通過(guò)統(tǒng)計(jì)處理來(lái)估計(jì)。 系統(tǒng)誤差(system error):由于受試對(duì)象,研究者,儀器設(shè)備,研究方法等非實(shí)驗(yàn)因素影響等確定性原因造成,有一定傾向性或規(guī)律性的誤差,可以避免。 隨機(jī)變量(random variable):是指取值不能事先確定的觀察結(jié)果,不能用一個(gè)正常數(shù)來(lái)表示,每個(gè)變量的取值服從特定的概率分布。 參數(shù)(parameter):根據(jù)總體分布特征而計(jì)算的總體統(tǒng)計(jì)指標(biāo)。 統(tǒng)計(jì)量(statistic):由總體中隨機(jī)抽取樣本而計(jì)算的相應(yīng)樣本指標(biāo)。 頻數(shù)表(frequency table):將各變量值及其相應(yīng)的頻數(shù)列出表格形式,用來(lái)表示一批數(shù)據(jù)各觀察值出現(xiàn)的頻繁程度。 算術(shù)均數(shù)(arithmetic mean):描述一組數(shù)據(jù)在數(shù)量上的平均水平??傮w均數(shù)用μ表示,樣本均數(shù)用表示。 幾何均數(shù)(geometric mean):描述對(duì)數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平,記為G. 中位數(shù)(median),將一組觀察值由小到大排列,n為奇數(shù)時(shí)取位次居中的變量值,為偶數(shù)時(shí),取位次居中的兩個(gè)變量的平均值。 極差(range):又稱(chēng)全距,為最大值與最小值之差,用于資料的粗略分析,計(jì)算簡(jiǎn)便但穩(wěn)定性較差。符號(hào)R. 百分位數(shù)(percentile):將n個(gè)觀察值從小到大依次排列,再把它們的位次轉(zhuǎn)化為百分位。 四分位數(shù)間距(inter quarnle range):表示百分位數(shù)P75和百分位數(shù)P25之差,定義為Q=P75-P25.。 方差(variance):表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個(gè)數(shù)得到。 標(biāo)準(zhǔn)差(standard deviation):是描述反映正態(tài)分布計(jì)量資料離散程度的指標(biāo)。是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大小樣本均可,最為常用。 變異系數(shù)(coefficient of variation):用于量綱不同和變量間或均數(shù)相差較大的變量間變異程度的比較,其計(jì)算公式為: CV= 正態(tài)曲線(normal curve)是函數(shù)f(X)= 對(duì)應(yīng)的曲線,此曲線是一條高峰位于中央,兩側(cè)逐漸下降并完全對(duì)稱(chēng),曲線兩端永遠(yuǎn)不與橫軸相交的鐘形曲線。 正態(tài)分布(normal distribution):若指標(biāo)X的頻率曲線對(duì)應(yīng)于正態(tài)曲線,則稱(chēng)該指標(biāo)服從正態(tài)分布,通常用記號(hào)N(μ,σ2)表示均數(shù)為標(biāo)準(zhǔn)差為的正態(tài)分布。 標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution):均數(shù)為0標(biāo)準(zhǔn)差為1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布,記為N(0,1). 標(biāo)準(zhǔn)化轉(zhuǎn)換(standardized transformation):若隨機(jī)變量X服從正態(tài)分布N(μ,σ2),經(jīng)過(guò)標(biāo)準(zhǔn)化轉(zhuǎn)換Z=,就服從標(biāo)準(zhǔn)正態(tài)分布。 統(tǒng)計(jì)推斷(statistical inference):通過(guò)樣本指標(biāo)來(lái)說(shuō)明總體特征,這種從樣本獲取有關(guān)總體信息的過(guò)程為統(tǒng)計(jì)推斷。 抽樣誤差(sampling error):由個(gè)體差異產(chǎn)生,由于抽樣而造成的樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱(chēng)為抽樣誤差,無(wú)傾向性,不可避免。 均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean SEM):用于表示均數(shù)抽樣誤差的指標(biāo),反映樣本均數(shù)之間的離散程度和樣本均數(shù)抽樣誤差的大小。 可信區(qū)間(confidence interval CI):為按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍,含義是包含總體參數(shù)的可能性是1-a。 自由度:n個(gè)變量中,可自由取值的變量的個(gè)數(shù)。 參數(shù)估計(jì):用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù)),有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。 假設(shè)檢驗(yàn)中P的含義:指從H0規(guī)定的總體隨機(jī)抽得的等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。 I類(lèi)錯(cuò)誤:拒絕了實(shí)際上成立的H0這類(lèi)棄真的錯(cuò)誤稱(chēng)為I類(lèi)錯(cuò)誤,概率大小用alfa α表示。 對(duì)的卻錯(cuò)殺 II類(lèi)錯(cuò)誤:接受了實(shí)際上不成立的H0這類(lèi)存?zhèn)蔚腻e(cuò)誤稱(chēng)為II類(lèi)錯(cuò)誤,概率大小用β表示。 錯(cuò)的卻留者 檢驗(yàn)效能:是指當(dāng)兩總體確有差別,按規(guī)定的檢驗(yàn)水準(zhǔn)所能發(fā)現(xiàn)該差異的能力。數(shù)值表示:1-β 檢驗(yàn)水準(zhǔn):是預(yù)先規(guī)定的,當(dāng)假設(shè)檢驗(yàn)結(jié)果拒絕H0接受H1下有差別的結(jié)論時(shí)犯錯(cuò)誤的概率稱(chēng)為檢驗(yàn)水準(zhǔn),記為α 均方:有離均差平方和被自由度相除而得。 方差分析:根據(jù)資料的設(shè)計(jì)類(lèi)型,即變異的不同來(lái)源將全部觀察值總的離均差平方和與自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余每個(gè)部分的變異可由某個(gè)或某幾個(gè)因素的作用加以解釋?zhuān)ㄟ^(guò)各變異來(lái)源地均方與誤差均方比值的大小,借助F分布做出統(tǒng)計(jì)推斷,判斷各因素對(duì)觀測(cè)指標(biāo)有無(wú)影響。 總變異:樣本中全部實(shí)驗(yàn)單位差異稱(chēng)為總變異,其大小可用全部觀察值的均方表示。 組間變異:各處理組間觀察值大小不等,這種變異稱(chēng)為組間變異,可用組間均方表示。 組內(nèi)變異:各處理組內(nèi)部觀察值大小不等,這種變異稱(chēng)為組內(nèi)變異,可用組內(nèi)均方表示。 完全隨機(jī)設(shè)計(jì):只考慮一個(gè)處理因素,將全部受試對(duì)象隨機(jī)分配到各處理組,然后觀察實(shí)驗(yàn)效應(yīng)。 隨機(jī)區(qū)組設(shè)計(jì):事先將全部受試對(duì)象按自然屬性分為若干區(qū)組,原則是各區(qū)組內(nèi)的受試對(duì)象的特征相同或相近,且受試對(duì)象數(shù)與處理因素的水平相等,然后將每個(gè)區(qū)組內(nèi)的觀察對(duì)象隨機(jī)地分配到各處理組。 相對(duì)數(shù):是兩個(gè)有聯(lián)系的指標(biāo)之比,是分類(lèi)變量常用的描述性統(tǒng)計(jì)指標(biāo),常用相對(duì)數(shù)有“率,構(gòu)成比,比”等。 率:頻率指標(biāo),說(shuō)明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度,計(jì)算公式為發(fā)生某現(xiàn)象的觀察單位數(shù)除以可能發(fā)生某現(xiàn)象的觀察總體值*100% 表示方式有百分率%,千分率。 構(gòu)成比:構(gòu)成指標(biāo)。說(shuō)明某一事物內(nèi)部的各組成部分所占的比重或分布,計(jì)算公式為:某一組分的觀察單位數(shù)除以同一事物各組分的觀察單位總數(shù)*100%,表示方法有百分?jǐn)?shù)等。 比相對(duì)比。是AB兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明A是B的若干倍或百分之幾,計(jì)算公式為比等于。 標(biāo)準(zhǔn)化法:常用于內(nèi)部構(gòu)成不同的兩個(gè)或多個(gè)率比較的一種方法,基本思想是指定一個(gè)統(tǒng)計(jì)標(biāo)準(zhǔn),按指定標(biāo)準(zhǔn)計(jì)算調(diào)制率,使之具備可比性以后再比較,以消除由于內(nèi)部構(gòu)成不同對(duì)總率比較帶來(lái)的影響。 定基比:統(tǒng)一用某個(gè)時(shí)間的指標(biāo)作為基數(shù),其它各時(shí)間的指標(biāo)與之相比。 環(huán)比:以前一個(gè)時(shí)間的指標(biāo)作基數(shù),以相鄰的后一個(gè)時(shí)間的指標(biāo)與之相比。 平均增長(zhǎng)速度:用于概括某一時(shí)期的平均速度變化,即該時(shí)期環(huán)比的幾何均數(shù)減1。計(jì)算公式為平均增長(zhǎng)速度=平均發(fā)展速度-1= 粗死亡率(crude death rate CDR):或死亡率(mortality rate),指某地某年平均每千人口中的死亡數(shù),它反映居民總的死亡水平。 發(fā)病率(incidence rate IR):表示一定時(shí)期內(nèi),可能發(fā)生某病的一定人群中新發(fā)生某病的強(qiáng)度。 患病率(prevalence rate PR):又稱(chēng)現(xiàn)患率,指某時(shí)刻點(diǎn)上受檢人群中現(xiàn)患某種疾病的頻率,通常用于描述病程較長(zhǎng)或發(fā)病時(shí)間不明確的疾病的患病情況。 動(dòng)態(tài)數(shù)列(dynamic series)按一定的時(shí)間順序,將一系列描述事物的統(tǒng)計(jì)指標(biāo)依次排列起來(lái),就可以觀察和比較該事物在時(shí)間上的變化和發(fā)展趨勢(shì)。 標(biāo)化死亡率(standardized mortality rate SMR):尋找一個(gè)統(tǒng)一的分布作為標(biāo)準(zhǔn)組,然后每個(gè)比較組均按照該分布標(biāo)準(zhǔn)計(jì)算相應(yīng)的死亡率,所得到的死亡率是相對(duì)于標(biāo)準(zhǔn)組的,故稱(chēng)為標(biāo)化死亡率,由于采取了統(tǒng)一的標(biāo)準(zhǔn),消除了內(nèi)部分布不同對(duì)總死亡率的影響,使算得的標(biāo)化死亡率具有可比性。 二項(xiàng)分布(Binomial distribution):如果每一次實(shí)驗(yàn)只有陽(yáng)性或陰性兩種可能的結(jié)果,每次實(shí)驗(yàn)陽(yáng)性結(jié)果的發(fā)生概率均為π,陰性結(jié)果均為1-π,每次實(shí)驗(yàn)結(jié)果是相互獨(dú)立的,那么重復(fù)n次實(shí)驗(yàn),發(fā)生陽(yáng)性結(jié)果次數(shù)X的概率分布稱(chēng)為二項(xiàng)分布。 擬合優(yōu)度:指一種度量某事物的頻數(shù)分布是否符合某一理論分布或數(shù)據(jù)是否與模型吻合的方法。 非參數(shù)統(tǒng)計(jì):不依賴(lài)于總體分布類(lèi)型,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn)。 參數(shù)統(tǒng)計(jì):通常要求樣本來(lái)自總體分布型是已知的,在這種假設(shè)的基礎(chǔ)上,對(duì)總體參數(shù)進(jìn)行估計(jì)和檢驗(yàn)。 秩次:變量值按從小到大順序所編的秩序號(hào)。 秩和:各組秩次的合計(jì)稱(chēng)為秩和,是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。 直線回歸:建立一個(gè)描述應(yīng)變量依自變量而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。 回歸系數(shù):即直線的斜率,直線回歸方程中用b表示,其統(tǒng)計(jì)意義為X每增減一個(gè)單位,Y平均改變b個(gè)單位。 直線相關(guān):用于雙變量正態(tài)分布資料,有正相關(guān),負(fù)相關(guān)和零相關(guān)等關(guān)系。零相關(guān)表示兩變量之間美歐直線相關(guān)系數(shù)。 相關(guān)系數(shù)或積差相關(guān)系數(shù):以符號(hào)γ表示樣本相關(guān)系數(shù),p表示總體相關(guān)系數(shù),它是說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。 秩相關(guān)或等級(jí)相關(guān):用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析,適用于1,不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析,2,總體分布型未知,3,用等級(jí)表示原始數(shù)據(jù)。 統(tǒng)計(jì)圖:將統(tǒng)計(jì)指標(biāo)用幾何圖形表達(dá),即以點(diǎn)的位置,線段的升降,直條的長(zhǎng)短和面積的大小等形式直觀的表示事物間的數(shù)量關(guān)系。 安慰劑對(duì)照:在實(shí)驗(yàn)研究中,對(duì)照組使用一種外形與實(shí)驗(yàn)藥物完全相同而毫無(wú)藥理作用的物質(zhì),這種對(duì)照稱(chēng)為安慰劑對(duì)照。 隨機(jī)化:指研究對(duì)象中或總體中每一個(gè)觀察單位都有同等的機(jī)會(huì)被選入樣本或?qū)嶒?yàn)研究的各處理組中。 混雜因素:指實(shí)驗(yàn)研究中由于某些非實(shí)驗(yàn)因素與實(shí)驗(yàn)因素同時(shí)并存的作用影響到觀察的結(jié)果,這種非實(shí)驗(yàn)因素稱(chēng)為混雜因素。 偏倚:指在實(shí)驗(yàn)中由于某些非實(shí)驗(yàn)因素的干擾而形成的系統(tǒng)誤差,歪曲了處理因素的真實(shí)效應(yīng)。 實(shí)驗(yàn)研究:是指研究者根據(jù)研究目的主動(dòng)加以干預(yù)措施,并觀察總結(jié)結(jié)果,回答假設(shè)研究所提出的問(wèn)題的一種研究方法。 調(diào)查研究:是指對(duì)特定對(duì)象群體進(jìn)行調(diào)查,影響被調(diào)查的因素是客觀存在的,研究者只能被動(dòng)地觀察和如實(shí)記錄。調(diào)查時(shí)的研究條件往往難以控制,一般只有通過(guò)合理分組,設(shè)置對(duì)照等手段盡可能的減少干擾。 簡(jiǎn)答 1, 統(tǒng)計(jì)工作的步驟:統(tǒng)計(jì)工作全過(guò)程可分為:統(tǒng)計(jì)設(shè)計(jì),搜集資料,整理資料和分析資料四個(gè)步驟。它們相互聯(lián)系,缺一不可。 設(shè)計(jì):是整個(gè)統(tǒng)計(jì)研究實(shí)施的依據(jù),是最關(guān)鍵的一環(huán),在設(shè)計(jì)時(shí)應(yīng)對(duì)后三個(gè)步驟進(jìn)行周密的設(shè)想和安排。 搜集資料:是統(tǒng)計(jì)工作的基礎(chǔ)。是根據(jù)設(shè)計(jì)取得準(zhǔn)確可靠地原始數(shù)據(jù),按其來(lái)源時(shí)間分為經(jīng)常性資料和一時(shí)性資料。資料要求完整,準(zhǔn)確和及時(shí)。 整理資料:對(duì)原始資料進(jìn)行審核、校正、整理并使之系統(tǒng)化、條理化,便于統(tǒng)計(jì)分析。 分析資料:計(jì)算統(tǒng)計(jì)指標(biāo),反映數(shù)據(jù)的綜合特征,闡明事物內(nèi)在的聯(lián)系和規(guī)律,得出科學(xué)結(jié)論,統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷。 2, 制作頻數(shù)表的步驟:求全距,定組段數(shù)和組距;劃組段;繪制整理表。 3, 頻數(shù)表的用途:解釋頻數(shù)的分布特征和類(lèi)型:便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析處理;便于發(fā)現(xiàn)某些特大或特小的可疑值。 4, 標(biāo)準(zhǔn)差的用途:表示觀察值得平均離散程度:結(jié)合均數(shù)可疑描述正態(tài)資料頻數(shù)分布的特征和估計(jì)醫(yī)學(xué)參考值范圍:結(jié)合樣本均數(shù)可疑計(jì)算變異系數(shù);結(jié)合樣本含量可疑計(jì)算標(biāo)準(zhǔn)誤。 5, 變異系數(shù)的應(yīng)用:比較度量衡單位不同的多組資料的變異度:比較均數(shù)相差懸殊的多組資料的變異度。 6, 正態(tài)分布的特征:以μ為中心,左右對(duì)稱(chēng),均數(shù)處于曲線最高,兩邊逐漸下降;正態(tài)分布曲線下面積分分布有一定規(guī)律:有兩個(gè)參數(shù)μ和σ,位置參數(shù)μ和變異參數(shù)σ決定了曲線的變異度和位置。 7, 正態(tài)分布的應(yīng)用:估計(jì)頻數(shù)分布:制定醫(yī)學(xué)參考值范圍;做質(zhì)量控制 8, 標(biāo)準(zhǔn)誤的用途:反映了樣本均數(shù)間的離散程度及樣本均數(shù)抽樣誤差的大小;推算可信區(qū)間;進(jìn)行假設(shè)檢驗(yàn)。 9, t分布的特征:?jiǎn)畏宸植?,以O(shè)位中心,左右對(duì)稱(chēng),類(lèi)似于標(biāo)準(zhǔn)正態(tài)分布;t分布形狀與n有關(guān),自由度越小,標(biāo)準(zhǔn)誤越大,t值越分散,曲峰越矮,尾翹越高;n趨于無(wú)窮時(shí),樣本標(biāo)準(zhǔn)差逼近總體標(biāo)準(zhǔn)差,t分布逼近標(biāo)準(zhǔn)正態(tài)分布,t分布不是一條曲線,而是一簇曲線。 10, 假設(shè)檢驗(yàn)的基本思想:基于反證法思想和小概率思想。反證法思想:首先提出假設(shè),用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如果可能性小,則認(rèn)為假設(shè)不成立,拒絕它,如果可能性大,還不能認(rèn)為它不成立;小概率思想:是指小概率事件在一次隨機(jī)實(shí)驗(yàn)中認(rèn)為基本上不會(huì)發(fā)生,在進(jìn)行統(tǒng)計(jì)分析時(shí)要事先規(guī)定概率,即檢驗(yàn)水準(zhǔn)a 11, 假設(shè)檢驗(yàn)的基本步驟:建立假設(shè);確定檢驗(yàn)水準(zhǔn);選定檢驗(yàn)方法;計(jì)算檢驗(yàn)統(tǒng)計(jì)量;確定P值,做出推斷結(jié)論。 12, t檢驗(yàn)的應(yīng)用條件:當(dāng)樣本含量較小時(shí),理論上要求樣本取自正態(tài)總體,兩樣本均數(shù)比較時(shí)還要求兩樣本方差相等,(u檢驗(yàn)應(yīng)用條件:樣本含量較大,或n雖小但總體標(biāo)準(zhǔn)差已知)。 13, 配對(duì)設(shè)計(jì)的幾種情形:兩個(gè)同質(zhì)受試對(duì)象分別接受兩種不同的處理;同一受試對(duì)象分別接受兩種不同的處理;同一受試對(duì)象處理前后 14, 配對(duì)t檢驗(yàn)的基本原理:設(shè)兩種處理的效應(yīng)相同,即u1=u2,即看成是差值的樣本均數(shù)d所代表的未知總體均數(shù)與已知總體均數(shù)的比較 15, 假設(shè)檢驗(yàn)注意的問(wèn)題:要有嚴(yán)密的研究設(shè)計(jì):不同變量或資料選用不同的檢驗(yàn)方法;正確理解顯著性一詞的含義;做結(jié)論不能絕對(duì)化;統(tǒng)計(jì)顯著性對(duì)應(yīng)于統(tǒng)計(jì)結(jié)論,醫(yī)學(xué)臨床生物學(xué)顯著性對(duì)應(yīng)于專(zhuān)業(yè)結(jié)論。 16, 參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的區(qū)別及各自優(yōu)缺點(diǎn): 參數(shù)檢驗(yàn):以已知分布為假設(shè)條件,對(duì)總體參數(shù)進(jìn)行估計(jì)或檢驗(yàn); 非參數(shù)檢驗(yàn):不依賴(lài)總體分布的具體形式和檢驗(yàn)分布是否相同。參數(shù)檢驗(yàn)優(yōu)點(diǎn)是符合條件時(shí)檢驗(yàn)效率高,缺點(diǎn)是對(duì)資料要求嚴(yán)格而且要求資料的分布型已知和總體方差相等。 非參數(shù)檢驗(yàn)優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單便于掌握;應(yīng)用廣泛;收集資料方便,缺點(diǎn)是容易損失信息。檢驗(yàn)效率低。 17, 可信區(qū)間與假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系:可信區(qū)間用于說(shuō)明量的大小即推斷總體均數(shù)的范圍,而假設(shè)檢驗(yàn)用于推斷質(zhì)的不同即判斷兩總體均數(shù)是否不同,兩者相互聯(lián)系又相互區(qū)別;可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題;可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息,但并不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn);可信區(qū)間只能在預(yù)先規(guī)定的概率——檢驗(yàn)水準(zhǔn)的前提下進(jìn)行計(jì)算,而假設(shè)檢驗(yàn)?zāi)軌颢@得較為確切的P值,故兩者結(jié)合起來(lái)次才是完整的分析。 18, 方差分析的基本思想:根據(jù)資料的設(shè)計(jì)類(lèi)型,即變異的不同來(lái)源將全部觀察值總的離均差平方和和自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余每個(gè)部分的變異可由某個(gè)或幾個(gè)因素的作用加以解釋?zhuān)ㄟ^(guò)比較不同變異來(lái)源地均方,借助F分布做出統(tǒng)計(jì)推斷,從而了解該因素對(duì)觀測(cè)指標(biāo)有無(wú)影響。 19, 方差分析的應(yīng)用條件:1各次觀察獨(dú)立,即任何兩個(gè)觀察值之間均不相關(guān),2同一水平下的觀察值Xij分別服從總體均數(shù)μ的正態(tài)分布。3各總體的方差基本相等,概括的表達(dá)為:任何觀察值都是獨(dú)立的來(lái)自于具有等方差的正態(tài)總體。 20, 應(yīng)用相對(duì)數(shù)的注意事項(xiàng):計(jì)算相對(duì)數(shù)的分母一般不宜過(guò)?。环治鍪遣荒芤詷?gòu)成比代替率,應(yīng)當(dāng)注意不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析;對(duì)觀察單位不等的幾個(gè)率,不能直接相加求其總率,在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性;對(duì)樣本率(構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。 21, 四格表2檢驗(yàn)的適用條件:1,當(dāng)n>=40且所有T>=5時(shí),用普通的2檢驗(yàn),若所得的P約等于0時(shí),改用確切概率法,2,當(dāng)n>=40但1<=T<=5時(shí),用校正2檢驗(yàn);3當(dāng)n<40或T<1時(shí),不能用2檢驗(yàn),改用確切概率法。 22, 秩和檢驗(yàn)的基本思想:假定從一總體中,隨機(jī)抽取一個(gè)樣本,可以求出T+和T-,當(dāng)重復(fù)所有可能組合的樣本,得T+和T-的分布,T的分布以均數(shù)為中心對(duì)稱(chēng)的非連續(xù)分布,當(dāng)H0成立,從總體隨機(jī)抽取任一樣本,所得T值在均數(shù)附近的概率最大,當(dāng)T值遠(yuǎn)離均數(shù)概率較小,隨著n增大,T的分布逐漸逼近均數(shù)n(n+1)/4,方差n(n+1)(2n+1)/24的正態(tài)分布,當(dāng)n<25時(shí),T的分布已較好地近似正態(tài)分布。 23, 成組設(shè)計(jì)兩個(gè)樣本比較的秩和檢驗(yàn)的基本思想n1和n2兩個(gè)樣本,來(lái)自同一總體和分布相同的兩個(gè)總體,即假設(shè)檢驗(yàn)H0成立,則n1樣本的秩和T與平均秩和n1(N+1)/2一般相差不大,也就是u值小于u,若T與平均秩和n1(N+1)/2相差很大,則表示籌得的樣本統(tǒng)計(jì)量T值的概率很小,因而拒絕檢驗(yàn)假設(shè)H0。 24, 直線回歸方程的應(yīng)用:描述兩變量的依存關(guān)系;利用回歸方程進(jìn)行預(yù)測(cè);利用回歸方程進(jìn)行統(tǒng)計(jì)控制。 25, 應(yīng)用直線回歸應(yīng)注意的問(wèn)題:做回歸分析要有實(shí)際意義,不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象勉強(qiáng)做回歸分析,即使有回歸關(guān)系也不一定是因果關(guān)系,還必須對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認(rèn)識(shí),能從專(zhuān)業(yè)理論上做出合理解釋或有所依據(jù),在進(jìn)行直線回歸分析前,應(yīng)繪制散點(diǎn)圖,當(dāng)觀察點(diǎn)的分布有直線趨勢(shì),才適宜直線回歸分析;直線回歸方程的適用范圍一般以自便量的取值為限,不能任意外延。 26, 直線回歸與相關(guān)的區(qū)別 1資料要求不同:回歸要求變量Y服從正態(tài)分布,X是可以精確測(cè)量和嚴(yán)格控制的變量,相關(guān)要求兩個(gè)變量X,Y服從雙變量正態(tài)分布, 2應(yīng)用情況不同:說(shuō)明兩變量間依存變化的數(shù)量關(guān)系用回歸,說(shuō)明變量間的相關(guān)關(guān)系用相關(guān) 3,意義不同:回歸系數(shù)b表示自變量X每變化一個(gè)單位后應(yīng)變量Y的平均變化量,相關(guān)系數(shù)r表示兩變量相關(guān)的方向和密切程度 4取值范圍不同:-1<=r<=1;b負(fù)無(wú)窮到正無(wú)窮大。 5單位不同,回歸系數(shù)b有單位,相關(guān)系數(shù)r沒(méi)單位。 27, 直線回歸與相關(guān)的聯(lián)系: 1兩者都是研究?jī)蓚€(gè)數(shù)值變量的關(guān)系的統(tǒng)計(jì)方法, 2方向一致:對(duì)一組數(shù)據(jù)若同時(shí)計(jì)算r與b,他們的正負(fù)號(hào)一致,r為正說(shuō)明兩變量間的相互關(guān)系是同向變化的,b為正號(hào)說(shuō)明X增減一個(gè)單位,Y平均增減b個(gè)單位, 3假設(shè)檢驗(yàn)對(duì)同一樣本,r與b的假設(shè)檢驗(yàn)得到的t值相等,由于r的假設(shè)檢驗(yàn)簡(jiǎn)單,故在實(shí)際應(yīng)用中常用以前法代替后法, 4用回歸解釋相關(guān),決定系數(shù)P2=SS回/SS總,回歸平方和越接近總平方和,R2越接近1。 28, 列表的原則 1重點(diǎn)突出,簡(jiǎn)單明了 2主次分明,層次清楚,符合邏輯。 29, 列表的基本要求 1標(biāo)題,概括表的內(nèi)容,寫(xiě)于表的正上方中央,必要時(shí)注明時(shí)間地點(diǎn)。主要內(nèi)容 2標(biāo)目 以橫縱向標(biāo)目分別說(shuō)明主語(yǔ)與謂語(yǔ),文字簡(jiǎn)明,層次清楚,有單位用() 3,線條 用三線條表示,粗略的頂端線及縱標(biāo)下的橫線,其余一律省去, 4數(shù)字 以阿拉伯?dāng)?shù)字表示,暫缺或無(wú)數(shù)字分別以“”、“——”表示,不應(yīng)有空項(xiàng),為核實(shí)與分析,表常應(yīng)有合計(jì)。 5不列備注,必要說(shuō)明者表*,于表下方說(shuō)明。 30, 實(shí)驗(yàn)的基本原則 隨機(jī)化,對(duì)照,重復(fù)。 31, 對(duì)照的種類(lèi):空白,安慰劑,自身,實(shí)驗(yàn),標(biāo)準(zhǔn) 32, 實(shí)驗(yàn)設(shè)計(jì)的基本步驟:建立研究假設(shè),明確研究范圍,確立處理因素,明確觀察指標(biāo),控制誤差和偏倚。 33, 常用的實(shí)驗(yàn)設(shè)計(jì)方法:完全隨機(jī)設(shè)計(jì),配對(duì)設(shè)計(jì),交叉設(shè)計(jì),隨機(jī)區(qū)組設(shè)計(jì),析因設(shè)計(jì)。 34, 確定樣本含量時(shí)應(yīng)具備的條件:建立假設(shè)檢驗(yàn),定出檢驗(yàn)水準(zhǔn),提出所期望的檢驗(yàn)效能,必須知道有樣本推斷總體的一些信息。 35, 常用的估計(jì)樣本含量的方法:兩樣本均數(shù)比較,配對(duì)實(shí)驗(yàn)和交叉試驗(yàn),樣本均數(shù)與總體均數(shù)的比較,兩樣本率的比較,配對(duì)分類(lèi)資料多用X2檢驗(yàn)進(jìn)行處理,估計(jì)總體均數(shù)的樣本含量,估計(jì)總體率的樣本含量。 36, 實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì)的主要區(qū)別: 調(diào)查設(shè)計(jì) 1在研究過(guò)程中沒(méi)有人為施加的干預(yù)措施,而是客觀的觀察記錄某些現(xiàn)象的現(xiàn)狀及其相關(guān)特征, 2不能采用隨機(jī)分配的方法來(lái)平衡或消除非研究因素對(duì)研究結(jié)果的影響; 實(shí)驗(yàn)設(shè)計(jì) 1研究者根據(jù)研究目的主動(dòng)加以干預(yù)措施,并觀察總結(jié)其結(jié)果,回答研究假設(shè)所提出的問(wèn)題, 2按隨機(jī)分配的方法去除混雜因素。 37, 標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別與聯(lián)系 區(qū)別 1概念不同:標(biāo)準(zhǔn)差是描述樣本中個(gè)體值間的變異程度指標(biāo),標(biāo)準(zhǔn)差越小,表示變量值圍繞均數(shù)波動(dòng)越小,標(biāo)準(zhǔn)誤是描述樣本均數(shù)間的變異程度指標(biāo),標(biāo)準(zhǔn)差越小,表示變量值圍繞均數(shù)波動(dòng)越小。 2用途不同:標(biāo)準(zhǔn)差用于表示變量值對(duì)均數(shù)波動(dòng)的大小,當(dāng)資料呈正態(tài)分布時(shí),與均數(shù)結(jié)合可估計(jì)正常值范圍,計(jì)算變異系數(shù)等,標(biāo)準(zhǔn)誤常用于表示樣本統(tǒng)計(jì)量和總體參數(shù)的波動(dòng)情況,可估計(jì)參數(shù)可信區(qū)間進(jìn)行假設(shè)檢驗(yàn)。 3與例數(shù)的關(guān)系不同,當(dāng)樣本含量足夠大時(shí),標(biāo)準(zhǔn)差趨向穩(wěn)定,而標(biāo)準(zhǔn)誤隨例數(shù)增大而減小,甚至趨向于0,若樣本含量趨向于總例數(shù),標(biāo)準(zhǔn)差趨近于0或更高。 38, 非參數(shù)檢驗(yàn)的適應(yīng)情況:1分布型未知,2能以嚴(yán)重程度,優(yōu)劣等級(jí),效果大小和名次先后等劃分的等級(jí)資料。3分布極度偏態(tài)。4本組內(nèi)個(gè)別變量偏離越大,遠(yuǎn)離本組其他變量值,5,方差不齊時(shí),6篩選或只需獲得初步結(jié)果。 39, 如何正確選用單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn):?jiǎn)蝹?cè)檢驗(yàn)首先應(yīng)根據(jù)專(zhuān)業(yè)知識(shí)來(lái)確定,同時(shí)也應(yīng)考慮所要解決問(wèn)題的目的,若從轉(zhuǎn)押知識(shí)判斷一種方法的結(jié)果可能低于或高于另一種方法的結(jié)果,則用單側(cè)檢驗(yàn);在尚不能從專(zhuān)業(yè)知識(shí)判斷兩種結(jié)果高低時(shí),用雙側(cè)檢驗(yàn),若研究者對(duì)于低于或高于兩種結(jié)果都關(guān)心時(shí),則用雙側(cè)檢驗(yàn),若只關(guān)心其中一種可能,則取單側(cè)檢驗(yàn),一般認(rèn)為雙側(cè)檢驗(yàn)較保守和穩(wěn)妥,單側(cè)檢驗(yàn)由于充分利用了另一側(cè)的不可能性,更易得出有差別的結(jié)論,但應(yīng)慎用。 40, 配對(duì)t檢驗(yàn)與配伍組設(shè)計(jì)的方差分析之間有何聯(lián)系??jī)蓸颖総檢驗(yàn)與完全隨機(jī)設(shè)計(jì)的方差分析有何聯(lián)系? 配伍組設(shè)計(jì)的方差分析是配對(duì)t檢驗(yàn)的推廣,他們的基本原理相同。完全隨機(jī)設(shè)計(jì)的方差分析是兩樣本t檢驗(yàn)的推廣,他們的基本原理相同。不管是配伍組設(shè)計(jì)害死完全隨機(jī)設(shè)計(jì),當(dāng)對(duì)比樣本為兩組,可用t檢驗(yàn)也可以用方差分析,他們是等價(jià)的,當(dāng)對(duì)比樣本在兩組以上只能用方差分析。 41, P 0.05拒絕H0的理論根據(jù)。P值是指從H0規(guī)定的總體隨機(jī)抽取等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量的概率,P 0.05,說(shuō)明在H0成立的條件下,得到現(xiàn)有檢驗(yàn)結(jié)果的概率小于小概率事件標(biāo)準(zhǔn)0.05.因小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生,現(xiàn)的確發(fā)生了,說(shuō)明樣本信息不支持H0,所以懷疑假設(shè)H0不成立,故拒絕H0。 42, 配對(duì)比較的假設(shè)檢驗(yàn),能否出現(xiàn)t檢驗(yàn)結(jié)果P>0.05,而非參數(shù)檢驗(yàn)結(jié)果P<0.05? 答:可能出現(xiàn)。配對(duì)t檢驗(yàn)的統(tǒng)計(jì)量t=,式中d為差值均數(shù),當(dāng)Sd固定時(shí),t的大小取決于d,差值均數(shù)小,t值就小,表明每個(gè)對(duì)子是接近的,故檢驗(yàn)結(jié)果為P>0.05。推斷兩總體差值為0的假設(shè)未能拒絕,在參數(shù)檢驗(yàn)中,綜合了差數(shù)大小與方向的全部信息,差數(shù)大小更能提供兩組數(shù)據(jù)之差有無(wú)實(shí)際意義的信息,而配對(duì)秩和檢驗(yàn)更側(cè)重方向的作用,設(shè)想當(dāng)n對(duì)差數(shù)全部為正號(hào)時(shí),盡管兩組數(shù)據(jù)非常接近,也會(huì)出現(xiàn)T+很大,T-為零的局面,即P<0.05的結(jié)果,這種局面雖然可以出現(xiàn),但隨n的增大,如果H0為真,則差數(shù)的方向是隨機(jī)出現(xiàn)的,故T+和T-一般相差不大,其檢驗(yàn)結(jié)果與參數(shù)檢驗(yàn)結(jié)果多數(shù)情況下還是一致的。 43, 參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)所得結(jié)果不一致,以何為準(zhǔn)? 僅供參考 第一章 緒論 統(tǒng)計(jì)學(xué)(statistics),是研究數(shù)據(jù)的收集、整理、分析的一門(mén)科學(xué),幫助人們分析占有信息。達(dá)到去偽存真、去粗存精、爭(zhēng)取認(rèn)識(shí)世界的一種重要手段。 衛(wèi)生統(tǒng)計(jì)學(xué)(health statistics):是研究居民健康狀況以及衛(wèi)生服務(wù)領(lǐng)域中數(shù)據(jù)的收集、整理和分析的一門(mén)科學(xué)。 統(tǒng)計(jì)描述(descriptive statistics)用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對(duì)資料的數(shù)量特征及其分布規(guī)律進(jìn)行滴定和描述。 統(tǒng)計(jì)推斷(statistical inference):通過(guò)樣本指標(biāo)來(lái)說(shuō)明總體特征,從樣本獲取有關(guān)總體信息的過(guò)程 總體(population):是根據(jù)研究目的確定的同質(zhì)觀察單位的全體。 樣本(sample)從總體中隨機(jī)抽取部分由代表性的觀察單位,其測(cè)量值的集合稱(chēng)為樣本。 變量(variable):在確定總體之后,研究者則應(yīng)對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量和觀察,這種特征稱(chēng)為變量。 變異(variation):指在自然地狀態(tài)下,個(gè)體測(cè)量結(jié)果在同質(zhì)基礎(chǔ)上的差異。 隨機(jī)抽樣(random sample):按隨機(jī)化原則從總體中抽取部分觀察單位的過(guò)程。以避免誤差和偏倚對(duì)研究結(jié)果有所影響。 樣本含量或樣本大?。╯ample size):樣本包含的觀察單位數(shù)稱(chēng)為樣本含量,醫(yī)學(xué)上也稱(chēng)為樣本例數(shù)。 定量資料(quantitative data)是測(cè)量每個(gè)觀察單位某項(xiàng)指標(biāo)大小所得到的資料,一般均有度量衡單位。 分類(lèi)資料(categorical data):觀察值是定性的,表現(xiàn)為互不相容的類(lèi)別或?qū)傩浴?/p> 有序分類(lèi)(ordinal categories):各類(lèi)之間有程度的差別,給人以“半定量”的概念。 概率(probability):是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值,記為P(A),P(A)越大,說(shuō)明A事件發(fā)生的可能性越大,0<P(A)<1,小概率事件。 統(tǒng)計(jì)工作的步驟:設(shè)計(jì)(design),收集資料(collection),整理資料(sorting data),分析資料(analysis of data)(統(tǒng)計(jì)描述descriptive statistics)、統(tǒng)計(jì)推斷(inferential statistics) 第二章 定量資料的統(tǒng)計(jì)描述 對(duì)稱(chēng)分布:是指集中位置在中間,左右兩側(cè)頻數(shù)大體對(duì)稱(chēng)。 偏態(tài)分布:指集中位置偏向一側(cè),頻數(shù)分布不對(duì)稱(chēng),分為正偏態(tài)和負(fù)偏態(tài)。 均數(shù)(mean):描述一組數(shù)據(jù)在數(shù)量上的平均水平,適用于對(duì)稱(chēng)分布,特別是正態(tài)或者近似正態(tài)分布的定量資料。 中位數(shù)(median),是指將一組觀察值從小到大排列后,居于中間位置的那個(gè)數(shù)值。將一組觀察值由小到大排列,n為奇數(shù)時(shí)取位次居中的變量值,為偶數(shù)時(shí),取位次居中的兩個(gè)變量的平均值。 極差(range):是全部數(shù)據(jù)中最大值與最小值之差,它描述了數(shù)據(jù)變異的程度。又稱(chēng)全距,為最大值與最小值之差,用于資料的粗略分析,計(jì)算簡(jiǎn)便但穩(wěn)定性較差。符號(hào)R. 標(biāo)準(zhǔn)差:反映定量資料離散趨勢(shì)的指標(biāo),它能反映每一個(gè)變量值與均值的平均的離散程度,S越小,變量值與均值離散程度越小,均數(shù)代表性越好。 變異系數(shù)(coefficient of variation CV):標(biāo)準(zhǔn)差與算術(shù)均數(shù)的比值。 頻數(shù)分布表的用途: 1揭示資料的分布類(lèi)型 2由頻數(shù)分布表可以看到頻數(shù)分布的兩個(gè)重要特征:集中趨勢(shì)和離散趨勢(shì)。 3便于發(fā)現(xiàn)某些特大或特小的可疑值。 4便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和做統(tǒng)計(jì)處理。 描述集中趨勢(shì)的指標(biāo):均數(shù)X,幾何均數(shù)G,中位數(shù)M 描述離散趨勢(shì)的指標(biāo):極差,方差,標(biāo)準(zhǔn)差,四分位數(shù)間距IQR,變異系數(shù)CV 第三章 正態(tài)分布 正態(tài)分布: 若X的頻數(shù)曲線對(duì)應(yīng)于數(shù)學(xué)上的正態(tài)分布曲線(曲線呈鐘型,兩頭低中間高,左右對(duì)稱(chēng))則稱(chēng)該指標(biāo)服從正態(tài)分布。 正態(tài)分布的應(yīng)用:歸頻數(shù)分布:制定參考值范圍,作質(zhì)量控制,統(tǒng)計(jì)處理方法的基礎(chǔ)。 第四章 總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn) 抽樣誤差(sampling error):是由個(gè)體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。 標(biāo)準(zhǔn)誤(standard error)是樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。 均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean SEM)用于表示均數(shù)抽樣誤差的指標(biāo),反映樣本均數(shù)之間的離散程度和樣本均數(shù)抽樣誤差的大小。 參數(shù)估計(jì):是指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。 點(diǎn)估計(jì):就是用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。 區(qū)間估計(jì)confidence interval CI:按預(yù)先給定的概率(1-a)確定的包含未知總體參數(shù)的可能范圍。該范圍通常稱(chēng)為參數(shù)的可信區(qū)間或置信區(qū)間。 I類(lèi)錯(cuò)誤:拒絕了實(shí)際上成立的H0這類(lèi)棄真的錯(cuò)誤稱(chēng)為I類(lèi)錯(cuò)誤,概率大小用α表示。 II類(lèi)錯(cuò)誤:接受了實(shí)際上不成立的H0這類(lèi)存?zhèn)蔚腻e(cuò)誤稱(chēng)為II類(lèi)錯(cuò)誤,概率大小用β表示。 可信度:預(yù)先給定的1-a。為按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍,含義是包含總體參數(shù)的可能性是1-a。 檢驗(yàn)效能(power of a test)(1-β)當(dāng)兩總體確有差異,按規(guī)定檢驗(yàn)水準(zhǔn),所能發(fā)現(xiàn)該差異的能力。 中心極限定理: 1從正態(tài)總體N(μ,σ)中,隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)也服從正態(tài)分布,即使從偏態(tài)總體中隨機(jī)抽取,當(dāng)n是足夠大時(shí)(如n>50),也近似正態(tài)分布。 2從均數(shù)μ,標(biāo)準(zhǔn)差σ的正態(tài)或偏態(tài)總體,抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)也為μ,標(biāo)準(zhǔn)差用σ()= 統(tǒng)計(jì)推斷包括:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。 標(biāo)準(zhǔn)誤的用途:可反映樣品均數(shù)與總體均數(shù)距離遠(yuǎn)近,反映可靠性:與樣本均數(shù)結(jié)合估計(jì)總體均數(shù)的可信區(qū)間;進(jìn)行假設(shè)檢驗(yàn)。 假設(shè)檢驗(yàn)應(yīng)注意的問(wèn)題:1,要有嚴(yán)密的研究設(shè)計(jì)2,不同變量或資料應(yīng)選擇不同的檢驗(yàn)方法3,正確理解“顯著性”一詞的含義4,做結(jié)論不能絕對(duì)化5,統(tǒng)計(jì)“顯著性”與醫(yī)學(xué)臨床/生物學(xué)“顯著性”。 可信區(qū)間與假設(shè)檢驗(yàn):1可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題,2可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息。 第五章 方差分析 變量變換:將原始數(shù)據(jù)做某種函數(shù)轉(zhuǎn)換,使各組達(dá)到方差齊性,也可使資料轉(zhuǎn)換為正態(tài)分布。 方差分析的基本思想:就是把全部觀察值間的變異(總變異)按設(shè)計(jì)和需要分解成兩個(gè)或多個(gè)組成部分,總自由度也分解成相應(yīng)的幾個(gè)部分,再做分析。 分解的每一部分代表不同的含義,其中至少有一部分代表各均數(shù)間的變異情況,另一部分代表誤差。離均差平方和除以自由度得均方,組間均方與誤差均方之比為F值,F(xiàn)值遠(yuǎn)大于1,表示各組均數(shù)間差別有顯著性,F(xiàn)值遠(yuǎn)小于1,表示各組均數(shù)間差別無(wú)顯著性,可查F界表確定P。 方差分析的用途:兩個(gè)或多個(gè)樣本均數(shù)的比較,分析兩個(gè)或多個(gè)研究因素的交互關(guān)系以及回歸方程的線性假設(shè)檢驗(yàn)。 方差分析的應(yīng)用條件:1,各樣本是相互獨(dú)立的隨機(jī)樣本,2各樣本來(lái)自正態(tài)總體,3各處理組總體方差齊性。 變量變換:1目的:使方差性齊;資料正態(tài)化;還可用于曲線直線化;2類(lèi)型:對(duì)數(shù)變換:平方根變換;倒數(shù)變換;平方根反正弦 變換等。 第六章 分類(lèi)資料的統(tǒng)計(jì)描述 Relative number相對(duì)數(shù):由兩個(gè)有聯(lián)系的指標(biāo)之比組成的用以描述分類(lèi)變量的統(tǒng)計(jì)指標(biāo)。 Rate率:又稱(chēng)頻率指標(biāo),說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。率=發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)×100% Proportion構(gòu)成比:又稱(chēng)構(gòu)成指標(biāo),說(shuō)明某一事物內(nèi)部組成部分所占的比重或分布。構(gòu)成比=某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)×100% Ratio比:又稱(chēng)相對(duì)比。是A,B兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明A是B的若干倍或百分之幾。比=A/B Standard mortality ratio SMR標(biāo)準(zhǔn)化死亡比:指被標(biāo)化組實(shí)際死亡數(shù)與預(yù)期死亡數(shù)之比。若SMR>1,表示被標(biāo)化人群的死亡率高于標(biāo)準(zhǔn)組:反之若SMR<1,表示被標(biāo)化人群的死亡率低于標(biāo)準(zhǔn)組。 Dynamic series動(dòng)態(tài)數(shù)列:是一系列按時(shí)間順序排列起來(lái)的統(tǒng)計(jì)指標(biāo),包括絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù),用以說(shuō)明事物在時(shí)間上的變化和發(fā)展趨勢(shì)。 定基比:即統(tǒng)一用某個(gè)時(shí)間的指標(biāo)作基數(shù),以各時(shí)間的指標(biāo)與之相比,是常用的動(dòng)態(tài)數(shù)列分析指標(biāo)之一。 環(huán)比:以前一個(gè)時(shí)間的指標(biāo)作基數(shù),以相鄰的后一個(gè)時(shí)間的指標(biāo)與之相比。是常用的動(dòng)態(tài)數(shù)列分析指標(biāo)之一。 應(yīng)用相對(duì)數(shù)應(yīng)注意的問(wèn)題:計(jì)算相對(duì)數(shù)的分母一般不宜過(guò)小,當(dāng)例數(shù)小于30時(shí),宜用絕對(duì)數(shù)表示為好;分析時(shí)不能以構(gòu)成比代替率,應(yīng)當(dāng)注意不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析;對(duì)觀察單位不等的幾個(gè)率,不能直接相加求其總率,在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性;對(duì)樣本率(構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。 標(biāo)準(zhǔn)化法的基本思想:當(dāng)兩組或多組率之間比較,其內(nèi)部各小組的率明顯不同,且各小組的觀察例數(shù)的構(gòu)成比也明顯不同時(shí),則不能直接比較兩組或多組的總率,得出結(jié)論。為消除構(gòu)成不同造成的影響。采取統(tǒng)一的標(biāo)準(zhǔn)構(gòu)成進(jìn)行調(diào)整,使之標(biāo)準(zhǔn)化,以具有可比性。 標(biāo)準(zhǔn)化率的計(jì)算(直接法):p’=或p’= Ni:標(biāo)準(zhǔn)組個(gè)小組例數(shù):pi:被標(biāo)化組各小組的率,N:標(biāo)準(zhǔn)組總例數(shù) 平均發(fā)展速度= a0=基期指標(biāo);an:第n年指標(biāo) 平均增長(zhǎng)速度=平均發(fā)展速度-1 第九章 秩和檢驗(yàn) 參數(shù)統(tǒng)計(jì):通常要求樣本來(lái)自總體分布型是已知的,在這種假設(shè)的基礎(chǔ)上,對(duì)總體參數(shù)進(jìn)行估計(jì)和檢驗(yàn)。 非參數(shù)統(tǒng)計(jì):當(dāng)樣本來(lái)自總體分布型是未知的或總體分布與檢驗(yàn)所要求的條件不符時(shí),所使用的統(tǒng)計(jì)方法。不依賴(lài)于總體分布類(lèi)型,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn)。 非參數(shù)統(tǒng)計(jì)的優(yōu)缺點(diǎn):1應(yīng)用范圍廣,簡(jiǎn)便,易掌握,對(duì)資料分布特征無(wú)特殊要求。 2當(dāng)資料適合參數(shù)統(tǒng)計(jì),而用非參數(shù)統(tǒng)計(jì)會(huì)損失部分信息,減低檢驗(yàn)效能。 秩和檢驗(yàn)方法
第十一章 回歸和相關(guān) 直線相關(guān):或簡(jiǎn)單相關(guān),描述兩變量的相互關(guān)系,用于雙變量正態(tài)分布資料。有正相關(guān)、負(fù)相關(guān)和零相關(guān)(非直線相關(guān))系。 相關(guān)系數(shù):或累積相關(guān)系數(shù),說(shuō)明具有直線關(guān)系的兩個(gè)變量間,相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。樣本相關(guān)系數(shù)用r表示,總體相關(guān)系數(shù)用ρ表示。 直線回歸:描述兩變量間的依存關(guān)系。利用回歸分析方法能夠找到一個(gè)描述變量之間的變化關(guān)系的數(shù)學(xué)表達(dá)式。 回歸系數(shù):或直線的斜率,樣本回歸系數(shù)b,總體回歸系數(shù)β,b的統(tǒng)計(jì)學(xué)意義為:X每增加/減少一個(gè)單位時(shí),Y平均改變b個(gè)單位。 剩余:或殘差,即實(shí)際值與估計(jì)值之差。SSB即2,為Y的離均差平方和。說(shuō)明未考慮X與Y的回歸關(guān)系時(shí)Y的變異。 剩余平方和:SS剩,即2,它反映X對(duì)Y的線性影響之外的一切因素對(duì)Y的變異情況。也就是在總平方和中無(wú)法用X解釋的部分,其值越小,說(shuō)明直線回歸的估計(jì)誤差越小。 回歸平方和:SS回,即2,它反映由于X與Y的直線關(guān)系而使Y的總變異減小的部分。也就是在總平方和中可以用X解釋的部分,其值越大,說(shuō)明回歸效果越好。 剩余標(biāo)準(zhǔn)差:指當(dāng)X對(duì)Y的影響被扣除后,Y仍存在變異,此變異由抽樣誤差造成,與X無(wú)關(guān)。用來(lái)反映Y的剩余變異。 預(yù)測(cè):吧預(yù)報(bào)因子(X)代入回歸方程對(duì)預(yù)報(bào)量(Y)進(jìn)行估計(jì),其波動(dòng)范圍可按求個(gè)體Y值容許區(qū)間方法計(jì)量。 統(tǒng)計(jì)控制:利用回歸方程進(jìn)行逆估計(jì),要求Y在一定范圍內(nèi)波動(dòng),可以通過(guò)控制X的取值來(lái)實(shí)現(xiàn)。 決定系數(shù):即r2=SS回/SS總.當(dāng)總平方和固定不變時(shí),回歸平方和的大小取決于r2。 秩相關(guān):又稱(chēng)等級(jí)相關(guān),用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析,適用于1,不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析,2,總體分布型未知,3,用等級(jí)表示原始數(shù)據(jù)。 等級(jí)相關(guān)系數(shù):即rs,說(shuō)明兩個(gè)變量間相互關(guān)系的密切程度與相關(guān)方向,用于下列資料:1,不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析,2,總體分布型未知,3,用等級(jí)表示原始數(shù)據(jù)。 假設(shè)檢驗(yàn):1b,方差分析,t檢驗(yàn);2界值表,t檢驗(yàn)。 直線回歸方程的應(yīng)用:1描述兩變量的依存關(guān)系;2預(yù)測(cè);3統(tǒng)計(jì)控制 應(yīng)用直線回歸應(yīng)注意的問(wèn)題: 1. 作回歸要有實(shí)際意義。 2. 回歸分析前繪制散點(diǎn)圖,觀察直線趨勢(shì),修正或刪除異常點(diǎn)。 3. 直線回歸方程的適用范圍一般以自變量的取值范圍為限。 相關(guān)和回歸的區(qū)別: 1. 資料要求不同:回歸要求Y服從正態(tài)分布,X可精確測(cè)量和嚴(yán)格控制:相關(guān)要求雙變量正態(tài)分布。 2. 應(yīng)用情況不同:回歸——依存關(guān)系:相關(guān)——相互關(guān)系。 相關(guān)和回歸的聯(lián)系: 1. 方向一致:r,b符號(hào)一致。 2. 假設(shè)檢驗(yàn)等價(jià):統(tǒng)一樣本,r,b的假設(shè)檢驗(yàn)得到的t值相同。 3. 用回歸解釋相關(guān)。 A.SS回越接近SS總,,則r2越接近l,說(shuō)明引入相關(guān)的效果越好。 B.相關(guān)系數(shù)的大小與SS總及回歸系數(shù)有關(guān),所以相關(guān)系數(shù)不能作為回歸估計(jì)精度的指標(biāo)。 秩相關(guān)的應(yīng)用條件: 1. 不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析。 2. 總體分布型未知。 3. 用等級(jí)表示的原始數(shù)據(jù)。 第十二章 常用統(tǒng)計(jì)表 統(tǒng)計(jì)表:在科技報(bào)告或論文中,常將統(tǒng)計(jì)資料及指標(biāo)以表格列出,稱(chēng)為統(tǒng)計(jì)表??煞譃楹?jiǎn)單表和復(fù)合表。 統(tǒng)計(jì)圖:是用點(diǎn)的位置、線段的升降、直線的長(zhǎng)短或面積的大小等形式表達(dá)統(tǒng)計(jì)資料,可直觀反映出事物間的數(shù)量關(guān)系。 列表原則:1重點(diǎn)突出,簡(jiǎn)單明了2主次分明,層次清楚,符合邏輯。 列表基本要求:1標(biāo)題2標(biāo)目3線條4數(shù)字5不列備注 制圖基本要求:1標(biāo)題2標(biāo)目3圖例 常用統(tǒng)計(jì)圖
第十三章 實(shí)驗(yàn)設(shè)計(jì) 實(shí)驗(yàn)研究:是指研究者根據(jù)研究目的主動(dòng)加以干預(yù)措施,并觀察總結(jié)結(jié)果,回答假設(shè)研究所提出的問(wèn)題的一種研究方法。依研究目的分為實(shí)驗(yàn)研究和臨床試驗(yàn)。 實(shí)驗(yàn)研究設(shè)計(jì)(experimental design):是以動(dòng)物或標(biāo)本(如血,痰,尿等)為研究對(duì)象采取干預(yù)措施的研究。 臨床試驗(yàn)(clinical trial):從統(tǒng)計(jì)學(xué)角度出發(fā),只要是以人為研究對(duì)象并采取了干預(yù)措施的研究統(tǒng)稱(chēng)為臨床試驗(yàn),可分為臨床療效實(shí)驗(yàn)和社區(qū)干預(yù)實(shí)驗(yàn)。 隨機(jī)化原則:即總體中的每個(gè)觀察單位都有相等的機(jī)會(huì)被選入到樣本中來(lái)。 隨機(jī)分配(randomized allocation):為增強(qiáng)可比性,依型講究假設(shè)的要求規(guī)定了納入標(biāo)準(zhǔn),將實(shí)驗(yàn)對(duì)象分入實(shí)驗(yàn)組和對(duì)照組中。 空白對(duì)照:對(duì)照組不施加任何處理措施。 安慰劑對(duì)照:在實(shí)驗(yàn)研究中,對(duì)照組使用一種外形與實(shí)驗(yàn)藥物完全相同而毫無(wú)藥理作用的物質(zhì),這種對(duì)照稱(chēng)為安慰劑對(duì)照。 實(shí)驗(yàn)對(duì)照:對(duì)照組和實(shí)驗(yàn)組的處理措施區(qū)別在于:實(shí)驗(yàn)組加入了有效成分,而對(duì)照組則無(wú)。 標(biāo)準(zhǔn)對(duì)照:用公認(rèn)的有效藥物、現(xiàn)有的標(biāo)準(zhǔn)方法或常規(guī)方法做對(duì)照。 自身對(duì)照:對(duì)照和實(shí)驗(yàn)措施在同一實(shí)驗(yàn)對(duì)象上實(shí)施。 相互對(duì)照:幾個(gè)處理(或水平)互為對(duì)照。 處理因素:是根據(jù)研究目的而施加的特定的實(shí)驗(yàn)措施。 實(shí)驗(yàn)效應(yīng):主要只處理因素作用于實(shí)驗(yàn)對(duì)象的反應(yīng),這種效應(yīng)將通過(guò)實(shí)驗(yàn)中觀察指標(biāo)顯示出來(lái)。觀察指標(biāo)應(yīng)該客觀性較強(qiáng),靈敏度較高。精確性較強(qiáng)。 準(zhǔn)確度(accuracy):觀察值與真值的接近程度。 精確度(precision):重復(fù)觀察時(shí):觀察值與其平均值的接近程度。 隨機(jī)對(duì)照試驗(yàn)(randomized control trial):將受試對(duì)象隨機(jī)分配到實(shí)驗(yàn)組和對(duì)照組,通過(guò)比較分析回答研究假設(shè)的問(wèn)題。 隨機(jī)雙盲對(duì)照實(shí)驗(yàn)(randomized double blind control trial):在隨機(jī)對(duì)照試驗(yàn)的基礎(chǔ)上再采用雙盲法。 配對(duì)設(shè)計(jì)(paired design):將實(shí)驗(yàn)對(duì)象按一定條件配成對(duì)子,如將年齡、體重一致的動(dòng)物配成對(duì)子。再將每對(duì)中的兩個(gè)受試對(duì)象隨機(jī)分配到不同處理組。據(jù)以配對(duì)的因素為可能影響實(shí)驗(yàn)結(jié)果的主要混雜因素。 系統(tǒng)誤差:由于受試對(duì)象,研究者,儀器設(shè)備,研究方法等非實(shí)驗(yàn)因素影響等確定性原因造成,有一定傾向性或規(guī)律性的誤差,可以避免。 偏倚:指在實(shí)驗(yàn)中由于某些非實(shí)驗(yàn)因素的干擾而形成的系統(tǒng)誤差,歪曲了處理因素的真實(shí)效應(yīng)。 選擇性偏倚selective bias:由于納入觀察對(duì)象的方法不正確而產(chǎn)生的偏倚。 測(cè)量性偏倚 measurement bias:實(shí)驗(yàn)過(guò)程中對(duì)研究對(duì)象進(jìn)行觀察或測(cè)量而造成的偏倚。 沾染contamination:對(duì)照組實(shí)驗(yàn)對(duì)象接受實(shí)驗(yàn)組的處理措施,提高了對(duì)照組的有效率,結(jié)果導(dǎo)致了實(shí)驗(yàn)組和對(duì)照組的差異。 干擾cointervention:實(shí)驗(yàn)組從實(shí)驗(yàn)外接受了對(duì)實(shí)驗(yàn)因素有效的藥物或措施(非處理措施),提高了實(shí)驗(yàn)的有效率,結(jié)果擴(kuò)大了實(shí)驗(yàn)組和對(duì)照組的差異。 依從性:compliance受試者對(duì)于干預(yù)措施及實(shí)驗(yàn)過(guò)程的執(zhí)行程度。 非依從性noncompliance:受試者為按照研究人員的規(guī)定方案執(zhí)行稱(chēng)為非依從性。 失訪lost to followup:受試者在實(shí)驗(yàn)過(guò)程中由于各種原因退出實(shí)驗(yàn)稱(chēng)為失訪。 雙盲法(double blind method):課題主持人采取措施使研究者和研究對(duì)象均不知道接受實(shí)驗(yàn)措施或?qū)φ沾胧?/p> 單盲法:single blind method:只有患者不知道處理措施的內(nèi)容。 三盲法:triple blind method:主持人/研究者/患者均不知道處理措施的內(nèi)容。 混雜偏倚confounding bias:在總結(jié)分析階段,由某些非實(shí)驗(yàn)因素與實(shí)驗(yàn)因素同時(shí)并存的作用影響到觀察的結(jié)果,造成混雜因素的偏倚。 實(shí)驗(yàn)設(shè)計(jì)的基本原則:隨機(jī)化、對(duì)照、重復(fù)。 對(duì)照原則的目的: 實(shí)驗(yàn)研究的目的是驗(yàn)證研究假設(shè)是否正確,只有經(jīng)過(guò)比較才能鑒別其真?zhèn)?,設(shè)對(duì)照組是比較的基礎(chǔ),沒(méi)有對(duì)照很難說(shuō)明研究假設(shè)是否正確;設(shè)立對(duì)照也是控制實(shí)驗(yàn)過(guò)程中非實(shí)驗(yàn)因素的影響和偏倚的一種有力措施。常用的對(duì)照有:空白對(duì)照,安慰劑對(duì)照,實(shí)驗(yàn)對(duì)照,標(biāo)準(zhǔn)對(duì)照,自身對(duì)照,相互對(duì)照。 重復(fù)原則:含義為1足夠的樣本含量;2實(shí)驗(yàn)的次數(shù)。 實(shí)驗(yàn)設(shè)計(jì)的三要素:處理因素、實(shí)驗(yàn)效應(yīng)、受試對(duì)象。 確定受試對(duì)象納入標(biāo)準(zhǔn)應(yīng)注意: 1應(yīng)納入對(duì)處理因素的效應(yīng)反應(yīng)靈敏的患者。 2某些處理措施對(duì)一些特殊人群產(chǎn)生有害作用,應(yīng)排除實(shí)驗(yàn)之外。 常用的實(shí)驗(yàn)設(shè)計(jì)方法:隨機(jī)對(duì)照實(shí)驗(yàn),配對(duì)設(shè)計(jì),交叉設(shè)計(jì),配伍組設(shè)計(jì)。 隨機(jī)對(duì)照試驗(yàn)有點(diǎn)(隨機(jī)化的目的) 1有效避免非實(shí)驗(yàn)因素的影響,使實(shí)驗(yàn)因素充分顯示 2增強(qiáng)各比較組間的可比性,使研究結(jié)論更可靠。 3更好地控制非實(shí)驗(yàn)因素對(duì)實(shí)驗(yàn)因素的影響,有效地控制了偏倚和誤差。 4滿足了隨機(jī)化原則,使檢驗(yàn)結(jié)果反映 真實(shí)差異。 交叉設(shè)計(jì)的優(yōu)點(diǎn): 1節(jié)約樣本含量 2能控制時(shí)間因素及個(gè)體差異對(duì)處理因素方式的影響 3從醫(yī)德觀點(diǎn)出發(fā),均等考慮每個(gè)患者的利益。 交叉設(shè)計(jì)的注意事項(xiàng): 1前提是兩種處理方式不能相互影響。 2不適用于病程較短急性病效果的研究 3應(yīng)盡可能采用盲法。 確定樣本含量的意義:正確確定樣本含量是實(shí)驗(yàn)設(shè)計(jì)的一個(gè)重要組成部分,估計(jì)樣本含量應(yīng)克服兩種傾向:1片面追求增大樣品含量導(dǎo)致人力、物力和時(shí)間的浪費(fèi),還可能引入更多的混雜因素。2樣本含量偏少,檢驗(yàn)效能偏低,導(dǎo)致總體本來(lái)存在的差異未能檢出,導(dǎo)致非真實(shí)的陰性結(jié)果。樣本含量大小還受個(gè)體差異和研究實(shí)驗(yàn)要求的精神有關(guān)。閱讀專(zhuān)業(yè)文獻(xiàn)時(shí),對(duì)假設(shè)檢驗(yàn)陰性結(jié)果有必要復(fù)核樣本含量和檢驗(yàn)效能是否偏低。以正確分析假設(shè)檢驗(yàn)的結(jié)論。 第X章2檢驗(yàn) 2 test (Chi-square test)2是一種用途較廣的假設(shè)性檢驗(yàn)方法,可用于推斷兩個(gè)及多個(gè)總體率或總體構(gòu)成比之間有無(wú)差別,兩種屬性或兩個(gè)變量之間有無(wú)關(guān)聯(lián)性,以及頻數(shù)分布的擬合優(yōu)度檢驗(yàn)等。 2檢驗(yàn)的基本思想:2值是以理論數(shù)為基數(shù)的相對(duì)誤差,它反映了實(shí)際數(shù)與理論數(shù)吻合的程度(差別的程度)。若檢驗(yàn)假設(shè)成立,則實(shí)際數(shù)與理論數(shù)的差別不會(huì)很大,出現(xiàn)大的2值的概率p是很小的,若P≤α檢驗(yàn)水準(zhǔn),就懷疑假設(shè),因而拒絕它,若P≥α,則無(wú)理由拒絕它。 理論數(shù)的計(jì)算:Tic=, Ti,r第i行第c列的理論數(shù),ni為T(mén)ic所在的行合計(jì),nc為T(mén)ic所在的列合計(jì):n為總例數(shù)。 2檢驗(yàn)的基本公式:2= ————————————(1) 2檢驗(yàn)的校正公式:2= ——————————(2) 四表格專(zhuān)用公式 四表格專(zhuān)用公式:2=—————————(3) 校正公式2=———————(4) 四格表2檢驗(yàn)的條件: 1當(dāng)n≥40且所有的T≥5時(shí),用普通的2檢驗(yàn)(公式1,3),若所得P≈α,改用確切的概率法。 2當(dāng)n≥40但又1≤T≤5,用校正的2檢驗(yàn)(公式2,4)。 3當(dāng)n<40或有T<1時(shí),不能用2檢驗(yàn),改用確切概率法。 配對(duì)四格表資料的2檢驗(yàn): 2=,v=1(b+c≥40時(shí)使用) 校正公式2=,v=1 (b+c<40時(shí)使用) 行X列表的2檢驗(yàn)公式2=n()無(wú)校正公式 行X列表的2檢驗(yàn)的注意事項(xiàng): 1不能有理論數(shù)T<1,并且1≤T≤5的格子數(shù)不超過(guò)總格子數(shù)的1/5. 2當(dāng)檢驗(yàn)有統(tǒng)計(jì)學(xué)意義(拒絕H0)時(shí),只能認(rèn)為各總體率或構(gòu)成比之間總的來(lái)說(shuō)有差別,但不能說(shuō)明它們彼此之間都有差別,或某兩者之間有差別。若要進(jìn)一步解決此問(wèn)題,可用2分割法。 3若表格有一個(gè)方向按多個(gè)等級(jí)分類(lèi),則稱(chēng)單向有序行列表,當(dāng)?shù)燃?jí)數(shù)大于3時(shí),一般用秩和檢驗(yàn)分析更為適宜。 四格表的確切概率法的應(yīng)用條件: 1, 四格表內(nèi)理論頻數(shù)T<1 2, 樣本含量n<40 3, 2檢驗(yàn)后所得概率P接近檢驗(yàn)水準(zhǔn)α。 試題: 一、名詞解釋?zhuān)?/p> 1, coefficient(相關(guān)系數(shù)):又稱(chēng)積差相關(guān)系數(shù)(product-moment correlation),是說(shuō)明具有直線關(guān)系的兩個(gè)變量間,相互關(guān)系的密切程度與相關(guān)方向的指標(biāo)。 2, proportion(構(gòu)成比):又稱(chēng)構(gòu)成指標(biāo)。說(shuō)明某一事物內(nèi)部的各組成部分所占的比重或分布,計(jì)算公式為:某一組分的觀察單位數(shù)除以同一事物各組分的觀察單位總數(shù)*100%,表示方法有百分?jǐn)?shù)等。 3, coefficient of variation (變異系數(shù)):常記為CV。它被定義為標(biāo)準(zhǔn)差與算術(shù)平均數(shù)之比。即CV=S/×100%。它描述了相對(duì)于算術(shù)均數(shù)而言。標(biāo)準(zhǔn)差的大小,即描述數(shù)據(jù)的變異相對(duì)于其平均水平來(lái)說(shuō)是大還是小。 4, population(總體):是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,確切的說(shuō)是同質(zhì)的所有的觀察單位某種變量值的集合。 5, standard error SE(標(biāo)準(zhǔn)誤):樣本均數(shù)的標(biāo)準(zhǔn)差也稱(chēng)均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean)它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)間的差異,說(shuō)明均數(shù)抽樣誤差的大小。 6, incidence rate(發(fā)病率):表示一定時(shí)期內(nèi),在可能發(fā)生某病的一定人群中新發(fā)生的某病例數(shù)。其計(jì)算公式為:某病發(fā)病率=該期間新發(fā)生的某病例數(shù)/一定期間內(nèi)可能發(fā)生某病的平均人口數(shù)×100% 7, Chi-square(2值)是以理論數(shù)為基數(shù)的相對(duì)誤差,它反映了實(shí)際數(shù)與理論數(shù)吻合的程度(差別的程度)。 8, Chi-square test(2檢驗(yàn)):是一種用途較廣的假設(shè)檢驗(yàn)方法,即推斷兩個(gè)及多個(gè)總體構(gòu)成比之間有無(wú)差別,兩種屬性或兩個(gè)變量之間有無(wú)關(guān)聯(lián)性,以及頻數(shù)分布的擬合優(yōu)度檢驗(yàn)等。 9, Normal distribution(正態(tài)分布):若X的頻數(shù)曲線應(yīng)用于數(shù)學(xué)上的正態(tài)分布曲線(曲線呈鐘型,兩頭低中間高,左右對(duì)稱(chēng)),則稱(chēng)該指標(biāo)服從正態(tài)分布。 10, Mortality rate(死亡率):指某地某年平均每千人口中的死亡數(shù),它反映居民總的死亡水平。死亡率=某人群某年(因某病)總死亡人數(shù)/該人群同年平均人口×1000 簡(jiǎn)單題 1: 應(yīng)用相對(duì)數(shù)應(yīng)該注意什么? 計(jì)算相對(duì)數(shù)的分母一般不宜過(guò)?。环治鍪遣荒芤詷?gòu)成比代替率,應(yīng)當(dāng)注意不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析;對(duì)觀察單位不等的幾個(gè)率,不能直接相加求其總率,在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性;對(duì)樣本率(構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。 2:方差分析的基本思想? 根據(jù)資料的設(shè)計(jì)類(lèi)型,即變異的不同來(lái)源將全部觀察值總的離均差平方和和自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余每個(gè)部分的變異可由某個(gè)或幾個(gè)因素的作用加以解釋?zhuān)ㄟ^(guò)比較不同變異來(lái)源地均方,借助F分布做出統(tǒng)計(jì)推斷,從而了解該因素對(duì)觀測(cè)指標(biāo)有無(wú)影響。F值遠(yuǎn)大于1,表示各組均數(shù)間差別有顯著性,F(xiàn)值遠(yuǎn)小于1,表示各組均數(shù)間差別無(wú)顯著性,可查F界表確定P. 3:相關(guān)和回歸的區(qū)別和聯(lián)系? 直線回歸與相關(guān)的區(qū)別1資料要求不同:回歸要求變量Y服從正態(tài)分布,X是可以精確測(cè)量和嚴(yán)格控制的變量,相關(guān)要求兩個(gè)變量X,Y服從雙變量正態(tài)分布,2應(yīng)用情況不同:說(shuō)明兩變量間依存變化的數(shù)量關(guān)系用回歸,說(shuō)明變量間的相關(guān)關(guān)系用相關(guān)3,意義不同:回歸系數(shù)b表示自變量X每變化一個(gè)單位后應(yīng)變量Y的平均變化量,相關(guān)系數(shù)r表示兩變量相關(guān)的方向和密切程度,4取值范圍不同:-1<=r<=1;b負(fù)無(wú)窮到正無(wú)窮大。5單位不同,回歸系數(shù)b有單位,相關(guān)系數(shù)r沒(méi)單位。 直線回歸與相關(guān)的聯(lián)系:1兩者都是研究?jī)蓚€(gè)數(shù)值變量的關(guān)系的統(tǒng)計(jì)方法,2方向一致:對(duì)一組數(shù)據(jù)若同時(shí)計(jì)算r與b,他們的正負(fù)號(hào)一致,r為正說(shuō)明兩變量間的相互關(guān)系是同向變化的,b為正號(hào)說(shuō)明X增減一個(gè)單位,Y平均增減b個(gè)單位,3假設(shè)檢驗(yàn)對(duì)同一樣本,r與b的假設(shè)檢驗(yàn)得到的t值相等,由于r的假設(shè)檢驗(yàn)簡(jiǎn)單,故在實(shí)際應(yīng)用中常用以前法代替后法,4用回歸解釋相關(guān),決定系數(shù)P2=SS回/SS總,回歸平方和越接近總平方和,R2越接近1 4:行X列表2檢驗(yàn)注意事項(xiàng)。 答:1.不能有理論數(shù)T<1,并且1≤T≤5的格子數(shù)不超過(guò)總格子數(shù)的1/5;2.當(dāng)檢驗(yàn)有統(tǒng)計(jì)學(xué)意義(拒絕H0)時(shí),只能說(shuō)明各總體率或構(gòu)成比之間總的來(lái)說(shuō)有差別,但不能說(shuō)明它們之間都有差別,成兩者之間有差別,若要進(jìn)一步解決此問(wèn)題,可用2分割法。3,若表格有一個(gè)方向按多個(gè)等級(jí)分類(lèi),則稱(chēng)單向有序行X列表,當(dāng)?shù)燃?jí)數(shù)大于3時(shí),一般用秩和檢驗(yàn)分析更為適宜。 5:可信區(qū)間和假設(shè)檢驗(yàn)的關(guān)系? 可信區(qū)間用于說(shuō)明量的大小即推斷總體均數(shù)的范圍,而假設(shè)檢驗(yàn)用于推斷質(zhì)的不同即判斷兩總體均數(shù)是否不同,兩者相互聯(lián)系又相互區(qū)別;可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題;可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息,但并不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn);可信區(qū)間只能在預(yù)先規(guī)定的概率——檢驗(yàn)水準(zhǔn)的前提下進(jìn)行計(jì)算,而假設(shè)檢驗(yàn)?zāi)軌颢@得較為確切的P值,故兩者結(jié)合起來(lái)次才是完整的分析。 6:二項(xiàng)分布應(yīng)用條件? 答:1.每次試驗(yàn)結(jié)果,只能是兩個(gè)互斥的結(jié)果之一(A或非A)。2.每次試驗(yàn)的條件不變,即每次試驗(yàn)中A發(fā)生的概率不變,均為x,3.各次實(shí)驗(yàn)獨(dú)立,即一次試驗(yàn)出現(xiàn)什么樣的結(jié)果與前面已出現(xiàn)的結(jié)果無(wú)關(guān)。 7:.t檢驗(yàn)的應(yīng)用條件,方差不齊時(shí)的處理方法? 答:當(dāng)樣本含量較小時(shí),理論上要求樣本取自正態(tài)總體,兩樣本均數(shù)比較時(shí)還要求兩樣本方差相等,(u檢驗(yàn)應(yīng)用條件:樣本含量較大,或n雖小但總體標(biāo)準(zhǔn)差已知)。若兩總體方差相等,則直接用t檢驗(yàn)。若總體方差不等,可采用t’檢驗(yàn)或變量變換或秩和檢驗(yàn)等方法處理。 8:.實(shí)驗(yàn)設(shè)計(jì)的幾個(gè)原則,要素,方法,適用范圍,優(yōu)缺點(diǎn)? 答:原則:1對(duì)照原則2重復(fù)原則3隨機(jī)化原則。 要素:1處理因素2受試對(duì)象3實(shí)驗(yàn)效應(yīng)。 方法和優(yōu)點(diǎn):1隨機(jī)對(duì)照實(shí)驗(yàn):是將受試對(duì)象隨機(jī)分配到試驗(yàn)組和對(duì)照組,通過(guò)比較分析回答研究假設(shè)的問(wèn)題,該設(shè)計(jì)既貫徹了隨機(jī)化原則,又設(shè)有對(duì)照。優(yōu)點(diǎn)是A有效的避免了某些非實(shí)驗(yàn)因素的影響B(tài)增強(qiáng)了各比較組的可比性,使結(jié)論更可靠C有利于所比較總體間存在真實(shí)差異D滿足了隨機(jī)化原則,更能反映真實(shí)差異。2配對(duì)設(shè)計(jì):將實(shí)驗(yàn)對(duì)象按一定條件配成對(duì)子,再隨機(jī)分配每對(duì)的兩個(gè)對(duì)象接受不同的處理方式。優(yōu)點(diǎn)最大限度排除了非處理因素的干擾;降低個(gè)體差異水平;提高實(shí)驗(yàn)效果;增強(qiáng)均衡性。3交叉設(shè)計(jì):是一種特殊的自身對(duì)照設(shè)計(jì)。優(yōu)點(diǎn):A節(jié)約樣本含量B能夠控制時(shí)間因素及個(gè)體差異對(duì)處理方式的影響C每個(gè)實(shí)驗(yàn)對(duì)象同時(shí)接受了實(shí)驗(yàn)因素和對(duì)照,考慮了每個(gè)患者的利益。4.配伍設(shè)計(jì):是將條件相近的實(shí)驗(yàn)對(duì)象配成一組。優(yōu)點(diǎn):增強(qiáng)了各組間的均衡性,可進(jìn)一步控制混雜性偏倚。 計(jì)量數(shù)據(jù)統(tǒng)計(jì)描述和統(tǒng)計(jì)圖表的是非題 1. 在同一連續(xù)分布總體中作隨機(jī)抽樣,理論上樣本均數(shù)越大,則樣本標(biāo)準(zhǔn)差s越大。(錯(cuò)) 2. 在同一連續(xù)分布總體中作隨機(jī)抽樣,理論上樣本含量n越大,則樣本標(biāo)準(zhǔn)差越小(錯(cuò)) 3. 對(duì)稱(chēng)分布就是正態(tài)分布。(錯(cuò)) 4. 在同一連續(xù)分布總體中作隨機(jī)抽樣,理論上樣本含量n越大,則樣本極差越大。(對(duì)) 5. 樣本中位數(shù)不受樣本中的極端值影響。(對(duì)) 6. 正態(tài)分布資料也可用中位數(shù)描述其中集中趨勢(shì)(中心位置)。(對(duì)) 7. 分組的連續(xù)分布資料,計(jì)算百分位數(shù)要求組距相等。(錯(cuò)) 8. 第80百分位數(shù)ρ80表示有80%變量值比它大。(錯(cuò)) 9. 對(duì)于連續(xù)分布資料,單位相同時(shí),也可用變異系數(shù)比較兩個(gè)變量的相對(duì)離散度。(錯(cuò)) 10. 在同一連續(xù)分布總體中作隨機(jī)抽樣,理論上樣本含量n越大,則從樣本算得的變異系數(shù)越小。(錯(cuò)) 11. 對(duì)于計(jì)量數(shù)據(jù),不應(yīng)按分組方式?jīng)Q定是否計(jì)算機(jī)和均數(shù)。(對(duì)) 12. 若男女兒童平均是高接近,可用標(biāo)準(zhǔn)差s來(lái)比較其絕對(duì)離散度。(對(duì)) 13. 四分位數(shù)間距也是描述連續(xù)分布數(shù)據(jù)離散度的指標(biāo)。(對(duì)) 14. 自由度p(-∞,∞)時(shí)的t分布就是標(biāo)準(zhǔn)正態(tài)分布。(對(duì)) 15. 標(biāo)準(zhǔn)正態(tài)分布常用N(0,1)表示。(對(duì)) 16. 嚴(yán)格地說(shuō), 是一定以0為中心,左右對(duì)稱(chēng)。(錯(cuò)) 17. 標(biāo)準(zhǔn)差是位置系數(shù)。(錯(cuò)) 18. 對(duì)于連續(xù)分布數(shù)據(jù),樣本標(biāo)準(zhǔn)差的均數(shù)理論上等于總體標(biāo)準(zhǔn)差。(錯(cuò)) 19. 對(duì)于連續(xù)分布數(shù)據(jù),樣本方差的均數(shù)理論上等于總體方差。(對(duì)) 20. 只有當(dāng)樣本含量很大時(shí),連續(xù)分布數(shù)據(jù)的樣本均數(shù)的平均數(shù)理論上才等于總體均數(shù)。(錯(cuò)) 21. μ±1.96σ表示任何分布計(jì)量指標(biāo)的95%變量值所在范圍。(錯(cuò)) 22. 正態(tài)分布總體,理論上P,P和μ±1.96σ范圍是一樣的。(對(duì)) 23. 直方圖是描述連續(xù)分布變量頻數(shù)分布的統(tǒng)計(jì)圖。(對(duì)) 24. 構(gòu)成比資料可畫(huà)圓圖。(對(duì)) 25. 線圖可以描述一個(gè)計(jì)量指標(biāo)隨另一個(gè)計(jì)量指標(biāo)變化而變化的趨勢(shì)。(對(duì)) 26. 半對(duì)數(shù)線圖可以描述和比較事物的發(fā)展變化的相對(duì)速度。(對(duì)) 27. 表示某中學(xué)高三年級(jí)10個(gè)班學(xué)生近視比例的比較,應(yīng)用線圖(錯(cuò),條圖) 28. 描述200人血壓餓分布,應(yīng)畫(huà)直圖。(錯(cuò),圓圖或百分條圖) 29. 在同一正態(tài)總體N(μ,σ)中隨機(jī)抽樣,兩個(gè)變量值X1和X2之差d服從正態(tài)分布N(μ,σ)(錯(cuò)) 30. 兩正態(tài)分布變量XN(μ1,σ1)和X2N(μ2,σ2)之差的方差是σ12-σ22(錯(cuò))。 31. 比較2000年年底某地三種疾病的患病率,宜繪制之線圖。(錯(cuò),條圖) 32. 描述300人肺活量與身高關(guān)系可畫(huà)散點(diǎn)圖。(對(duì)) 33. 縱坐標(biāo)取等比尺度而橫坐標(biāo)取等差尺度時(shí)的線圖成為對(duì)數(shù)線圖。(對(duì)) 34. 一般的正常值范圍是指95%正常人的該指標(biāo)所在范圍。(對(duì)) 35. 理論上正態(tài)分布的標(biāo)準(zhǔn)差不會(huì)大于平均數(shù)。(錯(cuò)) 36. 變量值有負(fù)數(shù)時(shí)不能直接計(jì)算幾何均數(shù)。(對(duì)) 37. 均數(shù)大于0時(shí)所計(jì)算的變異系數(shù)才有意義。(對(duì)) 38. 利用組距不相等的頻數(shù)分布表資料計(jì)算樣本均數(shù)x和樣本標(biāo)準(zhǔn)方差s,宜用加權(quán)法。(對(duì)) 39. 在同一連續(xù)分布總體中作隨機(jī)抽樣,理論上樣本含量n越大,樣本四分位數(shù)間距越大。(錯(cuò)) 40. 超出95%正常值范圍的個(gè)體都是異常個(gè)體。(錯(cuò)) |
|
來(lái)自: hchungw > 《統(tǒng)計(jì)學(xué)》