統(tǒng)計(jì)學(xué)名詞簡(jiǎn)述

hchungw 2020-01-12

展開(kāi)全文

名詞解釋?zhuān)?/p>

醫(yī)學(xué)統(tǒng)計(jì)學(xué)：用統(tǒng)計(jì)學(xué)的原理和方法研究生物醫(yī)學(xué)問(wèn)題的一門(mén)學(xué)科。

變量（variable）：觀察單位的某項(xiàng)特征如身高,體重,薪資,物價(jià),

變量值（value of variable）：變量的觀察結(jié)果（測(cè)量值）

總體（population）：是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體，確切的說(shuō)是同質(zhì)的所有的觀察單位某種變量值的集合。

樣本（sample）從總體中隨機(jī)抽取部分由代表性的觀察單位，其測(cè)量值的集合稱(chēng)為樣本。

隨機(jī)抽樣（random sample）：按隨機(jī)化原則從總體中抽取部分觀察單位的過(guò)程。

同質(zhì)（homogeneity）：是針對(duì)被研究指標(biāo)來(lái)講，其影響因素相同。簡(jiǎn)單地理解就是指對(duì)研究指標(biāo)影響大約可以控制的主要因素應(yīng)盡可能相同。

變異（variation）：指在自然地狀態(tài)下，個(gè)體測(cè)量結(jié)果在同質(zhì)基礎(chǔ)上的差異。

等級(jí)資料（ordinal data）：將觀察單位按測(cè)量結(jié)果的某種屬性的不同程度分組，所得各組的觀察單位稱(chēng)為等級(jí)資料，如患者的治療結(jié)果可分為治愈，好轉(zhuǎn)，有效，無(wú)效，死亡。有序變量（定性變量的一種）。

概率（probability）：是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值，記為P（A），P（A）越大，說(shuō)明A事件發(fā)生的可能性越大，0<P(A)<1,小概率事件。

頻率（frequency）：在相同的條件下，獨(dú)立重復(fù)做n次實(shí)驗(yàn)，事件A出現(xiàn)了m次，比值m/n稱(chēng)為隨機(jī)事件A在n次實(shí)驗(yàn)中出現(xiàn)的頻率。

隨機(jī)誤差（random error）：排除了系統(tǒng)誤差后的尚存的誤差，受多種因素影響，使觀察值不按照方向性和系統(tǒng)性而隨機(jī)的變化，誤差變量一般服從正態(tài)分布，可以通過(guò)統(tǒng)計(jì)處理來(lái)估計(jì)。

系統(tǒng)誤差（system error）：由于受試對(duì)象，研究者，儀器設(shè)備，研究方法等非實(shí)驗(yàn)因素影響等確定性原因造成，有一定傾向性或規(guī)律性的誤差，可以避免。

隨機(jī)變量（random variable）：是指取值不能事先確定的觀察結(jié)果，不能用一個(gè)正常數(shù)來(lái)表示，每個(gè)變量的取值服從特定的概率分布。

參數(shù)（parameter）：根據(jù)總體分布特征而計(jì)算的總體統(tǒng)計(jì)指標(biāo)。

統(tǒng)計(jì)量（statistic）：由總體中隨機(jī)抽取樣本而計(jì)算的相應(yīng)樣本指標(biāo)。

頻數(shù)表（frequency table）：將各變量值及其相應(yīng)的頻數(shù)列出表格形式，用來(lái)表示一批數(shù)據(jù)各觀察值出現(xiàn)的頻繁程度。

算術(shù)均數(shù)（arithmetic mean）：描述一組數(shù)據(jù)在數(shù)量上的平均水平?？傮w均數(shù)用μ表示，樣本均數(shù)用表示。

幾何均數(shù)（geometric mean）：描述對(duì)數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平，記為G.

中位數(shù)（median），將一組觀察值由小到大排列，n為奇數(shù)時(shí)取位次居中的變量值，為偶數(shù)時(shí)，取位次居中的兩個(gè)變量的平均值。

極差（range）：又稱(chēng)全距，為最大值與最小值之差，用于資料的粗略分析，計(jì)算簡(jiǎn)便但穩(wěn)定性較差。符號(hào)R.

百分位數(shù)（percentile）：將n個(gè)觀察值從小到大依次排列，再把它們的位次轉(zhuǎn)化為百分位。

四分位數(shù)間距（inter quarnle range）：表示百分位數(shù)P₇₅和百分位數(shù)P₂₅之差，定義為Q=P₇₅-P₂₅.。

方差（variance）：表示一組數(shù)據(jù)的平均離散情況，由離均差的平方和除以樣本個(gè)數(shù)得到。

標(biāo)準(zhǔn)差（standard deviation）：是描述反映正態(tài)分布計(jì)量資料離散程度的指標(biāo)。是方差的正平方根，使用的量綱與原量綱相同，適用于近似正態(tài)分布的資料，大小樣本均可，最為常用。

變異系數(shù)（coefficient of variation）：用于量綱不同和變量間或均數(shù)相差較大的變量間變異程度的比較，其計(jì)算公式為：

CV=

正態(tài)曲線（normal curve）是函數(shù)f(X)= 對(duì)應(yīng)的曲線，此曲線是一條高峰位于中央，兩側(cè)逐漸下降并完全對(duì)稱(chēng)，曲線兩端永遠(yuǎn)不與橫軸相交的鐘形曲線。

正態(tài)分布（normal distribution）：若指標(biāo)X的頻率曲線對(duì)應(yīng)于正態(tài)曲線，則稱(chēng)該指標(biāo)服從正態(tài)分布，通常用記號(hào)N（μ,σ²）表示均數(shù)為標(biāo)準(zhǔn)差為的正態(tài)分布。

標(biāo)準(zhǔn)正態(tài)分布（standard normal distribution）：均數(shù)為0標(biāo)準(zhǔn)差為1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布，記為N(0,1).

標(biāo)準(zhǔn)化轉(zhuǎn)換（standardized transformation）：若隨機(jī)變量X服從正態(tài)分布N（μ,σ²），經(jīng)過(guò)標(biāo)準(zhǔn)化轉(zhuǎn)換Z=,就服從標(biāo)準(zhǔn)正態(tài)分布。

統(tǒng)計(jì)推斷（statistical inference）：通過(guò)樣本指標(biāo)來(lái)說(shuō)明總體特征，這種從樣本獲取有關(guān)總體信息的過(guò)程為統(tǒng)計(jì)推斷。

抽樣誤差（sampling error）：由個(gè)體差異產(chǎn)生，由于抽樣而造成的樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱(chēng)為抽樣誤差，無(wú)傾向性，不可避免。

均數(shù)的標(biāo)準(zhǔn)誤（standard error of mean SEM）：用于表示均數(shù)抽樣誤差的指標(biāo)，反映樣本均數(shù)之間的離散程度和樣本均數(shù)抽樣誤差的大小。

可信區(qū)間（confidence interval CI）：為按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍，含義是包含總體參數(shù)的可能性是1-a。

自由度：n個(gè)變量中，可自由取值的變量的個(gè)數(shù)。

參數(shù)估計(jì)：用樣本指標(biāo)（統(tǒng)計(jì)量）估計(jì)總體指標(biāo)（參數(shù)），有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。

假設(shè)檢驗(yàn)中P的含義：指從H₀規(guī)定的總體隨機(jī)抽得的等于及大于（或等于及小于）現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。

I類(lèi)錯(cuò)誤：拒絕了實(shí)際上成立的H₀這類(lèi)棄真的錯(cuò)誤稱(chēng)為I類(lèi)錯(cuò)誤，概率大小用alfa α表示。

對(duì)的卻錯(cuò)殺

II類(lèi)錯(cuò)誤：接受了實(shí)際上不成立的H₀這類(lèi)存?zhèn)蔚腻e(cuò)誤稱(chēng)為II類(lèi)錯(cuò)誤，概率大小用β表示。

錯(cuò)的卻留者

檢驗(yàn)效能：是指當(dāng)兩總體確有差別，按規(guī)定的檢驗(yàn)水準(zhǔn)所能發(fā)現(xiàn)該差異的能力。數(shù)值表示：1-β

檢驗(yàn)水準(zhǔn)：是預(yù)先規(guī)定的，當(dāng)假設(shè)檢驗(yàn)結(jié)果拒絕H₀接受H₁下有差別的結(jié)論時(shí)犯錯(cuò)誤的概率稱(chēng)為檢驗(yàn)水準(zhǔn)，記為α

均方：有離均差平方和被自由度相除而得。

方差分析：根據(jù)資料的設(shè)計(jì)類(lèi)型，即變異的不同來(lái)源將全部觀察值總的離均差平方和與自由度分解為兩個(gè)或多個(gè)部分，除隨機(jī)誤差外，其余每個(gè)部分的變異可由某個(gè)或某幾個(gè)因素的作用加以解釋?zhuān)ㄟ^(guò)各變異來(lái)源地均方與誤差均方比值的大小，借助F分布做出統(tǒng)計(jì)推斷，判斷各因素對(duì)觀測(cè)指標(biāo)有無(wú)影響。

總變異：樣本中全部實(shí)驗(yàn)單位差異稱(chēng)為總變異，其大小可用全部觀察值的均方表示。

組間變異：各處理組間觀察值大小不等，這種變異稱(chēng)為組間變異，可用組間均方表示。

組內(nèi)變異：各處理組內(nèi)部觀察值大小不等，這種變異稱(chēng)為組內(nèi)變異，可用組內(nèi)均方表示。

完全隨機(jī)設(shè)計(jì)：只考慮一個(gè)處理因素，將全部受試對(duì)象隨機(jī)分配到各處理組，然后觀察實(shí)驗(yàn)效應(yīng)。

隨機(jī)區(qū)組設(shè)計(jì)：事先將全部受試對(duì)象按自然屬性分為若干區(qū)組，原則是各區(qū)組內(nèi)的受試對(duì)象的特征相同或相近，且受試對(duì)象數(shù)與處理因素的水平相等，然后將每個(gè)區(qū)組內(nèi)的觀察對(duì)象隨機(jī)地分配到各處理組。

相對(duì)數(shù)：是兩個(gè)有聯(lián)系的指標(biāo)之比，是分類(lèi)變量常用的描述性統(tǒng)計(jì)指標(biāo)，常用相對(duì)數(shù)有“率，構(gòu)成比，比”等。

率：頻率指標(biāo)，說(shuō)明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度，計(jì)算公式為發(fā)生某現(xiàn)象的觀察單位數(shù)除以可能發(fā)生某現(xiàn)象的觀察總體值*100% 表示方式有百分率%，千分率。

構(gòu)成比：構(gòu)成指標(biāo)。說(shuō)明某一事物內(nèi)部的各組成部分所占的比重或分布，計(jì)算公式為：某一組分的觀察單位數(shù)除以同一事物各組分的觀察單位總數(shù)*100%，表示方法有百分?jǐn)?shù)等。

比相對(duì)比。是AB兩個(gè)有關(guān)指標(biāo)之比，說(shuō)明A是B的若干倍或百分之幾，計(jì)算公式為比等于。

標(biāo)準(zhǔn)化法：常用于內(nèi)部構(gòu)成不同的兩個(gè)或多個(gè)率比較的一種方法，基本思想是指定一個(gè)統(tǒng)計(jì)標(biāo)準(zhǔn)，按指定標(biāo)準(zhǔn)計(jì)算調(diào)制率，使之具備可比性以后再比較，以消除由于內(nèi)部構(gòu)成不同對(duì)總率比較帶來(lái)的影響。

定基比：統(tǒng)一用某個(gè)時(shí)間的指標(biāo)作為基數(shù)，其它各時(shí)間的指標(biāo)與之相比。

環(huán)比：以前一個(gè)時(shí)間的指標(biāo)作基數(shù)，以相鄰的后一個(gè)時(shí)間的指標(biāo)與之相比。

平均增長(zhǎng)速度：用于概括某一時(shí)期的平均速度變化，即該時(shí)期環(huán)比的幾何均數(shù)減1。計(jì)算公式為平均增長(zhǎng)速度=平均發(fā)展速度-1=

粗死亡率（crude death rate CDR）：或死亡率（mortality rate），指某地某年平均每千人口中的死亡數(shù)，它反映居民總的死亡水平。

發(fā)病率（incidence rate IR）：表示一定時(shí)期內(nèi)，可能發(fā)生某病的一定人群中新發(fā)生某病的強(qiáng)度。

患病率（prevalence rate PR）：又稱(chēng)現(xiàn)患率，指某時(shí)刻點(diǎn)上受檢人群中現(xiàn)患某種疾病的頻率，通常用于描述病程較長(zhǎng)或發(fā)病時(shí)間不明確的疾病的患病情況。

動(dòng)態(tài)數(shù)列（dynamic series）按一定的時(shí)間順序，將一系列描述事物的統(tǒng)計(jì)指標(biāo)依次排列起來(lái)，就可以觀察和比較該事物在時(shí)間上的變化和發(fā)展趨勢(shì)。

標(biāo)化死亡率（standardized mortality rate SMR）:尋找一個(gè)統(tǒng)一的分布作為標(biāo)準(zhǔn)組，然后每個(gè)比較組均按照該分布標(biāo)準(zhǔn)計(jì)算相應(yīng)的死亡率，所得到的死亡率是相對(duì)于標(biāo)準(zhǔn)組的，故稱(chēng)為標(biāo)化死亡率，由于采取了統(tǒng)一的標(biāo)準(zhǔn)，消除了內(nèi)部分布不同對(duì)總死亡率的影響，使算得的標(biāo)化死亡率具有可比性。

二項(xiàng)分布（Binomial distribution）：如果每一次實(shí)驗(yàn)只有陽(yáng)性或陰性兩種可能的結(jié)果，每次實(shí)驗(yàn)陽(yáng)性結(jié)果的發(fā)生概率均為π，陰性結(jié)果均為1-π，每次實(shí)驗(yàn)結(jié)果是相互獨(dú)立的，那么重復(fù)n次實(shí)驗(yàn)，發(fā)生陽(yáng)性結(jié)果次數(shù)X的概率分布稱(chēng)為二項(xiàng)分布。

擬合優(yōu)度：指一種度量某事物的頻數(shù)分布是否符合某一理論分布或數(shù)據(jù)是否與模型吻合的方法。

非參數(shù)統(tǒng)計(jì)：不依賴(lài)于總體分布類(lèi)型，也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn)。

參數(shù)統(tǒng)計(jì)：通常要求樣本來(lái)自總體分布型是已知的，在這種假設(shè)的基礎(chǔ)上，對(duì)總體參數(shù)進(jìn)行估計(jì)和檢驗(yàn)。

秩次：變量值按從小到大順序所編的秩序號(hào)。

秩和：各組秩次的合計(jì)稱(chēng)為秩和，是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。

直線回歸：建立一個(gè)描述應(yīng)變量依自變量而變化的直線方程，并要求各點(diǎn)與該直線縱向距離的平方和為最小。

回歸系數(shù)：即直線的斜率，直線回歸方程中用b表示，其統(tǒng)計(jì)意義為X每增減一個(gè)單位，Y平均改變b個(gè)單位。

直線相關(guān)：用于雙變量正態(tài)分布資料，有正相關(guān)，負(fù)相關(guān)和零相關(guān)等關(guān)系。零相關(guān)表示兩變量之間美歐直線相關(guān)系數(shù)。

相關(guān)系數(shù)或積差相關(guān)系數(shù)：以符號(hào)γ表示樣本相關(guān)系數(shù)，p表示總體相關(guān)系數(shù)，它是說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。

秩相關(guān)或等級(jí)相關(guān)：用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析，適用于1，不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析，2，總體分布型未知，3，用等級(jí)表示原始數(shù)據(jù)。

統(tǒng)計(jì)圖：將統(tǒng)計(jì)指標(biāo)用幾何圖形表達(dá)，即以點(diǎn)的位置，線段的升降，直條的長(zhǎng)短和面積的大小等形式直觀的表示事物間的數(shù)量關(guān)系。

安慰劑對(duì)照：在實(shí)驗(yàn)研究中，對(duì)照組使用一種外形與實(shí)驗(yàn)藥物完全相同而毫無(wú)藥理作用的物質(zhì)，這種對(duì)照稱(chēng)為安慰劑對(duì)照。

隨機(jī)化：指研究對(duì)象中或總體中每一個(gè)觀察單位都有同等的機(jī)會(huì)被選入樣本或?qū)嶒?yàn)研究的各處理組中。

混雜因素：指實(shí)驗(yàn)研究中由于某些非實(shí)驗(yàn)因素與實(shí)驗(yàn)因素同時(shí)并存的作用影響到觀察的結(jié)果，這種非實(shí)驗(yàn)因素稱(chēng)為混雜因素。

偏倚：指在實(shí)驗(yàn)中由于某些非實(shí)驗(yàn)因素的干擾而形成的系統(tǒng)誤差，歪曲了處理因素的真實(shí)效應(yīng)。

實(shí)驗(yàn)研究：是指研究者根據(jù)研究目的主動(dòng)加以干預(yù)措施，并觀察總結(jié)結(jié)果，回答假設(shè)研究所提出的問(wèn)題的一種研究方法。

調(diào)查研究：是指對(duì)特定對(duì)象群體進(jìn)行調(diào)查，影響被調(diào)查的因素是客觀存在的，研究者只能被動(dòng)地觀察和如實(shí)記錄。調(diào)查時(shí)的研究條件往往難以控制，一般只有通過(guò)合理分組，設(shè)置對(duì)照等手段盡可能的減少干擾。

簡(jiǎn)答

1， 統(tǒng)計(jì)工作的步驟：統(tǒng)計(jì)工作全過(guò)程可分為：統(tǒng)計(jì)設(shè)計(jì)，搜集資料，整理資料和分析資料四個(gè)步驟。它們相互聯(lián)系，缺一不可。

設(shè)計(jì)：是整個(gè)統(tǒng)計(jì)研究實(shí)施的依據(jù)，是最關(guān)鍵的一環(huán)，在設(shè)計(jì)時(shí)應(yīng)對(duì)后三個(gè)步驟進(jìn)行周密的設(shè)想和安排。

搜集資料：是統(tǒng)計(jì)工作的基礎(chǔ)。是根據(jù)設(shè)計(jì)取得準(zhǔn)確可靠地原始數(shù)據(jù)，按其來(lái)源時(shí)間分為經(jīng)常性資料和一時(shí)性資料。資料要求完整，準(zhǔn)確和及時(shí)。

整理資料：對(duì)原始資料進(jìn)行審核、校正、整理并使之系統(tǒng)化、條理化，便于統(tǒng)計(jì)分析。

分析資料：計(jì)算統(tǒng)計(jì)指標(biāo)，反映數(shù)據(jù)的綜合特征，闡明事物內(nèi)在的聯(lián)系和規(guī)律，得出科學(xué)結(jié)論，統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷。

2， 制作頻數(shù)表的步驟：求全距，定組段數(shù)和組距；劃組段；繪制整理表。

3， 頻數(shù)表的用途：解釋頻數(shù)的分布特征和類(lèi)型：便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析處理；便于發(fā)現(xiàn)某些特大或特小的可疑值。

4， 標(biāo)準(zhǔn)差的用途：表示觀察值得平均離散程度：結(jié)合均數(shù)可疑描述正態(tài)資料頻數(shù)分布的特征和估計(jì)醫(yī)學(xué)參考值范圍：結(jié)合樣本均數(shù)可疑計(jì)算變異系數(shù)；結(jié)合樣本含量可疑計(jì)算標(biāo)準(zhǔn)誤。

5， 變異系數(shù)的應(yīng)用：比較度量衡單位不同的多組資料的變異度：比較均數(shù)相差懸殊的多組資料的變異度。

6， 正態(tài)分布的特征：以μ為中心，左右對(duì)稱(chēng)，均數(shù)處于曲線最高，兩邊逐漸下降；正態(tài)分布曲線下面積分分布有一定規(guī)律：有兩個(gè)參數(shù)μ和σ，位置參數(shù)μ和變異參數(shù)σ決定了曲線的變異度和位置。

7， 正態(tài)分布的應(yīng)用：估計(jì)頻數(shù)分布：制定醫(yī)學(xué)參考值范圍；做質(zhì)量控制

8， 標(biāo)準(zhǔn)誤的用途：反映了樣本均數(shù)間的離散程度及樣本均數(shù)抽樣誤差的大小；推算可信區(qū)間；進(jìn)行假設(shè)檢驗(yàn)。

9， t分布的特征：?jiǎn)畏宸植?，以O(shè)位中心，左右對(duì)稱(chēng)，類(lèi)似于標(biāo)準(zhǔn)正態(tài)分布；t分布形狀與n有關(guān)，自由度越小，標(biāo)準(zhǔn)誤越大，t值越分散，曲峰越矮，尾翹越高；n趨于無(wú)窮時(shí)，樣本標(biāo)準(zhǔn)差逼近總體標(biāo)準(zhǔn)差，t分布逼近標(biāo)準(zhǔn)正態(tài)分布，t分布不是一條曲線，而是一簇曲線。

10， 假設(shè)檢驗(yàn)的基本思想：基于反證法思想和小概率思想。反證法思想：首先提出假設(shè)，用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小，如果可能性小，則認(rèn)為假設(shè)不成立，拒絕它，如果可能性大，還不能認(rèn)為它不成立；小概率思想：是指小概率事件在一次隨機(jī)實(shí)驗(yàn)中認(rèn)為基本上不會(huì)發(fā)生，在進(jìn)行統(tǒng)計(jì)分析時(shí)要事先規(guī)定概率，即檢驗(yàn)水準(zhǔn)a

11， 假設(shè)檢驗(yàn)的基本步驟：建立假設(shè)；確定檢驗(yàn)水準(zhǔn)；選定檢驗(yàn)方法；計(jì)算檢驗(yàn)統(tǒng)計(jì)量；確定P值，做出推斷結(jié)論。

12， t檢驗(yàn)的應(yīng)用條件：當(dāng)樣本含量較小時(shí)，理論上要求樣本取自正態(tài)總體，兩樣本均數(shù)比較時(shí)還要求兩樣本方差相等，（u檢驗(yàn)應(yīng)用條件：樣本含量較大，或n雖小但總體標(biāo)準(zhǔn)差已知）。

13， 配對(duì)設(shè)計(jì)的幾種情形：兩個(gè)同質(zhì)受試對(duì)象分別接受兩種不同的處理；同一受試對(duì)象分別接受兩種不同的處理；同一受試對(duì)象處理前后

14， 配對(duì)t檢驗(yàn)的基本原理：設(shè)兩種處理的效應(yīng)相同，即u₁=u₂，即看成是差值的樣本均數(shù)d所代表的未知總體均數(shù)與已知總體均數(shù)的比較

15， 假設(shè)檢驗(yàn)注意的問(wèn)題：要有嚴(yán)密的研究設(shè)計(jì)：不同變量或資料選用不同的檢驗(yàn)方法；正確理解顯著性一詞的含義；做結(jié)論不能絕對(duì)化；統(tǒng)計(jì)顯著性對(duì)應(yīng)于統(tǒng)計(jì)結(jié)論，醫(yī)學(xué)臨床生物學(xué)顯著性對(duì)應(yīng)于專(zhuān)業(yè)結(jié)論。

16， 參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的區(qū)別及各自優(yōu)缺點(diǎn)：

參數(shù)檢驗(yàn)：以已知分布為假設(shè)條件，對(duì)總體參數(shù)進(jìn)行估計(jì)或檢驗(yàn)；

非參數(shù)檢驗(yàn)：不依賴(lài)總體分布的具體形式和檢驗(yàn)分布是否相同。參數(shù)檢驗(yàn)優(yōu)點(diǎn)是符合條件時(shí)檢驗(yàn)效率高，缺點(diǎn)是對(duì)資料要求嚴(yán)格而且要求資料的分布型已知和總體方差相等。

非參數(shù)檢驗(yàn)優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單便于掌握；應(yīng)用廣泛；收集資料方便，缺點(diǎn)是容易損失信息。檢驗(yàn)效率低。

17， 可信區(qū)間與假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系：可信區(qū)間用于說(shuō)明量的大小即推斷總體均數(shù)的范圍，而假設(shè)檢驗(yàn)用于推斷質(zhì)的不同即判斷兩總體均數(shù)是否不同，兩者相互聯(lián)系又相互區(qū)別；可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題；可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息，但并不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn)；可信區(qū)間只能在預(yù)先規(guī)定的概率——檢驗(yàn)水準(zhǔn)的前提下進(jìn)行計(jì)算，而假設(shè)檢驗(yàn)?zāi)軌颢@得較為確切的P值，故兩者結(jié)合起來(lái)次才是完整的分析。

18， 方差分析的基本思想：根據(jù)資料的設(shè)計(jì)類(lèi)型，即變異的不同來(lái)源將全部觀察值總的離均差平方和和自由度分解為兩個(gè)或多個(gè)部分，除隨機(jī)誤差外，其余每個(gè)部分的變異可由某個(gè)或幾個(gè)因素的作用加以解釋?zhuān)ㄟ^(guò)比較不同變異來(lái)源地均方，借助F分布做出統(tǒng)計(jì)推斷，從而了解該因素對(duì)觀測(cè)指標(biāo)有無(wú)影響。

19， 方差分析的應(yīng)用條件：1各次觀察獨(dú)立，即任何兩個(gè)觀察值之間均不相關(guān)，2同一水平下的觀察值X_ij分別服從總體均數(shù)μ的正態(tài)分布。3各總體的方差基本相等，概括的表達(dá)為：任何觀察值都是獨(dú)立的來(lái)自于具有等方差的正態(tài)總體。

20， 應(yīng)用相對(duì)數(shù)的注意事項(xiàng)：計(jì)算相對(duì)數(shù)的分母一般不宜過(guò)?。环治鍪遣荒芤詷?gòu)成比代替率，應(yīng)當(dāng)注意不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析；對(duì)觀察單位不等的幾個(gè)率，不能直接相加求其總率，在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性；對(duì)樣本率（構(gòu)成比）的比較應(yīng)隨機(jī)抽樣，并做假設(shè)檢驗(yàn)。

21， 四格表²檢驗(yàn)的適用條件：1，當(dāng)n>=40且所有T>=5時(shí)，用普通的²檢驗(yàn)，若所得的P約等于0時(shí)，改用確切概率法，2，當(dāng)n>=40但1<=T<=5時(shí)，用校正²檢驗(yàn)；3當(dāng)n<40或T<1時(shí)，不能用²檢驗(yàn)，改用確切概率法。

22，秩和檢驗(yàn)的基本思想：假定從一總體中，隨機(jī)抽取一個(gè)樣本，可以求出T+和T-，當(dāng)重復(fù)所有可能組合的樣本，得T+和T-的分布，T的分布以均數(shù)為中心對(duì)稱(chēng)的非連續(xù)分布，當(dāng)H₀成立，從總體隨機(jī)抽取任一樣本，所得T值在均數(shù)附近的概率最大，當(dāng)T值遠(yuǎn)離均數(shù)概率較小，隨著n增大，T的分布逐漸逼近均數(shù)n(n+1)/4，方差n(n+1)(2n+1)/24的正態(tài)分布，當(dāng)n<25時(shí)，T的分布已較好地近似正態(tài)分布。

23，成組設(shè)計(jì)兩個(gè)樣本比較的秩和檢驗(yàn)的基本思想n1和n2兩個(gè)樣本，來(lái)自同一總體和分布相同的兩個(gè)總體，即假設(shè)檢驗(yàn)H₀成立，則n1樣本的秩和T與平均秩和n1(N+1)/2一般相差不大，也就是u值小于u，若T與平均秩和n1(N+1)/2相差很大，則表示籌得的樣本統(tǒng)計(jì)量T值的概率很小，因而拒絕檢驗(yàn)假設(shè)H₀。

24，直線回歸方程的應(yīng)用：描述兩變量的依存關(guān)系；利用回歸方程進(jìn)行預(yù)測(cè)；利用回歸方程進(jìn)行統(tǒng)計(jì)控制。

25，應(yīng)用直線回歸應(yīng)注意的問(wèn)題：做回歸分析要有實(shí)際意義，不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象勉強(qiáng)做回歸分析，即使有回歸關(guān)系也不一定是因果關(guān)系，還必須對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認(rèn)識(shí)，能從專(zhuān)業(yè)理論上做出合理解釋或有所依據(jù)，在進(jìn)行直線回歸分析前，應(yīng)繪制散點(diǎn)圖，當(dāng)觀察點(diǎn)的分布有直線趨勢(shì)，才適宜直線回歸分析；直線回歸方程的適用范圍一般以自便量的取值為限，不能任意外延。

26，直線回歸與相關(guān)的區(qū)別

1資料要求不同：回歸要求變量Y服從正態(tài)分布，X是可以精確測(cè)量和嚴(yán)格控制的變量，相關(guān)要求兩個(gè)變量X，Y服從雙變量正態(tài)分布，

2應(yīng)用情況不同：說(shuō)明兩變量間依存變化的數(shù)量關(guān)系用回歸，說(shuō)明變量間的相關(guān)關(guān)系用相關(guān)

3，意義不同：回歸系數(shù)b表示自變量X每變化一個(gè)單位后應(yīng)變量Y的平均變化量，相關(guān)系數(shù)r表示兩變量相關(guān)的方向和密切程度

4取值范圍不同：-1<=r<=1；b負(fù)無(wú)窮到正無(wú)窮大。

5單位不同，回歸系數(shù)b有單位，相關(guān)系數(shù)r沒(méi)單位。

27，直線回歸與相關(guān)的聯(lián)系：

1兩者都是研究?jī)蓚€(gè)數(shù)值變量的關(guān)系的統(tǒng)計(jì)方法，

2方向一致：對(duì)一組數(shù)據(jù)若同時(shí)計(jì)算r與b，他們的正負(fù)號(hào)一致，r為正說(shuō)明兩變量間的相互關(guān)系是同向變化的，b為正號(hào)說(shuō)明X增減一個(gè)單位，Y平均增減b個(gè)單位，

3假設(shè)檢驗(yàn)對(duì)同一樣本，r與b的假設(shè)檢驗(yàn)得到的t值相等，由于r的假設(shè)檢驗(yàn)簡(jiǎn)單，故在實(shí)際應(yīng)用中常用以前法代替后法，

4用回歸解釋相關(guān)，決定系數(shù)P²=SS回/SS總，回歸平方和越接近總平方和，R²越接近1。

28，列表的原則

1重點(diǎn)突出，簡(jiǎn)單明了

2主次分明，層次清楚，符合邏輯。

29，列表的基本要求

1標(biāo)題，概括表的內(nèi)容，寫(xiě)于表的正上方中央，必要時(shí)注明時(shí)間地點(diǎn)。主要內(nèi)容

2標(biāo)目以橫縱向標(biāo)目分別說(shuō)明主語(yǔ)與謂語(yǔ)，文字簡(jiǎn)明，層次清楚，有單位用（）

3，線條用三線條表示，粗略的頂端線及縱標(biāo)下的橫線，其余一律省去，

4數(shù)字以阿拉伯?dāng)?shù)字表示，暫缺或無(wú)數(shù)字分別以“”、“——”表示，不應(yīng)有空項(xiàng)，為核實(shí)與分析，表常應(yīng)有合計(jì)。

5不列備注，必要說(shuō)明者表*，于表下方說(shuō)明。

30，實(shí)驗(yàn)的基本原則隨機(jī)化，對(duì)照，重復(fù)。

31，對(duì)照的種類(lèi)：空白，安慰劑，自身，實(shí)驗(yàn)，標(biāo)準(zhǔn)

32，實(shí)驗(yàn)設(shè)計(jì)的基本步驟：建立研究假設(shè)，明確研究范圍，確立處理因素，明確觀察指標(biāo)，控制誤差和偏倚。

33，常用的實(shí)驗(yàn)設(shè)計(jì)方法：完全隨機(jī)設(shè)計(jì)，配對(duì)設(shè)計(jì)，交叉設(shè)計(jì)，隨機(jī)區(qū)組設(shè)計(jì)，析因設(shè)計(jì)。

34，確定樣本含量時(shí)應(yīng)具備的條件：建立假設(shè)檢驗(yàn)，定出檢驗(yàn)水準(zhǔn)，提出所期望的檢驗(yàn)效能，必須知道有樣本推斷總體的一些信息。

35，常用的估計(jì)樣本含量的方法：兩樣本均數(shù)比較，配對(duì)實(shí)驗(yàn)和交叉試驗(yàn)，樣本均數(shù)與總體均數(shù)的比較，兩樣本率的比較，配對(duì)分類(lèi)資料多用X²檢驗(yàn)進(jìn)行處理，估計(jì)總體均數(shù)的樣本含量，估計(jì)總體率的樣本含量。

36，實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì)的主要區(qū)別：

調(diào)查設(shè)計(jì)

1在研究過(guò)程中沒(méi)有人為施加的干預(yù)措施，而是客觀的觀察記錄某些現(xiàn)象的現(xiàn)狀及其相關(guān)特征，

2不能采用隨機(jī)分配的方法來(lái)平衡或消除非研究因素對(duì)研究結(jié)果的影響；

實(shí)驗(yàn)設(shè)計(jì)

1研究者根據(jù)研究目的主動(dòng)加以干預(yù)措施，并觀察總結(jié)其結(jié)果，回答研究假設(shè)所提出的問(wèn)題，

2按隨機(jī)分配的方法去除混雜因素。

37，標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別與聯(lián)系

區(qū)別

1概念不同：標(biāo)準(zhǔn)差是描述樣本中個(gè)體值間的變異程度指標(biāo)，標(biāo)準(zhǔn)差越小，表示變量值圍繞均數(shù)波動(dòng)越小，標(biāo)準(zhǔn)誤是描述樣本均數(shù)間的變異程度指標(biāo)，標(biāo)準(zhǔn)差越小，表示變量值圍繞均數(shù)波動(dòng)越小。

2用途不同：標(biāo)準(zhǔn)差用于表示變量值對(duì)均數(shù)波動(dòng)的大小，當(dāng)資料呈正態(tài)分布時(shí)，與均數(shù)結(jié)合可估計(jì)正常值范圍，計(jì)算變異系數(shù)等，標(biāo)準(zhǔn)誤常用于表示樣本統(tǒng)計(jì)量和總體參數(shù)的波動(dòng)情況，可估計(jì)參數(shù)可信區(qū)間進(jìn)行假設(shè)檢驗(yàn)。

3與例數(shù)的關(guān)系不同，當(dāng)樣本含量足夠大時(shí)，標(biāo)準(zhǔn)差趨向穩(wěn)定，而標(biāo)準(zhǔn)誤隨例數(shù)增大而減小，甚至趨向于0，若樣本含量趨向于總例數(shù)，標(biāo)準(zhǔn)差趨近于0或更高。

38，非參數(shù)檢驗(yàn)的適應(yīng)情況：1分布型未知，2能以嚴(yán)重程度，優(yōu)劣等級(jí)，效果大小和名次先后等劃分的等級(jí)資料。3分布極度偏態(tài)。4本組內(nèi)個(gè)別變量偏離越大，遠(yuǎn)離本組其他變量值，5，方差不齊時(shí)，6篩選或只需獲得初步結(jié)果。

39，如何正確選用單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)：?jiǎn)蝹?cè)檢驗(yàn)首先應(yīng)根據(jù)專(zhuān)業(yè)知識(shí)來(lái)確定，同時(shí)也應(yīng)考慮所要解決問(wèn)題的目的，若從轉(zhuǎn)押知識(shí)判斷一種方法的結(jié)果可能低于或高于另一種方法的結(jié)果，則用單側(cè)檢驗(yàn)；在尚不能從專(zhuān)業(yè)知識(shí)判斷兩種結(jié)果高低時(shí)，用雙側(cè)檢驗(yàn)，若研究者對(duì)于低于或高于兩種結(jié)果都關(guān)心時(shí)，則用雙側(cè)檢驗(yàn)，若只關(guān)心其中一種可能，則取單側(cè)檢驗(yàn)，一般認(rèn)為雙側(cè)檢驗(yàn)較保守和穩(wěn)妥，單側(cè)檢驗(yàn)由于充分利用了另一側(cè)的不可能性，更易得出有差別的結(jié)論，但應(yīng)慎用。

40，配對(duì)t檢驗(yàn)與配伍組設(shè)計(jì)的方差分析之間有何聯(lián)系？?jī)蓸颖総檢驗(yàn)與完全隨機(jī)設(shè)計(jì)的方差分析有何聯(lián)系？

配伍組設(shè)計(jì)的方差分析是配對(duì)t檢驗(yàn)的推廣，他們的基本原理相同。完全隨機(jī)設(shè)計(jì)的方差分析是兩樣本t檢驗(yàn)的推廣，他們的基本原理相同。不管是配伍組設(shè)計(jì)害死完全隨機(jī)設(shè)計(jì)，當(dāng)對(duì)比樣本為兩組，可用t檢驗(yàn)也可以用方差分析，他們是等價(jià)的，當(dāng)對(duì)比樣本在兩組以上只能用方差分析。

41， P 0.05拒絕H₀的理論根據(jù)。P值是指從H₀規(guī)定的總體隨機(jī)抽取等于及大于（或等于及小于）現(xiàn)有樣本統(tǒng)計(jì)量的概率，P 0.05，說(shuō)明在H₀成立的條件下，得到現(xiàn)有檢驗(yàn)結(jié)果的概率小于小概率事件標(biāo)準(zhǔn)0.05.因小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生，現(xiàn)的確發(fā)生了，說(shuō)明樣本信息不支持H₀，所以懷疑假設(shè)H₀不成立，故拒絕H₀。

42，配對(duì)比較的假設(shè)檢驗(yàn)，能否出現(xiàn)t檢驗(yàn)結(jié)果P>0.05，而非參數(shù)檢驗(yàn)結(jié)果P<0.05？

答：可能出現(xiàn)。配對(duì)t檢驗(yàn)的統(tǒng)計(jì)量t=，式中d為差值均數(shù)，當(dāng)Sd固定時(shí)，t的大小取決于d，差值均數(shù)小，t值就小，表明每個(gè)對(duì)子是接近的，故檢驗(yàn)結(jié)果為P>0.05。推斷兩總體差值為0的假設(shè)未能拒絕，在參數(shù)檢驗(yàn)中，綜合了差數(shù)大小與方向的全部信息，差數(shù)大小更能提供兩組數(shù)據(jù)之差有無(wú)實(shí)際意義的信息，而配對(duì)秩和檢驗(yàn)更側(cè)重方向的作用，設(shè)想當(dāng)n對(duì)差數(shù)全部為正號(hào)時(shí)，盡管兩組數(shù)據(jù)非常接近，也會(huì)出現(xiàn)T+很大，T-為零的局面，即P<0.05的結(jié)果，這種局面雖然可以出現(xiàn)，但隨n的增大，如果H₀為真，則差數(shù)的方向是隨機(jī)出現(xiàn)的，故T+和T-一般相差不大，其檢驗(yàn)結(jié)果與參數(shù)檢驗(yàn)結(jié)果多數(shù)情況下還是一致的。

43，參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)所得結(jié)果不一致，以何為準(zhǔn)？

僅供參考

第一章緒論

統(tǒng)計(jì)學(xué)（statistics），是研究數(shù)據(jù)的收集、整理、分析的一門(mén)科學(xué)，幫助人們分析占有信息。達(dá)到去偽存真、去粗存精、爭(zhēng)取認(rèn)識(shí)世界的一種重要手段。

衛(wèi)生統(tǒng)計(jì)學(xué)（health statistics）：是研究居民健康狀況以及衛(wèi)生服務(wù)領(lǐng)域中數(shù)據(jù)的收集、整理和分析的一門(mén)科學(xué)。

統(tǒng)計(jì)描述（descriptive statistics）用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法，對(duì)資料的數(shù)量特征及其分布規(guī)律進(jìn)行滴定和描述。

統(tǒng)計(jì)推斷（statistical inference）：通過(guò)樣本指標(biāo)來(lái)說(shuō)明總體特征，從樣本獲取有關(guān)總體信息的過(guò)程

總體（population）：是根據(jù)研究目的確定的同質(zhì)觀察單位的全體。

樣本（sample）從總體中隨機(jī)抽取部分由代表性的觀察單位，其測(cè)量值的集合稱(chēng)為樣本。

變量（variable）：在確定總體之后，研究者則應(yīng)對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量和觀察，這種特征稱(chēng)為變量。

變異（variation）：指在自然地狀態(tài)下，個(gè)體測(cè)量結(jié)果在同質(zhì)基礎(chǔ)上的差異。

隨機(jī)抽樣（random sample）：按隨機(jī)化原則從總體中抽取部分觀察單位的過(guò)程。以避免誤差和偏倚對(duì)研究結(jié)果有所影響。

樣本含量或樣本大?。╯ample size）：樣本包含的觀察單位數(shù)稱(chēng)為樣本含量，醫(yī)學(xué)上也稱(chēng)為樣本例數(shù)。

定量資料（quantitative data）是測(cè)量每個(gè)觀察單位某項(xiàng)指標(biāo)大小所得到的資料，一般均有度量衡單位。

分類(lèi)資料（categorical data）：觀察值是定性的，表現(xiàn)為互不相容的類(lèi)別或?qū)傩浴?/p>

有序分類(lèi)（ordinal categories）：各類(lèi)之間有程度的差別，給人以“半定量”的概念。

概率（probability）：是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值，記為P（A），P（A）越大，說(shuō)明A事件發(fā)生的可能性越大，0<P(A)<1,小概率事件。

統(tǒng)計(jì)工作的步驟：設(shè)計(jì)（design），收集資料（collection），整理資料（sorting data），分析資料（analysis of data）（統(tǒng)計(jì)描述descriptive statistics）、統(tǒng)計(jì)推斷（inferential statistics）

第二章定量資料的統(tǒng)計(jì)描述

對(duì)稱(chēng)分布：是指集中位置在中間，左右兩側(cè)頻數(shù)大體對(duì)稱(chēng)。

偏態(tài)分布：指集中位置偏向一側(cè)，頻數(shù)分布不對(duì)稱(chēng)，分為正偏態(tài)和負(fù)偏態(tài)。

均數(shù)（mean）：描述一組數(shù)據(jù)在數(shù)量上的平均水平，適用于對(duì)稱(chēng)分布，特別是正態(tài)或者近似正態(tài)分布的定量資料。

中位數(shù)（median），是指將一組觀察值從小到大排列后，居于中間位置的那個(gè)數(shù)值。將一組觀察值由小到大排列，n為奇數(shù)時(shí)取位次居中的變量值，為偶數(shù)時(shí)，取位次居中的兩個(gè)變量的平均值。

極差（range）：是全部數(shù)據(jù)中最大值與最小值之差，它描述了數(shù)據(jù)變異的程度。又稱(chēng)全距，為最大值與最小值之差，用于資料的粗略分析，計(jì)算簡(jiǎn)便但穩(wěn)定性較差。符號(hào)R.

標(biāo)準(zhǔn)差：反映定量資料離散趨勢(shì)的指標(biāo)，它能反映每一個(gè)變量值與均值的平均的離散程度，S越小，變量值與均值離散程度越小，均數(shù)代表性越好。

變異系數(shù)（coefficient of variation CV）：標(biāo)準(zhǔn)差與算術(shù)均數(shù)的比值。

頻數(shù)分布表的用途：

1揭示資料的分布類(lèi)型

2由頻數(shù)分布表可以看到頻數(shù)分布的兩個(gè)重要特征：集中趨勢(shì)和離散趨勢(shì)。

3便于發(fā)現(xiàn)某些特大或特小的可疑值。

4便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和做統(tǒng)計(jì)處理。

描述集中趨勢(shì)的指標(biāo)：均數(shù)X，幾何均數(shù)G，中位數(shù)M

描述離散趨勢(shì)的指標(biāo)：極差，方差，標(biāo)準(zhǔn)差，四分位數(shù)間距IQR，變異系數(shù)CV

第三章正態(tài)分布

正態(tài)分布：若X的頻數(shù)曲線對(duì)應(yīng)于數(shù)學(xué)上的正態(tài)分布曲線（曲線呈鐘型，兩頭低中間高，左右對(duì)稱(chēng)）則稱(chēng)該指標(biāo)服從正態(tài)分布。

正態(tài)分布的應(yīng)用：歸頻數(shù)分布：制定參考值范圍，作質(zhì)量控制，統(tǒng)計(jì)處理方法的基礎(chǔ)。

第四章總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)

抽樣誤差（sampling error）：是由個(gè)體變異產(chǎn)生的，抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。

標(biāo)準(zhǔn)誤（standard error）是樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。

均數(shù)的標(biāo)準(zhǔn)誤（standard error of mean SEM）用于表示均數(shù)抽樣誤差的指標(biāo)，反映樣本均數(shù)之間的離散程度和樣本均數(shù)抽樣誤差的大小。

參數(shù)估計(jì)：是指用樣本指標(biāo)值（統(tǒng)計(jì)量）估計(jì)總體指標(biāo)值（參數(shù)）。

點(diǎn)估計(jì)：就是用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。

區(qū)間估計(jì)confidence interval CI：按預(yù)先給定的概率（1-a）確定的包含未知總體參數(shù)的可能范圍。該范圍通常稱(chēng)為參數(shù)的可信區(qū)間或置信區(qū)間。

I類(lèi)錯(cuò)誤：拒絕了實(shí)際上成立的H₀這類(lèi)棄真的錯(cuò)誤稱(chēng)為I類(lèi)錯(cuò)誤，概率大小用α表示。

II類(lèi)錯(cuò)誤：接受了實(shí)際上不成立的H₀這類(lèi)存?zhèn)蔚腻e(cuò)誤稱(chēng)為II類(lèi)錯(cuò)誤，概率大小用β表示。

可信度：預(yù)先給定的1-a。為按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍，含義是包含總體參數(shù)的可能性是1-a。

檢驗(yàn)效能（power of a test）（1-β）當(dāng)兩總體確有差異，按規(guī)定檢驗(yàn)水準(zhǔn)，所能發(fā)現(xiàn)該差異的能力。

中心極限定理：

1從正態(tài)總體N（μ,σ）中，隨機(jī)抽取例數(shù)為n的樣本，樣本均數(shù)也服從正態(tài)分布，即使從偏態(tài)總體中隨機(jī)抽取，當(dāng)n是足夠大時(shí)（如n>50），也近似正態(tài)分布。

2從均數(shù)μ，標(biāo)準(zhǔn)差σ的正態(tài)或偏態(tài)總體，抽取例數(shù)為n的樣本，樣本均數(shù)的總體均數(shù)也為μ，標(biāo)準(zhǔn)差用σ（）=

統(tǒng)計(jì)推斷包括：參數(shù)估計(jì)和假設(shè)檢驗(yàn)。

標(biāo)準(zhǔn)誤的用途：可反映樣品均數(shù)與總體均數(shù)距離遠(yuǎn)近，反映可靠性：與樣本均數(shù)結(jié)合估計(jì)總體均數(shù)的可信區(qū)間；進(jìn)行假設(shè)檢驗(yàn)。

假設(shè)檢驗(yàn)應(yīng)注意的問(wèn)題：1，要有嚴(yán)密的研究設(shè)計(jì)2，不同變量或資料應(yīng)選擇不同的檢驗(yàn)方法3，正確理解“顯著性”一詞的含義4，做結(jié)論不能絕對(duì)化5，統(tǒng)計(jì)“顯著性”與醫(yī)學(xué)臨床/生物學(xué)“顯著性”。

可信區(qū)間與假設(shè)檢驗(yàn)：1可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題，2可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息。

第五章方差分析

變量變換：將原始數(shù)據(jù)做某種函數(shù)轉(zhuǎn)換，使各組達(dá)到方差齊性，也可使資料轉(zhuǎn)換為正態(tài)分布。

方差分析的基本思想：就是把全部觀察值間的變異（總變異）按設(shè)計(jì)和需要分解成兩個(gè)或多個(gè)組成部分，總自由度也分解成相應(yīng)的幾個(gè)部分，再做分析。

分解的每一部分代表不同的含義，其中至少有一部分代表各均數(shù)間的變異情況，另一部分代表誤差。離均差平方和除以自由度得均方，組間均方與誤差均方之比為F值，F(xiàn)值遠(yuǎn)大于1，表示各組均數(shù)間差別有顯著性，F(xiàn)值遠(yuǎn)小于1，表示各組均數(shù)間差別無(wú)顯著性，可查F界表確定P。

方差分析的用途：兩個(gè)或多個(gè)樣本均數(shù)的比較，分析兩個(gè)或多個(gè)研究因素的交互關(guān)系以及回歸方程的線性假設(shè)檢驗(yàn)。

方差分析的應(yīng)用條件：1，各樣本是相互獨(dú)立的隨機(jī)樣本，2各樣本來(lái)自正態(tài)總體，3各處理組總體方差齊性。

變量變換：1目的：使方差性齊；資料正態(tài)化；還可用于曲線直線化；2類(lèi)型：對(duì)數(shù)變換：平方根變換；倒數(shù)變換；平方根反正弦變換等。

第六章分類(lèi)資料的統(tǒng)計(jì)描述

Relative number相對(duì)數(shù)：由兩個(gè)有聯(lián)系的指標(biāo)之比組成的用以描述分類(lèi)變量的統(tǒng)計(jì)指標(biāo)。

Rate率：又稱(chēng)頻率指標(biāo)，說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。率=發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)×100%

Proportion構(gòu)成比:又稱(chēng)構(gòu)成指標(biāo)，說(shuō)明某一事物內(nèi)部組成部分所占的比重或分布。構(gòu)成比=某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)×100%

Ratio比：又稱(chēng)相對(duì)比。是A，B兩個(gè)有關(guān)指標(biāo)之比，說(shuō)明A是B的若干倍或百分之幾。比=A/B

Standard mortality ratio SMR標(biāo)準(zhǔn)化死亡比：指被標(biāo)化組實(shí)際死亡數(shù)與預(yù)期死亡數(shù)之比。若SMR>1，表示被標(biāo)化人群的死亡率高于標(biāo)準(zhǔn)組：反之若SMR<1，表示被標(biāo)化人群的死亡率低于標(biāo)準(zhǔn)組。

Dynamic series動(dòng)態(tài)數(shù)列：是一系列按時(shí)間順序排列起來(lái)的統(tǒng)計(jì)指標(biāo)，包括絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)，用以說(shuō)明事物在時(shí)間上的變化和發(fā)展趨勢(shì)。

定基比：即統(tǒng)一用某個(gè)時(shí)間的指標(biāo)作基數(shù)，以各時(shí)間的指標(biāo)與之相比，是常用的動(dòng)態(tài)數(shù)列分析指標(biāo)之一。

環(huán)比：以前一個(gè)時(shí)間的指標(biāo)作基數(shù)，以相鄰的后一個(gè)時(shí)間的指標(biāo)與之相比。是常用的動(dòng)態(tài)數(shù)列分析指標(biāo)之一。

應(yīng)用相對(duì)數(shù)應(yīng)注意的問(wèn)題：計(jì)算相對(duì)數(shù)的分母一般不宜過(guò)小，當(dāng)例數(shù)小于30時(shí)，宜用絕對(duì)數(shù)表示為好；分析時(shí)不能以構(gòu)成比代替率，應(yīng)當(dāng)注意不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析；對(duì)觀察單位不等的幾個(gè)率，不能直接相加求其總率，在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性；對(duì)樣本率（構(gòu)成比）的比較應(yīng)隨機(jī)抽樣，并做假設(shè)檢驗(yàn)。

標(biāo)準(zhǔn)化法的基本思想：當(dāng)兩組或多組率之間比較，其內(nèi)部各小組的率明顯不同，且各小組的觀察例數(shù)的構(gòu)成比也明顯不同時(shí)，則不能直接比較兩組或多組的總率，得出結(jié)論。為消除構(gòu)成不同造成的影響。采取統(tǒng)一的標(biāo)準(zhǔn)構(gòu)成進(jìn)行調(diào)整，使之標(biāo)準(zhǔn)化，以具有可比性。

標(biāo)準(zhǔn)化率的計(jì)算（直接法）：p’=或p’=

N_i：標(biāo)準(zhǔn)組個(gè)小組例數(shù)：p_i：被標(biāo)化組各小組的率，N：標(biāo)準(zhǔn)組總例數(shù)

平均發(fā)展速度= a₀=基期指標(biāo)；a_n：第n年指標(biāo)

平均增長(zhǎng)速度=平均發(fā)展速度-1

第九章秩和檢驗(yàn)

非參數(shù)統(tǒng)計(jì)：當(dāng)樣本來(lái)自總體分布型是未知的或總體分布與檢驗(yàn)所要求的條件不符時(shí)，所使用的統(tǒng)計(jì)方法。不依賴(lài)于總體分布類(lèi)型，也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn)。

非參數(shù)統(tǒng)計(jì)的優(yōu)缺點(diǎn)：1應(yīng)用范圍廣，簡(jiǎn)便，易掌握，對(duì)資料分布特征無(wú)特殊要求。

2當(dāng)資料適合參數(shù)統(tǒng)計(jì)，而用非參數(shù)統(tǒng)計(jì)會(huì)損失部分信息，減低檢驗(yàn)效能。

秩和檢驗(yàn)方法

配對(duì)設(shè)計(jì)差值的符號(hào)

秩和檢驗(yàn)

成組設(shè)計(jì)兩樣本比較的秩和檢驗(yàn)

成組設(shè)計(jì)多樣本比較的秩和檢驗(yàn)

假設(shè)

H₀M=0

H₁M≠0

α =0.05

H₀兩總體分布相同

H₁兩總體分布不同

α =0.05

H₀總體分布均相同

H₁總體分布不同或不完全相同

α =0.05

方法

1，差值由小到大編秩，人去T+或T-，查表確定p值。

2， N>25，用μ檢驗(yàn)

1.所有數(shù)據(jù)由小到大編秩，小n_i組秩和為T(mén)。查表確定p值。

2. n₁>10或n2-n1>10時(shí)，用μ檢驗(yàn)

1.所有數(shù)據(jù)由小到大編秩，求出各組秩和Ri計(jì)算H值。

2.當(dāng)k=3，n≤5時(shí)查H界值表確定p，當(dāng)最小n>5時(shí)，v=k-1.

查X²表，確定p。

注意事項(xiàng)

編秩時(shí)，絕對(duì)值相等者，取平均秩次

1.編秩時(shí)，相同數(shù)據(jù)在不同組內(nèi)取平均秩次

2.相同秩次較多時(shí)，需要校正。

1，編秩時(shí)，相同數(shù)據(jù)在不同組內(nèi)取平均秩次。

2.相同秩次較多時(shí)，需校正。

第十一章回歸和相關(guān)

直線相關(guān)：或簡(jiǎn)單相關(guān)，描述兩變量的相互關(guān)系，用于雙變量正態(tài)分布資料。有正相關(guān)、負(fù)相關(guān)和零相關(guān)（非直線相關(guān)）系。

相關(guān)系數(shù)：或累積相關(guān)系數(shù)，說(shuō)明具有直線關(guān)系的兩個(gè)變量間，相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo)。樣本相關(guān)系數(shù)用r表示，總體相關(guān)系數(shù)用ρ表示。

直線回歸：描述兩變量間的依存關(guān)系。利用回歸分析方法能夠找到一個(gè)描述變量之間的變化關(guān)系的數(shù)學(xué)表達(dá)式。

回歸系數(shù)：或直線的斜率，樣本回歸系數(shù)b，總體回歸系數(shù)β，b的統(tǒng)計(jì)學(xué)意義為：X每增加/減少一個(gè)單位時(shí)，Y平均改變b個(gè)單位。

剩余：或殘差，即實(shí)際值與估計(jì)值之差。SS_B即²，為Y的離均差平方和。說(shuō)明未考慮X與Y的回歸關(guān)系時(shí)Y的變異。

剩余平方和：SS_剩，即²，它反映X對(duì)Y的線性影響之外的一切因素對(duì)Y的變異情況。也就是在總平方和中無(wú)法用X解釋的部分，其值越小，說(shuō)明直線回歸的估計(jì)誤差越小。

回歸平方和：SS_回，即²_，它反映由于X與Y的直線關(guān)系而使Y的總變異減小的部分。也就是在總平方和中可以用X解釋的部分，其值越大，說(shuō)明回歸效果越好。

剩余標(biāo)準(zhǔn)差：指當(dāng)X對(duì)Y的影響被扣除后，Y仍存在變異，此變異由抽樣誤差造成，與X無(wú)關(guān)。用來(lái)反映Y的剩余變異。

預(yù)測(cè)：吧預(yù)報(bào)因子（X）代入回歸方程對(duì)預(yù)報(bào)量（Y）進(jìn)行估計(jì)，其波動(dòng)范圍可按求個(gè)體Y值容許區(qū)間方法計(jì)量。

統(tǒng)計(jì)控制：利用回歸方程進(jìn)行逆估計(jì)，要求Y在一定范圍內(nèi)波動(dòng)，可以通過(guò)控制X的取值來(lái)實(shí)現(xiàn)。

決定系數(shù)：即r²=SS_回/SS_總.當(dāng)總平方和固定不變時(shí)，回歸平方和的大小取決于r²。

秩相關(guān)：又稱(chēng)等級(jí)相關(guān)，用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析，適用于1，不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析，2，總體分布型未知，3，用等級(jí)表示原始數(shù)據(jù)。

等級(jí)相關(guān)系數(shù)：即rs,說(shuō)明兩個(gè)變量間相互關(guān)系的密切程度與相關(guān)方向，用于下列資料：1，不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析，2，總體分布型未知，3，用等級(jí)表示原始數(shù)據(jù)。

假設(shè)檢驗(yàn)：1b，方差分析，t檢驗(yàn)；2界值表，t檢驗(yàn)。

直線回歸方程的應(yīng)用：1描述兩變量的依存關(guān)系；2預(yù)測(cè)；3統(tǒng)計(jì)控制

應(yīng)用直線回歸應(yīng)注意的問(wèn)題：

1. 作回歸要有實(shí)際意義。

2. 回歸分析前繪制散點(diǎn)圖，觀察直線趨勢(shì)，修正或刪除異常點(diǎn)。

3. 直線回歸方程的適用范圍一般以自變量的取值范圍為限。

相關(guān)和回歸的區(qū)別：

1. 資料要求不同：回歸要求Y服從正態(tài)分布，X可精確測(cè)量和嚴(yán)格控制：相關(guān)要求雙變量正態(tài)分布。

2. 應(yīng)用情況不同：回歸——依存關(guān)系：相關(guān)——相互關(guān)系。

相關(guān)和回歸的聯(lián)系：

1．方向一致：r，b符號(hào)一致。

2．假設(shè)檢驗(yàn)等價(jià)：統(tǒng)一樣本，r，b的假設(shè)檢驗(yàn)得到的t值相同。

3．用回歸解釋相關(guān)。

A．SS_回越接近SS_總，，則r²越接近l，說(shuō)明引入相關(guān)的效果越好。

B．相關(guān)系數(shù)的大小與SS_總及回歸系數(shù)有關(guān)，所以相關(guān)系數(shù)不能作為回歸估計(jì)精度的指標(biāo)。

秩相關(guān)的應(yīng)用條件：

1. 不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析。

2. 總體分布型未知。

3. 用等級(jí)表示的原始數(shù)據(jù)。

第十二章常用統(tǒng)計(jì)表

統(tǒng)計(jì)表：在科技報(bào)告或論文中，常將統(tǒng)計(jì)資料及指標(biāo)以表格列出，稱(chēng)為統(tǒng)計(jì)表?？煞譃楹?jiǎn)單表和復(fù)合表。

統(tǒng)計(jì)圖：是用點(diǎn)的位置、線段的升降、直線的長(zhǎng)短或面積的大小等形式表達(dá)統(tǒng)計(jì)資料，可直觀反映出事物間的數(shù)量關(guān)系。

列表原則：1重點(diǎn)突出，簡(jiǎn)單明了2主次分明，層次清楚，符合邏輯。

列表基本要求：1標(biāo)題2標(biāo)目3線條4數(shù)字5不列備注

制圖基本要求：1標(biāo)題2標(biāo)目3圖例

常用統(tǒng)計(jì)圖

統(tǒng)計(jì)圖	定義	制圖
直條圖	用等寬長(zhǎng)條的高度表示按質(zhì)量分組的資料	起點(diǎn)為0，等寬，等間距直條，按高低順序排列。
圓圖	以圓面積表示事物的全部，用扇形面積表示各組成部分所占比重	圓面積為100%，各構(gòu)成比分別乘3.6度，繪扇形面積，以12點(diǎn)為始，由大到小依次繪制。
普通線圖	用線段的升降表示隨時(shí)間變化的趨勢(shì)，用于連續(xù)性資料	X，Y軸為算術(shù)尺度，相鄰兩點(diǎn)以折線連接
半對(duì)數(shù)線圖	用線段的升降表示隨時(shí)間變化的變動(dòng)速度，用于連續(xù)性資料	X軸為算術(shù)尺度，Y軸為對(duì)數(shù)尺度。
直方圖	用矩形面積表示連續(xù)性變量的頻數(shù)分布。	X軸表示連續(xù)性變量的組段，Y軸表示頻數(shù)或頻率，尺度從0開(kāi)始
散點(diǎn)圖	以點(diǎn)的密集程度和趨勢(shì)表示兩種事物間的相關(guān)關(guān)系。	同線圖，但相鄰兩點(diǎn)間不連接。

第十三章實(shí)驗(yàn)設(shè)計(jì)

實(shí)驗(yàn)研究：是指研究者根據(jù)研究目的主動(dòng)加以干預(yù)措施，并觀察總結(jié)結(jié)果，回答假設(shè)研究所提出的問(wèn)題的一種研究方法。依研究目的分為實(shí)驗(yàn)研究和臨床試驗(yàn)。

實(shí)驗(yàn)研究設(shè)計(jì)（experimental design）：是以動(dòng)物或標(biāo)本（如血，痰，尿等）為研究對(duì)象采取干預(yù)措施的研究。

臨床試驗(yàn)（clinical trial）：從統(tǒng)計(jì)學(xué)角度出發(fā)，只要是以人為研究對(duì)象并采取了干預(yù)措施的研究統(tǒng)稱(chēng)為臨床試驗(yàn)，可分為臨床療效實(shí)驗(yàn)和社區(qū)干預(yù)實(shí)驗(yàn)。

隨機(jī)化原則:即總體中的每個(gè)觀察單位都有相等的機(jī)會(huì)被選入到樣本中來(lái)。

隨機(jī)分配（randomized allocation）：為增強(qiáng)可比性，依型講究假設(shè)的要求規(guī)定了納入標(biāo)準(zhǔn)，將實(shí)驗(yàn)對(duì)象分入實(shí)驗(yàn)組和對(duì)照組中。

空白對(duì)照：對(duì)照組不施加任何處理措施。

安慰劑對(duì)照：在實(shí)驗(yàn)研究中，對(duì)照組使用一種外形與實(shí)驗(yàn)藥物完全相同而毫無(wú)藥理作用的物質(zhì)，這種對(duì)照稱(chēng)為安慰劑對(duì)照。

實(shí)驗(yàn)對(duì)照：對(duì)照組和實(shí)驗(yàn)組的處理措施區(qū)別在于：實(shí)驗(yàn)組加入了有效成分，而對(duì)照組則無(wú)。

標(biāo)準(zhǔn)對(duì)照：用公認(rèn)的有效藥物、現(xiàn)有的標(biāo)準(zhǔn)方法或常規(guī)方法做對(duì)照。

自身對(duì)照：對(duì)照和實(shí)驗(yàn)措施在同一實(shí)驗(yàn)對(duì)象上實(shí)施。

相互對(duì)照：幾個(gè)處理（或水平）互為對(duì)照。

處理因素：是根據(jù)研究目的而施加的特定的實(shí)驗(yàn)措施。

實(shí)驗(yàn)效應(yīng)：主要只處理因素作用于實(shí)驗(yàn)對(duì)象的反應(yīng)，這種效應(yīng)將通過(guò)實(shí)驗(yàn)中觀察指標(biāo)顯示出來(lái)。觀察指標(biāo)應(yīng)該客觀性較強(qiáng)，靈敏度較高。精確性較強(qiáng)。

準(zhǔn)確度（accuracy）：觀察值與真值的接近程度。

精確度（precision）：重復(fù)觀察時(shí)：觀察值與其平均值的接近程度。

隨機(jī)對(duì)照試驗(yàn)（randomized control trial）:將受試對(duì)象隨機(jī)分配到實(shí)驗(yàn)組和對(duì)照組，通過(guò)比較分析回答研究假設(shè)的問(wèn)題。

隨機(jī)雙盲對(duì)照實(shí)驗(yàn)（randomized double blind control trial）：在隨機(jī)對(duì)照試驗(yàn)的基礎(chǔ)上再采用雙盲法。

配對(duì)設(shè)計(jì)（paired design）：將實(shí)驗(yàn)對(duì)象按一定條件配成對(duì)子，如將年齡、體重一致的動(dòng)物配成對(duì)子。再將每對(duì)中的兩個(gè)受試對(duì)象隨機(jī)分配到不同處理組。據(jù)以配對(duì)的因素為可能影響實(shí)驗(yàn)結(jié)果的主要混雜因素。

系統(tǒng)誤差：由于受試對(duì)象，研究者，儀器設(shè)備，研究方法等非實(shí)驗(yàn)因素影響等確定性原因造成，有一定傾向性或規(guī)律性的誤差，可以避免。

偏倚：指在實(shí)驗(yàn)中由于某些非實(shí)驗(yàn)因素的干擾而形成的系統(tǒng)誤差，歪曲了處理因素的真實(shí)效應(yīng)。

選擇性偏倚selective bias：由于納入觀察對(duì)象的方法不正確而產(chǎn)生的偏倚。

測(cè)量性偏倚 measurement bias:實(shí)驗(yàn)過(guò)程中對(duì)研究對(duì)象進(jìn)行觀察或測(cè)量而造成的偏倚。

沾染contamination：對(duì)照組實(shí)驗(yàn)對(duì)象接受實(shí)驗(yàn)組的處理措施，提高了對(duì)照組的有效率，結(jié)果導(dǎo)致了實(shí)驗(yàn)組和對(duì)照組的差異。

干擾cointervention：實(shí)驗(yàn)組從實(shí)驗(yàn)外接受了對(duì)實(shí)驗(yàn)因素有效的藥物或措施（非處理措施），提高了實(shí)驗(yàn)的有效率，結(jié)果擴(kuò)大了實(shí)驗(yàn)組和對(duì)照組的差異。

依從性：compliance受試者對(duì)于干預(yù)措施及實(shí)驗(yàn)過(guò)程的執(zhí)行程度。

非依從性noncompliance：受試者為按照研究人員的規(guī)定方案執(zhí)行稱(chēng)為非依從性。

失訪lost to followup：受試者在實(shí)驗(yàn)過(guò)程中由于各種原因退出實(shí)驗(yàn)稱(chēng)為失訪。

雙盲法（double blind method）：課題主持人采取措施使研究者和研究對(duì)象均不知道接受實(shí)驗(yàn)措施或?qū)φ沾胧?/p>

單盲法：single blind method：只有患者不知道處理措施的內(nèi)容。

三盲法：triple blind method：主持人/研究者/患者均不知道處理措施的內(nèi)容。

混雜偏倚confounding bias：在總結(jié)分析階段，由某些非實(shí)驗(yàn)因素與實(shí)驗(yàn)因素同時(shí)并存的作用影響到觀察的結(jié)果，造成混雜因素的偏倚。

實(shí)驗(yàn)設(shè)計(jì)的基本原則：隨機(jī)化、對(duì)照、重復(fù)。

對(duì)照原則的目的：實(shí)驗(yàn)研究的目的是驗(yàn)證研究假設(shè)是否正確，只有經(jīng)過(guò)比較才能鑒別其真?zhèn)?，設(shè)對(duì)照組是比較的基礎(chǔ)，沒(méi)有對(duì)照很難說(shuō)明研究假設(shè)是否正確；設(shè)立對(duì)照也是控制實(shí)驗(yàn)過(guò)程中非實(shí)驗(yàn)因素的影響和偏倚的一種有力措施。常用的對(duì)照有：空白對(duì)照，安慰劑對(duì)照，實(shí)驗(yàn)對(duì)照，標(biāo)準(zhǔn)對(duì)照，自身對(duì)照，相互對(duì)照。

重復(fù)原則：含義為1足夠的樣本含量；2實(shí)驗(yàn)的次數(shù)。

實(shí)驗(yàn)設(shè)計(jì)的三要素：處理因素、實(shí)驗(yàn)效應(yīng)、受試對(duì)象。

確定受試對(duì)象納入標(biāo)準(zhǔn)應(yīng)注意：

1應(yīng)納入對(duì)處理因素的效應(yīng)反應(yīng)靈敏的患者。

2某些處理措施對(duì)一些特殊人群產(chǎn)生有害作用，應(yīng)排除實(shí)驗(yàn)之外。

常用的實(shí)驗(yàn)設(shè)計(jì)方法：隨機(jī)對(duì)照實(shí)驗(yàn)，配對(duì)設(shè)計(jì)，交叉設(shè)計(jì)，配伍組設(shè)計(jì)。

隨機(jī)對(duì)照試驗(yàn)有點(diǎn)（隨機(jī)化的目的）

1有效避免非實(shí)驗(yàn)因素的影響，使實(shí)驗(yàn)因素充分顯示

2增強(qiáng)各比較組間的可比性，使研究結(jié)論更可靠。

3更好地控制非實(shí)驗(yàn)因素對(duì)實(shí)驗(yàn)因素的影響，有效地控制了偏倚和誤差。

4滿足了隨機(jī)化原則，使檢驗(yàn)結(jié)果反映真實(shí)差異。

交叉設(shè)計(jì)的優(yōu)點(diǎn)：

1節(jié)約樣本含量

2能控制時(shí)間因素及個(gè)體差異對(duì)處理因素方式的影響

3從醫(yī)德觀點(diǎn)出發(fā)，均等考慮每個(gè)患者的利益。

交叉設(shè)計(jì)的注意事項(xiàng)：

1前提是兩種處理方式不能相互影響。

2不適用于病程較短急性病效果的研究

3應(yīng)盡可能采用盲法。

確定樣本含量的意義：正確確定樣本含量是實(shí)驗(yàn)設(shè)計(jì)的一個(gè)重要組成部分，估計(jì)樣本含量應(yīng)克服兩種傾向：1片面追求增大樣品含量導(dǎo)致人力、物力和時(shí)間的浪費(fèi)，還可能引入更多的混雜因素。2樣本含量偏少，檢驗(yàn)效能偏低，導(dǎo)致總體本來(lái)存在的差異未能檢出，導(dǎo)致非真實(shí)的陰性結(jié)果。樣本含量大小還受個(gè)體差異和研究實(shí)驗(yàn)要求的精神有關(guān)。閱讀專(zhuān)業(yè)文獻(xiàn)時(shí)，對(duì)假設(shè)檢驗(yàn)陰性結(jié)果有必要復(fù)核樣本含量和檢驗(yàn)效能是否偏低。以正確分析假設(shè)檢驗(yàn)的結(jié)論。

第X章²檢驗(yàn)

² test （Chi-square test）²是一種用途較廣的假設(shè)性檢驗(yàn)方法，可用于推斷兩個(gè)及多個(gè)總體率或總體構(gòu)成比之間有無(wú)差別，兩種屬性或兩個(gè)變量之間有無(wú)關(guān)聯(lián)性，以及頻數(shù)分布的擬合優(yōu)度檢驗(yàn)等。

²檢驗(yàn)的基本思想：²值是以理論數(shù)為基數(shù)的相對(duì)誤差，它反映了實(shí)際數(shù)與理論數(shù)吻合的程度（差別的程度）。若檢驗(yàn)假設(shè)成立，則實(shí)際數(shù)與理論數(shù)的差別不會(huì)很大，出現(xiàn)大的²值的概率p是很小的，若P≤α檢驗(yàn)水準(zhǔn)，就懷疑假設(shè)，因而拒絕它，若P≥α，則無(wú)理由拒絕它。

理論數(shù)的計(jì)算：T_ic=, T_i,r第i行第c列的理論數(shù)，n_i為T(mén)_ic所在的行合計(jì)，n_c為T(mén)_ic所在的列合計(jì)：n為總例數(shù)。

²檢驗(yàn)的基本公式：²= ————————————（1）

²檢驗(yàn)的校正公式：²= ——————————（2）

四表格專(zhuān)用公式

四表格專(zhuān)用公式：²=—————————（3）

校正公式²=———————（4）

四格表²檢驗(yàn)的條件：

1當(dāng)n≥40且所有的T≥5時(shí)，用普通的²檢驗(yàn)（公式1，3），若所得P≈α，改用確切的概率法。

2當(dāng)n≥40但又1≤T≤5，用校正的²檢驗(yàn)（公式2，4）。

3當(dāng)n<40或有T<1時(shí)，不能用²檢驗(yàn)，改用確切概率法。

配對(duì)四格表資料的²檢驗(yàn): ²=,v=1(b+c≥40時(shí)使用)

校正公式²=，v=1 （b+c<40時(shí)使用）

行X列表的²檢驗(yàn)公式²=n（）無(wú)校正公式

行X列表的²檢驗(yàn)的注意事項(xiàng)：

1不能有理論數(shù)T<1,并且1≤T≤5的格子數(shù)不超過(guò)總格子數(shù)的1/5.

2當(dāng)檢驗(yàn)有統(tǒng)計(jì)學(xué)意義（拒絕H₀）時(shí)，只能認(rèn)為各總體率或構(gòu)成比之間總的來(lái)說(shuō)有差別，但不能說(shuō)明它們彼此之間都有差別，或某兩者之間有差別。若要進(jìn)一步解決此問(wèn)題，可用²分割法。

3若表格有一個(gè)方向按多個(gè)等級(jí)分類(lèi)，則稱(chēng)單向有序行列表，當(dāng)?shù)燃?jí)數(shù)大于3時(shí)，一般用秩和檢驗(yàn)分析更為適宜。

四格表的確切概率法的應(yīng)用條件：

1，四格表內(nèi)理論頻數(shù)T<1

2，樣本含量n<40

3， ²檢驗(yàn)后所得概率P接近檢驗(yàn)水準(zhǔn)α。

試題：

一、名詞解釋?zhuān)?/p>

1， coefficient（相關(guān)系數(shù)）：又稱(chēng)積差相關(guān)系數(shù)（product-moment correlation），是說(shuō)明具有直線關(guān)系的兩個(gè)變量間，相互關(guān)系的密切程度與相關(guān)方向的指標(biāo)。

2， proportion（構(gòu)成比）：又稱(chēng)構(gòu)成指標(biāo)。說(shuō)明某一事物內(nèi)部的各組成部分所占的比重或分布，計(jì)算公式為：某一組分的觀察單位數(shù)除以同一事物各組分的觀察單位總數(shù)*100%，表示方法有百分?jǐn)?shù)等。

3， coefficient of variation （變異系數(shù)）：常記為CV。它被定義為標(biāo)準(zhǔn)差與算術(shù)平均數(shù)之比。即CV=S/×100%。它描述了相對(duì)于算術(shù)均數(shù)而言。標(biāo)準(zhǔn)差的大小，即描述數(shù)據(jù)的變異相對(duì)于其平均水平來(lái)說(shuō)是大還是小。

4， population（總體）：是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體，確切的說(shuō)是同質(zhì)的所有的觀察單位某種變量值的集合。

5， standard error SE（標(biāo)準(zhǔn)誤）：樣本均數(shù)的標(biāo)準(zhǔn)差也稱(chēng)均數(shù)的標(biāo)準(zhǔn)誤（standard error of mean）它反映了樣本均數(shù)間的離散程度，也反映了樣本均數(shù)與總體均數(shù)間的差異，說(shuō)明均數(shù)抽樣誤差的大小。

6， incidence rate（發(fā)病率）：表示一定時(shí)期內(nèi)，在可能發(fā)生某病的一定人群中新發(fā)生的某病例數(shù)。其計(jì)算公式為：某病發(fā)病率=該期間新發(fā)生的某病例數(shù)/一定期間內(nèi)可能發(fā)生某病的平均人口數(shù)×100%

7， Chi-square（²值）是以理論數(shù)為基數(shù)的相對(duì)誤差，它反映了實(shí)際數(shù)與理論數(shù)吻合的程度（差別的程度）。

8， Chi-square test（²檢驗(yàn)）：是一種用途較廣的假設(shè)檢驗(yàn)方法，即推斷兩個(gè)及多個(gè)總體構(gòu)成比之間有無(wú)差別，兩種屬性或兩個(gè)變量之間有無(wú)關(guān)聯(lián)性，以及頻數(shù)分布的擬合優(yōu)度檢驗(yàn)等。

9， Normal distribution（正態(tài)分布）：若X的頻數(shù)曲線應(yīng)用于數(shù)學(xué)上的正態(tài)分布曲線（曲線呈鐘型，兩頭低中間高，左右對(duì)稱(chēng)），則稱(chēng)該指標(biāo)服從正態(tài)分布。

10， Mortality rate（死亡率）：指某地某年平均每千人口中的死亡數(shù)，它反映居民總的死亡水平。死亡率=某人群某年（因某病）總死亡人數(shù)/該人群同年平均人口×1000

簡(jiǎn)單題

1: 應(yīng)用相對(duì)數(shù)應(yīng)該注意什么？

計(jì)算相對(duì)數(shù)的分母一般不宜過(guò)?。环治鍪遣荒芤詷?gòu)成比代替率，應(yīng)當(dāng)注意不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析；對(duì)觀察單位不等的幾個(gè)率，不能直接相加求其總率，在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性；對(duì)樣本率（構(gòu)成比）的比較應(yīng)隨機(jī)抽樣，并做假設(shè)檢驗(yàn)。

2:方差分析的基本思想？

根據(jù)資料的設(shè)計(jì)類(lèi)型，即變異的不同來(lái)源將全部觀察值總的離均差平方和和自由度分解為兩個(gè)或多個(gè)部分，除隨機(jī)誤差外，其余每個(gè)部分的變異可由某個(gè)或幾個(gè)因素的作用加以解釋?zhuān)ㄟ^(guò)比較不同變異來(lái)源地均方，借助F分布做出統(tǒng)計(jì)推斷，從而了解該因素對(duì)觀測(cè)指標(biāo)有無(wú)影響。F值遠(yuǎn)大于1，表示各組均數(shù)間差別有顯著性，F(xiàn)值遠(yuǎn)小于1，表示各組均數(shù)間差別無(wú)顯著性，可查F界表確定P.

3:相關(guān)和回歸的區(qū)別和聯(lián)系？

直線回歸與相關(guān)的區(qū)別1資料要求不同：回歸要求變量Y服從正態(tài)分布，X是可以精確測(cè)量和嚴(yán)格控制的變量，相關(guān)要求兩個(gè)變量X，Y服從雙變量正態(tài)分布，2應(yīng)用情況不同：說(shuō)明兩變量間依存變化的數(shù)量關(guān)系用回歸，說(shuō)明變量間的相關(guān)關(guān)系用相關(guān)3，意義不同：回歸系數(shù)b表示自變量X每變化一個(gè)單位后應(yīng)變量Y的平均變化量，相關(guān)系數(shù)r表示兩變量相關(guān)的方向和密切程度，4取值范圍不同：-1<=r<=1；b負(fù)無(wú)窮到正無(wú)窮大。5單位不同，回歸系數(shù)b有單位，相關(guān)系數(shù)r沒(méi)單位。

直線回歸與相關(guān)的聯(lián)系：1兩者都是研究?jī)蓚€(gè)數(shù)值變量的關(guān)系的統(tǒng)計(jì)方法，2方向一致：對(duì)一組數(shù)據(jù)若同時(shí)計(jì)算r與b，他們的正負(fù)號(hào)一致，r為正說(shuō)明兩變量間的相互關(guān)系是同向變化的，b為正號(hào)說(shuō)明X增減一個(gè)單位，Y平均增減b個(gè)單位，3假設(shè)檢驗(yàn)對(duì)同一樣本，r與b的假設(shè)檢驗(yàn)得到的t值相等，由于r的假設(shè)檢驗(yàn)簡(jiǎn)單，故在實(shí)際應(yīng)用中常用以前法代替后法，4用回歸解釋相關(guān)，決定系數(shù)P²=SS回/SS總，回歸平方和越接近總平方和，R²越接近1

4:行X列表²檢驗(yàn)注意事項(xiàng)。

答：1.不能有理論數(shù)T<1,并且1≤T≤5的格子數(shù)不超過(guò)總格子數(shù)的1/5；2.當(dāng)檢驗(yàn)有統(tǒng)計(jì)學(xué)意義（拒絕H₀）時(shí)，只能說(shuō)明各總體率或構(gòu)成比之間總的來(lái)說(shuō)有差別，但不能說(shuō)明它們之間都有差別，成兩者之間有差別，若要進(jìn)一步解決此問(wèn)題，可用²分割法。3，若表格有一個(gè)方向按多個(gè)等級(jí)分類(lèi)，則稱(chēng)單向有序行X列表，當(dāng)?shù)燃?jí)數(shù)大于3時(shí)，一般用秩和檢驗(yàn)分析更為適宜。

5:可信區(qū)間和假設(shè)檢驗(yàn)的關(guān)系？

可信區(qū)間用于說(shuō)明量的大小即推斷總體均數(shù)的范圍，而假設(shè)檢驗(yàn)用于推斷質(zhì)的不同即判斷兩總體均數(shù)是否不同，兩者相互聯(lián)系又相互區(qū)別；可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題；可信區(qū)間比假設(shè)檢驗(yàn)可提供更多的信息，但并不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn)；可信區(qū)間只能在預(yù)先規(guī)定的概率——檢驗(yàn)水準(zhǔn)的前提下進(jìn)行計(jì)算，而假設(shè)檢驗(yàn)?zāi)軌颢@得較為確切的P值，故兩者結(jié)合起來(lái)次才是完整的分析。

6:二項(xiàng)分布應(yīng)用條件？

答：1.每次試驗(yàn)結(jié)果，只能是兩個(gè)互斥的結(jié)果之一（A或非A）。2.每次試驗(yàn)的條件不變，即每次試驗(yàn)中A發(fā)生的概率不變，均為x，3.各次實(shí)驗(yàn)獨(dú)立，即一次試驗(yàn)出現(xiàn)什么樣的結(jié)果與前面已出現(xiàn)的結(jié)果無(wú)關(guān)。

7:.t檢驗(yàn)的應(yīng)用條件，方差不齊時(shí)的處理方法？

答：當(dāng)樣本含量較小時(shí)，理論上要求樣本取自正態(tài)總體，兩樣本均數(shù)比較時(shí)還要求兩樣本方差相等，（u檢驗(yàn)應(yīng)用條件：樣本含量較大，或n雖小但總體標(biāo)準(zhǔn)差已知）。若兩總體方差相等，則直接用t檢驗(yàn)。若總體方差不等，可采用t’檢驗(yàn)或變量變換或秩和檢驗(yàn)等方法處理。

8:.實(shí)驗(yàn)設(shè)計(jì)的幾個(gè)原則，要素，方法，適用范圍，優(yōu)缺點(diǎn)？

答：原則：1對(duì)照原則2重復(fù)原則3隨機(jī)化原則。

要素：1處理因素2受試對(duì)象3實(shí)驗(yàn)效應(yīng)。

方法和優(yōu)點(diǎn)：1隨機(jī)對(duì)照實(shí)驗(yàn)：是將受試對(duì)象隨機(jī)分配到試驗(yàn)組和對(duì)照組，通過(guò)比較分析回答研究假設(shè)的問(wèn)題，該設(shè)計(jì)既貫徹了隨機(jī)化原則，又設(shè)有對(duì)照。優(yōu)點(diǎn)是A有效的避免了某些非實(shí)驗(yàn)因素的影響B(tài)增強(qiáng)了各比較組的可比性，使結(jié)論更可靠C有利于所比較總體間存在真實(shí)差異D滿足了隨機(jī)化原則，更能反映真實(shí)差異。2配對(duì)設(shè)計(jì)：將實(shí)驗(yàn)對(duì)象按一定條件配成對(duì)子，再隨機(jī)分配每對(duì)的兩個(gè)對(duì)象接受不同的處理方式。優(yōu)點(diǎn)最大限度排除了非處理因素的干擾；降低個(gè)體差異水平；提高實(shí)驗(yàn)效果；增強(qiáng)均衡性。3交叉設(shè)計(jì)：是一種特殊的自身對(duì)照設(shè)計(jì)。優(yōu)點(diǎn)：A節(jié)約樣本含量B能夠控制時(shí)間因素及個(gè)體差異對(duì)處理方式的影響C每個(gè)實(shí)驗(yàn)對(duì)象同時(shí)接受了實(shí)驗(yàn)因素和對(duì)照，考慮了每個(gè)患者的利益。4.配伍設(shè)計(jì)：是將條件相近的實(shí)驗(yàn)對(duì)象配成一組。優(yōu)點(diǎn)：增強(qiáng)了各組間的均衡性，可進(jìn)一步控制混雜性偏倚。

計(jì)量數(shù)據(jù)統(tǒng)計(jì)描述和統(tǒng)計(jì)圖表的是非題

1. 在同一連續(xù)分布總體中作隨機(jī)抽樣，理論上樣本均數(shù)越大，則樣本標(biāo)準(zhǔn)差s越大。（錯(cuò)）

2. 在同一連續(xù)分布總體中作隨機(jī)抽樣，理論上樣本含量n越大，則樣本標(biāo)準(zhǔn)差越小（錯(cuò)）

3. 對(duì)稱(chēng)分布就是正態(tài)分布。（錯(cuò)）

4. 在同一連續(xù)分布總體中作隨機(jī)抽樣，理論上樣本含量n越大，則樣本極差越大。（對(duì)）

5. 樣本中位數(shù)不受樣本中的極端值影響。（對(duì)）

6. 正態(tài)分布資料也可用中位數(shù)描述其中集中趨勢(shì)（中心位置）。（對(duì)）

7. 分組的連續(xù)分布資料，計(jì)算百分位數(shù)要求組距相等。（錯(cuò)）

8. 第80百分位數(shù)ρ₈₀表示有80%變量值比它大。（錯(cuò)）

9. 對(duì)于連續(xù)分布資料，單位相同時(shí)，也可用變異系數(shù)比較兩個(gè)變量的相對(duì)離散度。（錯(cuò)）

10. 在同一連續(xù)分布總體中作隨機(jī)抽樣，理論上樣本含量n越大，則從樣本算得的變異系數(shù)越小。（錯(cuò)）

11. 對(duì)于計(jì)量數(shù)據(jù)，不應(yīng)按分組方式?jīng)Q定是否計(jì)算機(jī)和均數(shù)。（對(duì)）

12. 若男女兒童平均是高接近，可用標(biāo)準(zhǔn)差s來(lái)比較其絕對(duì)離散度。（對(duì)）

13. 四分位數(shù)間距也是描述連續(xù)分布數(shù)據(jù)離散度的指標(biāo)。（對(duì)）

14. 自由度p（-∞，∞）時(shí)的t分布就是標(biāo)準(zhǔn)正態(tài)分布。（對(duì)）

15. 標(biāo)準(zhǔn)正態(tài)分布常用N（0，1）表示。（對(duì)）

16. 嚴(yán)格地說(shuō)，是一定以0為中心，左右對(duì)稱(chēng)。（錯(cuò)）

17. 標(biāo)準(zhǔn)差是位置系數(shù)。（錯(cuò)）

18. 對(duì)于連續(xù)分布數(shù)據(jù)，樣本標(biāo)準(zhǔn)差的均數(shù)理論上等于總體標(biāo)準(zhǔn)差。（錯(cuò)）

19. 對(duì)于連續(xù)分布數(shù)據(jù)，樣本方差的均數(shù)理論上等于總體方差。（對(duì)）

20. 只有當(dāng)樣本含量很大時(shí)，連續(xù)分布數(shù)據(jù)的樣本均數(shù)的平均數(shù)理論上才等于總體均數(shù)。（錯(cuò)）

21. μ±1.96σ表示任何分布計(jì)量指標(biāo)的95%變量值所在范圍。（錯(cuò)）

22. 正態(tài)分布總體，理論上P，P和μ±1.96σ范圍是一樣的。（對(duì)）

23. 直方圖是描述連續(xù)分布變量頻數(shù)分布的統(tǒng)計(jì)圖。（對(duì)）

24. 構(gòu)成比資料可畫(huà)圓圖。（對(duì)）

25. 線圖可以描述一個(gè)計(jì)量指標(biāo)隨另一個(gè)計(jì)量指標(biāo)變化而變化的趨勢(shì)。（對(duì)）

26. 半對(duì)數(shù)線圖可以描述和比較事物的發(fā)展變化的相對(duì)速度。（對(duì)）

27. 表示某中學(xué)高三年級(jí)10個(gè)班學(xué)生近視比例的比較，應(yīng)用線圖（錯(cuò)，條圖）

28. 描述200人血壓餓分布，應(yīng)畫(huà)直圖。（錯(cuò)，圓圖或百分條圖）

29. 在同一正態(tài)總體N（μ，σ）中隨機(jī)抽樣，兩個(gè)變量值X₁和X₂之差d服從正態(tài)分布N（μ，σ）（錯(cuò)）

30. 兩正態(tài)分布變量XN（μ₁，σ₁）和X2N（μ₂，σ₂）之差的方差是σ₁²-σ₂²（錯(cuò)）。

31. 比較2000年年底某地三種疾病的患病率，宜繪制之線圖。（錯(cuò)，條圖）

32. 描述300人肺活量與身高關(guān)系可畫(huà)散點(diǎn)圖。（對(duì)）

33. 縱坐標(biāo)取等比尺度而橫坐標(biāo)取等差尺度時(shí)的線圖成為對(duì)數(shù)線圖。（對(duì)）

34. 一般的正常值范圍是指95%正常人的該指標(biāo)所在范圍。（對(duì)）

35. 理論上正態(tài)分布的標(biāo)準(zhǔn)差不會(huì)大于平均數(shù)。（錯(cuò)）

36. 變量值有負(fù)數(shù)時(shí)不能直接計(jì)算幾何均數(shù)。（對(duì)）

37. 均數(shù)大于0時(shí)所計(jì)算的變異系數(shù)才有意義。（對(duì)）

38. 利用組距不相等的頻數(shù)分布表資料計(jì)算樣本均數(shù)x和樣本標(biāo)準(zhǔn)方差s，宜用加權(quán)法。（對(duì)）

39. 在同一連續(xù)分布總體中作隨機(jī)抽樣，理論上樣本含量n越大，樣本四分位數(shù)間距越大。（錯(cuò)）

40. 超出95%正常值范圍的個(gè)體都是異常個(gè)體。（錯(cuò)）

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自： hchungw > 《統(tǒng)計(jì)學(xué)》

舉報(bào)/認(rèn)領(lǐng)