SPSS 全稱為「社會(huì)科學(xué)統(tǒng)計(jì)軟件包」,是 IBM 公司推出的一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。 圖中我們看到 SPSS 有 23 個(gè)方法模塊,雖然我們不能每個(gè)模塊都能用到,但作為一個(gè)科研工作者,其中的某些功能是必須要掌握的。 圖一:SPSS 的 23 個(gè)模塊 下面列出幾個(gè)典型的例子供大家在做數(shù)據(jù)中作為參考: 圖二:醫(yī)學(xué)中 SPSS 用到的模塊 一、描述性研究 圖三:SPSS描述性研究 描述性分析主要是對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性描述,主要用于描述變量的基本特征。描述性分析對(duì)于數(shù)據(jù)分析來說是一項(xiàng)基礎(chǔ)性的工作,目的要于熟悉數(shù)據(jù)源,把握數(shù)據(jù)的整體性分布情況。 SPSS 中的描述性分析過程可以生成相關(guān)的描述性統(tǒng)計(jì)量,如均值、方差、標(biāo)準(zhǔn)差、全距、峰度和偏度等,同時(shí)描述性分析過程還能將原始數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)Z分值并作為變量儲(chǔ)存。 基本輸出的統(tǒng)計(jì)量主要有以下幾個(gè)方面: (一) 表示集中趨勢(shì)的統(tǒng)計(jì)量:均值,中位數(shù),眾數(shù),百分位數(shù); (二)表示離中趨勢(shì)的統(tǒng)計(jì)量:方差與標(biāo)準(zhǔn)差,均值標(biāo)準(zhǔn)誤差,極差或范圍,最大值,最小值,變異系數(shù); (三)表示分布形態(tài)的統(tǒng)計(jì)量:偏度,峰度; (四)其他相關(guān)統(tǒng)計(jì)量:Z 標(biāo)準(zhǔn)化得分(注:Z 標(biāo)準(zhǔn)化得分是某一數(shù)據(jù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位的測量值,在統(tǒng)計(jì)分析中起著十分重要的作用)。 具體實(shí)際操作如下: 1.打開數(shù)據(jù)源,如下圖所示: 2.在菜單欄中依次選擇「分析-描述統(tǒng)計(jì)-描述」命令,得到結(jié)果如下圖: 3.點(diǎn)擊對(duì)話框中的「選項(xiàng)」: 4.因?yàn)楝F(xiàn)在是屬于熟悉 SPSS 的階段,可嘗試全部勾選: 5.返回到描述性對(duì)話框,勾選左下方的「將標(biāo)準(zhǔn)化得分另存為變量」,最后按「確定」,得到結(jié)果如下圖: 6.返回?cái)?shù)據(jù)源表,可看到已生成 Z 標(biāo)準(zhǔn)化得分: 其中,標(biāo)準(zhǔn)化得分大于零,說明原數(shù)據(jù)比平均分高;若標(biāo)準(zhǔn)化得分小于零,說明原數(shù)據(jù)比平均分小。如第一個(gè)數(shù)值為 -3.08124,則說明,該學(xué)生該科得分比整個(gè)平均分要低大約 3 個(gè)標(biāo)準(zhǔn)差。 二、T 檢驗(yàn) 圖四:SPSS 中 T 檢驗(yàn) (1)單樣本 T 檢驗(yàn) 單樣本 T 檢驗(yàn)的目的是利用來自總體的樣本數(shù)據(jù),推斷該總體的均值是否與制定的檢驗(yàn)值之間存在顯著性差異。它是對(duì)總體均值的假設(shè)檢驗(yàn)。 SPSS軟件操作流程: 1.Analyze > Compare Means > One-Sample T Test 2.在打開的 one-sample T Testp 窗口中,檢驗(yàn)變量(Test Variable)選擇血紅蛋白 x, 檢驗(yàn)值(Test Value)中輸入 14.02, 點(diǎn)擊 OK。輸出結(jié)果。 (2)獨(dú)立樣本 T 檢驗(yàn) 獨(dú)立樣本 T 檢驗(yàn)是用于兩個(gè)獨(dú)立樣本均值的比較。兩個(gè)樣本必須獨(dú)立且服從正態(tài)分布。 按照Analyze>Compare Means>Independent-Sample T Test操作打開Independent-Samples T Test窗口。 2.檢驗(yàn)變量中選擇 PreWeight, 檢驗(yàn)值為 group(0 1)。點(diǎn)擊 OK,輸出結(jié)果。 注意:Levene's test 用于確定方差齊性,注意根據(jù)該結(jié)果判斷哪一行數(shù)據(jù)為最終結(jié)論。如果分組在 3 組或 3 組以上的均值比較可以應(yīng)用單因素 ANOVA。 三、方差分析 圖五:SPSS 的方差分析 1.首先打開 SPSS,其次點(diǎn)擊「變量視圖」: 2.給變量命名: 3.點(diǎn)擊數(shù)據(jù)視圖,再點(diǎn)擊「肝」一列變量,導(dǎo)入數(shù)據(jù),點(diǎn)擊「組別」這組變量,輸入對(duì)應(yīng)的濃度(不同濃度代表不同組別): 4.點(diǎn)擊「變量視圖」,點(diǎn)擊組別這一組的「值」,給各組命名,然后點(diǎn)擊方形圖標(biāo): 5.在彈出的對(duì)話框中,點(diǎn)擊「值」,輸入剛才組別變量中寫的那些濃度值一個(gè),其次點(diǎn)擊「標(biāo)簽」給其命名: 6.等到所有添加后,依照樣板數(shù)據(jù),輸入不同組的名字和濃度: 7.點(diǎn)擊「分析」,再點(diǎn)擊「比較均值」,在下拉菜單中點(diǎn)擊「單因素 ANOVA」 8.在新的對(duì)話框中,依據(jù)樣板數(shù)據(jù),添加「因變量列表」,添加「因子」,然后選擇分析方式: 9.勾選上需要的比較方法,點(diǎn)擊繼續(xù): 10.最后,分析結(jié)果就出來了: 四、線性回歸 圖六:SPSS 線性回歸 在回歸分析中,只有一個(gè)自變量的回歸分析,稱為一元回歸;多于一個(gè)自變量的回歸分析,稱為多元回歸。在做線性回歸分析之前需要先做散點(diǎn)圖,如果散點(diǎn)圖不呈現(xiàn)線性關(guān)系,則不能做線性回歸。 (1)問題與數(shù)據(jù) 某地方病研究所調(diào)查了 8 名正常兒童的尿肌酐含量(mmol/24h),請(qǐng)估計(jì)尿肌酐含量(Y)對(duì)其年齡(X)的直線回歸方程。 (2)SPSS操作 1.數(shù)據(jù)錄入 SPSS: 2.做散點(diǎn)圖,判斷是否為線性關(guān)系: 3.將自變量年齡(X)放入 X 軸;將因變量尿肌酐含量(Y)放入 Y 軸;其它默認(rèn)選項(xiàng)后,點(diǎn)擊確定: 4.從圖上判斷變量之間大致呈線性關(guān)系,可以繼續(xù)做回歸: 5.將年齡放入自變量,尿肌酐含量放入因變量,點(diǎn)擊確定: 6.結(jié)果分析: (3)結(jié)果解讀 ① R 方(0.778)是回歸方程的決定系數(shù),表示Y變異的 77.8% 可以由X的變異來解釋。 ②對(duì)回歸方程進(jìn)行方差分析:F=20.968,P=0.004??梢哉J(rèn)為年齡和尿肌酐含量有直線關(guān)系。 ③對(duì)回歸系數(shù)進(jìn)行 T 檢驗(yàn):Constant(回歸方程的截距)與0之間的差別有統(tǒng)計(jì)學(xué)意義(t=5.595,P=0.001),斜率與0之間的差別有統(tǒng)計(jì)學(xué)意義(t=4.579,P=0.004)。 因此,建立回歸方程為=1.662+0.139X,X 為兒童年齡,Y 為尿肌酐含量。 因此,建立回歸方程為=1.662+0.139X,X 為兒童年齡,Y 為尿肌酐含量。題圖來源:丁香通 |
|