SPSS 數(shù)據(jù)分析，掌握這 6 大模塊就夠了

生物_醫(yī)藥_科研 2018-12-11

展開全文

SPSS 全稱為「社會(huì)科學(xué)統(tǒng)計(jì)軟件包」，是 IBM 公司推出的一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。

圖中我們看到 SPSS 有 23 個(gè)方法模塊，雖然我們不能每個(gè)模塊都能用到，但作為一個(gè)科研工作者，其中的某些功能是必須要掌握的。

圖一：SPSS 的 23 個(gè)模塊

下面列出幾個(gè)典型的例子供大家在做數(shù)據(jù)中作為參考：

圖二：醫(yī)學(xué)中 SPSS 用到的模塊

一、描述性研究

圖三：SPSS描述性研究

描述性分析主要是對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性描述，主要用于描述變量的基本特征。描述性分析對(duì)于數(shù)據(jù)分析來說是一項(xiàng)基礎(chǔ)性的工作，目的要于熟悉數(shù)據(jù)源，把握數(shù)據(jù)的整體性分布情況。

SPSS 中的描述性分析過程可以生成相關(guān)的描述性統(tǒng)計(jì)量，如均值、方差、標(biāo)準(zhǔn)差、全距、峰度和偏度等，同時(shí)描述性分析過程還能將原始數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)Z分值并作為變量儲(chǔ)存。

基本輸出的統(tǒng)計(jì)量主要有以下幾個(gè)方面：

（一）表示集中趨勢(shì)的統(tǒng)計(jì)量：均值，中位數(shù)，眾數(shù)，百分位數(shù)；

（二）表示離中趨勢(shì)的統(tǒng)計(jì)量：方差與標(biāo)準(zhǔn)差，均值標(biāo)準(zhǔn)誤差，極差或范圍，最大值，最小值，變異系數(shù)；

（三）表示分布形態(tài)的統(tǒng)計(jì)量：偏度，峰度；

（四）其他相關(guān)統(tǒng)計(jì)量：Z 標(biāo)準(zhǔn)化得分（注：Z 標(biāo)準(zhǔn)化得分是某一數(shù)據(jù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位的測量值，在統(tǒng)計(jì)分析中起著十分重要的作用）。

具體實(shí)際操作如下：

1.打開數(shù)據(jù)源，如下圖所示：

2.在菜單欄中依次選擇「分析-描述統(tǒng)計(jì)-描述」命令，得到結(jié)果如下圖：

3.點(diǎn)擊對(duì)話框中的「選項(xiàng)」：

4.因?yàn)楝F(xiàn)在是屬于熟悉 SPSS 的階段，可嘗試全部勾選：

5.返回到描述性對(duì)話框，勾選左下方的「將標(biāo)準(zhǔn)化得分另存為變量」，最后按「確定」，得到結(jié)果如下圖：

6.返回?cái)?shù)據(jù)源表，可看到已生成 Z 標(biāo)準(zhǔn)化得分：

其中，標(biāo)準(zhǔn)化得分大于零，說明原數(shù)據(jù)比平均分高；若標(biāo)準(zhǔn)化得分小于零，說明原數(shù)據(jù)比平均分小。如第一個(gè)數(shù)值為 -3.08124，則說明，該學(xué)生該科得分比整個(gè)平均分要低大約 3 個(gè)標(biāo)準(zhǔn)差。

二、T 檢驗(yàn)

圖四：SPSS 中 T 檢驗(yàn)

（1）單樣本 T 檢驗(yàn)

單樣本 T 檢驗(yàn)的目的是利用來自總體的樣本數(shù)據(jù)，推斷該總體的均值是否與制定的檢驗(yàn)值之間存在顯著性差異。它是對(duì)總體均值的假設(shè)檢驗(yàn)。

SPSS軟件操作流程：

1.Analyze > Compare Means > One-Sample T Test

2.在打開的 one-sample T Testp 窗口中，檢驗(yàn)變量（Test Variable）選擇血紅蛋白 x, 檢驗(yàn)值（Test Value）中輸入 14.02, 點(diǎn)擊 OK。輸出結(jié)果。

（2）獨(dú)立樣本 T 檢驗(yàn)

獨(dú)立樣本 T 檢驗(yàn)是用于兩個(gè)獨(dú)立樣本均值的比較。兩個(gè)樣本必須獨(dú)立且服從正態(tài)分布。

按照Analyze>Compare Means>Independent-Sample T Test操作打開Independent-Samples T Test窗口。

2.檢驗(yàn)變量中選擇 PreWeight, 檢驗(yàn)值為 group(0 1)。點(diǎn)擊 OK，輸出結(jié)果。

注意：Levene's test 用于確定方差齊性，注意根據(jù)該結(jié)果判斷哪一行數(shù)據(jù)為最終結(jié)論。如果分組在 3 組或 3 組以上的均值比較可以應(yīng)用單因素 ANOVA。

三、方差分析

圖五：SPSS 的方差分析

1.首先打開 SPSS，其次點(diǎn)擊「變量視圖」：

2.給變量命名：

3.點(diǎn)擊數(shù)據(jù)視圖，再點(diǎn)擊「肝」一列變量，導(dǎo)入數(shù)據(jù)，點(diǎn)擊「組別」這組變量，輸入對(duì)應(yīng)的濃度（不同濃度代表不同組別）：

4.點(diǎn)擊「變量視圖」，點(diǎn)擊組別這一組的「值」，給各組命名，然后點(diǎn)擊方形圖標(biāo)：

5.在彈出的對(duì)話框中，點(diǎn)擊「值」，輸入剛才組別變量中寫的那些濃度值一個(gè)，其次點(diǎn)擊「標(biāo)簽」給其命名：

6.等到所有添加后，依照樣板數(shù)據(jù)，輸入不同組的名字和濃度：

7.點(diǎn)擊「分析」，再點(diǎn)擊「比較均值」，在下拉菜單中點(diǎn)擊「單因素 ANOVA」

8.在新的對(duì)話框中，依據(jù)樣板數(shù)據(jù)，添加「因變量列表」，添加「因子」，然后選擇分析方式：

9.勾選上需要的比較方法，點(diǎn)擊繼續(xù)：

10.最后，分析結(jié)果就出來了：

四、線性回歸

圖六：SPSS 線性回歸

在回歸分析中，只有一個(gè)自變量的回歸分析，稱為一元回歸；多于一個(gè)自變量的回歸分析，稱為多元回歸。在做線性回歸分析之前需要先做散點(diǎn)圖，如果散點(diǎn)圖不呈現(xiàn)線性關(guān)系，則不能做線性回歸。

（1）問題與數(shù)據(jù)

某地方病研究所調(diào)查了 8 名正常兒童的尿肌酐含量（mmol/24h），請(qǐng)估計(jì)尿肌酐含量（Y）對(duì)其年齡（X）的直線回歸方程。

（2）SPSS操作

1.數(shù)據(jù)錄入 SPSS：

2.做散點(diǎn)圖，判斷是否為線性關(guān)系：

3.將自變量年齡（X）放入 X 軸；將因變量尿肌酐含量（Y）放入 Y 軸；其它默認(rèn)選項(xiàng)后，點(diǎn)擊確定：

4.從圖上判斷變量之間大致呈線性關(guān)系，可以繼續(xù)做回歸：

5.將年齡放入自變量，尿肌酐含量放入因變量，點(diǎn)擊確定：

6.結(jié)果分析：

（3）結(jié)果解讀

① R 方（0.778）是回歸方程的決定系數(shù)，表示Y變異的 77.8% 可以由X的變異來解釋。

②對(duì)回歸方程進(jìn)行方差分析：F=20.968，P=0.004?？梢哉J(rèn)為年齡和尿肌酐含量有直線關(guān)系。

③對(duì)回歸系數(shù)進(jìn)行 T 檢驗(yàn)：Constant（回歸方程的截距）與0之間的差別有統(tǒng)計(jì)學(xué)意義（t=5.595,P=0.001），斜率與0之間的差別有統(tǒng)計(jì)學(xué)意義（t=4.579,P=0.004）。

因此，建立回歸方程為=1.662+0.139X，X 為兒童年齡，Y 為尿肌酐含量。

因此，建立回歸方程為=1.662+0.139X，X 為兒童年齡，Y 為尿肌酐含量。題圖來源：丁香通

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：生物_醫(yī)藥_科研 > 《SPSS》

舉報(bào)/認(rèn)領(lǐng)