很多朋友跟我說(shuō)統(tǒng)計(jì)學(xué)很難,其實(shí)這個(gè)東西你說(shuō)難也難,說(shuō)簡(jiǎn)單也簡(jiǎn)單。簡(jiǎn)單是因?yàn)橹恍枰雷约旱慕y(tǒng)計(jì)資料是什么類型,把數(shù)據(jù)導(dǎo)入 SPSS 然后找到對(duì)應(yīng)的分析方法就行了,分分鐘出結(jié)果;難是因?yàn)槔锩娓鞣N資料的分類,數(shù)據(jù)的錄入,軟件的操作,以及模型的建造難。 統(tǒng)計(jì)學(xué)是門工具,既然是個(gè)工具肯定得讓人們能學(xué)會(huì)使用,所以必有一些套路和捷徑。就像 CS(計(jì)算機(jī)科學(xué)),IT,沒有專業(yè)學(xué)過(guò)的都知道很難吧,但是讓你用電腦查個(gè)資料,用個(gè)軟件總會(huì)吧? 所以統(tǒng)計(jì)學(xué)簡(jiǎn)單。而且我們科研狗不需要掌握像國(guó)家統(tǒng)計(jì)局工作人員那樣深的統(tǒng)計(jì)學(xué)知識(shí),我們只需要什么樣的資料用哪種統(tǒng)計(jì)學(xué)方法分析就可以了,然后再用 SPSS 軟件操作就行了(后面我可能開視頻課來(lái)講 SPSS 的具體操作,絕對(duì)通俗易懂,一學(xué)就會(huì))。既然有套路,我就帶大家看看統(tǒng)計(jì)學(xué)都有哪些套路: 1 首先,要科普一下基本知識(shí),基本知識(shí)都不懂, 怎么學(xué)統(tǒng)計(jì)學(xué)? 自變量(Independent variable):自變量是指研究者主動(dòng)操縱,而引起因變量發(fā)生變化的因素或條件,因此自變量被看作是因變量的原因。 因變量(Dependent variable):實(shí)驗(yàn)中由于自變量而引起實(shí)驗(yàn)對(duì)象的變化和結(jié)果叫做因變量。 咳咳,劃重點(diǎn)了:O(∩_∩)O:很多人容易搞混這兩個(gè)概念,因?yàn)檫@兩個(gè)定義是翻譯過(guò)來(lái)的,我個(gè)人覺得不準(zhǔn)確也不好理解,我覺得自變量應(yīng)該翻譯為獨(dú)立變量,就從字面上硬翻,而自變量翻譯為因此變量。 計(jì)數(shù)資料:指先將觀察單位按其性質(zhì)或類別分組,然后清點(diǎn)各組觀察單位個(gè)數(shù)所得的資料。其特點(diǎn)是: 對(duì)每組觀察單位只研究其數(shù)量的多少,而不具體考慮某指標(biāo)的質(zhì)量特征,屬非連續(xù)性資料。 計(jì)量資料:指先將觀察單位按其性質(zhì)或類別分組,然后清點(diǎn)各組觀察單位個(gè)數(shù)所得的資料。其特點(diǎn)是: 對(duì)每組觀察單位只研究其數(shù)量的多少,而不具體考慮某指標(biāo)的質(zhì)量特征,屬非連續(xù)性資料。 我們觀察或者測(cè)量因變量得到的數(shù)據(jù)集合就是統(tǒng)計(jì)資料,醫(yī)學(xué)統(tǒng)計(jì)資料按其性質(zhì)一般分為計(jì)數(shù)資料與計(jì)量資料兩類。 為什么要分成兩種資料呢?因?yàn)椴煌愋偷慕y(tǒng)計(jì)資料應(yīng)采用不同的統(tǒng)計(jì)分析方法。 為什么不同資料要用不同的統(tǒng)計(jì)學(xué)分析方法呢?因?yàn)榻y(tǒng)計(jì)分析方法相當(dāng)于一個(gè)比較兩個(gè)東西之間差異(或差距)的平臺(tái)。 比如蘋果,橙子,那我想知道蘋果,橙子之間的不同,那我可以從重量,形態(tài),體積大小,顏色,甜度,口感,種屬關(guān)系等不同角度去測(cè)量然后得到數(shù)據(jù)(也就是統(tǒng)計(jì)學(xué)資料),重量可以測(cè)量(得到計(jì)量資料),然后我們就可以用獨(dú)立樣本的 t 檢驗(yàn)分析得出蘋果跟橙子在重量上是有差異的也就是這兩種水果是不同的。 但我們只知道蘋果跟橙子在重量上有差異是不夠的,假如一個(gè)橙子跟蘋果的重量相等的話,我們就不能說(shuō)橙子是蘋果吧,于是我們要進(jìn)一步了解和認(rèn)識(shí)到蘋果和橙子的確是不同的,怎么辦呢? 人類是很聰明的,自然就想到了辦法,人們會(huì)給它分類,然后計(jì)算個(gè)數(shù),比如顏色,蘋果一般為紅色,橙子一般為黃色,所以我們可以測(cè)這兩種水果的顏色的個(gè)數(shù),我們得到數(shù)據(jù)資料(就是計(jì)數(shù)資料)。 最后所有重量,形態(tài),體積大小,顏色,甜度,口感,種屬關(guān)系等的資料統(tǒng)計(jì)在一起,建造一個(gè)模型,我們簡(jiǎn)稱為蘋果-橙子模型。然后用 logistic 回歸分析,分析得到蘋果跟橙子是不同的。 以后我們只需要輸入一個(gè)物體 x 的參數(shù),如把重量,形態(tài),體積大小,顏色,甜度,口感,種屬關(guān)系等數(shù)據(jù)輸入進(jìn)去得到結(jié)果,然后概率學(xué)角度來(lái)判斷物體x是橙子還是蘋果或者兩者都不是。 說(shuō)這么多就是想讓大家知道統(tǒng)計(jì)學(xué)就是一個(gè)分析工具,根據(jù)不同資料的情況,我們分析數(shù)據(jù)的方法也就不同。 上個(gè)圖大家就明白了,不同資料選擇不同分析方法。 2 接下來(lái)我就教大家具體怎樣選擇統(tǒng)計(jì)分析方法: 不知道自己的實(shí)驗(yàn)設(shè)計(jì)是如何分組的,請(qǐng)自行解決。 3 知道了自己的實(shí)驗(yàn)分組就好辦了。接下來(lái)的三張圖就教大家怎樣按圖索驥,選擇適合的統(tǒng)計(jì)分析方法來(lái)分析自己的數(shù)據(jù)有沒有統(tǒng)計(jì)學(xué)意義了。 注:線性回歸需滿足 LINE 條件 L(Linear):因變量與自變量呈線性關(guān)系; I(Independent):每個(gè)個(gè)體觀察值之間互相獨(dú)立; N(Normal distribution):在一定范圍內(nèi),任意給定 X 值,對(duì)應(yīng)的隨機(jī)變量 Y 都服從正態(tài)分布; E(Equal variance):在一定范圍內(nèi),不同的 X 值所對(duì)應(yīng)的隨機(jī)變量 Y 的方差相等; 4 注:兩組之間比較是最常見的,一個(gè)處理組,一個(gè)對(duì)照組,自變量經(jīng)處理因素處理之后產(chǎn)生因變量,然后統(tǒng)計(jì)因變量數(shù)據(jù),再根據(jù)因變量數(shù)據(jù)的不同類型,選擇不同的統(tǒng)計(jì)方法比較兩組之間是否因變量有差異。 5 但有時(shí)候我們的實(shí)驗(yàn)會(huì)分為三組,如按不同時(shí)間,不同濃度,不同劑量等,這時(shí)候我們要比較這些分組的數(shù)據(jù),我們就得用三組及三組以上的統(tǒng)計(jì)學(xué)方法來(lái)分析組間的差異。
注:隨機(jī)區(qū)組設(shè)計(jì)資料與重復(fù)測(cè)量資料區(qū)別:
相信大家看了以上圖片就知道統(tǒng)計(jì)學(xué)的套路原來(lái)是如此簡(jiǎn)單。大家只需要按圖索驥就行了。至于怎么用 SPSS 做統(tǒng)計(jì)學(xué)分析,大家可以在百度上搜索教程。 舉個(gè)例子: 6 寫在后面:筆者目前為止用上面 4 張圖基本上可以解決統(tǒng)計(jì)學(xué)的問題了,當(dāng)然統(tǒng)計(jì)學(xué)還有更深入的內(nèi)容,但我想如果需要做到那一步了,大家還是會(huì)去請(qǐng)專業(yè)人士幫忙做統(tǒng)計(jì)分析的。人的精力有限,擅長(zhǎng)的專業(yè)也有所不同。 另外,很多小伙伴有個(gè)誤區(qū):就是覺得統(tǒng)計(jì)學(xué)能拯救他們的實(shí)驗(yàn)結(jié)果以及實(shí)驗(yàn)方案,其實(shí)并不是的,你的實(shí)驗(yàn)方案定了,你的統(tǒng)計(jì)學(xué)分析方法就定了,然后統(tǒng)計(jì)學(xué)只是幫你分析你的實(shí)驗(yàn)數(shù)據(jù)有沒有差異而已。 另外實(shí)驗(yàn)數(shù)據(jù)沒有差異,大家會(huì)想到修改數(shù)據(jù),這里的話不建議大家這樣做。建議大家先做預(yù)實(shí)驗(yàn),預(yù)實(shí)驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,后面重復(fù)即可;預(yù)實(shí)驗(yàn)數(shù)據(jù)沒有意義,大家可以增加劑量或者濃度,使其達(dá)到有統(tǒng)計(jì)學(xué)意義,如果還達(dá)不到統(tǒng)計(jì)學(xué)意義,可以修改方案或者路線了。 為什么要這樣做呢?因?yàn)檫@樣才沒有違背實(shí)驗(yàn)的初衷啊,再說(shuō)修改數(shù)據(jù)就已經(jīng)是造假了,前段時(shí)間國(guó)內(nèi)一些知名院校的文章相繼被撤稿 107 余篇,這著實(shí)令國(guó)人羞愧啊。大家都是搞科研的,也知道科學(xué)這一領(lǐng)域其實(shí)也是造不了假的,真相遲早會(huì)大白的。這也正是科研的純凈和美之所在,不是嗎? 不說(shuō)了,我去做實(shí)驗(yàn)了。 |
|