正態(tài)分布是說,在平均值附近觀察到特定數(shù)據(jù)值的概率最大,并且隨著與平均值的差值的增加而迅速減小。多快取決于一個叫標(biāo)準(zhǔn)差的量。數(shù)學(xué)是模式的科學(xué)。概率的隨機作用遠非我們直覺理解的那樣。目前關(guān)于“隨機”的定義是:幾個世紀(jì)以來,數(shù)學(xué)家們一直在研究幾何、代數(shù)和分析中的數(shù)學(xué)模式,他們意識到,即使是隨機性也有它自己的模式。但是,“隨機事件的模式”與“隨機事件沒有模式”的觀點并不沖突,因為隨機事件的規(guī)律是統(tǒng)計意義的。例如,如果你反復(fù)多次擲一個骰子,那么大約有六分之一的次數(shù)擲到1,這是一個清晰的統(tǒng)計模式。但這并不能告訴你下一次投擲時,哪個數(shù)字會出現(xiàn)。直到19世紀(jì),數(shù)學(xué)家和科學(xué)家才意識到統(tǒng)計模式(規(guī)律)在偶然事件中的重要性。甚至人類的行為,如自殺和離婚,也受到數(shù)量法則的影響。這似乎與自由意志相抵觸。但今天,這些統(tǒng)計規(guī)律構(gòu)成了醫(yī)學(xué)試驗、社會政策、保險費用、風(fēng)險評估和職業(yè)規(guī)劃的基礎(chǔ)。這一切都是由賭博學(xué)者吉羅拉莫·卡達諾引起的??ㄟ_諾是個“不學(xué)無術(shù)”的人,他通過下國際象棋和賭博來賺錢。他將自己強大的才智應(yīng)用于這兩方面。國際象棋并不取決于運氣。然而,在賭博中,運氣似乎是主要的“實力”??ㄟ_諾意識到,即使在賭博中,他也可以發(fā)揮出自己的數(shù)學(xué)才能。他就此主題寫了一本書,名為《概率游戲(博弈)之書》,這是第一次系統(tǒng)地討論數(shù)學(xué)概率的書。概率游戲引起了布萊斯·帕斯卡的注意。他和費馬曾就一個與賭博有關(guān)的數(shù)學(xué)問題互相寫信。在此過程中,他們創(chuàng)造了一個新的數(shù)學(xué)分支:概率論。概率論中的一個核心概念就是我們現(xiàn)在所說的“期望”,這是玩家長期的平均收益。1713年,當(dāng)雅各布·伯努利發(fā)表了他的《猜想的藝術(shù)》時,概率論成為數(shù)學(xué)中一個成熟的領(lǐng)域。他從事件概率的“工作定義”開始:這里用“工作定義”,因為如果試圖讓它成為基礎(chǔ)的話,會出現(xiàn)問題。例如,假設(shè)有一枚均勻的硬幣,多次拋擲,大多數(shù)情況下,得到的是一個看起來隨機的正面和反面的序列。如果持續(xù)投擲足夠長的時間,大約有一半的時間會得到正面。然而,很少會恰好有一半的時間是正面朝上,例如,在奇數(shù)次投擲中,這是不可能的。我從微積分中得到靈感來修改定義,但有時極限并不存在。例如,假設(shè)正面和反面的順序是拋擲得到“人頭”朝上的概率等于拋擲次數(shù)趨于無窮時,拋擲得到“人頭”朝上的概的極限,我們要證明這個極限存在。 一次反面,兩次正面,3次反面,6次正面,12次反面,以此類推。3次反面之后,每個階段的數(shù)字都翻倍。投擲三次后,正面的比例是2/3,6次后是1/3,12次后是2/3,24次后是1/3,所以這個比例來回擺動,在2/3和1/3之間,因此沒有明確的極限。而且這樣的投擲結(jié)果序列是非常不可能的,但為了定義“不可能”,我們需要定義概率。所以邏輯是循環(huán)的。此外,即使極限存在,它也可能不是1/2的“正確”值。一個極端的情況是硬幣落地時總是正面朝上(極限是1)。同樣,這是極不可能的。伯努利決定從相反的方向來研究這個問題。首先定義正面和反面出現(xiàn)的概率為0到1之間的p。如果硬幣是均勻的,那么p=1/2,否則不是1/2(有偏差)。伯努利證明了一個基本定理,大數(shù)定律。大數(shù)定律指出,如果拋擲次數(shù)足夠多,正面朝上的概率確實有極限,極限是p。從哲學(xué)上講,這個定理表明,通過以一種自然的方式分配概率(即數(shù)字)是合理的。所以伯努利的觀點是,作為概率的數(shù)字提供了一個一致的數(shù)學(xué)模型來描述一遍又一遍拋硬幣的過程。其中所有行都以1開始和結(jié)束,每個數(shù)字都是它上面兩個數(shù)字的和。我們現(xiàn)在稱這些數(shù)字為二項式系數(shù),因為它們出現(xiàn)在二項式表達式(p + q)^n的代數(shù)中。也就是說:伯努利的關(guān)鍵觀點是,如果我們拋n次硬幣,得到正面的概率是p,那么拋擲特定次數(shù)得到正面的概率是(p + q)^n的對應(yīng)項,其中q = 1 ? p。什么意思呢?例如,假設(shè)我拋硬幣三次。那么八個可能的結(jié)果是:根據(jù)正面出現(xiàn)的次數(shù)對序列進行分組。所以在這八個可能的序列中,有: 這種與二項式系數(shù)的聯(lián)系并非巧合。如果你展開代數(shù)公式(H + T)^3,會得到:即使在這種情況下,每一個極端的HHH和TTT只在8個試驗中出現(xiàn)一次。使用二項式系數(shù)進行更復(fù)雜的計算,可以證明伯努利大數(shù)定律。當(dāng)數(shù)學(xué)家們不知道如何計算一些重要的東西時,他們會找到一種方法來間接地靠近它。舉個例子,你想知道投擲100次硬幣得到42次正面的概率,你必須做200次乘法然后簡化一個非常復(fù)雜的分數(shù)。我的電腦瞬間就告訴我答案,是這種直接計算是不可行的。大約在1730年,亞伯拉罕·德·莫弗爾推導(dǎo)出了一個關(guān)于重復(fù)投擲“不均勻硬幣”的概率的近似公式。這引出了誤差函數(shù)或正態(tài)分布,由于其形狀,通常被稱為“鐘形曲線”。他證明了,用公式定義均值μ、方差σ^2的正態(tài)分布Φ(x):對于投擲n次不均勻硬幣(n是大數(shù)),得到m個正面的概率非常接近Φ(x),當(dāng)這里的“均值”指的是平均值,而“方差”指的是數(shù)據(jù)分布的范圍——鐘形曲線的寬度。方差的平方根,σ本身,稱為標(biāo)準(zhǔn)差。下圖顯示了Φ(x)的值如何依賴于x。曲線看起來有點像鐘形。鐘形曲線是概率分布的一個例子;這意味著,在兩個給定值之間獲得數(shù)據(jù)的概率等于曲線下和與這些值對應(yīng)的垂直線之間的面積。曲線下的總面積是1。當(dāng)鐘形曲線開始出現(xiàn)在社會科學(xué)的經(jīng)驗數(shù)據(jù)中時,它開始得到重視,而不僅僅是理論數(shù)學(xué)。1835年,比利時人阿道夫·奎特雷是社會學(xué)定量方法的先驅(qū),他收集和分析了大量的數(shù)據(jù),包括犯罪、離婚率、自殺、出生、死亡、身高、體重等,這些變量沒有人認為會符合任何數(shù)學(xué)模式,因為它們的原因太復(fù)雜,涉及到人類的選擇(自由意志)。認為這可以簡化成一個簡單的公式似乎很可笑如果你想準(zhǔn)確預(yù)測誰會自殺,以及何時自殺,顯然是不可能的。但當(dāng)奎特雷專注于統(tǒng)計問題時,例如不同人群、不同地點、不同年份的自殺比例,他開始看到模式。這些是有爭議的:如果你預(yù)測明年某個地方將有六起自殺事件,當(dāng)每個人都有自由意志時,這又有什么意義呢?他們都可能改變主意。但是自殺的人所構(gòu)成的人口數(shù)量并沒有事先明確說明;這不僅是那些自殺的人所做選擇的結(jié)果,也是那些想過自殺但沒有自殺的人所做選擇的結(jié)果。人們在許多其他事情的背景下行使自由意志,這些事情影響著他們的自由決定:這里的約束包括經(jīng)濟問題、關(guān)系問題、精神狀態(tài)、宗教背景……無論如何,鐘形曲線不能做出準(zhǔn)確的預(yù)測;它只是說明哪個數(shù)字最有可能??赡軙l(fā)生五到七起自殺事件,這給任何人都留下了施展自由意志和改變主意的空間。數(shù)據(jù)最終贏得了勝利。無論出于什么原因,人們的集體行為比個人行為更容易預(yù)測。也許最簡單的例子就是身高。當(dāng)奎特雷繪制給定人群的身高比例時,他得到了一條漂亮的鐘形曲線。他對許多其他社會變量得出了同樣的曲線形狀。鐘形曲線迅速成為概率論的標(biāo)志,特別是統(tǒng)計學(xué)。主要有兩個原因:一是鐘形曲線的計算相對簡單,二是它在實踐中的應(yīng)用。這種思維方式的主要來源之一是18世紀(jì)的天文學(xué)。由于儀器的微小變化,人為的誤差,或者僅僅是大氣中氣流的運動,觀測數(shù)據(jù)都會出現(xiàn)誤差。那個時期的天文學(xué)家想要觀察行星、彗星和小行星,并計算它們的軌道,這就需要得到最符合數(shù)據(jù)的軌道。這個問題的實際解決辦法首先出現(xiàn)了。它歸結(jié)為:在數(shù)據(jù)中選擇一條直線,使總誤差盡可能小。這里的誤差必須是正的,簡單方法是將其平方。所以總誤差是觀測值與直線模型偏差的平方和,期望的直線使其最小化。1805年,法國數(shù)學(xué)家阿德里安-瑪麗·勒讓德發(fā)現(xiàn)了這條線的一個簡單公式,使得計算起來很容易。這個公式被稱為最小二乘法。下圖說明了關(guān)于壓力和血壓的人工數(shù)據(jù)的方法。圖中使用勒讓德公式得出的直線。不到十年,最小二乘方法就成為法國、普魯士和意大利天文學(xué)家的標(biāo)準(zhǔn)方法。又過了20年,它成了英國的標(biāo)準(zhǔn)。高斯將最小二乘方法作為他在天體力學(xué)領(lǐng)域研究的基石。1801年,他成功預(yù)測了小行星谷神星的存在。這一預(yù)測奠定了他在數(shù)學(xué)和天文學(xué)上的聲譽,并使他成為哥根廷大學(xué)的天文學(xué)教授。高斯并沒有使用最小二乘來做這個特殊的預(yù)測,他的計算歸結(jié)為求解一個八次代數(shù)方程。但在1809年的《天體繞太陽作二次曲線運動的運動理論》中,他把重點放在了最小二乘法上。他還說,早在勒讓德10年前,他就提出并使用了這個方法,這引起了一些爭議。為什么觀測誤差應(yīng)該是正態(tài)分布的?1810年,拉普拉斯給出了一個驚人的答案。拉普拉斯利用傅里葉變換證明了許多觀測值的平均值可以用鐘形曲線來描述,即使個別觀測值并非如此。他的結(jié)果,中心極限定理,是概率論和統(tǒng)計學(xué)的一個重要轉(zhuǎn)折點,因為它為數(shù)學(xué)家最喜歡的分布——鐘形曲線——分析觀測誤差提供了理論依據(jù)。中心極限定理指出鐘形曲線是唯一適合于多次重復(fù)觀測的均值的概率分布。因此,它被稱為“正態(tài)分布”。1865年,弗朗西斯·高爾頓研究了孩子的身高與其父母的身高之間的關(guān)系。這是一個更大的目標(biāo):理解遺傳。證明中心極限定理很困難,因為中心極限定理是一把雙刃劍??乩装l(fā)現(xiàn)了一個關(guān)于身高的漂亮的鐘形曲線,但這似乎并沒有顯示出影響身高的不同因素,因為中心極限定理預(yù)測了正態(tài)分布,不管這些因素的分布是什么。即使父母的特征是這些因素之一,他們也可能被其他因素所覆蓋——例如營養(yǎng)、健康、社會地位等等。然而,到了1889年,高爾頓找到了擺脫這種困境的方法。拉普拉斯中心極限定理的證明依賴于平均許多不同因素的影響,但這些因素必須滿足一些嚴格的條件。1875年,高爾頓將這些條件描述為“高度人為的”:- 所有人都承認自己被視為“高于平均水平”或“低于平均水平”的簡單替代品;
這些條件都不適用于人類遺傳。條件(4)對應(yīng)于拉普拉斯的假設(shè),即被加因子的數(shù)目趨于無窮大,所以“無窮大”有點夸張;然而,數(shù)學(xué)所建立的是為了得到一個很好的正態(tài)分布的近似,必須結(jié)合大量的因素。每一個因素對平均值的貢獻很小。比方說,有100個因素,每個因素貢獻了其價值的百分之一。每一個單獨的實驗都沒有顯著的效果。中心極限定理為正態(tài)分布提供了一個充分條件,而不是一個必要條件。即使它的假設(shè)失敗,由于其他原因,有關(guān)的分布可能仍然是正態(tài)分布。高爾頓的任務(wù)就是找出這些原因。要想與遺傳聯(lián)系起來,它們必須適用于少數(shù)大而不同的影響的組合,而不是大量的無關(guān)緊要的影響。他慢慢地摸索著找到了解決辦法,并通過兩個實驗找到了答案。這兩個實驗都可以追溯到1877年。其中一種是設(shè)置一個裝置,在這種裝置中,滾珠從斜坡上掉下來,撞到一排柱上,向左或向右的幾率相等。理論上,球應(yīng)該根據(jù)二項分布在底部堆積起來,所以它們應(yīng)該形成一個大致鐘形的堆。他想象當(dāng)球的一部分下落時,它們?nèi)匀粫纬梢粋€鐘形曲線,但這個鐘形更窄。這意味著最終的大鐘形曲線可以被看作是許多小曲線的總和。當(dāng)多個因素(每個因素都遵循其獨立的鐘形曲線)組合在一起時,鐘形曲線就會自我復(fù)制。當(dāng)高爾頓培育出豌豆時,關(guān)鍵時刻到來了。1875年,他把種子分給了七個朋友。每個人都收到了70粒種子,但重量都不同。1877年,他測量了這七組種子的“后代”。每一組都是正態(tài)分布,但每一組的平均重量不同,與原始組中每個種子的重量相當(dāng)。當(dāng)他將所有組的豌豆合并后,結(jié)果再次呈正態(tài)分布,但方差更大——鐘形曲線更寬。這再次表明,組合幾個鐘形曲線會產(chǎn)生另一個鐘形曲線。高爾頓找到了這一現(xiàn)象的數(shù)學(xué)原因。假設(shè)兩個隨機變量都是正態(tài)分布,均值和方差不一定相同。它們的和也是正態(tài)分布的;它的均值是兩個均值之和,它的方差是兩個方差之和。這個定理適用于少量的因子組合,每個因子可以乘以一個常數(shù),所以它適用于任何線性組合。正態(tài)分布是有效的,即使每個因素的影響都很大。現(xiàn)在高爾頓可以看到這個結(jié)果是如何應(yīng)用到遺傳上的。假設(shè)由孩子身高給出的隨機變量是父母身高相應(yīng)隨機變量的組合,這些隨機變量是正態(tài)分布的。假設(shè)遺傳因素是相加的,那么孩子的身高也會呈正態(tài)分布。隨著鐘形曲線的中心作用被牢牢地固定在當(dāng)時被認為是堅實的基礎(chǔ)上,統(tǒng)計學(xué)家可以以高爾頓的觀點為基礎(chǔ),其他領(lǐng)域的工作者也可以應(yīng)用這些結(jié)果。社會科學(xué)是早期的受益者,生物學(xué)緊隨其后,而由于勒讓德、拉普拉斯和高斯,物理科學(xué)已經(jīng)走在了前面。很快,任何想要從數(shù)據(jù)中提取模式的人都可以使用完整的統(tǒng)計工具箱。我將只關(guān)注一種技術(shù),因為它經(jīng)常被用于確定藥物的有效性,以及許多其他應(yīng)用。它被稱為假設(shè)檢驗,其目標(biāo)是評估數(shù)據(jù)中明顯模式的重要性。它是由四個人建立的:英國人羅納德·艾爾默·費雪、卡爾·皮爾森和他的兒子埃根,以及一個生于俄羅斯、在美國度過了大部分時間的波蘭人杰西·內(nèi)曼。在公眾意識中,“鐘形曲線”一詞與兩位美國人——心理學(xué)家理查德·J·赫恩斯坦和政治學(xué)家查爾斯·默里在1994年出版的爭議性著作《鐘形曲線》有著不可避免的聯(lián)系。這本書的主題是宣稱用智商衡量的智力與收入、就業(yè)、懷孕率、犯罪率等社會變量之間的聯(lián)系。作者認為,智商水平比父母的社會和經(jīng)濟地位或教育水平更能預(yù)測這些變量。爭論是不可避免的,無論這本書的學(xué)術(shù)功過如何,因為它觸及了一根敏感的神經(jīng):種族和智力之間的關(guān)系。媒體報道傾向于強調(diào)智商差異主要源于遺傳,但這本書對這種聯(lián)系持謹慎態(tài)度,并對基因、環(huán)境和智力之間的相互作用持開放態(tài)度。另一個有爭議的問題是,一項分析表明,美國的社會分層在整個20世紀(jì)顯著增加,而主要原因是智力的差異。另一項是一系列處理這一所謂問題的政策建議。一是減少移民,書中稱移民降低了平均智商。也許最具爭議性的建議是,據(jù)稱鼓勵貧困婦女生育的社會福利政策應(yīng)該停止。具有諷刺意味的是,這個想法要追溯到高爾頓本人。他在1869年出版的《遺傳天才》提出了這樣一個觀點:“人類的自然能力是在與整個有機世界的形式和物理特征完全相同的限制下,由遺傳得來的?!币虼耍谶B續(xù)幾代中,通過明智的婚姻來產(chǎn)生一個具有高度天賦的男性種族是相當(dāng)可行的。他斷言智商較低的人生育能力更高。相反,他表達了社會可能會發(fā)生變化的希望,讓更聰明的人理解多生孩子的必要性。把數(shù)學(xué)模型當(dāng)作現(xiàn)實來看待是錯誤的。在物理科學(xué)中,模型通常非常符合現(xiàn)實,這可能是一種方便的思考方式。但在社會科學(xué)中,模型往往比漫畫好不了多少。僅僅因為智商具有數(shù)學(xué)譜系,就認為它是對人類能力的某種精確衡量,這種觀點也犯了同樣的錯誤。把廣泛的、極具爭議的社會政策建立在簡單化、有缺陷的數(shù)學(xué)模型之上是不明智的。概率論被廣泛應(yīng)用于新藥和治療方法的醫(yī)學(xué)試驗中,用來檢驗數(shù)據(jù)的統(tǒng)計意義。測試通?;诘讓臃植际钦龖B(tài)分布的假設(shè)。一個典型的例子是癌癥群集的檢測。對某些疾病而言,群集是指該疾病在總?cè)丝谥邪l(fā)生的頻率高于預(yù)期的群體。集群可能是地理上的,也可能是指具有特定生活方式或特定時期的人。例如,退休的職業(yè)摔跤手,或者1960年到1970年出生的男孩。從賭博問題中衍生出來的統(tǒng)計方法有多種用途。它們?yōu)榉治錾鐣?、醫(yī)療和科學(xué)數(shù)據(jù)提供了工具。任何使用統(tǒng)計方法的人都需要了解這些方法背后的假設(shè)及其含義。盲目地將數(shù)字輸入計算機,并把結(jié)果當(dāng)作真理,而不理解所使用方法的局限性,這將導(dǎo)致災(zāi)難。然而,合法使用統(tǒng)計數(shù)字已使我們的世界得到了翻天覆地的改善。這一切都始于奎特雷的鐘形曲線。
|