這個(gè)世界變差(Variation)無(wú)處不在,且因變差而生美 試想:如果所有人都長(zhǎng)得一樣,所有的花兒只有一種顏色,所有山峰高度一樣,沒(méi)有季節(jié)變換……該是何等恐怖! 然而在質(zhì)量管理領(lǐng)域,我們常聽(tīng)聽(tīng)說(shuō),變差(Variation)是質(zhì)量管理的大敵。 但事實(shí)上,“消除變差”只能說(shuō)是質(zhì)量管里中一個(gè)理想化的、不可實(shí)現(xiàn)的目標(biāo),因?yàn)榫拖袷澜缟蠜](méi)有兩片完全相同的樹(shù)葉,變差是永遠(yuǎn)存在并且是不可絕對(duì)消除的。 因此我們只能盡量去“減少變差”。 那么如何減少變差呢? 通過(guò)理解概率分布,我們對(duì)“變差”會(huì)有更深刻的認(rèn)識(shí);掌握變差之規(guī)律,我們才能利用規(guī)律,順勢(shì)而為。 什么是概率分布? 我們身邊每時(shí)每刻都有各種事件正在發(fā)生:骰子擲出、雨滴落下、巴士到站。 事件發(fā)生之后,特定的結(jié)果便確定了:擲出3點(diǎn)加4點(diǎn),今日的降雨量是半英寸,巴士3分鐘到站。在事件發(fā)生之前,我們只能討論結(jié)果的可能性。 概率分布就是描述的每種結(jié)果出現(xiàn)的可能性,所有的可能性加在一起形成“必然”,也就是概率分布的概率之和恒等于1。 然而概率分布有數(shù)百種,好在實(shí)踐中經(jīng)常出現(xiàn)的概率分布只有15種(且都是鄉(xiāng)里鄉(xiāng)親關(guān)系密切,如下圖),今天我們只重點(diǎn)介紹最重要的一種分布:正態(tài)分布。 什么是正態(tài)分布? 正態(tài)分布,也稱(chēng)“常態(tài)分布”,又名“高斯分布”,英文名有Normal distribution,Gaussian distribution,Law of Errors, 是一個(gè)在數(shù)學(xué)、物理及工程等領(lǐng)域都非常重要的概率分布,在統(tǒng)計(jì)學(xué)的許多方面有著重大的影響力。 正態(tài)分布曲線呈兩頭低,中間高,左右對(duì)稱(chēng);因其呈優(yōu)雅的鐘形,因此人們又經(jīng)常稱(chēng)之為鐘形曲線(Bell curve)。 若隨機(jī)變量X服從一個(gè)數(shù)學(xué)期望為μ、方差為σ^2的正態(tài)分布,記為N(μ,σ^2)。其概率密度函數(shù)為正態(tài)分布的期望值μ決定了其位置,其標(biāo)準(zhǔn)差σ決定了分布的幅度。當(dāng)μ = 0,σ = 1時(shí)的正態(tài)分布是標(biāo)準(zhǔn)正態(tài)分布。 正太分布函數(shù)包含了最重要的兩個(gè)常數(shù): 自然對(duì)數(shù) e, 以及圓周率 π,曲線因此呈現(xiàn)出一種和諧的美感。 正態(tài)分布之歷史 正態(tài)分布跟許多大咖都有關(guān)系,其中就包括法裔英國(guó)數(shù)學(xué)家棣莫弗、德國(guó)數(shù)學(xué)家高斯、法國(guó)數(shù)學(xué)家拉普拉斯等等。 正態(tài)分布最早由棣莫弗在求二項(xiàng)分布的漸近公式中得到,但因當(dāng)時(shí)只是一個(gè)雛形并沒(méi)有引起大家的注意也沒(méi)有被正式命名. 后來(lái)高斯在研究天文觀測(cè)的測(cè)量誤差時(shí)從另一個(gè)角度導(dǎo)出了它,并正式冠以 Normal Distribution . 再后來(lái)法國(guó)數(shù)學(xué)家拉普拉斯進(jìn)一步發(fā)展了正態(tài)分布,他提出的中心極限定理,使得正態(tài)分布的應(yīng)用變得極其強(qiáng)大從而占據(jù)了統(tǒng)計(jì)學(xué)的中心位置。 正態(tài)分布為何重要? 首先,正太分布揭示這個(gè)世界非常多非常多變量的分布規(guī)律,比如: § 人的身高 § 汽車(chē)零件尺寸 § 測(cè)量誤差 § 血壓 § 考試成績(jī)…… 其次,在統(tǒng)計(jì)理論中,正態(tài)分布極其重要。 如果把統(tǒng)計(jì)學(xué)看作一座大樓,那么正態(tài)分布就是大廈下最重要的基石 : t分布、F分布、卡方分布都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來(lái)的;此外,t分布、二項(xiàng)分布、Poisson分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來(lái)處理。 68-95-99.7 經(jīng)驗(yàn)法則 由正態(tài)分布引申出來(lái)的“68-95-99.7”法則又叫又叫 3-sigma 法則,對(duì)質(zhì)量人而言記住上面的函數(shù)公式可能有點(diǎn)難也沒(méi)有太大必要,但理解并記住這個(gè)經(jīng)驗(yàn)法則必大大受益。 法則告訴我們,對(duì)于正態(tài)分布,如上圖所示,幾乎所有數(shù)據(jù)都將落在均值的三倍標(biāo)準(zhǔn)差內(nèi): § 68%的數(shù)據(jù)將分布在均值的(正負(fù))一個(gè)標(biāo)準(zhǔn)偏差之內(nèi) § 95%的數(shù)據(jù)將分布在均值的(正負(fù))兩個(gè)標(biāo)準(zhǔn)偏差之內(nèi) § 99.7%的數(shù)據(jù)將分布在均值的(正負(fù))三個(gè)標(biāo)準(zhǔn)偏差之內(nèi) 不得不說(shuō)的中心極限定理 說(shuō)到正態(tài)分布就不得不說(shuō)中心極限定理,如前文已經(jīng)提到 “國(guó)數(shù)學(xué)家拉普拉斯進(jìn)一步發(fā)展了正態(tài)分布,他提出的中心極限定理,使得正態(tài)分布的應(yīng)用變得極其強(qiáng)大從而占據(jù)了統(tǒng)計(jì)學(xué)的中心位置”。 心極限定理是概率論中最著名的結(jié)果之一,它指出:不管總體是什么分布,任意一個(gè)總體的樣本平均值都會(huì)圍繞在總體的整體平均值周?chē)?,并且呈正態(tài)分布。 中心極限定理不僅提供了計(jì)算獨(dú)立隨機(jī)變量之和的近似概率的簡(jiǎn)單方法,而且有助于解釋為什么有很多自然群體的經(jīng)驗(yàn)頻率呈現(xiàn)出鐘形(即正態(tài))曲線這一事實(shí),因此中心極限定理這個(gè)結(jié)論使正態(tài)分布在數(shù)理統(tǒng)計(jì)中具有很重要的地位,也使正態(tài)分布有了廣泛的應(yīng)用。 正態(tài)分布與SPC控制圖 SPC的一個(gè)前提是數(shù)據(jù)要穩(wěn)定受控,即服從正太分布,否則SPC就不能發(fā)揮其預(yù)測(cè)功能。 前面介紹的 64-95-97.3 經(jīng)驗(yàn)法則可以解釋SPC中的各種判異原則,比如最常見(jiàn)最基本的就是,如果某個(gè)值落在了三個(gè)標(biāo)準(zhǔn)差之外,那么這個(gè)值就極可能是特殊原因?qū)е碌漠惓#▽?dǎo)致非正態(tài)): 正常情況下一個(gè)值落在三個(gè)西格瑪以外的概率只有0.3%(小概率事件),但是卻100%發(fā)生了,因此我們推斷這是異常導(dǎo)致。 正態(tài)曲線蘊(yùn)含的人生哲學(xué) 對(duì)于那條美麗的鐘形曲線可能大多習(xí)以為常,你可曾瞥到其蘊(yùn)藏著的人生智慧? 對(duì)于這一點(diǎn),就留個(gè)白,大家自己悟吧。 |
|
來(lái)自: 本草館長(zhǎng) > 《概率統(tǒng)計(jì)》