小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

陳希孺:機會的數(shù)學之(二)大數(shù)定律

 張東鍵 2013-07-10

l2大數(shù)定律

讓我們再回到最初討論的那個“盒中抽球”的模型。盒中有l0個球,73白。我們說“隨意抽出一個球,得白球的概率為03,這是從取得自球的機會大小的角度看。其實,它不過是白球在全部球中所占的比率而已。

     比率是一個極普通但是又極常用而重要的概念。在科技、生產(chǎn)和經(jīng)濟、社會以至日常生活中,幾乎是無所不在。我們說對一個情況數(shù)量上的掌握,往往就是指對有關(guān)比率有較確切的了解。比如說“某廠產(chǎn)品的合格率很高”,高到什么程度?還是不清楚,遠不如給出一個具體的合格品率更說明問題。要考察一國或一地區(qū)的文盲情況,首要的指標是文盲率——文盲數(shù)目占全部人口數(shù)目的比率。當然還有文盲的年齡、地域和性別等的分布問題,但比率給出一個總的概念。

    因此.在現(xiàn)實生活中,有許多努力就花在搞清楚形形色色的比率上,在許多情況下這是一個需要花費大量人力、物力和時間的工作。如果從理論角度看,則不過是一個“盒子里有兩種顏色的球“的模型。例如一工廠的產(chǎn)品,白球代表不合格品而黑球代表合格品;對文盲率問題.白球代表文盲而黑球代表非文盲等等。無論問題的實際方面是何等的復雜,若問題只涉及比率,都不影響這個模型的代表性。

    這里我們看到數(shù)學這門學科的本質(zhì)所在。對數(shù)學不大了解的人,容易把它看成一種高深玄妙脫離實際的東西。的確,數(shù)學里研究的形形色色的模型、運算、關(guān)系.等等,都是高度抽象的。但這種抽象是植根于現(xiàn)實,并非憑空的想象。所謂模型,不過是把一大類本質(zhì)一樣但外表各異的問題表述成一種規(guī)格化的模式而已.它雖是一種抽象.但有豐富的實際內(nèi)涵.盒子模型就是一個極好的例子。把這個模型有關(guān)的理論和力法研究清楚了。就可以用于像合格品率、文盲率等一切關(guān)于比率的問題。其實,數(shù)字本身就是一種高度抽象。例如:“3這個符號本身不能傳達什么意義,必須是“3本書”、“3頭?!钡扰c具體事物結(jié)合才產(chǎn)生意義,但這一抽象極有用處,這是大家都容易理解的。

    把比率問題歸結(jié)于盒子模型,問題就表述成:一個盒子中放了若干個黑白兩種顏色的球,要想搞清楚(或者說估計)白球在其中占多大的比率。不妨以wb記白球數(shù)和黑球數(shù)?,F(xiàn)實問題中有幾種情況:一種是知道黑、白兩種球個數(shù)之和wb。如文盲率問題,w+b代表一國或地區(qū)的人口總數(shù),這往往有較可靠的統(tǒng)計資料。一種是wb知其一而不知其和,此時目的正在于估計這個和,下述所謂“捉—放—捉”試驗是一個很好的例子。有一個湖,其中有某種魚類,但不知總數(shù)N是多少。為估計這個數(shù)目,從湖中捉上來該種魚若干條,數(shù)目記為w。在這w條魚上標上記號再放回湖中,待過了相當時候以便使魚能隨機地在湖中散開(這相當于把盒中的球充分擾亂),然后從湖中撈起這種魚n條,計數(shù)出其中有記號的有m條.利用已知的數(shù)wnm,就可以對總數(shù)N作一個估計,方法如下:wN代表整個湖中該種魚上有記號者的比率,而mn代表撈起的那些魚中有記號者的比率。近似地視二者為相等:wN=mn,得N=nw/m。當然.這只是一種近似的估計而非嚴格相等。n愈大,誤差一般就愈小。

    最后一種情況是wb這兩個數(shù)都不知道,例如,想要估計在全國或某地區(qū)的吸毒者中,受艾滋病病毒HIV感染者的比率。但是,不論是這3種情況的哪一種,作為估計白球比率  p=w/(w+b)的問題,其處理方法上沒有多大差別(當知道總數(shù)w+b時,有某種方便之處,但與目前我們這里的討論無關(guān)),故在下面可以不管這點。

    我們的問題是要估計p。如果是“盒子里放球”的情形,問題很簡單:把盒中的球倒出來計點出黑、白球各有多少就成。但實際問題中往往不容許這樣做。如估計湖中的魚數(shù),要這樣做得排干湖水。又如估計文盲率,這樣做相當于把全國人口連一檢查何人是文盲,何人不是,這樣大規(guī)模的工作不一定可行。在估計工廠產(chǎn)品的合格率時,對產(chǎn)品的檢驗可能是破壞性的,更不可能逐個進行檢查。

    所以,我們只能檢查盒中的一部分球,且一般只是很小的一部分。但要記?。诂F(xiàn)時問題中,球的總數(shù)w+b一般是極大(要不這樣就可以用普查,即把盒中的球逐一檢視的方法),故其很小一部分仍可能是一個很大的數(shù)目。假定我們打算檢視盒中的m個球。不妨設想球是一個一個被拍出,共抽m次。這造成一種復雜的情況:盒中的球數(shù)在不斷的變化,這我們在前面討論10個人分3張音樂會票的問題時就曾指出過。為了簡化,我們把球檢視后仍放回去,以使在每一次抽球時,盒里總是保持wb個球。如果w+b很大而m與之相比很小,則這個放回對結(jié)果不會有多大影響,因為個球被重復抽到的可能性極低。但這樣做在理論上有一個很大的好處,即各次抽球成為一個完全同一的試驗的重復?!巴耆弧北硎荆好看纬榍驎r條件完全一樣,即從有w+b個球的盒中隨機抽出一個米?!鞍淹耆瑯拥脑囼炛貜腿舾纱巍痹诟怕手惺且粋€極其重要的模型。由于它最初由伯努利所研究,故通稱為伯努利模型(伯努利及其著作后文有介紹)。在此我們又注意到數(shù)學的一個特點:數(shù)學中研究的種種模型,往往包含了對現(xiàn)實情況的簡化。這是因為,數(shù)學方法的力量畢竟是有限的,對付過于復雜的現(xiàn)實問題往往無能為力。只要這種簡化不與現(xiàn)實距離過遠.或者說,所造成的誤差不致對結(jié)論的有用性造成較大的傷害,基于簡化模型而發(fā)展的數(shù)學方法仍有其實用價值。

    回到估計白球比率p=w(w+b)的問題。按上述有放回地逐一從盒中抽出n個球(每次抽出后,記下其黑白,再放回盒中,擾亂后重抽),記錄白球出現(xiàn)次數(shù)為m,比值mn稱為在這n次試驗(抽取)中白球出現(xiàn)的“頻率”。直觀上容易相信:至少在n比較大的時候,這個頻率mn應當與p比較接近,因而可以拿它作為未知的p的一個估計。從“等可能性”含義的分析上看,有理由相信這一點:考慮3白球7黑球的情況,把10個球編號為l10,其中3個白球編號為1,2,3。設想抽了l000次,由于每號球之被抽出有同等可能,它應該反映在這一點上:在這1000次抽取中,各號球被抽到的次數(shù)應大致差不多。因為,如果差別過大,則說明某些球比另一些球被抽到的機會大得多,這有悖于“機會均等”的含義——自然,由于偶然性的作用,小的差別會有。這樣.大體上每號球有100次左右的機會被抽到。因此,在這1000次抽取中,白球(1,23)出現(xiàn)的次數(shù)m大體上在300左右,二者的比m/n=0.3左右,而0.3正是盒中白球的比率。

       當然,以上的討論不能算作嚴格的論證。學過平面幾何的讀者知道,在數(shù)學上對論證的要求很嚴格。為證明一個幾何定理.例如三角形的三個高相交于一點,要經(jīng)過多步推導,每一步都要有嚴格的依據(jù),一絲不茍。而在我們上述論證中,“大體上”,“左右”這些含糊的字眼多次出現(xiàn),夠不上數(shù)學論證的標準。

    在歷史上,第一個企圖對“當試驗次數(shù)n愈來愈大時,頻率m/n會愈來愈接近比率p=w/(w+b)”這個論斷給予嚴格的意義和數(shù)學證明的,是早期概率論歷史上最重要的學者雅各布·伯努利(16541705)。他出生于瑞士的巴塞爾·在他的家族中,有五六位成員曾在數(shù)學和概率論領(lǐng)域中做出過重要貢獻.雅各布是其中最負盛名的。他的貢獻中,最重要的、對后世起了最大的影響的,就是剛才提到的“頻率接近比率”這個論斷的數(shù)學證明。說來有趣的是:他之所以研究這個問題。并非因為他對這個論斷之真?zhèn)未嬖谝蓡?。如他自己在著作中所說,甚軍那些最愚笨的人,出于其自然的天性而無須他人指點.也會相信這一點。因為這個論斷得到如此廣泛的公認,它理應有其理論上的根據(jù)所在,他的目標就是致力于找出這個根據(jù)。

    除了這個問題以外,伯努利還對現(xiàn)代高等數(shù)學的基礎——微積分的發(fā)展起了重要的作用。他生活的那段時期正值牛頓和萊布尼茲發(fā)明丁微積分。伯努利與萊布尼茲有良好的個人關(guān)系.他通過與萊布尼茲的通信,與后者探時微積分研究中的問題。有的學者認為,他當時對這個重要領(lǐng)域的貢獻,是牛、萊以下的第一人。

在現(xiàn)代,學者們進行學術(shù)交流的方式很多。交通和通信的進步。使個人接觸和會議交流變得很方便,還有眾多的期刊與專業(yè)著作等。在伯努利時代則不同,當時學術(shù)交流的主要手段,是學者之間的個人通信。就伯努利而言,他在概率論方面的研究,得益于與惠更斯的聯(lián)系。惠更斯(16291695)是歐洲當時最大的概率論學者,他在1657年出版的著作《機遇的規(guī)律》,是卡丹諾《機遇博弈》之后最有影響的概率論著作.曾在長達50年的時間內(nèi)成為這門學科的標準教科書。伯努利與惠更斯長期保持通信聯(lián)系,仔細研究過惠更斯的上述著作,并為這本書寫了詳細的注解。這些都寫進了他的成名作《推測術(shù)》中。

    《推測術(shù)》在概率史上的評價很高。有的學者認為它的問世標志著概率論脫離其萌芽狀態(tài)而走向嚴格數(shù)學化發(fā)展方向的升端。伯努利寫這本著作是在他生命的最后兩年(他死于l705),在他去世時書尚未完全定稿。遺留的工作由他的侄兒、概率學家尼科拉斯·伯努利完成,后又經(jīng)過一番周折,才得于1713年出版。

    該書分4個部分。前3部分是到那時為止有關(guān)古典概率計算所積累的一些成果的總結(jié)和提高。重要的是第4部分,在其中他用嚴格的數(shù)學方法證明了前面提及的那個結(jié)論:當n愈來愈大時,白球出現(xiàn)的頻率m/n愈來愈接近白球在盒中的比率w(wb)。

    這個結(jié)論現(xiàn)在通稱為“大數(shù)定律”。在概率論上還有許多類似的結(jié)果,也稱作九數(shù)定律,為加以分別,特別稱呼它為“伯努利大數(shù)定律”。

    伯努利大數(shù)定律的重大意義,在于它揭示了因偶然性的作用而呈現(xiàn)的雜亂無章現(xiàn)象中的一種規(guī)律性,或簡單地講,在紛亂中找到了一種秩序。如果你每天在盒中抽一個球記下其結(jié)果(再放回去),當抽到白球時記以1而抽到黑球時記以0.則你得到的是一串雜亂的數(shù)字,例如:

    11000l00111101100000101l0…

外表上看不出有何特征或規(guī)律性。如果有另一個人把你剛才所做的重做一遍,他也得出這樣一串由01構(gòu)成的數(shù)字,同樣的雜亂無章但與你那一串并不相同。伯努利大數(shù)定律告訴我們,這表面的紛亂之下其實存在著種規(guī)律性,即在這數(shù)串中,1所占的比率愈來愈穩(wěn)定到一個值上面,此值即盒中白球的比率。這個穩(wěn)定性要到數(shù)串的長度足夠大時才顯示出來:在開始的一段中比率的變化可以是很大的,這正是大數(shù)定律這個名稱的由來。

    跳出這個盒子模型,對大數(shù)定律的意義作一種更寬廣的解釋,可以不夸張的說,它反映了我們的世界的一個基本規(guī)律:在一個包含眾多個體的大群體中,由于偶然性而產(chǎn)生的個體差異,著眼在一個個的個體上看,是雜亂無章,毫無規(guī)律,難于預測的。但由于大數(shù)定律的作用,整個群體卻能呈現(xiàn)某種穩(wěn)定的形志。例如一個封閉容器中的氣體,它包含大量的分子,它們各自在每時每刻的位置、速度和方向,都以種偶然的方式在變化著,但容器中的氣體仍能保有一個穩(wěn)定的壓力和溫度。電流是由電子運動形成的,每個電子的行為雜乩而不可預測,但整體看呈現(xiàn)一個穩(wěn)定的電流強度。在社會、經(jīng)濟領(lǐng)域中,群體中個體的狀況千差萬別,且變化不定,但一些反映群體狀況的平均指標,在一定時期內(nèi)能保持穩(wěn)定,或呈現(xiàn)規(guī)律性的變化。究其根源,都是由于大數(shù)定律的作用。

    上文談到的壓力、電流等的穩(wěn)定性,是一種從經(jīng)驗上觀察到的事實。另一方面.我們又曾指出:伯努利用數(shù)學的方法嚴格論證了大數(shù)定律,這二者的關(guān)系該如何去理解?

這個問題牽涉到數(shù)學理論與現(xiàn)實世界的關(guān)系,值得花一點篇幅來談談。先看看伯努利的數(shù)學證明:盒中一共有N=w+b個球,白球w個,黑球b個。伯努利要求每次抽取一球時,N個球中每一個有同等可能被抽到,至于在現(xiàn)實中能否和如何做到這一點,數(shù)學證明完全不管它,只把這規(guī)定為一個必須做到的前提。把這N個球按1N編號,則n次抽取的結(jié)果是如下形式的一個序列:

 個。n次抽取的結(jié)果可以是這Nn個序列中的任何一個,伯努利要求這個Nn結(jié)果有等可能性。這一點早在卡爾諾16世紀的著作中已提到了。而且,在每次抽取時能保證等可能性的基礎上,這一點看來也是不言而喻的。但我們?nèi)缘冒阉闯墒且粋€引伸的假定,因為“等可能性”既然不是一個數(shù)學概念,用數(shù)學的形式推導去證明這一點是不可能的。最后,伯努利將上述Nn個結(jié)果的等可能性,數(shù)學化解釋為:其中任何一個序列在n次抽取中出現(xiàn)的概率都是1/Nn。這一個解釋把“等可能性”這種模糊的概念轉(zhuǎn)化為一個明確的數(shù)學命題。在這個基礎上,伯努利不難完成他的證明。

從現(xiàn)實世界的角度看,大數(shù)定律是無法嚴格證明的。因為試驗和觀察,不論你進行得多長,只能是有限次。你把一個均勻方正的骰子擲了萬億次,記錄出么點出現(xiàn)的頻率,極其接近16。但你怎么去證明:當你再繼續(xù)擲萬億次時,仍能保持及縮小這個差距呢?你就是做了,我還可以再提出投擲百萬億次,總是解決不了。因此,說到底,從現(xiàn)實世界的角度看,大數(shù)定律是人類觀察到的一個經(jīng)驗規(guī)律。伯努利大數(shù)定律(及其他形形色色的大數(shù)定律)的意義,在于對這樣一個經(jīng)驗規(guī)律給了一個理論上的解釋。因為在現(xiàn)實世界中,盡管很難以至不可能達到伯努利數(shù)學證明中那種理想化的條什,但可以與之非常接近,因而伯努利證明的數(shù)學結(jié)論“基本上能適用??梢哉f.大數(shù)定律這個經(jīng)驗規(guī)律,一般人都能知其然,而伯努利的研究成果告訴你所以然。

    在歷史上,不少的有心人也真拿這個定律作為實驗驗證的對象。丹麥概率論學者克里克在二戰(zhàn)時曾被拘留,在拘留中他做過幾個試驗以打發(fā)日子。在一個試驗中.他投擲一枚硬幣達10 000次之多。硬幣指定一面出現(xiàn)的概率被認為是12。在投擲的初期,該面出現(xiàn)的頻率擺動很大。后來逐漸平緩,在0.5的附近擺愈來愈小,到10 000次終結(jié)時頻率為0 507,與0 5稍有差距。這可以有兩種解釋:一是由于偶然性的作用 ——雖則投擲次數(shù)之多使偶然性的作用大為減弱,但仍不能說沒有。理論上的計算指出:當投擲10 000次時,頻率仍可以有一個±0.01,甚至更大一點的擺動幅度。另一種解釋是該面出現(xiàn)的概率并非確切地等下0.5:硬幣的兩面有形狀不一的花紋,它使硬幣的兩個面并不嚴格的處在對等狀態(tài)。擲骰子提供了更多可能的組合。在1 9世紀末,英國生物學家兼統(tǒng)計學家威爾登將12粒骰于投擲了 26 306次——相當于把一粒骰子投擲315 672次,每次記錄其是否“投出56點”,最后記錄得“投出56點”共106 602次,頻率為106 602315 672=0.337 7。按骰子均勻性,“投出56點”的概率為26=0.333 3。與頻率0.33 7 7比,有0.004 4的差距。這差距稍嫌大一些,因為投擲的次數(shù)極大。按理論,若概率真為l3,當投到3l5 672這么多次時,頻率與概率的差距,很不可能超過0.0013這說明威爾登所用骰子很可能并非全都均勻。

    18世紀一位叫布豐的法國科學家做過這樣一個計算:在平面上畫一組等距離a的平行線如圖l.l。隨機地向這平面上拋一根長為L的針,La小,針可以與該組平行線之一相交,也可以不與任何直線相交,圖中畫出了這兩種情況。理論上的計算表明,前一種情況發(fā)生的概率是:

 

   這里時圓周率。后來不斷有人對此進行實地試驗,看得出的頻率與上述公式的p相比差距如何。印度統(tǒng)計學家C.R勞的著作<<統(tǒng)計與真理>>介紹了好幾個這種結(jié)果,其中一位意大利數(shù)學家在1901年報道他的結(jié)果:他投擲3408次,算得頻率與p之差距在小數(shù)點后的第6位。這么小的差距多少帶有偶然性。在勞介紹的其余一些實例中,有投擲次數(shù)更多但接近程度不如者,這不僅不奇怪,且是合理的現(xiàn)象,原因還是在于偶然性。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多