波斯公主選駙馬,她是這么利用大數(shù)據(jù)和算法找男人的波斯公主的題目至少還教了我們另一點(diǎn),就是哪怕你的方法是最優(yōu),你也永遠(yuǎn)不可能是每次都得到最英俊的駙馬。生活就是有風(fēng)險(xiǎn)的,不可測(cè)的。這似乎是個(gè)打擊,但也是一種釋懷。如果你按照一個(gè)正確的方法去做了,哪怕結(jié)果差強(qiáng)人意,這也并不是你的錯(cuò)。
(本文精選自36大數(shù)據(jù)) 這是大學(xué)時(shí)的一道數(shù)學(xué)題。我大學(xué)的專業(yè)是數(shù)學(xué),有一次,教授給出了《波斯公主選駙馬》題,如下:
說明一點(diǎn)是,沒有任何選擇方法能夠保證公主一定選擇到最帥的帥哥。對(duì)于任何選擇方法,總存在某些出場(chǎng)的順序,讓公主與帥哥錯(cuò)過。所以,題目所問的,不是必勝的選法(因?yàn)椴淮嬖冢歉怕首罡叩倪x法。 因?yàn)椴⒉皇且懻摂?shù)學(xué),我這里就直接給出答案了:最佳選法是 pass 掉最開始的 100/e 名男子(e = 2.718… 是自然對(duì)數(shù),即100/e 約等于 37)。但是記錄下這 37 名男子中最英俊者。之后魚貫而來的男子中,出現(xiàn)的第一位英俊程度超越所有前 37人者,即為駙馬。如果人都走光了,也沒出現(xiàn)這么一位 Mr. Right,那么就只好選擇第100位男子。 這個(gè)最佳選法,后面有很有意思的數(shù)學(xué)推導(dǎo)。
正解后面的思考方法 數(shù)學(xué)的推論且不論,這個(gè)答案背后是一個(gè)可為廣泛應(yīng)用的思考方法。公主選擇的難處在于她不知道這百人的英俊程度是怎樣分布的,是在怎樣一個(gè)范圍內(nèi)。所以她最佳的策略是,pass 掉最初 37 位男子,但是把他們看成一個(gè)有代表性的sample,從而了解這百人相貌的大致分布。然后在這個(gè)認(rèn)知的基礎(chǔ)上進(jìn)行選擇。 真實(shí)的談情說愛當(dāng)然不是一個(gè)簡單的選美。普通人也不能像波斯貴族那樣要誰有誰。但是思維方法共通。假如你是一位女生,第一次戀愛的時(shí)候,也許你覺得男朋友不夠細(xì)膩,不解風(fēng)情。但你無法判斷的是,是否天下男生大多如此,還是你特別倒霉碰到這樣的極品。你唯有試過三個(gè)五個(gè)后,才能夠?qū)δ行赃@個(gè)物種有個(gè)全局的判斷。所以,當(dāng)你和第一任男朋友分手后,大可不必悲天憫人,亦或?qū)μ煜履腥耸U_的態(tài)度是:okay,我現(xiàn)在有一個(gè)data point, 現(xiàn)在我來找些更多的data points。
花多長時(shí)間學(xué)習(xí)? 找到多少 data points 才夠呢?換句話說我們學(xué)習(xí)到什么時(shí)候才能夠信任自己對(duì)世界的判斷?以下這個(gè)小故事中,我們可以看出大自然是怎么解決這個(gè)問題的。 1944年冬天,二戰(zhàn)進(jìn)入尾聲。德國人封鎖了荷蘭德占區(qū)的補(bǔ)給。1944-1945年的冬天,被稱為”hunger winter”(饑餓的冬天)。有四百五十萬荷蘭人遭受饑餓,一萬八千人餓死。1945年,德國戰(zhàn)敗,封鎖也隨之解除。 但這個(gè)饑餓冬天所帶來的影響卻一直留存到幾十年后。那些封鎖期間懷著孩子的婦女,她們肚子里發(fā)育中的胚胎,雖無知覺,也經(jīng)歷了這場(chǎng)災(zāi)難。幾十年后,當(dāng)這些孩子成為50歲的中年人,科學(xué)家們發(fā)現(xiàn)他們會(huì)比之前,或者之后出生的荷蘭孩子都更肥胖,更容易有心血管疾病。 對(duì)此的一種解釋是,還在媽媽肚子里的時(shí)候,我們的身體就在學(xué)習(xí)這是怎樣一個(gè)世界:是個(gè)食物充足,衣食無憂的世界?還是一個(gè)有上頓沒下頓的世界?這些荷蘭饑荒那年出生的嬰兒,他們的身體學(xué)習(xí)到:“這是一個(gè)食物匱乏的世界”。哪怕他們成年之后,荷蘭已經(jīng)是一個(gè)富余的發(fā)達(dá)國家,他們的身體還是不忘早年饑餓的經(jīng)歷,會(huì)盡力存儲(chǔ)脂肪,準(zhǔn)備著下一個(gè)饑餓冬天的到來。結(jié)果就是這個(gè)人群更容易肥胖,并且更容易患有與肥胖相關(guān)的心血管疾病。 有意思的是,對(duì)食物豐富與否的學(xué)習(xí),在10月懷胎中完成,居然之后幾十年也無法扭轉(zhuǎn)。這個(gè)學(xué)習(xí)的窗口,是我們的身體,我們的基因所決定的。孩子學(xué)東西快,是因?yàn)樗麄兊纳眢w和大腦就是 specialized 學(xué)習(xí)機(jī)器。有研究說,人腦中負(fù)責(zé)抽象思維的前額葉在25歲才定型。換句話說,25歲以前,我們的思維,特別是那些高級(jí)的認(rèn)知能力,還在不斷變化著。而這其中很多的變化,就來自我們的環(huán)境。這種變化,就是我們?cè)趯W(xué)習(xí)我們所在的,到底是怎樣一個(gè)世界;怎樣的思維和行為,是在這個(gè)世界上行得通的。 從人腦的發(fā)育看來,過了25歲,至少從生理上來說,這種學(xué)習(xí)就停止了。這個(gè) deadline 取決于基因,而基因來源于千百萬年的進(jìn)化。千百萬年中,人類的平均壽命是徘徊在20-30歲。這可能就是為什么我們的學(xué)習(xí),從我們身體的設(shè)計(jì)上看來,是在25歲就截止了。 我們無法影響自己生理、身體上的學(xué)習(xí),但是有些事情的學(xué)習(xí),卻是我們可以影響的,而且應(yīng)該去影響的。選擇怎樣的工作?居住在哪個(gè)城市?找什么樣的伴侶?這些似乎不是應(yīng)該匆匆忙忙,趕著一個(gè)deadline (特別是25歲的 deadline)去決定的事情。你會(huì)進(jìn)行很多比較,才決定購買一輛汽車或者房子。而工作、伴侶,這些更重要的決定,你當(dāng)然要更多比較比較,了解一下你是在怎樣的一個(gè)世界里,才做決定。 也許你30歲了,沒有婚配的對(duì)象,不喜歡正在做的工作,但有種種壓力期待你“別折騰,安頓下來”。這壓力可能來自于一個(gè)一直不給個(gè)人選擇的社會(huì)傳統(tǒng),或者來自于一個(gè)預(yù)期壽命只有30歲的進(jìn)化壓力。但是這一切都變了:社會(huì)已經(jīng)有越來越多的選擇余地,我們也可以預(yù)料之中的活到80,90歲。 也許你要認(rèn)真考慮一下波斯公主的問題:我是否應(yīng)該繼續(xù)收集data points?還是已經(jīng)到了要做終生決定的時(shí)候?
回到波斯公主的題目 波斯公主的題目至少還教了我們另一點(diǎn),就是哪怕你的方法是最優(yōu),你也永遠(yuǎn)不可能是每次都得到最英俊的駙馬。在最優(yōu)化的選擇方法下,公主也只有 40% 左右的可能性選擇到最帥的男人。就是說,如果這樣選擇十次,每次這百名男子以隨機(jī)順序出現(xiàn),其中有6次,公主都會(huì)選到不是最帥的駙馬。 生活就是有風(fēng)險(xiǎn)的,不可測(cè)的。這似乎是個(gè)打擊,但也是一種釋懷。盡人事,安天命。如果你按照一個(gè)正確的方法去做了,哪怕結(jié)果差強(qiáng)人意,這也并不是你的錯(cuò)。 我學(xué)會(huì)的另一點(diǎn)是,如果我是作為被選的一方(就像那100名男子),timing 是至關(guān)重要的。以下是一個(gè)簡單的多的題目: 如果你是這百名男子中的一名,并且你能夠決定自己出場(chǎng)的名次,你會(huì)選擇在什么時(shí)候出場(chǎng),以最大提高自己被選的概率? 答案是第38名。你不會(huì)選擇在38名之前,因?yàn)槟惚贿x的概率是零(假設(shè)我們的公主學(xué)過高等數(shù)學(xué),知道最佳選法)。你也不會(huì)選擇后于38,因?yàn)槟闱懊婷慷嘁粋€(gè)人,就意味著多了一分公主選上他的機(jī)會(huì)。 如果你有一位意中人,你當(dāng)然要努力去追求幸福,但你可能也要想一下,這是否是最好的timing?
37% 法則“實(shí)測(cè)” 37% 法則的效果究竟如何呢?我們?cè)谟?jì)算機(jī)上編寫程序模擬了當(dāng)n = 30時(shí)利用37% 法則進(jìn)行選擇的過程(如果 MM 始終未接受求愛者,則自動(dòng)選擇最后一名求愛者)。編號(hào)越小的男生越次,編號(hào)為30的男生則表示最佳選擇。程序運(yùn)行10000次之后,竟然有大約4000次選中最佳男生,可見37%法則確實(shí)有效啊。 計(jì)算機(jī)模擬 10000 次后得到的結(jié)果 這個(gè)問題由數(shù)學(xué)家Merrill M. Flood在1949首次提出,這個(gè)問題被他取名為“未婚妻問題”。這個(gè)問題的精妙之處在于,在微積分界叱咤風(fēng)云的自然底數(shù) e,竟也出人意料地出現(xiàn)在了這個(gè)看似與它毫不相關(guān)的問題中。不知道此問題發(fā)表后,Geek男女間會(huì)不會(huì)多了一種分手的理由:不好意思,你是那37%的人??
如何求出最優(yōu)的 k 值? 大數(shù)學(xué)家歐拉對(duì)一個(gè)神秘的數(shù)學(xué)常數(shù)e ≈ 2.718深有研究,這個(gè)數(shù)字和“拒人問題”竟然有著直接的聯(lián)系。 對(duì)于某個(gè)固定的 k,如果最適合的人出現(xiàn)在了第 i 個(gè)位置(k < i ≤ n),要想讓他有幸正好被 MM 選中,就必須得滿足前 i-1 個(gè)人中的最好的人在前 k 個(gè)人里,這有 k/(i-1) 的可能??紤]所有可能的 i,我們便得到了試探前 k 個(gè)男生之后能選中最佳男生的總概率 P(k): 也就是說,如果你預(yù)計(jì)求愛者有n個(gè)人,你應(yīng)該先拒絕掉前n/e個(gè)人,靜候下一個(gè)比這些人都好的人。假設(shè)你一共會(huì)遇到大概30個(gè)求愛者,就應(yīng)該拒絕掉前30/e ≈ 30/2.718≈ 1個(gè)求愛者,然后從第 12 個(gè)求愛者開始,一旦發(fā)現(xiàn)比前面11個(gè)求愛者都好的人,就果斷接受他。由于 1/e 大約等于 37%,因此這條愛情大法也叫做 37%法則。 不過,37% 法則有一個(gè)小問題:如果最佳人選本來就在這 37% 的人里面,錯(cuò)過這37% 的人之后,她就再也碰不上更好的了。但在游戲過程中,她并不知道最佳人選已經(jīng)被拒,因此她會(huì)一直癡癡地等待。也就是說,MM 將會(huì)有37%的概率“失敗退場(chǎng)”,或者以被迫選擇最后一名求愛者的結(jié)局而告終。 (本文精選自:36大數(shù)據(jù)) |
|