交易必讀|淺談貝葉斯分析

tony0726 2017-06-01

展開(kāi)全文

先談概率，概率大家都很熟悉。對(duì)于概率的解讀區(qū)別了頻率流派和貝葉斯流派。如果不理解主觀概率，也就無(wú)法理解貝葉斯定律的核心思想。

貝葉斯分析是整個(gè)機(jī)器學(xué)習(xí)的基礎(chǔ)框架。首先從貝葉斯統(tǒng)計(jì)說(shuō)起。

先談概率。概率大家都很熟悉。然而說(shuō)到定義卻不一定說(shuō)對(duì)，中學(xué)課本會(huì)說(shuō)，概率是一件事發(fā)生的頻率。

而貝葉斯框架下的概率理論卻給了另一個(gè)角度：概率是我們的主觀概念，表明我們對(duì)某個(gè)事物發(fā)生的相信程度。如Pierre Lapalace所說(shuō): Probability theory is nothing but common sense reduced to calculation. 這正是貝葉斯派的核心。它解決的是來(lái)自外部的信息與我們大腦內(nèi)信念的交互關(guān)系。

兩種對(duì)于概率的解讀區(qū)別了頻率流派和貝葉斯流派。如果不理解主觀概率，也就無(wú)法理解貝葉斯定律的核心思想。

貝葉斯學(xué)派與頻率學(xué)派有何不同？

簡(jiǎn)單地說(shuō)，頻率學(xué)派與貝葉斯學(xué)派探討「不確定性」這件事時(shí)的出發(fā)點(diǎn)與立足點(diǎn)不同。頻率學(xué)派從「自然」角度出發(fā)，試圖直接為「事件」本身建模，即事件A在獨(dú)立重復(fù)試驗(yàn)中發(fā)生的頻率趨于極限p，那么這個(gè)極限就是該事件的概率。舉例而言，想要計(jì)算拋擲一枚硬幣時(shí)正面朝上的概率，我們需要不斷地拋擲硬幣，當(dāng)拋擲次數(shù)趨向無(wú)窮時(shí)正面朝上的頻率即為正面朝上的概率。

然而，貝葉斯學(xué)派并不從試圖刻畫「事件」本身，而從「觀察者」角度出發(fā)。貝葉斯學(xué)派并不試圖說(shuō)「事件本身是隨機(jī)的」，或者「世界的本體帶有某種隨機(jī)性」，這套理論根本不言說(shuō)關(guān)于「世界本體」的東西，而只是從「觀察者知識(shí)不完備」這一出發(fā)點(diǎn)開(kāi)始，構(gòu)造一套在貝葉斯概率論的框架下可以對(duì)不確定知識(shí)做出推斷的方法。頻率學(xué)派下說(shuō)的「隨機(jī)事件」在貝葉斯學(xué)派看來(lái)，并不是「事件本身具有某種客觀的隨機(jī)性」，而是「觀察者不知道事件的結(jié)果」而已，只是「觀察者」知識(shí)狀態(tài)中尚未包含這一事件的結(jié)果。但是在這種情況下，觀察者又試圖通過(guò)已經(jīng)觀察到的「證據(jù)」來(lái)推斷這一事件的結(jié)果，因此只能靠猜。貝葉斯概率論就想構(gòu)建一套比較完備的框架用來(lái)描述最能服務(wù)于理性推斷這一目的的「猜的過(guò)程」。因此，在貝葉斯框架下，同一件事情對(duì)于知情者而言就是「確定事件」，對(duì)于不知情者而言就是「隨機(jī)事件」，隨機(jī)性并不源于事件本身是否發(fā)生，而只是描述觀察者對(duì)該事件的知識(shí)狀態(tài)。

總的來(lái)說(shuō)，貝葉斯概率論為人的知識(shí)（knowledge）建模來(lái)定義「概率」這個(gè)概念。頻率學(xué)派試圖描述的是「事物本體」，而貝葉斯學(xué)派試圖描述的是觀察者知識(shí)狀態(tài)在新的觀測(cè)發(fā)生后如何更新。為了描述這種更新過(guò)程，貝葉斯概率論假設(shè)觀察者對(duì)某事件處于某個(gè)知識(shí)狀態(tài)中（例如：小明先驗(yàn)地相信一枚硬幣是均勻的，可能是出于認(rèn)為均勻硬幣最常見(jiàn)這種信念），之后觀察者開(kāi)始新的觀測(cè)或?qū)嶒?yàn)（小明開(kāi)始不斷地拋硬幣，發(fā)現(xiàn)拋了100次后，居然只有20次是正面朝上）。經(jīng)過(guò)中間的獨(dú)立重復(fù)試驗(yàn)，觀察者獲得了一些新的觀測(cè)結(jié)果，這些新的觀測(cè)將以含有不確定性的邏輯推斷的方式影響觀察者原有的信念（小明開(kāi)始懷疑這枚硬幣究竟是不是均勻的，甚至開(kāi)始斷定硬幣并不均勻）。在這一過(guò)程中，觀察者無(wú)法用簡(jiǎn)單的邏輯來(lái)推斷，因?yàn)橛^察者并沒(méi)有完全的信息作為證據(jù)，因此只能采用似真推斷（plausible reasoning），對(duì)于各種各樣可能的結(jié)果賦予一個(gè)「合理性」（plausibility）。例子中，小明原先認(rèn)為硬幣的分布是均勻的，于是根據(jù)小明原有的信念，這個(gè)論斷合理性非常高；在觀察到100次拋擲中只有20次正面朝上后，小明開(kāi)始懷疑硬幣的均勻性，此時(shí)小明很可能認(rèn)為「硬幣不均勻」這一推斷的合理性很高，支持的證據(jù)就是他剛剛實(shí)驗(yàn)的觀測(cè)結(jié)果。

上面的例子用貝葉斯概率論的語(yǔ)言來(lái)描述，就是觀察者持有某個(gè)前置信念（prior
belief），通過(guò)觀測(cè)獲得統(tǒng)計(jì)證據(jù)（evidence），通過(guò)滿足一定條件的邏輯一致推斷得出的關(guān)于該陳述的「合理性」，從而得出后置信念（posterior belief）來(lái)最好的表征觀測(cè)后的知識(shí)狀態(tài)（state of knowledge）。這里，貝葉斯概率推斷所試圖解決的核心問(wèn)題就是如何構(gòu)建一個(gè)滿足一定條件的邏輯體系賦予特定論斷一個(gè)實(shí)數(shù)所表征的論斷合理性的度量（measure of plausibility），從而可以允許觀測(cè)者在不完全信息的狀態(tài)下進(jìn)行推斷。這里，觀察者對(duì)某變量的信念或知識(shí)狀態(tài)就是頻率學(xué)派所說(shuō)的「概率分布」，也就是說(shuō)，觀察者的知識(shí)狀態(tài)就是對(duì)被觀察變量取各種值所賦予的「合理性」的分布。

從這個(gè)意義上來(lái)講，貝葉斯概率論試圖構(gòu)建的是知識(shí)狀態(tài)的表征，而不是客觀世界的表征。因此，在機(jī)器學(xué)習(xí)、統(tǒng)計(jì)推斷中，許多情況下貝葉斯概率推斷更能解決觀察者推斷的問(wèn)題，而繞開(kāi)了關(guān)于事件本體的討論，因?yàn)闆](méi)有討論本體的必要性。

貝葉斯分析居然能解決家庭糾紛？

來(lái)看一個(gè)有趣的案例：假如你是女生，在你的老公包里發(fā)現(xiàn)了別的女人內(nèi)褲，那他出軌的概率是多少。
稍微熟悉這個(gè)問(wèn)題的人會(huì)知道，做這個(gè)題目你要先考察基率。你要把這個(gè)問(wèn)題分解為幾步考慮：

1．你老公在沒(méi)有任何事件情況下出軌的概率是多少？如果他是個(gè)天生老實(shí)的IT或者風(fēng)流倜儻的CEO，顯然不該一視同仁。
2．如你老公出軌了，那么藏一條內(nèi)褲的概率是多少；如果他沒(méi)出軌，出現(xiàn)這個(gè)情況概率有多少？想想一般人即使出軌也不會(huì)那么傻，會(huì)不會(huì)有沒(méi)出軌而出現(xiàn)內(nèi)褲的狀況？有沒(méi)有可能是某個(gè)暗戀你老公的人陷害？
3．根據(jù)1和2求解，這才是擁有大學(xué)數(shù)學(xué)能力的人該做的。

在這里1其實(shí)就是先驗(yàn)概率P（A），而2是條件概率P（B|A），最終得到3后驗(yàn)概率P（A|B）。這三種即是貝葉斯統(tǒng)計(jì)的三要素。基于條件概率的貝葉斯定律數(shù)學(xué)方程極為簡(jiǎn)單：

A即出軌， B是內(nèi)褲出現(xiàn)，你得到1，2，就可以根據(jù)公式算出，根據(jù)內(nèi)褲出現(xiàn)判斷出軌的概率。

先驗(yàn)概率在貝葉斯統(tǒng)計(jì)中有重要意義，首先先驗(yàn)概率即我們?cè)谌〉米C據(jù)之前所指定的概率P（A），這個(gè)值通常是根據(jù)我們之前的常識(shí)，帶有一定主觀色彩。就像剛剛說(shuō)的出軌的問(wèn)題，你的先驗(yàn)概率代表了你對(duì)丈夫的信心。

有一個(gè)非常有趣的現(xiàn)象是，如果我們的先驗(yàn)概率審定為1或0（即肯定或否定某事發(fā)生），那，無(wú)論如何增加證據(jù)，也依然得到同樣的條件概率（此時(shí)P（A）=0 或 1 ， P（A|B）= 0或1）。這告訴我們一個(gè)經(jīng)驗(yàn)：不要過(guò)早下論斷，否則預(yù)測(cè)也就無(wú)法進(jìn)化了。如果想讓認(rèn)知進(jìn)步，就要給各種假設(shè)留空間。

貝葉斯分析看辛普森案

貝葉斯分析的思路，對(duì)于由證據(jù)的積累來(lái)推測(cè)一個(gè)事物發(fā)生的概率具有重大作用。當(dāng)我們要預(yù)測(cè)一個(gè)事物，首先根據(jù)已有的經(jīng)驗(yàn)和知識(shí)推斷一個(gè)先驗(yàn)概率，然后在新證據(jù)不斷積累的情況下調(diào)整這個(gè)概率。整個(gè)通過(guò)積累證據(jù)來(lái)得到一個(gè)事件發(fā)生概率的過(guò)程，我們稱為貝葉斯分析。

貝葉斯分析中的三要素在不同的問(wèn)題中通常有側(cè)重點(diǎn) 。很多時(shí)候，都是忽略先驗(yàn)概率的作用，比如描述一個(gè)人很書呆子氣讓你判斷他是大學(xué)老師還是銷售員的經(jīng)典案例（要看先驗(yàn)大學(xué)老師還是銷售員哪個(gè)多?。?nbsp;

但有時(shí)，我們也不理解條件概率，比如著名的辛普森案。為證明辛普森有殺妻之罪，檢方說(shuō)辛普森之前家暴。辯護(hù)律師說(shuō)，美國(guó)有400萬(wàn)女性被丈夫或男友打過(guò)，其中只有1432人被殺，概率是2800分之一。

這其實(shí)是誤用了后驗(yàn)概率。這里的條件是“被殺”且“有家暴”，而要推測(cè)的事件是“兇手是男友”（事實(shí)上概率高達(dá)90%），這才是貝葉斯分析的正當(dāng)用法，而辯護(hù)律師卻完全混淆了條件與需要驗(yàn)證的假設(shè)。

理解貝葉斯分析最好的方法即圖像法。這里的A的面積即先驗(yàn)，后驗(yàn)是陰影占籃圈的百分比。

貝葉斯分析可以瞬間理解一些常用的理論，如幸存者偏差。你發(fā)現(xiàn)一些沒(méi)讀過(guò)書的人很有錢，事實(shí)上是你發(fā)現(xiàn)就已經(jīng)是幸存者了（對(duì)應(yīng)上圖中小紅圈），而死了的人（紅圈外的大部分面積）你都沒(méi)見(jiàn)到啊。

還有陰謀論——陰謀論的特點(diǎn)是條件很多很復(fù)雜，但是條件一旦成立，結(jié)論幾乎成立，你一旦考慮了先驗(yàn)，這些條件成立本身即很困難，陰謀論不攻自克。

圖上紅圈和籃圈的面積，很少我們?cè)陂_(kāi)始就知道，這才是應(yīng)用中的難點(diǎn)。

此處，貝葉斯分析的框架也在教我們?nèi)绾翁幚硖乩c一般常識(shí)的規(guī)律。

如果你太注重特例（即不看先驗(yàn)概率），很有可能會(huì)誤把噪聲看做信號(hào)。

如恪守先驗(yàn)概率，就成為無(wú)視變化而墨守成規(guī)的人。其實(shí)只有貝葉斯派的人生存率會(huì)更高，因?yàn)樗麄儠?huì)重視特例，但也不忘記書本的經(jīng)驗(yàn)，根據(jù)貝葉斯公式小心調(diào)整信心，甚至?xí)鲃?dòng)設(shè)計(jì)實(shí)驗(yàn)根據(jù)信號(hào)判斷假設(shè)，這就是我們下一步要講的。

貝葉斯決策判定男女

在剛剛講到的貝葉斯統(tǒng)計(jì)分析的基礎(chǔ)上，我們就可以引出一個(gè)更核心的概念， 貝葉斯決策。

貝葉斯決策主要包含四個(gè)部分：數(shù)據(jù)（D），假設(shè)（W），目標(biāo)（O），決策（S）。 此處數(shù)據(jù)即之前講到的證據(jù)。假設(shè)是我們要驗(yàn)證的事實(shí)，目標(biāo)是我們最終要取得優(yōu)化的量，決策時(shí)根據(jù)目標(biāo)得到的最后行為。與上一步貝葉斯分析增加的部分是目標(biāo)和決策。假設(shè)在問(wèn)題里如果是連續(xù)的往往以參數(shù)空間的形式表達(dá)。

然后我們可以按照如下步驟做：

1.理清因果鏈條，哪個(gè)是假設(shè)，哪個(gè)是證據(jù)；
2.給出所有可能假設(shè)，即假設(shè)空間；
3.給出先驗(yàn)概率；
4.根據(jù)貝葉斯概率公式求解后驗(yàn)概率，得到假設(shè)空間的后驗(yàn)概率分布；
5.利用后驗(yàn)概率求解條件期望，得到條件期望最大值對(duì)應(yīng)的行為。

貝葉斯決策如果一旦變成自動(dòng)化的計(jì)算機(jī)算法，它就是機(jī)器學(xué)習(xí)。我們就用貝葉斯決策詮釋一個(gè)最簡(jiǎn)單的機(jī)器學(xué)習(xí)分類算法—— 樸素貝葉斯
假設(shè)給你一個(gè)人的身高和體重，不知道他的男女性別，可以通過(guò)我上述給出的貝葉斯決策機(jī)制解決這個(gè)問(wèn)題：

首先，此處的證據(jù)是身高和體重，假設(shè)是男或女。先驗(yàn)概率是人口中的男女比例，而我們需要掌握的條件概率是男性和女性的身高和體重分布，這應(yīng)該是很好掌握的信息。

然后我們可以根據(jù)貝葉斯公式求解后驗(yàn)概率，而此處我們要做的決策時(shí)男女，目標(biāo)是分類錯(cuò)誤率最低，決策即性別分類。
此處我們用到一個(gè)基本假設(shè)就是證據(jù)是互相獨(dú)立的，使我們能夠求得更簡(jiǎn)單的公式：

（圖：樸素貝葉斯，核心在于假設(shè)證據(jù)互相獨(dú)立）

由此我們得到下列乘法公式（feature對(duì)應(yīng)x）

用數(shù)學(xué)語(yǔ)言白表征這個(gè)問(wèn)題， X特征向量，h把X映射成不同的分類，我們要求得是P（y|x）正確率最大的假設(shè)（y）。

擲硬幣的概率不是50%

事實(shí)上，貝葉斯決策很少只涉及A和B，而是內(nèi)部包含關(guān)鍵的隱變量（參數(shù)），涉及對(duì)所研究事物的一些基本預(yù)設(shè)。比如下面這個(gè)簡(jiǎn)單例子：

拋硬幣，一個(gè)硬幣被投擲10次，9次朝上，那么根據(jù)頻率學(xué)派的觀點(diǎn)，得到第11次投擲的概率不變?yōu)?.5 ，如果你回答了0.9，你經(jīng)常會(huì)被看成一個(gè)傻X。其實(shí)不然，天底下哪有一樣的硬幣呢？

那么問(wèn)題來(lái)了，設(shè)一個(gè)賭局，一次正面向上你可以受益100，反面懲罰150。基于剛才的事實(shí)，要不要賭？

可以套用貝葉斯決策的理論來(lái)分析。這里的一個(gè)重要的隱變量是每一次投擲硬幣的概率，這個(gè)數(shù)字按照經(jīng)典頻率學(xué)派認(rèn)定一定是0.5，而按照貝葉斯學(xué)派的觀點(diǎn)，需要把這個(gè)變量看成是未知的，具有一定先驗(yàn)概率，之后嚴(yán)格按照貝葉斯公式計(jì)算新加入證據(jù)對(duì)先驗(yàn)概率的影響。

此處的先驗(yàn)概率即你對(duì)硬幣向上0.5這件事的信念，你越相信這個(gè)事實(shí)，這個(gè)分布越尖，反之越寬廣。我們用希臘字母θ來(lái)表征這個(gè)概率。整個(gè)決策表述如下：

公式的含義是你要用求解已知9次朝上1次朝下的時(shí)候求解你下一次投擲硬幣的期望收益，并因此決策要不要賭。

中間要驗(yàn)證的假設(shè)空間，即每一次投擲為正的概率，我們依然以每次事件獨(dú)立和該概率不隨時(shí)間變化為基準(zhǔn)（如果不是問(wèn)題將無(wú)限復(fù)雜），那么證據(jù)將根據(jù)上述公式改變假設(shè)空間的概率分布，而最終的期望可以根據(jù)這個(gè)分布求出。決策即使得這個(gè)期望最大的解。

注意，此處先驗(yàn)十分重要，因?yàn)樗绊憶Q策結(jié)果。而這又是一個(gè)很主觀的東西，如對(duì)0.5有絕對(duì)信心，那么你的就會(huì)非常尖，這時(shí)你需要得到大量偏離0.5的證據(jù)才能逐步糾偏。

對(duì)書呆子，估計(jì)會(huì)傾向給出一個(gè)比較尖銳的先驗(yàn)分布，相信書里說(shuō)的0.5而不賭，而一些更加傾向于相信特例的人則會(huì)給出很平坦的先驗(yàn)而更大的概率去賭。最終后者發(fā)財(cái)和傾家蕩產(chǎn)的幾率都比較高，而前者比較容易旱澇保收。

當(dāng)然，在數(shù)據(jù)量超大，比如說(shuō)1000次有900次為正的情況下，我們幾乎不需要考慮先驗(yàn)，此時(shí)幾乎可以認(rèn)定投擲的概率就是0.9。

（圖：證據(jù)對(duì)信念發(fā)生作用的貝葉斯過(guò)程）

大腦是一個(gè)貝葉斯網(wǎng)絡(luò)？

如果貝葉斯決策中牽涉的證據(jù)更復(fù)雜呢？如證據(jù)間不獨(dú)立而是互為因果呢？這時(shí)候需要更強(qiáng)大的工具——貝葉斯網(wǎng)絡(luò)。

世事無(wú)一不處于復(fù)雜的聯(lián)系之中，而貝葉斯網(wǎng)絡(luò)正是刻畫這種關(guān)聯(lián)的數(shù)學(xué)表述。

構(gòu)建一個(gè)貝葉斯網(wǎng)絡(luò)的關(guān)鍵方法是圖模型，構(gòu)建一個(gè)圖模型我們需要把具有因果聯(lián)系的各個(gè)事件用箭頭連在一起。

下圖例子是個(gè)事件：草坪濕潤(rùn)了，那么推測(cè)此時(shí)天氣多云的概率，因?yàn)閷?dǎo)致草坪濕潤(rùn)的原因有下雨、或?yàn)⑺囋诠ぷ鳎?而這兩者又都和多云聯(lián)系，那么可以畫出如下圖形，按貝葉斯概率公式逐級(jí)推出每個(gè)事件的概率。

貝葉斯網(wǎng)絡(luò)的特性是，當(dāng)某點(diǎn)一個(gè)證據(jù)出現(xiàn)，整個(gè)網(wǎng)絡(luò)中事件概率都變化。所謂看到鏡中白發(fā)，就改變你對(duì)人生中所有重大事件概率的推斷。

說(shuō)大腦是一個(gè)貝葉斯網(wǎng)絡(luò)，這句話又對(duì)又不對(duì)。大腦學(xué)習(xí)的原理，是一個(gè)新的證據(jù)逐步和內(nèi)部信念耦合的過(guò)程，本質(zhì)即貝葉斯網(wǎng)絡(luò)。但大腦又是不完全的貝葉斯推斷機(jī)，每人都有一個(gè)頂層以三觀構(gòu)建，底層逐步深入關(guān)于具體問(wèn)題看法的貝葉斯網(wǎng)路；但是我們卻很少有能夠通過(guò)一個(gè)證據(jù)更新整個(gè)網(wǎng)絡(luò)的能力，或者是我們吸收新證據(jù)的速度也往往十分緩慢。這是為什么我們經(jīng)常具有自相矛盾的信念體系。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

交易必讀|淺談貝葉斯分析

貝葉斯學(xué)派與頻率學(xué)派有何不同？

貝葉斯學(xué)派與頻率學(xué)派有何不同？