什么是冪律分布? 用數(shù)學(xué)表達(dá)就是“節(jié)點(diǎn)具有的連接數(shù)和節(jié)點(diǎn)數(shù)的乘積是一個定值”。簡單說,在一個系統(tǒng)里,如果擁有1萬元的人有10個,那么擁有1000元的人就有100個,而有10塊錢的人就有1萬個。這種分布現(xiàn)象就是冪律分布。 冪律分布的兩個特征:1、高度的不平均。 2、無標(biāo)度(分形) 說冪律分布,你可能不太了解,但你肯定聽過一個詞,叫“二八法則”。比如全社會80%的財(cái)富集中在20%的人手里,一個行業(yè)80%的市場被20%的頭部公司占據(jù),一家公司80%的生意來自20%的重點(diǎn)客戶……二八法則,其實(shí)就是冪律分布最直觀的表現(xiàn)。這也是冪律分布特征之一,高度的不平均。 圖里橫坐標(biāo),代表隨機(jī)變量的取值;縱坐標(biāo),代表發(fā)生的概率。而冪律分布就是一條向下的曲線,拖著一個長長的尾巴。它的含義也非常明確——在隨機(jī)變量中,越小的數(shù)值,出現(xiàn)的概率越大;越大的數(shù)值,出現(xiàn)的概率則越小。 雖然冪律分布無處不在,但它的數(shù)學(xué)特征只有一個,就是無標(biāo)度,也叫“無尺度”“尺度無關(guān)”。不管怎么叫,意思是一致的——在任何觀測尺度下,冪律分布都呈現(xiàn)同樣的分布特征。 一般的分布都會有個尺度范圍,在這個范圍內(nèi)服從這個分布,超過這個尺度可能就不服從這種分布了。而冪律分布沒有尺度的限制,不管截取任何一個部分,都仍然呈現(xiàn)冪律分布的特征。 比如,圖書銷量是服從冪律分布的,最暢銷那本書的銷量在前10名銷量中占的比例,和前10名的銷量在前100名的銷量中占的比例,和前100名在前1000名的總銷量中占的比例,大體都是相同的。 這就是冪律分布的數(shù)學(xué)特征——無標(biāo)度。符合冪律分布的網(wǎng)絡(luò),又被稱為“無標(biāo)度網(wǎng)絡(luò)”。如果你懂”分形“的話,分形的結(jié)構(gòu)自相似性符合冪律分布。 世界是不公平的冪律分布和正態(tài)分布,給我們展示了兩個不同的世界。在正態(tài)分布的社會里,中等收入階層占絕大多數(shù),低收入和高收入階層只占極少數(shù)。這種分布,被認(rèn)為是非常理想的社會結(jié)構(gòu),對聰明勤奮的人有激勵,讓弱者的落差感沒那么大。但是真實(shí)世界的趨勢,是越來越像冪律分布。第一個為冪律分布命名的是經(jīng)濟(jì)學(xué)家帕累托。他發(fā)現(xiàn),在19世紀(jì)的意大利,極少數(shù)的富人賺走了絕大部分的錢,大部分家庭的收入都很低。他的這一發(fā)現(xiàn)被后人稱為“帕累托法則”,也叫“二八定律” 用《新約·馬太福音》里的話就是:“凡有的,還要加倍給他叫他多余;沒有的,連他所有的也要奪過來。”用現(xiàn)在的話來說,就是“窮者越窮、富者越富”。 為什么會產(chǎn)生冪律分布? 冪律分布之所以產(chǎn)生,是網(wǎng)絡(luò)中的相互影響和正反饋的結(jié)果。因?yàn)檫@些分布里頭的個體并不是獨(dú)立的,而是相互聯(lián)系的。如果一個分布中的個體相互獨(dú)立,那么這樣子的分布就會傾向于比較溫和,比如身高、體重、智商,這些現(xiàn)象,人和人之間是互不影響、彼此獨(dú)立的。它們不是網(wǎng)絡(luò)現(xiàn)象,所以,它們服從的是正態(tài)分布。 但是,財(cái)富、人脈、聲望,還有人口和點(diǎn)擊量,它們都是網(wǎng)絡(luò)現(xiàn)象。一個人有多少錢、有多少人脈、有多少關(guān)注度,是在跟別人的互動中形成的。你必須把這些現(xiàn)象放到網(wǎng)絡(luò)之中,才能理解它為什么是這樣。 那么,網(wǎng)絡(luò)為什么會呈現(xiàn)冪律分布呢? 這跟網(wǎng)絡(luò)的生長機(jī)制有關(guān)。物理學(xué)家巴拉巴西(Barabási Albert-László)認(rèn)為,網(wǎng)絡(luò)生長的方式不是隨機(jī)發(fā)生的,而是優(yōu)先連接。當(dāng)新的節(jié)點(diǎn)加入網(wǎng)絡(luò),或者網(wǎng)絡(luò)中有新的連接產(chǎn)生時,連接度高的節(jié)點(diǎn)會比連接度低的節(jié)點(diǎn)更有可能得到新連接,這就是所謂的優(yōu)先連接。 在社交網(wǎng)絡(luò)中,一個人的朋友越多,就越有可能認(rèn)識新朋友。 在互聯(lián)網(wǎng)上,一個短視頻的點(diǎn)擊量越高,就越容易被更多的人看到。 在學(xué)術(shù)界,一篇論文被引用的數(shù)量越多,就越有可能被其他的論文引用。 正是在優(yōu)先連接這一機(jī)制的作用下,網(wǎng)絡(luò)才出現(xiàn)了冪律分布的結(jié)果。冪律分布的出現(xiàn),預(yù)示著一個系統(tǒng)從無序到有序的過程,從隨機(jī)網(wǎng)絡(luò)發(fā)展到無標(biāo)度網(wǎng)絡(luò)的過程。冪律分布的結(jié)果,是少數(shù)的節(jié)點(diǎn)能夠施加影響,重新組織整個系統(tǒng)。以航空網(wǎng)為例,倫敦、芝加哥、法蘭克福、阿姆斯特丹的機(jī)場都非常地大,有通往全國各地、全世界各地的航班,它們是全球航線網(wǎng)絡(luò)中的超級節(jié)點(diǎn)。但是與此同時,還有大量的小機(jī)場,他們是地方性的,只維持了幾條航線。航空公司通過小機(jī)場覆蓋盡可能多的乘客,又通過大機(jī)場這樣的超級節(jié)點(diǎn),最大程度地減少了轉(zhuǎn)機(jī)的次數(shù)。所以,航空網(wǎng)的效率,來自于他們主動運(yùn)用了冪律分布 冪律分布是個無法預(yù)測的魔鬼 冪律分布魔鬼的一面,主要體現(xiàn)在三個方面。 第一,冪律分布讓平均數(shù)失去意義。 正態(tài)分布是一種均勻?qū)ΨQ分布,大多數(shù)數(shù)據(jù)都集中在平均值附近,所以平均值非常有用,因?yàn)樗泶蠖鄶?shù)。而冪律分布呢?它的數(shù)據(jù)變化幅度非常大,平均值毫無意義。拿個人收入來說,有一貧如洗的窮人,也有揮金如土的富豪,把這兩群人的資產(chǎn)平均,完全沒有意義。 小布什總統(tǒng)就曾在競選演說中玩過這個把戲。他說,2003年的減稅計(jì)劃讓每個美國家庭平均少納稅1586美元。從數(shù)字上看,這句話沒有撒謊,但它有很強(qiáng)的誤導(dǎo)性。 因?yàn)樨?cái)富服從冪律分布,是高度不對稱的。大部分普通家庭收入不高,減稅的額度很有限;但小部分收入極高的家庭,可能會獲得幾萬甚至幾十萬的減稅額度,一下就把平均數(shù)拉高了。事實(shí)上,當(dāng)年減稅的中位數(shù)是650美元。也就是說,有一半的家庭連650美元都沒達(dá)到,更別提1500多美元了。 這就是冪律分布,隨機(jī)變量波動的范圍非常大,常用的平均值、標(biāo)準(zhǔn)差到這里都沒用了。如果說正態(tài)分布是概率分布的神,構(gòu)建了一個穩(wěn)定的秩序;冪律分布就是一個喜怒無常的魔鬼,讓已有的秩序和工具全部失效,使一切變得難以捉摸。 第二,冪律分布讓原本不會發(fā)生的極端事件發(fā)生。 在數(shù)學(xué)上,這個叫“長尾”,也叫肥尾、厚尾。簡單說就是,雖然極端數(shù)據(jù)出現(xiàn)的概率很低,但這個概率永遠(yuǎn)不會趨近于0,永遠(yuǎn)不會小到可以忽略不計(jì)。 這也和正態(tài)分布不同。在正態(tài)分布里,數(shù)據(jù)非常集中,非常極端的數(shù)據(jù)幾乎不可能出現(xiàn),可以直接忽略不不計(jì)。而在冪律分布里,再極端的數(shù)據(jù)都有出現(xiàn)的可能。 我可以用生命打賭,你在街上不可能看到身高超過5米的巨人。但一個城市的人口超過3000萬,一本好書在暢銷榜上盤踞30年,一個人的資產(chǎn)超過3000億,這些事情雖然可能性很小,但仍然隨時可能發(fā)生。就像超大規(guī)模的自然災(zāi)害,雖然發(fā)生概率極低,但我們知道它一定會發(fā)生。 而在冪律分布里,極端數(shù)據(jù)往往意味著極端事件。而極端事件,比如超大型海嘯、超強(qiáng)大地震、席卷全球的金融風(fēng)暴等,都會給人帶來非常大的損失。 正態(tài)分布構(gòu)建的世界非常穩(wěn)定,只需要考慮常規(guī)、考慮大多數(shù)就可以。但是冪律分布仿佛擁有一種神奇的魔力,讓不可能發(fā)生的事情變得可能。它全然不顧人們的預(yù)測,也不理會常規(guī),而是悄悄躲在陰暗的角落,不經(jīng)意間給人類致命一擊。你說,它是不是個魔鬼? 第三,冪律分布完全不可預(yù)測。 聽完前兩點(diǎn),你可能會說:雖然冪律分布很可怕,但我們還是可以對它進(jìn)行科學(xué)研究,然后攻克它??? 沒錯,科學(xué)家們確實(shí)一直致力于冪律分布的研究。但告訴你一個悲傷的結(jié)論,到目前為止,冪律分布還完全無法預(yù)測。即便是在簡單的模型里,我們也完全無法做出任何有效的預(yù)測。 比如著名的“沙堆模型”,在平臺上不斷添加沙粒,慢慢形成一個沙堆。隨著沙堆高度的增加,新添加的沙粒會帶動沙堆表面其他沙粒滾落,產(chǎn)生所謂的“沙崩”。統(tǒng)計(jì)沙崩的規(guī)模和發(fā)生的頻率,科學(xué)家發(fā)現(xiàn)它服從冪律分布。 這是一個極其簡單的模型實(shí)驗(yàn)。所有物理知識我們都掌握,而且能用計(jì)算機(jī)跟蹤每一粒沙子的位置,但仍然找不到沙堆崩塌的原因。我們既不知道在什么條件下,再放一粒沙子就會導(dǎo)致沙崩,也無法預(yù)測這粒沙子導(dǎo)致的沙崩規(guī)模會有多大。所以到目前,我們對于冪律分布,比如說各種自然災(zāi)害,基本還是束手無策。 你可能會說,不是有“二八法則”嗎?我們抓重點(diǎn),抓住重要的20%不就好了嗎?可能很多人都會這么告訴你,但我想說的是——這是個存量思維,可以總結(jié)過去,卻對未來沒有用。因?yàn)殡m然我們知道80%的生意來自于20%的客戶,但永遠(yuǎn)不知道下一個客戶是屬于重要的20%,還是不重要的80%。還是那句話,冪律分布不可預(yù)測。 我們知道大災(zāi)難影響很大,而且一定會來,卻不知道下一場大地震、下一場森林大火、下一場戰(zhàn)爭、下一次金融危機(jī)會什么時候發(fā)生,以及會帶來多大的損失。我們知道公司市值、電影票房、社會財(cái)富的分布極不均勻,卻尋找不到方法規(guī)避風(fēng)險。這真是讓人絕望。 雖然冪律分布是中性的,沒有好壞之分,但是站在人類的角度上來說,在一次次的自然災(zāi)害面前,我們還是會不由自主的產(chǎn)生一種念頭——冪律分布就是個徹徹底底的魔鬼。 可怕的魔鬼帶來新希望 雖然冪律分布無法預(yù)測,但我們能不能找到它產(chǎn)生的原因呢?找到了產(chǎn)生的原因,不就能避開地震、火山爆發(fā)、海嘯等自然災(zāi)害了嗎? 道理是這樣,但現(xiàn)實(shí)可能又要讓你失望了。冪律分布產(chǎn)生的原因,目前沒有統(tǒng)一的答案。各種解釋眾說紛紜,誰也說服不了誰。 其中一個比較主流,是1982年諾貝爾物理學(xué)獎得主肯尼斯·威爾遜的觀點(diǎn)。因?yàn)檫@個研究給人類對抗熵增,對抗世界的宿命,提供了新的希望。 威爾遜的研究突破,源于水變成冰這個常見的生活現(xiàn)象。他發(fā)現(xiàn),在水變成冰的過程中,存在一個神奇的臨界溫度——在臨界溫度之前,水分子里原子的自旋都是隨機(jī)指向不同的方向;可一旦到了臨界溫度,就會非常有序地指向同一個方向。 這是個神奇的事情,為什么在那一瞬間突然就從混亂變成了有序呢? 威爾遜收集了很多臨界態(tài)一瞬間的關(guān)鍵數(shù)據(jù),結(jié)果發(fā)現(xiàn),每個指標(biāo)都在臨界態(tài)附近涌現(xiàn)出了冪律分布。換句話說,在水變成冰,也就是從無序到有序的臨界狀態(tài)上,所有指標(biāo)都呈現(xiàn)出冪律分布的現(xiàn)象。而我們知道,無序是熵值最大,有序是熵值最小,所以這也就說明,在從無序到有序這個熵減的過程中,冪律分布必然發(fā)生。 為什么說這個結(jié)論給人帶來希望呢? 你想,如果這個理論是冪律分布產(chǎn)生的原因,那冪律分布就是我們對抗熵增的必經(jīng)狀態(tài)。只要一個生命還存在,一個系統(tǒng)還在演化,它就必然在做熵減的工作,所以出現(xiàn)冪律分布也就不足為奇。這也正好解釋了正態(tài)分布和冪律分布在生活里都很常見,秒殺其他分布的原因。 所以你看,雖然冪律分布像魔鬼一樣狡詐、難以預(yù)料,但它可能是我們對抗熵增的必然選擇,是每個系統(tǒng)從無序到有序,從混沌到清晰,從未知世界到規(guī)律世界的必經(jīng)之路。冪律分布存在的地方,看似兇險,卻恰恰是對抗熵增,對抗死寂,對抗死亡的角斗場,是我們的希望之光。 冪律分布對我們的啟示 冪律無處不在,給我們的一個最重要的啟示是:社會和自然的大部分系統(tǒng)都有重點(diǎn),做事情一定要抓重點(diǎn),持續(xù)地抓住重點(diǎn),就抓住了最高效率的關(guān)鍵。 你若在一個三線城市的小公司的小部門工作,你的部門其實(shí)有重點(diǎn)的。每天的工作看上去都是同樣無聊,其實(shí)也許和某個領(lǐng)導(dǎo)某個時刻的溝通特別重要,會影響你一輩子,而其他工作可能做到80分就很好。 這種利用小的投入能撬動更大收益的工具,就是杠桿。冪律告訴我們,每個系統(tǒng)里都有杠桿點(diǎn),找到這個杠桿點(diǎn),能迅速放大一個人的努力,達(dá)到事半功倍的效果。 冪律分形,意味著剛才提到的系統(tǒng)的重點(diǎn)都能繼續(xù)再分,找到更微妙的重點(diǎn)。杠桿點(diǎn)上,還能繼續(xù)加杠桿。 以二八法則為例。大家只知道20%投入有80%的收益,其實(shí)進(jìn)一步想想,這20%里依然遵循二八法則,有20%的20%。同理再推進(jìn)一層,我們可以找到二八法則的三次方:找到20%的20%的20%,收獲80%的80%的80%。你的效率就是別人的64倍。 二八法則:20% —— 80% 二八法則二次方:4% —— 64% 二八法則三次方:0.8% —— 51.2% 當(dāng)然,最難的是在變化的世界里持續(xù)找到那核心的20%。這個最難,但也最有價值。一家公司從天使投資到B輪,天使投資人大概會以100倍收益退出,付的就是這個當(dāng)年發(fā)現(xiàn)20%的錢。 找到事物的核心杠桿點(diǎn)需要大量的觀察和思考,然后抵抗住各種誘惑,堅(jiān)定地持續(xù)專注這20%,這需要強(qiáng)大的定力。這是投資的思考方式,也是自我投資者——高手——最重要的戰(zhàn)略。 |
|