漲知識(shí) 享生活 考慮一個(gè)往返行程案例:上海到青島距離750km,從青島開(kāi)車(chē)到上海,順暢不堵車(chē),速度100km/h;然后從上海返回青島時(shí),因?yàn)槎萝?chē),速度為20km/h。那么往返行程的平均速度是多少? 圖1 往返行程示例 是將往返速度分別相加后除以2嗎?也就是100km/h加上20km/h后除以2,平均速度是60km/h嗎? 我們換一種計(jì)算方式來(lái)看看: 可以發(fā)現(xiàn),后者計(jì)算出來(lái)的33km/h平均速度比之前的60km/h要低不少。 根本原因在于平均速度是一個(gè)比值,分子和分母都是獨(dú)立變量(分子是行程距離,而分母是時(shí)間)。后面的計(jì)算方式將這兩個(gè)獨(dú)立變量分開(kāi),分別相加(分子是總行程,分母是總時(shí)間),然后再相除形成一個(gè)比值,這樣計(jì)算出來(lái)的平均值才是正確的。 其實(shí),沒(méi)有一種數(shù)學(xué)運(yùn)算叫做“平均”,我們通常所說(shuō)的平均值是“算術(shù)平均值”,即上述第一種運(yùn)算方式(60km/h)。之所以稱為“平均值”,是因?yàn)槲覀兿M?“平均”的定義:“一般水平”或“中間值”。更專(zhuān)業(yè)地說(shuō),“平均值”也就是“中心趨勢(shì)”(Central Tendency)或“位置度量”(Measures of Location)。 在數(shù)學(xué)上,計(jì)算平均值的經(jīng)典方法有三個(gè),分別是:算數(shù)平均值(AM-Arithmetic Mean),幾何平均值(GM-Geometric Mean)和調(diào)和平均值(HM-Harmonic Mean)。他們也被稱為是畢達(dá)哥拉斯平均值(Pythagorean means)(畢達(dá)哥拉斯和后世希臘數(shù)學(xué)家研究了三者的比例關(guān)系,而以此命名)。 為了了解它們的基本功能,讓我們從熟悉的算術(shù)平均值開(kāi)始。 算術(shù)平均值 通過(guò)將數(shù)據(jù)集中的所有數(shù)值相加,然后除以數(shù)據(jù)集中數(shù)值的個(gè)數(shù)就可以得到算術(shù)平均值。 之所以要除以數(shù)值的個(gè)數(shù),也是為了將數(shù)值相加的總和降低到和原始數(shù)據(jù)集數(shù)值維度相同的水平。 比如:1,4,10 三個(gè)數(shù)字 算術(shù)平均值=(1+4+30)÷3=5 當(dāng)數(shù)據(jù)之間存在加法關(guān)系時(shí),算術(shù)平均值可以很好地生成數(shù)據(jù)集的“平均”數(shù)。這種關(guān)系通常被稱為“線性”,因?yàn)楫?dāng)以升序或降序繪圖時(shí),數(shù)字往往落在一條直線上或附近。下圖就是一個(gè)簡(jiǎn)單的線性案例,數(shù)據(jù)集中每個(gè)數(shù)字都是通過(guò)在前一個(gè)數(shù)字上加3而產(chǎn)生:1,4,7,10,13,16,19… 這時(shí)候用算術(shù)平均值方法計(jì)算出的值(1+4+7+10+13+16+19)÷7=10,恰好是一個(gè)合理的中間值。 但并非所有數(shù)據(jù)集都能用這種關(guān)系來(lái)描述。有些數(shù)據(jù)集是乘法或指數(shù)關(guān)系,例如,如果我們將每個(gè)連續(xù)數(shù)字乘以3的話:1,3,9,27,81,243,729… 這時(shí)候用算術(shù)平均值方法計(jì)算出的值156.1就不能很好地代表平均值,實(shí)際上,它是中位數(shù)(中間數(shù))也就是27的5倍多。 那應(yīng)該如何計(jì)算平均值呢? 接下來(lái)就和大家介紹一種新的方法: 幾何平均值 由于數(shù)值是倍數(shù)/乘數(shù)關(guān)系,為了求平均值,需要將所有的數(shù)字相乘而不是相加。然后,為了將乘積重新縮放到原始數(shù)據(jù)集維度范圍,我們必須再取根,而不是簡(jiǎn)單地相除。 所以,上述數(shù)據(jù)集1,3,9,27,81,243,729…的幾何平均數(shù)= 在這種情況下,我們的幾何平均值與數(shù)據(jù)集的中間值完全重合! 注意:幾何平均值并不總是等于中值,只有在所有數(shù)字之間存在完全一致的乘法關(guān)系的情況下(例如,將之前的每個(gè)數(shù)字乘以3)。真實(shí)世界的數(shù)據(jù)集很少包含這樣的精確關(guān)系,但對(duì)于那些近似這種乘法關(guān)系的數(shù)據(jù)集,幾何平均值將給出比算術(shù)平均值更接近的“中間數(shù)”。 幾何平均值的實(shí)際應(yīng)用 事實(shí)證明,幾何平均值有許多實(shí)際用途,因?yàn)樵诂F(xiàn)實(shí)世界中存在大量乘法關(guān)系。比如: 金融中的利息計(jì)算(包含復(fù)利) 假設(shè)我們有100000元,在5年內(nèi)每年產(chǎn)生不同的利率: 年利率:1%、9%、6%、2%、15% 第1年:100000+(100000*.01)=101000元 第2年:101000*1.09=110090元 第3年:110090*1.06=116695.40元 第4年:116695.40*1.02=119029.31元 第5年:119029.31*1.15=136883.70元 如果用算術(shù)平均值計(jì)算:平均年利率=(1%+9%+6%+2%+15%)÷5=6.6% 用平均年利率來(lái)計(jì)算總收益(包含復(fù)利)= 100000+100000*(1.066?)=137653.11 算術(shù)平均值將我們的實(shí)際收入高估了近1000元。這里我們犯了一個(gè)常見(jiàn)的錯(cuò)誤:我們對(duì)乘法過(guò)程應(yīng)用了加法運(yùn)算,結(jié)果就不會(huì)準(zhǔn)確。 現(xiàn)在我們?cè)僭囋噹缀纹骄担?/p> 年利率平均值= 將利率的幾何平均值代入復(fù)利公式: 賺取的總利息=100000元*(1.0648? - 1) = 36883.70 利息+本金=36883.70元+100000元=136883.70元 最終總額=136883.70元,與第一步計(jì)算的結(jié)果完全相同! 注解:我們必須在幾何平均值計(jì)算中使用(1+年利率)作為輸入,是因?yàn)閷?shí)際情況下,(1+年利率)才是乘法算子:本金乘以(1+年利率)來(lái)計(jì)算每個(gè)時(shí)期的金額。這樣做還有一個(gè)額外好處,即使存在負(fù)利率和0利率,也可以避免無(wú)法計(jì)算的情況。 更進(jìn)一步說(shuō),在計(jì)算類(lèi)似利率這種百分比數(shù)值的幾何平均數(shù)時(shí),一般需要將百分比轉(zhuǎn)換為十進(jìn)制乘數(shù)。如果數(shù)據(jù)集以百分比的形式增加或減少,請(qǐng)避免在幾何平均值中直接使用百分比值,因?yàn)樗鼤?huì)扭曲最終結(jié)果。 如果百分比是增加的,一般加上1。如果百分比減少,則從1中減去百分比(也可以認(rèn)為是1+負(fù)百分比)。 比如:一個(gè)數(shù)據(jù)值先增加10%,然后下降3%。 10%轉(zhuǎn)換為:1+10%=1+0.1=1.1 5%轉(zhuǎn)換為:1-3%=1+(-3%)=1-0.03=0.97 幾何平均值= 最后,將1.03減去1,將數(shù)值轉(zhuǎn)換回百分比,得出總值增加3%。 另外,幾何平均值的一大特點(diǎn)是:可以在完全不同的尺度上對(duì)數(shù)字進(jìn)行平均。 比如:我們想比較使用兩個(gè)不同評(píng)價(jià)標(biāo)準(zhǔn)的兩家咖啡店的在線評(píng)分。其中一種使用5分制來(lái)評(píng)價(jià),而另一種則使用100分制。 咖啡店A 評(píng)級(jí)1:4.5 評(píng)級(jí)2:68 咖啡店B 評(píng)級(jí)1:3 評(píng)級(jí)2:75 如果我們天真地計(jì)算每個(gè)咖啡店的原始評(píng)分的算術(shù)平均值: 咖啡店A=(4.5+68)÷2=36.25 咖啡店B=(3+75)÷2=39 我們的結(jié)論是咖啡店B是贏家。 其實(shí),在用算術(shù)平均值求平均值之前,必須要將數(shù)值歸一化到相同的尺度上,才能得到準(zhǔn)確的結(jié)果。因此,我們將評(píng)級(jí)1乘以20,將其從5分制提升到100分制的標(biāo)準(zhǔn): 咖啡店A 4.5 * 20 = 90 (90 + 68) ÷ 2 = 79 咖啡店B 3 * 20 = 60 (60 + 75) ÷ 2 = 67.5 因此,我們發(fā)現(xiàn)咖啡店A才是真正贏家,與上述算術(shù)平均值結(jié)論完全相反。 然而,幾何平均值允許我們得出相同的結(jié)論,而不必?fù)?dān)心尺度或度量單位: 咖啡店A=(4.5*68)的平方根=17.5 咖啡店B=(3*75)的平方根=15 通過(guò)上述例子可以發(fā)現(xiàn):算術(shù)平均值由更大范圍的數(shù)字主導(dǎo),這使我們認(rèn)為咖啡店B是評(píng)級(jí)較高的商店。這是因?yàn)樗阈g(shù)平均值是數(shù)字之間的加法關(guān)系,而不考慮比例和尺度。因此,在應(yīng)用算術(shù)平均值之前,需要將數(shù)字放在相同的尺度上。 另一方面,由于幾何平均值的乘法性質(zhì),它可以輕松地處理不同的比例關(guān)系。這是一個(gè)非常有用的特性,但同時(shí)我們丟失了尺度標(biāo)準(zhǔn)。在這種情況下,幾何平均值實(shí)際上是無(wú)單位的。 也就是說(shuō),上面的幾何平均值不是100分制中的17.5,也不是5分制中的15。它們只是無(wú)單位的數(shù)字,彼此成相對(duì)比例。(從技術(shù)上講,它們的尺度是原始尺度5和100的幾何平均值,即22.361)。 與生活中的大多數(shù)事情一樣,應(yīng)用幾何平均值幾乎沒(méi)有鐵板釘釘?shù)囊?guī)則(除了復(fù)利和類(lèi)似的事情)。雖然有一些經(jīng)驗(yàn)法則,但最終還是需要科學(xué)判斷。 現(xiàn)在讓我們來(lái)介紹一下我們最后一種畢達(dá)哥拉斯平均值: 調(diào)和平均值 算術(shù)平均值需要加法,幾何平均值使用乘法,而調(diào)和平均值使用倒數(shù)。調(diào)和平均值可以用文字描述為:數(shù)據(jù)集倒數(shù)的算術(shù)平均值的倒數(shù)。聽(tīng)起來(lái)確實(shí)有些拗口,但實(shí)際上只是幾個(gè)簡(jiǎn)單的步驟: 1. 取數(shù)據(jù)集中所有數(shù)字的倒數(shù) 2. 找出這些倒數(shù)的算術(shù)平均值 3. 取這個(gè)數(shù)的倒數(shù) 為什么要取倒數(shù),這樣做有什么好處呢? 調(diào)和平均值的實(shí)際應(yīng)用 要回答這個(gè)問(wèn)題,我們必須先了解:倒數(shù)有什么好處? 由于倒數(shù)和所有除法一樣,只是變相的乘法(而乘法本質(zhì)上只是變相的加法),倒數(shù)可以幫助我們更容易地除以分?jǐn)?shù)。例如,5÷3/7是多少?只需要將5乘以7/3(3/7的倒數(shù))就可以解決這個(gè)問(wèn)題: 5 ÷ 3/7 = 5/1 * 7/3 = 35/3 = 11 2/3 = 11.66667 但一種等效的方法是將數(shù)字5和3/7換算成一個(gè)公分母,然后按正常方式進(jìn)行除法: 5/1 ÷ 3/7 = 35/7 ÷ 3/7 = 35 ÷ 3 = 11 2/3 = 11.66667 同樣,類(lèi)似于使用幾何平均值作為乘法或非線性關(guān)系下的計(jì)算平均值方法(見(jiàn)上文),調(diào)和平均值幫助我們找到分?jǐn)?shù)之間的乘法/除數(shù)關(guān)系,而不必?fù)?dān)心公共分母。 因此,調(diào)和平均值自然適應(yīng)幾何平均值上的另一層乘法/除法。因此,在處理不同長(zhǎng)度或時(shí)期的利率或比率(即分?jǐn)?shù))數(shù)據(jù)集時(shí),它很有用。 就像文章開(kāi)頭所提的行程往返問(wèn)題,就可以用調(diào)和平均值來(lái)計(jì)算。 比如:從青島到上海速度的倒數(shù)是1/100,上海到青島速度的倒數(shù)是1/20,倒數(shù)的算術(shù)平均值是 , 則調(diào)和平均值200/6=33km/h,和第二種方法計(jì)算結(jié)果一模一樣! 另外,加權(quán)調(diào)和平均值是計(jì)算平均倍數(shù)的首選方法,如市盈率(P/E)。如果使用加權(quán)算術(shù)平均值對(duì)這些比率進(jìn)行平均,則高數(shù)據(jù)點(diǎn)的權(quán)重大于低數(shù)據(jù)點(diǎn)。另一方面,加權(quán)調(diào)和平均值正確地對(duì)每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行加權(quán)。簡(jiǎn)單的加權(quán)算術(shù)平均值向上偏移,無(wú)法在數(shù)字上證明其合理性,因?yàn)樗诰馐找?;正如?chē)輛速度不能在往返行程中平均一樣(見(jiàn)上文)。 例如,考慮兩家公司,一家公司的市值為1500億美元,收益為50億美元(市盈率為30),另一家公司市值為10億美元,利潤(rùn)為100萬(wàn)美元(市盈度為1000)??紤]一個(gè)由這兩種股票組成的指數(shù),30%投資于第一種股票,70%投資于第二種股票。我們想計(jì)算這個(gè)指數(shù)的市盈率。 使用加權(quán)算術(shù)平均值 (錯(cuò)誤示例): P/E=0.3*30+0.7*1000=709 使用加權(quán)調(diào)和平均值(正確示例): P/E= 因此,只有使用加權(quán)調(diào)和平均值才能找到該指數(shù)93.46的正確市盈率P/E,而加權(quán)算術(shù)平均值將顯著高估它。 三種均值符合嚴(yán)格的大小關(guān)系 由于它們各自的方程式:調(diào)和平均值總是小于幾何平均值,幾何平均值總是大于算術(shù)平均值。 當(dāng)數(shù)據(jù)集中的所有數(shù)字都是相同的精確數(shù)字時(shí),在這種情況下,所有3個(gè)均值都是相同的。因此,以下不等式成立: 調(diào)和平均值≤幾何平均值≤算術(shù)平均值 認(rèn)識(shí)到這種關(guān)系有助于理解何時(shí)應(yīng)用每種方法,以及對(duì)結(jié)果的影響。 為了更形象展示這種關(guān)系,讓我們看看上文提及的數(shù)據(jù)集中三種不同平均值的位置關(guān)系: 點(diǎn)贊 / 分享 / 在看,都是我們繼續(xù)進(jìn)步的動(dòng)力 |
|
來(lái)自: 咚寶魚(yú) > 《待分類(lèi)》