前陣子,我的朋友老楊向我咨詢一個問題。由于2021年國際海運(yùn)的運(yùn)輸時(shí)間很不穩(wěn)定,他想要做一下分析,提供給總部作為參考,但不知該如何入手,所以想找我?guī)兔Α?/span> 老楊所在的A公司有幾家工廠分布在包郵區(qū),通過上海港出口到美國印第安納州的客戶B工廠,主要的運(yùn)輸模式是海運(yùn)加美國內(nèi)陸多式聯(lián)運(yùn)。貨柜抵達(dá)美國西海岸的洛杉磯或長灘港后,通過鐵路運(yùn)輸至芝加哥,用卡車完成最后的派送。 考慮到啟運(yùn)港都是上海港,老楊統(tǒng)計(jì)了從啟運(yùn)港開船到貨物送達(dá)客戶倉庫的全部日期,用這個數(shù)據(jù)來分析運(yùn)輸時(shí)間的情況。 A公司的幾家工廠出貨量并不均衡,有整柜,也有拼柜。有時(shí)出貨量介于兩者之間,老楊也想知道整柜和拼柜的時(shí)效性有多少差別。 老楊把2020年11月至2021年10月的實(shí)際運(yùn)輸時(shí)間提供給我,在經(jīng)過初步整理后,得出了有效數(shù)據(jù)共有127條,具體情況如下表。 一 數(shù)據(jù)分析 首先使用散點(diǎn)圖來看一下,X軸是每票貨物實(shí)際開船的日期,Y軸是從開船到B公司倉庫的總天數(shù),包括了海上運(yùn)輸、進(jìn)口清關(guān)和內(nèi)陸多式聯(lián)運(yùn)的時(shí)間。下面的分析都是依照這個統(tǒng)計(jì)方式。 初看之下,整體的運(yùn)輸天數(shù)在20至105天左右,主要集中在40-60天的區(qū)間段。當(dāng)然目視化的方法只能用于快速判斷,我們還要進(jìn)行下一步的統(tǒng)計(jì)分析。 我把數(shù)據(jù)排序了一下,發(fā)現(xiàn)最小值是21天,也就是從上海港至客戶倉庫最快的時(shí)間,這相當(dāng)厲害了。 但是最大值竟然也有106天,相當(dāng)于是3. 5個月。最大值和最小值的差距有85天。其中出現(xiàn)次數(shù)最多的天數(shù)有兩個值,也就是眾數(shù),分別是47天和67天,各有7次。 想要計(jì)算眾數(shù),可以使用Excel中的公式MODE.MULT(數(shù)值范圍),它會返回眾數(shù)的所有值,我們就不用一個個去數(shù)了。 想要知道運(yùn)輸大概率會需要多少天,用平均數(shù)是最簡單的方法,127條記錄的平均數(shù)是51天,此處已經(jīng)四舍五入,下同。 平均數(shù)用起來簡便,但我們也知道它有缺點(diǎn),比如上海市平均工資公布后,我總感覺是拖了后腿。因此我們要使用百分位數(shù)來分析,當(dāng)然平均數(shù)還是有用的,留在后面再講。 25百分位數(shù) | 39天 | 50百分位數(shù) | 50天 | 75百分位數(shù) | 60天 |
百分位是指把所有數(shù)據(jù)從小到大排序,并計(jì)算相應(yīng)的累計(jì)百分位。第25百分位數(shù)又稱第一個四分位數(shù),在我們的統(tǒng)計(jì)中有127個記錄,25百分位對應(yīng)的是第31.75,從最小值開始數(shù)下來,在第31和第32之間的那個數(shù),也就是39天。 第50百分位數(shù)也叫中位數(shù),這個值比平均值更有意義。用75百分位數(shù)減去25百分位數(shù)的值叫做四分位距,它反映出的是數(shù)值之間的間距,體現(xiàn)出一種離散情況。 在這組數(shù)據(jù)中的四分位距是60-39=21天,意思是從小到大排序數(shù)據(jù)的第75百分位和第25百分位的差是21天。計(jì)算百分位的Excel公式是PERCENTILE.INC(數(shù)值范圍,百分比) ,比如要計(jì)算中位數(shù),就輸入0.5。 至此,我們感覺是掌握了一些信息,但還不太夠。想要知道這組數(shù)據(jù)整體偏離平均值的程度,我們要計(jì)算一下方差,也就是Variance。 來一波回憶殺,回想當(dāng)年學(xué)過的高中數(shù)學(xué)吧,方差是各個數(shù)據(jù)與平均數(shù)之差的平方的和的平均數(shù)。在這組數(shù)據(jù)里有127個值,方差的計(jì)算公式就是把每個數(shù)減去平均數(shù)51天后求一個二次方,把所有的平方加起來,再除以127。 在Excel里的計(jì)算公式是VAR. S(全部數(shù)值),很快就能算出結(jié)果是225.31。把方差開個二次根,可以得出標(biāo)準(zhǔn)差是15.01,Excel公式是SQRT(數(shù)值)。 看到了這里是不是有點(diǎn)上頭了?別著急還有最后一步,我們要算一下變異系數(shù)Coefficientof Variation,簡稱CV。它是用標(biāo)準(zhǔn)差除以平均值,在這里就是15.01/51,等于0.3,這個數(shù)字反映了樣本數(shù)據(jù)的離散程度。 一般來說,CV小于0.75說明變化性比較低。我們可以這樣理解,雖然運(yùn)輸時(shí)間比以前長了,但總體的離散程度很低,說明延長的時(shí)間是同比放大了。 只要我們調(diào)整在途運(yùn)輸天數(shù)的參數(shù),重新計(jì)算物料需求計(jì)劃,由于運(yùn)輸延誤造成的缺貨風(fēng)險(xiǎn)是總體可控的。這是第一個重要的洞察。 如果我們統(tǒng)計(jì)所有發(fā)生的運(yùn)輸天數(shù)的概率,就可以得到這樣一個結(jié)果。 這一步可以在Excel里使用數(shù)據(jù)透視表完成。選中所有“從啟運(yùn)港開船日到抵達(dá)倉庫天數(shù)”數(shù)據(jù)。 然后在Values里選擇Count,在show values as中選擇“% of Grand Total” 就可以計(jì)算出概率。接下來,使用柱狀圖把概率展示出來。 我們之前得出的兩個眾數(shù),47和67就是Y軸概率最大的兩個數(shù),各出現(xiàn)了7次,除以總樣本數(shù)127,概率就是5.51%。這個分布有點(diǎn)像是正態(tài)分布,也有點(diǎn)像是三角形分布,關(guān)于這點(diǎn)先放一放,待會兒再來看。 二 整柜 or 拼柜? 老楊的工廠有時(shí)用整柜出貨,有時(shí)用拼柜。當(dāng)貨物正好裝滿一個20尺或40尺集裝箱的時(shí)候,毫不疑問我們應(yīng)該選擇整柜。 但在整柜很難訂的時(shí)候,我們是否可以化整為零?畢竟市場上的拼柜訂艙更加容易一些。在不考慮成本因素的前提下,我們可以先對兩種模式的時(shí)效性做下分析。 這組數(shù)據(jù)中有55票整柜,包括20尺和40尺柜,另有72票拼柜,加起來正好是127。我們用之前使用的計(jì)算方式,求得了一系列的結(jié)果,計(jì)算過程不再贅述。 數(shù)據(jù)分析 | 整柜(20FT&40FT) | 拼柜 | 兩者之差 | 最小值 | 21 | 30 | -9 | 眾數(shù) | 39 | 67 | -28 | 平均值 | 47 | 54 | -7 | 25百分位數(shù) | 37 | 45 | -8 | 50百分位數(shù) | 45 | 53 | -8 | 75百分位數(shù) | 56 | 66 | -10 | 最大值 | 106 | 94 | 12 | 最大值與最小值的差 | 85 | 64 | 21 | 75與25百分位的差 | 19.5 | 21.5 | -2 | 方差 | 237.46 | 199.48 | 37.98 | 標(biāo)準(zhǔn)差 | 15.41 | 14.12 | 1.29 | 變異系數(shù) | 0.33 | 0.26 | 0.06 |
通過比較這兩種模式,我們可以得出幾個結(jié)論。 首先,拼柜的運(yùn)輸時(shí)間更長,這是因?yàn)樨浌裨谀康牡馗劭谛枰拖?,然后再安排零?dān)運(yùn)輸,這會增加運(yùn)輸?shù)目倳r(shí)間,因此這個結(jié)果是合理的。 其次,我們發(fā)現(xiàn)拼柜的變異系數(shù)小于整柜,這說明拼柜雖然慢一些,但時(shí)效性比整柜還要穩(wěn)定,這是另一個重要洞察。 如果我們把整柜和拼柜的概率分布拿出來看一下,它們展示出來的情況如下: 1.整柜的分布 這個分布呈現(xiàn)出了三角形分布的特征,眾數(shù)39是整組數(shù)據(jù)的概率最大值,其他概率在“39”的左右不均衡地分布著,中位數(shù)45和平均值47都在它右側(cè)。 2.拼柜的分布 拼柜同樣地出現(xiàn)了三角形分布,眾數(shù)67是該組數(shù)據(jù)的概率最大值,其他概率在它的左右不均衡地分布著。這次中位數(shù)53和平均值54都在67的左側(cè),這與整柜的情況是相反的。 我們不去深究為什么會造成這兩種情況,只需要知道三角形分布很適用于運(yùn)輸時(shí)間概率分析就好了。 在這樣的場景中,正態(tài)分布未必是最合適的,因?yàn)檫\(yùn)輸時(shí)間的最小值是有極限的,比如21天,但是最大值可能會超乎預(yù)期,只要在整個運(yùn)輸環(huán)節(jié)中的任意一點(diǎn)脫節(jié),就會造成難以預(yù)料的延誤,最大值106天就是一個例證。 如果不幸遇到了蘇伊士運(yùn)河堵塞的情況,那么最大值就又要無限期地增加了,概率分布應(yīng)該不是正態(tài)分布,而是三角形分布了。
三 數(shù)據(jù)提供的洞察 通過對這些數(shù)據(jù)的分析,我們至少可以得出以下的幾個結(jié)論。 1.運(yùn)輸時(shí)間 新冠疫情引發(fā)的一系列問題,屬實(shí)增加了海運(yùn)的運(yùn)輸時(shí)間。同時(shí)我們也發(fā)現(xiàn)變異系數(shù)還是較低的,不管是整柜還是拼柜。定期回顧實(shí)際運(yùn)輸時(shí)間,然后在系統(tǒng)里調(diào)整前置時(shí)間參數(shù),就可以避免因運(yùn)輸延誤造成的逾期訂單或缺貨。 2.整柜和拼柜的時(shí)效性 綜合來看,整柜雖然比拼柜更快一些,但是沒有拼柜時(shí)效性穩(wěn)定,前者的變異系數(shù)甚至更多了6%。整柜雖然沒有在堆場拆箱,二次運(yùn)輸?shù)倪^程,但依然卡在了其他多式聯(lián)運(yùn)的環(huán)節(jié)上,并沒有體現(xiàn)出優(yōu)勢。 拼柜是一個很好的備選方案,優(yōu)勢是不用等柜子,因?yàn)槭呛推渌鲐浫斯蚕砑b箱,更容易獲得艙位和可能更早的船期。 3.前提假設(shè) 以上結(jié)論僅是基于A公司和它所選擇的貨代,運(yùn)輸至美國B公司的場景下得出的結(jié)論,并不一定適用于其他場景,但這套方法論是可以供借鑒的。 供應(yīng)鏈的本質(zhì)就是數(shù)學(xué),用數(shù)據(jù)說話,拒絕無意義的空談。使用數(shù)據(jù)分析,可以幫助我們穿越迷霧,洞察供應(yīng)鏈的真相。
|