小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

沃爾瑪是怎么預測商品銷量的?大白話介紹下“Apriori算法”和“時間序列模型”

 東北泰寶寶 2024-12-09

圖片

在沃爾瑪?shù)囊患掖笮统欣?,銷售著海量的商品,從日常的食品飲料到各類家居用品,從時尚服裝到電子設(shè)備等應有盡有。
超市經(jīng)理面臨著一個巨大的挑戰(zhàn):如何精準地預測商品的需求,以便合理安排庫存、優(yōu)化采購計劃,既避免庫存積壓占用資金,又防止缺貨而錯失銷售機會。
為了解決這個問題,沃爾瑪?shù)臄?shù)據(jù)團隊決定運用先進的數(shù)據(jù)分析技術(shù),其中最知名的就是 “Apriori算法”和“時間序列模型”。
今天我們就用大白話來介紹一下。

圖片

一、Apriori算法
Apriori 算法就像是一個超級偵探,在沃爾瑪?shù)匿N售數(shù)據(jù)海洋里尋找隱藏的 “商品關(guān)聯(lián)寶藏”。
它的核心原則可以這樣理解:如果有一群朋友總是一起出現(xiàn),那么其中任意幾個朋友結(jié)伴出現(xiàn)的概率也會比較大。
在商品世界里,如果某些商品經(jīng)常被顧客一起購買,那么這些商品之間就存在著很強的關(guān)聯(lián)關(guān)系。
1、數(shù)據(jù)收集與初步整理
數(shù)據(jù)團隊收集了超市過去很長一段時間(比如一年)的詳細銷售記錄,每一條記錄就像是顧客購物籃里的一張 “購物小票”,上面清楚地寫著顧客購買了哪些商品以及購買的數(shù)量、時間等信息。
這些海量的 “購物清單” 堆積起來,就構(gòu)成了用于分析的原始數(shù)據(jù)寶庫。

圖片

2、“頻繁項集生成過程
首先,偵探(Apriori 算法)開始從最簡單的情況入手,查看單個商品在所有“購物小票” 中出現(xiàn)的次數(shù),就像是在數(shù)每個朋友獨自出現(xiàn)的頻率。
例如,發(fā)現(xiàn)牛奶在 100 萬張“購物清單”中出現(xiàn)了 20 萬次,那牛奶這個商品的出現(xiàn)頻率(支持度)就是 20%。
我們可以設(shè)定一個最小支持度閾值,比如 15%,那么牛奶明顯超過這個閾值,可以入選,就成為了一個頻繁1-項集”(其中數(shù)字代表著同時出現(xiàn)的商品數(shù)量,意味著它是單獨出現(xiàn)頻率較高的商品。

圖片

接著,偵探開始嘗試將兩個商品組合起來看。
比如把牛奶和面包組合在一起,查看這對“組合朋友”在所有“購物清單”中同時出現(xiàn)的次數(shù)。如果發(fā)現(xiàn)它們同時出現(xiàn)了 10 萬次,在總“購物清單”數(shù)為 100 萬的情況下,{牛奶,面包}這個組合的支持度就是 10%。
我們繼續(xù)尋找滿足最小支持度閾值的兩個商品組合,形成頻繁2-項集。
按照這樣的方式,不斷增加組合的商品數(shù)量,頻繁2-項集生成頻繁3-項集,以此類推,直到再也找不到滿足最小支持度閾值的新組合為止。
這個過程就像是不斷擴大朋友圈子,看看哪些更大的朋友群體總是一起出現(xiàn)。

圖片

3、關(guān)聯(lián)規(guī)則生成與應用
在找出了頻繁項集之后,偵探要進一步挖掘這些頻繁項集之間更深入的關(guān)系,也就是“關(guān)聯(lián)規(guī)則”。
比如發(fā)現(xiàn) {牛奶,面包,雞蛋} 是一個“頻繁3-項集”,那就可以計算關(guān)聯(lián)規(guī)則“牛奶,面包→雞蛋”的置信度,也就是當顧客同時購買了牛奶和面包之后,在多大概率上會購買雞蛋。
如果在購買了牛奶和面包的顧客中,發(fā)現(xiàn)有60%的人也購買了雞蛋,那么這條關(guān)聯(lián)規(guī)則的置信度就是60%。
我們也可以設(shè)定一個最小置信度閾值,比如50%,那么這條關(guān)聯(lián)規(guī)則明顯超過了50%,就被認為是有價值的,可以用來指導日常工作。
這意味著當看到顧客購買了牛奶和面包時,就有較大把握預測他們可能也會購買雞蛋。
超市就可以根據(jù)這個關(guān)聯(lián)規(guī)則來調(diào)整商品的擺放位置,例如把牛奶、面包和雞蛋放在相鄰的貨架上,方便顧客購買,或是一起打包參加促銷活動;
同時也能根據(jù)其中一種商品的銷售趨勢來預估其他關(guān)聯(lián)商品的需求,提前做好庫存準備。
不過,Apriori算法雖然基于真實數(shù)據(jù),但是只能機械地看出不同商品銷量之間的關(guān)系,所以為了更深入地分析,沃爾瑪開始探究“時間序列模型”。

圖片

二、時間序列模型
在構(gòu)建時間序列分析模型時,沃爾瑪會重點考慮以下四類因素:
(當然,實際構(gòu)建模型、開展分析更加復雜)
· 趨勢因素(Trend,T)
它反映了數(shù)據(jù)在較長時期內(nèi)的總體變化方向,是一種長期的、較為穩(wěn)定的增長或下降態(tài)勢。
例如,由于消費者對品牌認知度的提高、市場份額的逐步擴大或者產(chǎn)品技術(shù)的持續(xù)改進等原因?qū)е碌匿N量持續(xù)上升或下降的趨勢。
· 季節(jié)因素(Seasonal,S)
代表數(shù)據(jù)受到季節(jié)或固定周期的影響而產(chǎn)生的周期性波動。
對于許多商品,如服裝、食品等,其銷售會呈現(xiàn)出明顯的季節(jié)性規(guī)律,就像羽絨服,在冬季銷量高峰,夏季銷量低谷,這種與季節(jié)相關(guān)的周期性變化就是季節(jié)因素。
· 循環(huán)因素(Cyclical,C)
體現(xiàn)的是數(shù)據(jù)圍繞長期趨勢的周期性波動,這種波動的周期通常比季節(jié)周期長,并且不是固定時間間隔的。
它可能受到經(jīng)濟周期、行業(yè)周期或者產(chǎn)品生命周期等因素的影響。
例如,經(jīng)濟繁榮時期消費者購買能力增強,對高端產(chǎn)品的需求增加;或者某種產(chǎn)品在市場上從新興、成長、成熟到衰退的過程中,其銷量會呈現(xiàn)出相應的循環(huán)變化。
· 不規(guī)則因素(Irregular,I)
也稱為隨機因素,是由一些不可預見、不可控制的事件引起的銷售量的隨機波動。
這些事件可能包括突發(fā)的自然災害、社會事件、競爭對手的意外舉動(如突然的大幅降價或新產(chǎn)品推出)、原材料供應的突然變化等。

圖片

1、數(shù)據(jù)收集
以羽絨服為例,沃爾瑪首先收集過去 10 年每個門店每周的銷售數(shù)據(jù)。
除了銷售數(shù)量,還記錄詳細的產(chǎn)品信息,如羽絨服的款式(長款、短款)、填充材料(鵝絨、鴨絨)、含絨量、價格等詳細信息。
同時,為了數(shù)據(jù)更加詳實,沃爾瑪還收集了每家門店所在地區(qū)的氣象數(shù)據(jù)(包括每周平均氣溫、降雪量等)、當?shù)亟?jīng)濟數(shù)據(jù)(人均可支配收入、失業(yè)率等)、時尚趨勢數(shù)據(jù)(通過社交媒體熱度、時尚雜志推薦款式統(tǒng)計等)以及競爭對手的相關(guān)數(shù)據(jù)(競爭對手羽絨服的價格、促銷活動、市場份額等)。
2、分解時間序列因素
· 趨勢因素(T)
對過去 10 年的總銷量數(shù)據(jù)進行線性回歸分析。
假設(shè)發(fā)現(xiàn)銷量與年份之間存在線性關(guān)系y=ax+b,其中y是銷量,x是年份,ab是回歸系數(shù)。
經(jīng)過計算,如果b=500,這意味著在過去 10 年中,平均每年羽絨服銷量自然增長 500 件,這可能是由于品牌的市場推廣和產(chǎn)品質(zhì)量提升導致的。
進一步分析不同款式羽絨服的趨勢。
例如,發(fā)現(xiàn)長款羽絨服的銷量趨勢增長更快,可能是因為消費者對保暖性和時尚性結(jié)合的需求增加。
通過對不同款式羽絨服分別進行回歸分析,發(fā)現(xiàn)長款羽絨服銷量y=800x+300,短款羽絨服銷量y=300x+200,這表明長款羽絨服的年度增長趨勢更為明顯。

圖片

· 季節(jié)因素(S)
將每年的數(shù)據(jù)按照季度劃分,計算每個季度的平均銷量占全年平均銷量的比例。
例如,第一季度(1-3 月)的平均銷量占全年的 40%,第二季度(4-6 月)占 5%,第三季度(7-9 月)占 3%,第四季度(10-12 月)占 52%,這顯示出羽絨服銷售明顯的季節(jié)性。
進一步細分到月份,發(fā)現(xiàn) 12 月的銷量最高,平均占全年的 30%,1 月占 20%,11 月占 10% 等。
并且不同款式在季節(jié)內(nèi)的銷售高峰也有差異,長款羽絨服在 12 月和 1 月的銷量占其全年銷量的比例更高,可能達到 60%,而短款羽絨服在 11 月和 12 月的銷量占比相對較為均衡,約為 40% - 45%。
通過計算季節(jié)指數(shù)來更精確地量化季節(jié)因素。

圖片

圖片
· 循環(huán)因素(C)
從經(jīng)濟周期角度分析,在經(jīng)濟增長較快的年份,消費者對高端羽絨服(價格在 2000 元以上)的需求增長明顯。
例如,在 GDP 增長率高于 6% 的年份,高端羽絨服的銷量增長率達到 20%,而在經(jīng)濟增長緩慢的年份,其銷量增長率可能只有 5%。
從時尚周期看,當某種特定的羽絨服款式(如工裝風羽絨服)成為當年的流行款式時,其銷量會在當年及隨后一年大幅增長。
通過分析社交媒體上關(guān)于羽絨服款式的討論熱度和相關(guān)時尚博主的推薦,發(fā)現(xiàn)當某一款式的熱度指數(shù)(根據(jù)提及次數(shù)、點贊數(shù)等綜合計算)超過一定閾值(如 100 萬)時,該款式羽絨服的銷量會在接下來的兩個季度內(nèi)增長 30% - 50%。
· 不規(guī)則因素(I)
例如,分析競爭對手的影響。
當競爭對手在某一年推出類似款式的羽絨服,且價格低于沃爾瑪銷售的產(chǎn)品價格 10% 時,沃爾瑪該款式羽絨服的銷量在當季下降了 15% - 20%。
又如,考慮自然災害的影響。
在發(fā)生雪災的年份,羽絨服在受災地區(qū)的銷量會在短期內(nèi)激增如某一年某地區(qū)發(fā)生雪災,該地區(qū)沃爾瑪門店羽絨服銷量在受災后的一個月內(nèi)增長了 80%。
還有,原材料供應短缺也會產(chǎn)生影響。
如果鵝絨供應短缺導致進貨成本增加,產(chǎn)品價格上漲,可能會使羽絨服銷量下降 10% - 15%。

圖片

3、建立時間序列模型
采用乘法模型Y=T*S*C*I。
假設(shè)預測下一年的基礎(chǔ)銷量(僅考慮趨勢因素),根據(jù)回歸方程計算出下一年的趨勢銷量為 10000 件。
結(jié)合季節(jié)因素,對于 12 月,根據(jù)季節(jié)指數(shù)S=1.8,初步預測 12 月的銷量為10000*1.8=18000件。
考慮循環(huán)因素,如果下一年經(jīng)濟增長預計良好,GDP 增長率預計為 7%,對于高端羽絨服,循環(huán)因素可能使銷量增加 20%,此時高端羽絨服 12 月的銷量預測變?yōu)?/span>18000*(1+0.2)=21600件。
如果同時某種特定款式的羽絨服成為流行款式,其熱度指數(shù)超過閾值,銷量可能再增加 40%,則預測銷量變?yōu)?/span>21600*(1+40%)=30240件。
最后考慮不規(guī)則因素,假設(shè)競爭對手可能推出類似產(chǎn)品且價格有優(yōu)勢,預計會使銷量下降 15%,同時考慮原材料供應穩(wěn)定,綜合考慮不規(guī)則因素后,最終 12 月高端流行款式羽絨服的銷量預測為30240*(1-15%)=25704件。
4、模型評估與調(diào)整
使用過去兩年的數(shù)據(jù)作為驗證集,計算預測銷量和實際銷量之間的均方誤差(MSE)和平均絕對誤差(MAE)。
例如,MSE 計算公式為 

圖片

其中是yi實際銷量,yi^是預測銷量,n是樣本數(shù)量。
如果 MSE 和 MAE 的值較大,就需要調(diào)整模型。比如,如果發(fā)現(xiàn)預測的 12 月銷量總是高于實際銷量,可能是對競爭對手的價格策略(不規(guī)則因素)考慮不足。此時,需要重新收集競爭對手價格變化對銷量影響的數(shù)據(jù),調(diào)整不規(guī)則因素在模型中的權(quán)重,或者改進季節(jié)因素和循環(huán)因素的計算方法,以提高模型的預測精度。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多