來人人都是產(chǎn)品經(jīng)理【起點學院】,BAT實戰(zhàn)派產(chǎn)品總監(jiān)手把手系統(tǒng)帶你學產(chǎn)品、學運營。 如果去商場里買東西,我并不愿意聽導購小姐講的話,但是電商網(wǎng)站上的推薦,我還真的愿意看一看?!静履阆矚g】,好,那你就猜猜吧。 推薦這種體驗除了電商網(wǎng)站,還有新聞推薦、電臺音樂推薦、搜索相關(guān)內(nèi)容及廣告推薦,基于數(shù)據(jù)的個性化推薦也越來越普遍了。今天就針對場景來說說這些不同的個性化推薦算法吧。 說個性化之前,先提一下非個性化。 非個性化的推薦也是很常見的,畢竟人嘛都有從眾心理,總想知道大家都在看什么。非個性化推薦的方式主要就是以比較單一的維度加上半衰期去看全局排名,比如,30天內(nèi)點擊排名,一周熱門排名。 但是只靠非個性化推薦有個弊端,就是馬太效應,點的人越多的,經(jīng)過推薦點得人有更多。。。強者越強,弱者機會越少就越弱,可能導致兩級分化嚴重,一些比較優(yōu)質(zhì)素材就被埋沒了。 所以,為了解決一部分馬太效應的問題,也主要是順應數(shù)據(jù)化和自動化的模式,就需要增加個性化的推薦(可算說到正題了。。。)個性化的優(yōu)點是不僅體驗好,而且也大大增加了效率,讓你更快找到你感興趣的東西。YouTube也曾做過實驗測試個性化和非個性化的效果,最終結(jié)果顯示個性化推薦的點擊率是同期熱門視頻的兩倍。 1.新聞、視頻、資訊和電臺(基于內(nèi)容推薦)一般來說,如果是推薦資訊類的都會采用基于內(nèi)容的推薦,甚至早期的郵件過濾也采用這種方式。 基于內(nèi)容的推薦方法就是根據(jù)用戶過去的行為記錄來向用戶推薦相似額推薦品。簡單來說就是你常常瀏覽科技新聞,那就更多的給你推薦科技類的新聞。 復雜來說,根據(jù)行為設(shè)計權(quán)重,根據(jù)不同維度屬性區(qū)分推薦品都是麻煩的事,常用的判斷用戶可能會喜歡推薦品程度的余弦向量公式長這樣,我就不解釋了(已經(jīng)勾起了我關(guān)于高數(shù)不好的回憶)。。。 但是,這種算法缺點是由于內(nèi)容高度匹配,導致推薦結(jié)果的驚喜度較差,而且有冷啟動的問題,對新用戶不能提供可靠的推薦結(jié)果。并且,只有維度增加才能增加推薦的精度,但是維度一旦增加計算量也成指數(shù)型增長。如果是非實體的推薦品,定義風格也不是一件容易的事,同一個作者的文風和曲風也會發(fā)生改變。 2.電商零售類(協(xié)同過濾推薦和關(guān)聯(lián)規(guī)則推薦)說電商推薦那不可能不講到亞馬遜,傳言亞馬遜有三成的銷售額都來自個性化的商品推薦系統(tǒng)。實際上,我自己也常常在這里找到喜歡的書,也愿意主動的去看他到底給我推薦了什么。 一般,電商主流推薦算法是基于一個這樣的假設(shè),“跟你喜好相似的人喜歡的東西你也很有可能喜歡?!奔磪f(xié)同過濾過濾算法。主要的任務就是找出和你品味最相近的用戶,從而根據(jù)最近他的喜好預測你也可能喜歡什么。 這種方法可以推薦一些內(nèi)容上差異較大但是又是用戶感興趣的物品,很好的支持用戶發(fā)現(xiàn)潛在的興趣偏好。也不需要領(lǐng)域知識,并且隨著時間推移性能提高。但是也存在無法向新用戶推薦的問題,系統(tǒng)剛剛開始時推薦質(zhì)可能較量差。 電商行業(yè)也常常會使用到基于關(guān)聯(lián)規(guī)則的推薦。即以關(guān)聯(lián)規(guī)則為基礎(chǔ),把已購商品作為規(guī)則頭,規(guī)則體為推薦對象。比如,你購買了羽毛球拍,那我相應的會向你推薦羽毛球周邊用品。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性,在零售業(yè)中已經(jīng)得到了成功的應用。 3.廣告行業(yè)(基于知識推薦)自從可以瀏覽器讀取cookies,甚至獲得年齡屬性等信息,廣告的個性化投放就也可以根據(jù)不同場景使用了。 當用戶的行為數(shù)據(jù)較少時,基于知識的推薦可以幫助我們解決這類問題。用戶必須指定需求,然后系統(tǒng)設(shè)法給出解決方式。假設(shè),你的廣告需要指定某地區(qū)某年齡段的投放,系統(tǒng)就根據(jù)這條規(guī)則進行計算?;谥R的推薦在某種程度是可以看成是一種推理技術(shù)。這種方法不需要用戶行為數(shù)據(jù)就能推薦,所以不存在冷啟動問題。推薦結(jié)果主要依賴兩種形式,基于約束推薦和基于實例推薦。 4.組合推薦由于各種推薦方法都有優(yōu)缺點,所以在實際中,并不像上文講的那樣采用單一的方法進行建模和推薦(我真的只是為了解釋清楚算法)。。。 在組合方式上,也有多種思路:加權(quán)、變換、混合、特征組合、層疊、特征擴充、元級別。 并且,為了解決冷啟動的問題,還會相應的增加補足策略,比如根據(jù)用戶模型的數(shù)據(jù),結(jié)合挖掘的各種榜單進行補足,如全局熱門、分類熱門等。 還有一些開放性的問題,比如,需不需要幫助用戶有品味的提升,引導人去更好的生活。 最后,我總想,最好的推薦效果是像一個了解你的朋友一樣跟你推薦,因為他知道你喜歡什么,最近對什么感興趣,也總能發(fā)現(xiàn)一些有趣的新東西。這讓我想到有一些朋友總會興致勃勃的過來說,嘿,給你推薦個東西,你肯定喜歡,光是聽到這句話我好像就開心起來,也許這就是我喜歡這個功能的原因。 |
|