圖片來自簡書APP
一、推薦引擎的工作原理: 推薦引擎的工作原理
推薦引擎的工作原理 二、推薦引擎的分類: 基于大眾行為的推薦引擎和個性化推薦引擎 根據(jù)大眾行為的推薦引擎,對每個用戶都給出同樣的推薦,這些推薦可以是靜態(tài)的由系統(tǒng)管理員人工設(shè)定的,或者基于系統(tǒng)所有用戶的反饋統(tǒng)計計算出的熱度比較高的商品 個性化推薦引擎,對不同的用戶,根據(jù)他們的口味和喜好給出更加精確的推薦,這時,系統(tǒng)需要了解需推薦內(nèi)容和用戶的特質(zhì),或者通過找到與當(dāng)前用戶相同喜好的用戶,實現(xiàn)推薦。 大部分人們討論的推薦引擎都是個性化的推薦引擎,因為從根本上說,只有個性化的推薦引擎才是更加智能的信息發(fā)現(xiàn)過程。 三、根據(jù)推薦引擎的數(shù)據(jù)源 1、根據(jù)系統(tǒng)用戶的基本信息發(fā)現(xiàn)用戶的相關(guān)程度,這種被稱為基于人口統(tǒng)計學(xué)的推薦(Demographic-based Recommendation) 基于人口統(tǒng)計學(xué)的推薦
基于人口統(tǒng)計學(xué)的推薦 2、根據(jù)推薦物品或內(nèi)容的元數(shù)據(jù),發(fā)現(xiàn)物品或者內(nèi)容的相關(guān)性,這種被稱為基于內(nèi)容的推薦(Content-based Recommendation) 基于內(nèi)容的推薦
基于內(nèi)容的推薦 3、根據(jù)用戶對物品或者信息的偏好,發(fā)現(xiàn)物品或者內(nèi)容本身的相關(guān)性,或者是發(fā)現(xiàn)用戶的相關(guān)性,這種被稱為基于協(xié)同過濾的推薦(Collaborative Filtering-based Recommendation)。(口口相傳的推薦方式) 三個基本步驟: 1.用戶給產(chǎn)品評分 2.協(xié)同過濾找到有相似評分(即品味)的用戶,成為鄰近者 3.產(chǎn)品不是由用戶評分,而是由用戶的鄰近著的混合評分決定(領(lǐng)袖者的評價可能權(quán)重更大) 基于用戶的協(xié)同過濾
基于用戶的協(xié)同過濾 進一步研究涉及協(xié)同推薦領(lǐng)域的可信度和能力,其基本思想是,區(qū)分推薦的生產(chǎn)者和使用者,判斷生產(chǎn)者提供的信息質(zhì)量。在這種情況下,推薦的使用者是用戶;反過來用戶的鄰近者是生產(chǎn)者,生產(chǎn)者評分的質(zhì)量可以根據(jù)生產(chǎn)者與使用者評分之間的差異來衡量。 基于物品的協(xié)同過濾
基于物品的協(xié)同過濾 四、混合的推薦機制 在現(xiàn)行的 Web 站點上的推薦往往都不是單純只采用了某一種推薦的機制和策略,他們往往是將多個方法混合在一起,從而達(dá)到更好的推薦效果。關(guān)于如何組合各個推薦機制,這里講幾種比較流行的組合方法。 加權(quán)的混合(Weighted Hybridization): 用線性公式(linear formula)將幾種不同的推薦按照一定權(quán)重組合起來,具體權(quán)重的值需要在測試數(shù)據(jù)集上反復(fù)實驗,從而達(dá)到最好的推薦效果。 切換的混合(Switching Hybridization):前面也講到,其實對于不同的情況(數(shù)據(jù)量,系統(tǒng)運行狀況,用戶和物品的數(shù)目等),推薦策略可能有很大的不同,那么切換的混合方式,就是允許在不同的情況下,選擇最為合適的推薦機制計算推薦。 分區(qū)的混合(Mixed Hybridization):采用多種推薦機制,并將不同的推薦結(jié)果分不同的區(qū)顯示給用戶。其實,Amazon,當(dāng)當(dāng)網(wǎng)等很多電子商務(wù)網(wǎng)站都是采用這樣的方式,用戶可以得到很全面的推薦,也更容易找到他們想要的東西。 分層的混合(Meta-Level Hybridization): 采用多種推薦機制,并將一個推薦機制的結(jié)果作為另一個的輸入,從而綜合各個推薦機制的優(yōu)缺點,得到更加準(zhǔn)確的推薦。 五、冷啟動的處理 1基于人口統(tǒng)計學(xué)和基于內(nèi)容的推薦,一般來說在初始就需要維護好用戶或者物品基本屬性數(shù)據(jù)。所以冷啟動問題比較容易解決 2.基于用戶的協(xié)同過濾,當(dāng)新用戶進來時,通常是根據(jù)用戶類型、屬性特征,看相同類型的用戶的喜好,然后假設(shè)當(dāng)前用戶的喜好,然后推薦 3.基于物品的協(xié)同過濾,當(dāng)新物品出現(xiàn)時,通常是根據(jù)物品的類型、屬性特征,看相同類型的物品都被哪些商戶喜歡,假設(shè)這些商戶同樣喜歡這個新物品,然后推薦。 六、評估推薦系統(tǒng) 用戶認(rèn)為與推薦系統(tǒng)的交互有用嗎?他們對收到的推薦結(jié)果滿意嗎?是什么驅(qū)使用戶貢獻(xiàn)知識?比如有助于提高系統(tǒng)預(yù)測質(zhì)量的評分或評論?或或者用戶關(guān)于接受推薦真正喜歡的是什么?是意外和新奇,還是他們知識不想繼續(xù)找下去了? 概念的有效性、可靠性和靈敏度 實驗研究涉及一般會通過控制一個或多個獨立變量。 七、個性化推薦的重點: 1.能吸引更多地用戶到商品詳情頁面(物品瀏覽轉(zhuǎn)化率) 2.有助于將更多訪問者變成購買者(銷售轉(zhuǎn)化) 3.促使單個用戶瀏覽更多物品 4.促使單個用戶購買更多物品 注意有些算法對點擊量有明顯促進作用;有些算法對銷售轉(zhuǎn)化有明顯促進作用;不同的算法促進的點不同。所以要針對推薦的目的選擇合適的算法。 八、算法 這里面并沒有特別關(guān)注算法實現(xiàn)的東西,大部分公司這些是技術(shù)需要考慮的問題。 九、整體架構(gòu) 推薦系統(tǒng)架構(gòu)設(shè)計
推薦系統(tǒng)整理架構(gòu)設(shè)計 一、特征倉庫 1.用戶維度數(shù)據(jù):是用來描述用戶的特征數(shù)據(jù)。了解用戶,一般從用戶標(biāo)簽屬性和行為屬性兩個層面即可。 用戶標(biāo)簽屬性用來描述用戶靜態(tài)特征:性別、年齡、愛好、家庭住址等等 用戶行為數(shù)據(jù)簡單來說就是行為日志:用戶查看了什么、點擊了什么、收藏了、添加購物車了;分為顯性和隱形兩類:顯性的就是指能看出用戶的偏好比如收藏、添加購物車,而隱形的看不出用戶明顯的偏好,比如瀏覽行為,很可能只是因為這個頁面是首頁而已。 2.內(nèi)容維度數(shù)據(jù):表示內(nèi)容的細(xì)節(jié)特征,比如內(nèi)容是商品,則商品的價格、重量、顏色、型號等都是內(nèi)容維度的數(shù)據(jù) 3.時間維度、城市維度:比如用戶在北京的行為數(shù)據(jù)、用戶在晚上12點的行為數(shù)據(jù)。分析用戶特征的時候,要考慮用戶的地點和實效。 二、計算邏輯層 計算邏輯層
用戶內(nèi)容匹配:用戶喜歡某些特征的內(nèi)容;如果有些內(nèi)容包含這些特征,則認(rèn)為用戶喜歡這些內(nèi)容 內(nèi)容匹配:利用用戶之前喜歡的內(nèi)容,找到與這些內(nèi)容相似的內(nèi)容,認(rèn)為是用戶喜歡的。 用戶匹配:根據(jù)用戶特征尋找相似的用戶,相似的用戶喜歡的東西,認(rèn)為這個用戶也喜歡。 三、針對初步結(jié)果集的分析 1.過濾:把之前的推薦歷史過濾掉,把不符合要求、質(zhì)量差的內(nèi)容過濾掉 2.排名:制定結(jié)果集的優(yōu)先級 3.選擇優(yōu)質(zhì)內(nèi)容,整理,進行推薦 十、其他: 在算法層有些東西還是可以細(xì)分 比如N中推薦策略的疊加組合權(quán)重的靈活設(shè)置(可配置) 熱銷商品懲罰系數(shù)設(shè)置(可配置) 業(yè)務(wù)突發(fā)要求,某類商品的推薦降權(quán)處理等等。 這些都不應(yīng)該寫死在算法中,應(yīng)該做成靈活可配置的,適應(yīng)各種情況下的需求。 |
|
來自: 方之圓 > 《搜索&廣告&推薦》