小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

塔吉特知道你懷孕了:個(gè)性化推薦背后的生成機(jī)制

 昵稱535749 2013-10-30

塔吉特知道你懷孕了:個(gè)性化推薦背后的生成機(jī)制

2013/10/30 | i天下網(wǎng)商
i天下網(wǎng)商注:在電商領(lǐng)域,最著名的推薦系統(tǒng)應(yīng)屬亞馬遜網(wǎng)絡(luò)書(shū)店。“對(duì)同樣一本書(shū)有興趣的讀者們興趣在某種程度上相近”的假設(shè)前提下提供這樣的推薦已經(jīng)成為了今天電商推薦系統(tǒng)的典范。而在這背后,涉及到的最主要機(jī)理就是WEB挖掘和協(xié)同過(guò)濾分析。后者通過(guò)分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對(duì)某一信息的評(píng)價(jià),形成系統(tǒng)對(duì)該指定用戶對(duì)此信息的喜好程度預(yù)測(cè)。這樣的推薦算法將不再像傳統(tǒng)的基于內(nèi)容過(guò)濾直接分析內(nèi)容推薦了,也許你再也不用擔(dān)心在這樣的電商網(wǎng)站上搜索骨灰盒了。
 
文/通策信息首席運(yùn)營(yíng)官 譚磊
 
 
大家都記得塔吉特的案例:2012年,美國(guó)一名男子闖入他家附近的一家零售連鎖超市塔吉特內(nèi)抗議:你們竟然給我17歲的女兒發(fā)嬰兒尿片和童車優(yōu)惠券。店鋪經(jīng)理立刻向來(lái)者承認(rèn)錯(cuò)誤,但是該經(jīng)理并不知道這一行為是總公司運(yùn)行數(shù)據(jù)挖掘和個(gè)性化推薦的結(jié)果。一個(gè)月后,這位父親前來(lái)道歉,因?yàn)檫@時(shí)他知道自己的女兒的確懷孕了。塔吉特比這位父親知道自己女兒懷孕足足早了一個(gè)月。
 
塔吉特的案例是基于數(shù)據(jù)挖掘所做的用戶行為分析的結(jié)果,經(jīng)過(guò)分析之后,系統(tǒng)對(duì)用戶進(jìn)行了個(gè)性化推薦,以至于他們有把握給客戶提供的商品是他們所喜歡和需要的。
 
個(gè)性化推薦的背后原理
 
要了解個(gè)性化推薦,先得理解互聯(lián)網(wǎng)挖掘和協(xié)同過(guò)濾這兩個(gè)概念。
 
準(zhǔn)確地說(shuō),互聯(lián)網(wǎng)的挖掘(WEB挖掘)指的是,利用數(shù)據(jù)挖掘技術(shù)從互聯(lián)網(wǎng)上的文檔中及互聯(lián)網(wǎng)服務(wù)上自動(dòng)發(fā)現(xiàn)并提取人們感興趣的信息。
 
Web挖掘是對(duì)現(xiàn)代電子商務(wù)戰(zhàn)略的一個(gè)重要支持,尤其是web挖掘中的用戶訪問(wèn)模式挖掘主要用于對(duì)客戶在網(wǎng)上行為的分析以及潛在的顧客信息的發(fā)現(xiàn)。Web挖掘的一個(gè)實(shí)現(xiàn)方法是對(duì)服務(wù)器日志、錯(cuò)誤信息日志和本地終端數(shù)據(jù)日志等日志文件進(jìn)行分析,挖掘出用戶的訪問(wèn)行為、訪問(wèn)頻率和瀏覽內(nèi)容等信息,從而找出一定的模式和規(guī)則。
 
這就引出了協(xié)同過(guò)濾的概念。協(xié)同過(guò)濾是信息檢索的一種技術(shù),目標(biāo)是為了幫用戶在海量的互聯(lián)網(wǎng)信息(商品)中找出感興趣的內(nèi)容。
 
在電子商務(wù)的應(yīng)用中,我們通常使用協(xié)同過(guò)濾技術(shù)來(lái)找出關(guān)聯(lián)商品推薦。這種商品推薦方法被稱為推薦系統(tǒng)或個(gè)性化推薦系統(tǒng)。用通俗的話來(lái)說(shuō),協(xié)同過(guò)濾算法可以幫助找到和你喜好類似的那群人,看他們買了什么東西,然后推薦給你。
 
協(xié)同過(guò)濾的主要方法有以下三種:
 
基于用戶的:收集用戶的信息屬性。對(duì)于每一個(gè)用戶A,找到和他比較接近(或者相似)的幾個(gè)用戶。使用這些相似的用戶對(duì)用戶A的興趣點(diǎn)進(jìn)行預(yù)測(cè),而把那些潛在的并沒(méi)有被發(fā)掘出的興趣點(diǎn)推薦給用戶A。
 
基于項(xiàng)目的:收集項(xiàng)目的信息屬性。對(duì)于一個(gè)用戶,如果他對(duì)項(xiàng)目X有很高的興趣,那么他很有可能也對(duì)與X相似的項(xiàng)目有潛在的興趣。
 
基于內(nèi)容的:除了用戶和項(xiàng)目屬性之外,基于內(nèi)容的協(xié)同過(guò)濾還要進(jìn)一步分析用戶的評(píng)價(jià)內(nèi)容和反饋。比如用戶A對(duì)項(xiàng)目X感興趣,但是他對(duì)X的興趣是“痛恨”,這樣就不能把他和“喜歡”項(xiàng)目X的用戶歸類在一起了。
 
找到相似點(diǎn)
 
當(dāng)然,在電子商務(wù)領(lǐng)域,項(xiàng)目主要指的是商品。協(xié)同過(guò)濾推薦是基于這樣的假設(shè):如果一些用戶對(duì)一些項(xiàng)的評(píng)分比較相似,則和這些用戶相似的其他用戶對(duì)這些項(xiàng)的評(píng)分也比較相似,而這些用戶對(duì)于和這些項(xiàng)相似的其他項(xiàng)所做的評(píng)分也是相似的。
 
我們來(lái)舉例說(shuō)明:你在電子商城里買了電影碟片《指環(huán)王》和《星球大戰(zhàn)》,協(xié)同過(guò)濾算法可以幫助你找到買了類似產(chǎn)品的其他人。如果算法發(fā)現(xiàn)他們還買了《哈利·波特》,就會(huì)把《哈利·波特》推薦給你。如果你買了余華的《兄弟》和《活著》、蘇童的《大紅燈籠》,系統(tǒng)找到了其他買這些書(shū)的人,發(fā)現(xiàn)這些人都買了莫言的《檀香刑》,于是就會(huì)把這本書(shū)推薦給你。
 
當(dāng)我們找到和客戶A“相似”的那些其他客戶之后,就可以對(duì)商品列表進(jìn)行排序了,越多和客戶A相似的客戶買了商品X,就說(shuō)明商品X越可能吸引客戶A。
 
簡(jiǎn)單地說(shuō),我們?nèi)绻J(rèn)為有1000個(gè)客戶是和客戶A“相似”的,那么可以把這些客戶購(gòu)買的歷史數(shù)據(jù)調(diào)出來(lái)按照多寡排序。如果其中有100個(gè)客戶都購(gòu)買了商品X,有90個(gè)顧客購(gòu)買了商品Y,那么我們會(huì)優(yōu)先對(duì)客戶A推薦商品X,然后再推薦商品Y。
 
大數(shù)據(jù)下的個(gè)性化推薦
 
推薦系統(tǒng),或者稱為個(gè)性化推薦系統(tǒng),是建立在數(shù)據(jù)挖掘基礎(chǔ)上的一套系統(tǒng),以為顧客購(gòu)物提供完全個(gè)性化的決策支持和信息服務(wù)為目的。幾乎所有的海外大型電子商務(wù)網(wǎng)站,包括亞馬遜和eBay,都不同程度地使用了各種形式的推薦系統(tǒng)。
 
我們來(lái)看一個(gè)基于協(xié)同過(guò)濾規(guī)則的推薦系統(tǒng)實(shí)施案例。
 
如左下表所示,Chris、Jenny、Mark和Peter等都是系統(tǒng)中的用戶,而商品A、B、C等都是用戶購(gòu)買過(guò)的商品,打鉤表示對(duì)應(yīng)的用戶購(gòu)買了對(duì)應(yīng)的商品。
 
我們先來(lái)看基于用戶的推薦。假設(shè)通過(guò)推薦系統(tǒng),我們發(fā)現(xiàn)Chris和Peter兩位用戶的相似度是非常高的,其中Peter已經(jīng)購(gòu)買了商品A、C、E,而和他很“相似”的Chris只買了商品A,推薦系統(tǒng)就會(huì)把商品C和E推薦給Chris。
 
我們?cè)賮?lái)看基于項(xiàng)目的推薦。假設(shè)通過(guò)推薦系統(tǒng),我們發(fā)現(xiàn)商品B和商品D是“相似”的。在系統(tǒng)的眾多用戶中,Jenny購(gòu)買了商品B和D,Tina購(gòu)買了商品D,而Venessa購(gòu)買了商品B。我們的推薦系統(tǒng)根據(jù)商品B和D的相似規(guī)則,會(huì)把商品B推薦給Tina,并把商品D推薦給Venessa。
 
在協(xié)同過(guò)濾推薦系統(tǒng)中,一個(gè)需要考慮的因素是被推薦的商品X和商品Y本身的購(gòu)買頻率。如果在全部的用戶中有10%的客戶都購(gòu)買了商品X,而只有1%的客戶購(gòu)買了商品Y,那么這時(shí)我們可能應(yīng)該推薦的商品是Y而不是X。我們可以在排序的時(shí)候加上一個(gè)系數(shù),而這個(gè)系數(shù)的數(shù)值是和該商品整體的熱度成反比的。因?yàn)樯唐稾在全部客戶中被購(gòu)買的比例是商品Y的10倍,而在和客戶A“相似”的人群中被購(gòu)買的比例只多了10%,那么我們?cè)谂判驎r(shí)需要把Y排在X的前面。
 
需要補(bǔ)充的是,協(xié)同過(guò)濾推薦系統(tǒng)是依賴于大量數(shù)據(jù)的。如果數(shù)據(jù)量不夠充分,推薦的結(jié)果可能會(huì)令人啼笑皆非。在新用戶、新項(xiàng)目或者整個(gè)系統(tǒng)是全新開(kāi)始的情況下,個(gè)性化推薦引擎是無(wú)法工作的。


(原載于《天下網(wǎng)商·經(jīng)理人》十月刊,所有轉(zhuǎn)載請(qǐng)注明來(lái)源于i天下網(wǎng)商并附上鏈接)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多