1. 算法分發(fā)的基本原理 分發(fā)是整個資訊傳播中生態(tài)中直接接觸終端用戶的最后一環(huán)節(jié)。最理想化的傳播圖景是分發(fā)平臺上涵蓋著所有用戶需要的所有新聞內(nèi)容、資訊和廣告,同時也通過各種方式了解到用戶所有的已知需求和潛在需求;平臺實現(xiàn)所推送的每條信息都有用,每條資訊都被喜歡,都想知道,都應(yīng)該知道,即不匱乏,也不冗余,新聞資訊的質(zhì)量也正好符合本人的接收品位。 (1)協(xié)同濾過推薦 它包括兩種主要的推薦技術(shù)——基于記憶協(xié)同過濾和基于模型協(xié)同過濾。前者假設(shè)如果兩個用戶對產(chǎn)品有相似的喜好,那么他們現(xiàn)在對產(chǎn)品仍有相似的喜好;后者假設(shè)如果某個用戶過去喜歡某種產(chǎn)品,那么該用戶現(xiàn)在仍喜歡與此產(chǎn)品相似的產(chǎn)品。 (2)基于內(nèi)容的推薦 基于內(nèi)容的推薦即根據(jù)用戶歷史項目進行文本信息特征抽取,過濾,生成規(guī)模型,向用戶推薦與歷史項目內(nèi)容相似的信息。它的優(yōu)點之一就是解決了協(xié)同過濾中數(shù)據(jù)稀少時無法準(zhǔn)確判斷分發(fā)問題。 (3)關(guān)聯(lián)規(guī)則推薦 關(guān)聯(lián)規(guī)則推薦即基于用戶歷史數(shù)據(jù)挖掘用戶數(shù)據(jù)背后的關(guān)聯(lián),以分析用戶的潛在需求,向用戶推薦其感興趣的信息?;谠撍惴ǖ男畔⑼扑]流程主要分為兩個步驟:①根據(jù)當(dāng)前用戶閱讀過的感興趣的內(nèi)容,通過規(guī)則推導(dǎo)出用戶還沒有閱讀過的可能感興趣的內(nèi)容;②根據(jù)規(guī)則的支持度,對這些內(nèi)容排序展現(xiàn)給用戶。 2. 算法分發(fā)的現(xiàn)實操作流程 平臺首先要對這些新聞內(nèi)容進行消重,把內(nèi)容相似的東西消除掉。 目前算法平臺所使用的消重方法,有根據(jù)內(nèi)容消重、根據(jù)標(biāo)題消重、根據(jù)預(yù)覽圖片消重和根據(jù)相似組織消重買這些工作已經(jīng)全部可以由機器來完成,機器會自動根據(jù)對相似內(nèi)容辨認(rèn),把完全重復(fù)的內(nèi)容消除掉。 消重后進入新聞內(nèi)容的審核流程。及其主要對新聞內(nèi)容進行初步審核,把不符合法律法規(guī)、社會道德規(guī)范,從新聞專業(yè)角度來衡量屬于嚴(yán)重違規(guī)的內(nèi)容剔除。而人工審核會著重看標(biāo)題、正文、是否將廣告包裝成了推廣的信息等等。 新聞內(nèi)容順利通過重重審核的話,就會正式進入“大池子”等待推送分發(fā)。這一步由推薦引擎來完成。推薦引擎通過智能識別,把新聞內(nèi)容推薦給不同用戶。 這一步驟下的推薦包含三個類別,分別是啟動、擴大和限制。 第一步啟動。在這個類別中又分為全新用戶的偏好啟動和老用戶的偏好啟動。對于老用戶,第一步,要把這個用戶訂閱賬號的更新內(nèi)容第一時間向他推薦。這一步推送的精準(zhǔn)度很高。 第二步,要看這位用戶的既往瀏覽數(shù)據(jù),這一步的信息顆粒度是很粗的。此外,機器要從更加縱深的角度去收集這個用戶的興趣點。 其次是用系統(tǒng)框定一定數(shù)量用戶。 擴大推薦是指對于某個點擊率、閱讀時長都明顯高于平均水平的新聞內(nèi)容,系統(tǒng)會將它自動篩選出來,并向更多的人進行推薦。但在擴大推薦的過程中,系統(tǒng)也會依據(jù)用戶的反饋進行調(diào)整。 限制推薦是指某個點擊率、閱讀時長都明顯低于平均水平的新聞內(nèi)容,會被系統(tǒng)自動篩選出來,添加標(biāo)注。這樣的內(nèi)容會被縮小推薦范圍。 需要注意的是,作出擴大推薦或限制推薦的決定,也是會講過人工復(fù)審,因為有時候評論是來自價值觀判斷而不是針對新聞內(nèi)容質(zhì)量本身,這樣的評論就會被人工篩選出來,降權(quán)處理,不作為判斷的主要依據(jù)。 |
|