算法推薦技術(shù)從90年代開始顯露優(yōu)越性以來,被充分運用于電商、社交、內(nèi)容資訊等等眾多領(lǐng)域,并均為這些領(lǐng)域的革新做出了貢獻。但近年來,算法推薦卻不斷受到質(zhì)疑,無論是本身的有效性,還是其社會影響,都面臨諸多爭議。許多互聯(lián)網(wǎng)產(chǎn)品也一改“唯算法至上”的理念,在算法與人工之間搖擺不定,甚至有不少產(chǎn)品開始進行取消算法推薦的嘗試。本期騰訊媒體研究院將分享一篇文章,談?wù)動嘘P(guān)算法是否為技術(shù)上的倒退?算法推薦會成為互聯(lián)網(wǎng)歷史上的一段彎路嗎? 本文已獲授權(quán),轉(zhuǎn)載于騰訊研究院,作者二因斯坦 01算法推薦的發(fā)展簡史 算法推薦分為許多類型,但簡單來說,其原理就是基于用戶的歷史使用行為或相關(guān)信息,通過特定的數(shù)據(jù)模型,推測出用戶可能的偏愛喜好。1998年,Amazon平臺上線了基于物品的協(xié)同過濾算法(ItemCF算法),將推薦系統(tǒng)推向服務(wù)千萬級用戶和處理百萬級商品的規(guī)模。這一技術(shù)機制的革新產(chǎn)生了良好的效果,Amazon銷售額提高了35%左右——這是推薦算法從實驗室走向商業(yè)公司的一次成功應(yīng)用。 2006年,一家原本做DVD租賃的公司懸賞百萬招募算法推薦系統(tǒng),希望改善其影片推薦效果。最終,憑借此次大賽的成果,這家公司成功轉(zhuǎn)型為線上影片點播平臺,并向用戶普及了“推薦”的概念——這家公司就是Netflix。 圖片來自Netflix官方 視頻平臺YouTube同樣以算法推薦為特色。它最早只通過點擊和瀏覽量對內(nèi)容進行排序,2012年YouTube開始采用復(fù)雜的推薦算法,嘗試加入觀看時長、分享、喜歡等參數(shù)來向觀眾呈現(xiàn)視頻流。2016年9月,YouTube將其技術(shù)文檔整理成論文《Deep Neural Networks for YouTube Recommendations (深度神經(jīng)網(wǎng)絡(luò)在YouTube推薦系統(tǒng)中的應(yīng)用)》發(fā)表,公布了從大規(guī)模可選內(nèi)容中尋找最適合推薦結(jié)果的算法路徑,探討了深度學(xué)習(xí)帶來的性能跨越式提升。 在視頻網(wǎng)站之后,F(xiàn)acebook、Twitter等社交媒體也紛紛采用個性化信息流,將內(nèi)容按用戶興趣程度進行排列。從時間順序切換到算法亂序推薦,盡管初期引發(fā)了部分使用者的不適,但之后便被證明,這一舉動帶來了用戶使用時長、廣告點擊率的大幅增長。 國內(nèi)互聯(lián)網(wǎng)行業(yè)同樣擁抱算法。二十一世紀的第一個十年之后,內(nèi)容資訊平臺、短視頻應(yīng)用改變過往人工推薦的習(xí)慣,逐步加大算法推薦的比重,一大批代表性應(yīng)用在這一浪潮中涌現(xiàn)出來。2016年又被稱為“智媒元年”,以紀念算法推薦在內(nèi)容分發(fā)領(lǐng)域所做出的重大貢獻。毫無疑問,身處信息大爆炸的背景下,算法推薦是繼分類條目與搜索引擎之后的又一技術(shù)革新,它極大地提升了信息分發(fā)的效率和精準度,以此顛覆了人與信息的相處方式,也得益于這種能力,逐漸被應(yīng)用于交通、金融、法律等等人類社會的其他領(lǐng)域。 與人工推薦相比,算法推薦的優(yōu)越性不言而喻。但距“智媒元年”已經(jīng)過去5年,算法推薦的發(fā)展雖然已經(jīng)蓬勃,但它完全接手了互聯(lián)網(wǎng)領(lǐng)域的內(nèi)容分發(fā)嗎?
圖片來自公眾號公共圖片庫
02一些互聯(lián)網(wǎng)產(chǎn)品正在逐步嘗試算法化 事實上,許多互聯(lián)網(wǎng)產(chǎn)品都開始考慮取消算法推薦機制的可能性,并正在做出嘗試。 YouTube客戶端和網(wǎng)頁端都開始提供“不看推薦”和“清除歷史觀看數(shù)據(jù)”的選項,用戶可以自由選擇切換,其兒童頻道YouTube Kids更是徹底取消了算法推薦,改用純?nèi)斯ずY選內(nèi)容。Facebook新聞版塊在2019年開始招聘人工編輯(主要是資深記者),以應(yīng)對各國政府對其平臺充斥極端內(nèi)容的指控。 2017年成立的資訊分發(fā)平臺Substack也是以人工推薦為特色,讀者通過郵件訂閱來接收內(nèi)容,這吸引了不少懷舊的客戶,仿佛瞬間回到了RSS時代。該產(chǎn)品在多輪融資后估值已經(jīng)達到6.5億美元。為了與之抗衡,Twitter在年初收購了Substack的競爭對手Revue,而Facebook則新近推出了一款名為Bulletin的應(yīng)用——二者均是以時事通訊作者為主的資訊平臺,并采用編輯篩選,按作者訂閱的模式。誠然,算法推薦帶來的用戶和收入不可估量,但這么多的平臺都選擇重回時間流或人工推薦的形式,似乎也有那么一些勢在必行的推力。除了商業(yè)模式上獨辟蹊徑的考量,或許也是對算法推薦負面效應(yīng)的一種回應(yīng)。 在《為什么極端內(nèi)容更容易流行?》一文里,我們曾探討過推薦算法對社交媒體上極端內(nèi)容傳播的影響。極端內(nèi)容是一條獲取流量的捷徑,而基于“流量至上”的理念,算法往往在無形中為極端內(nèi)容的傳播充當(dāng)了推手的角色。 以Facebook為例,近2/3加入極端主義小組的用戶都是被Facebook推薦關(guān)注而非主動檢索。YouTube也面臨同樣的問題,平臺持續(xù)不斷地調(diào)整其推薦算法,盡量減少有害內(nèi)容的推薦量以控制傳播,盡管如此,成效卻依然了了。因此這家公司保留了超過1萬人的審核團隊,負責(zé)刪除違規(guī)視頻以及進一步改善各種機制和政策。 互聯(lián)網(wǎng)公司也在嘗試更智能的方式來自動識別極端內(nèi)容,比如研發(fā)一些惡意內(nèi)容檢測插件,但這些工具并沒有很好地投入使用——因為過于嚴格的審核會影響社區(qū)氛圍,平臺方不想因此造成過多的用戶流失。不少讀者應(yīng)該都會有過刷短視頻App一刷幾個小時忘了時間的經(jīng)歷,原因就在于源源不斷的推薦會讓人深受吸引無法自拔。算法推薦最初應(yīng)用的目的,是為了提升檢索效率, 降低用戶的時間成本,快速匹配用戶最需要的內(nèi)容,但卻逐漸演變成為增強用戶粘性,延長使用時間的機制保障,這顯然與本意有所偏離。 引發(fā)更多爭議的是“信息繭房”效應(yīng)。算法推薦會為了取悅用戶,不斷推薦其感興趣的內(nèi)容,這讓用戶以自身興趣為磚瓦構(gòu)筑起一道墻,從此只能沉浸在自己喜愛的、熟悉的已知的世界里,這就是“信息繭房”所描述的狀態(tài)。在學(xué)術(shù)界,針對這一理論的現(xiàn)實效應(yīng)還存在不少爭議,但可以確認的是,算法基于興趣的個性化推薦,確實收窄了用戶的信息接收范圍,并減少了接受差異化訊息的可能性。在日漸封閉的信息環(huán)境中,用戶只看自己想看的,只聽自己想聽的,并在不斷重復(fù)和自我驗證中強化固有觀念,進而相信一些扭曲的故事。要知道,現(xiàn)在還有不少YouTube用戶堅信,地球是平的,人類并不曾登上月球,水可以變成汽油。 這就是信息繭房的“功勞”。在快速資訊、短視頻領(lǐng)域,算法推薦或許有著優(yōu)越的表現(xiàn),但在嚴肅內(nèi)容的傳播上卻頻頻失效。這也是為什么Twiiter、Facebook都選擇將嚴肅新聞與社交內(nèi)容拆分,并投資做獨立的訂閱資訊平臺。 算法的基礎(chǔ)是海量的用戶數(shù)據(jù)收集,但是有些嚴肅內(nèi)容,比如深度報道、行業(yè)知識等,本身受眾面窄,沒有辦法為機器提供足夠的基礎(chǔ)數(shù)據(jù),自然也無法給出合適的推薦。另外,就像許多文藝類電影常常叫好不叫座一樣,很多優(yōu)質(zhì)內(nèi)容與通俗內(nèi)容放在同一個算法池中,可能很快就被淹沒了,需要人工編輯撈出來。 美國作家尼古拉斯·卡爾《淺薄:互聯(lián)網(wǎng)毒化了我們的大腦》,指出人們在享受互聯(lián)網(wǎng)所帶來便利的同時正在犧牲深度閱讀和深度思考的能力:“我們對瀏覽和略讀越來越得心應(yīng)手,但是,我們正在喪失的卻是專注能力、沉思能力和反省能力?!?nbsp;這本書講的是超鏈接對互聯(lián)網(wǎng)使用者記憶力的損害,但是從條目瀏覽到搜索引擎再到算法推薦,信息獲取的成本越來越低,留給人獨立思考的機會確實也越來越少了。圖片來自公眾號公共圖片庫 03取消算法推薦,不是技術(shù)倒退,是發(fā)展需求 在平臺行動起來做取消算法推薦的嘗試之前,許多用戶已經(jīng)提前意識到并展開行動。他們開始想辦法改變互聯(lián)網(wǎng)的使用方式,嘗試擺脫算法的影響。基于行為類型的不同,又可以分為“佛系用戶”“自律性選手”和“懷舊型用戶”: 因為算法推薦需要獲取用戶行為數(shù)據(jù)才能夠生效,于是有的用戶選擇隱藏自己的行為,“不登陸、不點贊、不關(guān)注、不評論”,不留使用痕跡,避免定位、相冊、通訊錄等權(quán)限被獲取,這類屬于佛系用戶,他們的戰(zhàn)略是盡可能讓算法摸不清自己,從而在互聯(lián)網(wǎng)上當(dāng)一個透明人。 “自律型選手”主要警惕算法引發(fā)的沉浸效應(yīng),通過手機時長管理軟件嚴格控制各個App的使用時間,避免使用易上癮App,偶爾不得不安裝就用完即刪,用強悍的自制力對抗強大的誘惑,進而實現(xiàn)防沉迷的效果。 而“懷舊型用戶”則會拒絕市面上的大多數(shù)資訊集合App,他們會使用RSS工具將多個訂閱源整合在一起,從而實現(xiàn)內(nèi)容都是自己主動關(guān)注的更新,與被動推薦的思路截然相反。對年輕人來說,這是一項古老的服務(wù),卻是擴充視野、走出信息繭房很好的對策。 這么多年來,算法能夠在各個領(lǐng)域得到大規(guī)模應(yīng)用,對信息分發(fā)效率的提升以及社會運作有著不言而喻的意義。互聯(lián)網(wǎng)產(chǎn)品嘗試進行一些去算法化的探索,并不是在強行逆轉(zhuǎn)技術(shù)的發(fā)展趨勢。在一定程度上去算法化,只是讓算法回歸本意,更好地服務(wù)人類。與此同時,不少互聯(lián)網(wǎng)產(chǎn)品也在對現(xiàn)有算法進行著不斷優(yōu)化以改善用戶體驗,根本目的就是要找出一種更具“可持續(xù)性”的發(fā)展模式。過去,我們說算法推薦的作用是把合適的內(nèi)容推給合適的用戶,那么,“去算法化”就是“把合適的工作留給算法,不合適的工作交給人工。”
圖片來自公眾號公共圖片庫
|