姜婷婷,許艷閏
(1. 武漢大學(xué)信息管理學(xué)院,武漢 430072;2. 武漢大學(xué)信息資源研究中心,武漢 430072)
當(dāng)人們所接收到的信息輸入量超過了人們理解和處理的范圍,就會進(jìn)入“ 信息過載”(informa‐tion overload) 狀態(tài)。在應(yīng)對信息過載時,“過濾”(filtering) 是一種常見的手段,即僅處理 “優(yōu)先級高” 的信息[1]。日新月異的互聯(lián)網(wǎng)技術(shù)雖然帶來了信息的爆炸式增長,加劇了信息過載,但同時也實(shí)現(xiàn)了信息的自動過濾,將 “優(yōu)先級高”(通常是指更符合個人偏好) 的信息直接推送給用戶,從而降低了信息生產(chǎn)者的送達(dá)成本和信息消費(fèi)者的決策成本[2]。
久而久之,人們開始發(fā)現(xiàn)自己正處在一個多樣性降低的信息世界中:視頻平臺經(jīng)常會推薦那些與自己以往喜好類似的電影[3];在線購物平臺會不斷地給自己推薦同一類型的產(chǎn)品[4];新聞網(wǎng)站推薦的新聞總是與自己的興趣高度一致[5];音樂平臺推薦的曲目與自己已經(jīng)收藏的曲目在風(fēng)格上也極為相似[6]。這種個性化的信息推薦促使網(wǎng)絡(luò)世界中形成了一個個無形的過濾氣泡,很多人都被困在自己的氣泡中,與異質(zhì)信息的接觸越來越少。
“ 過濾氣泡”(filter bubbles) 這一概念是由Pariser[7]在The Filter Bubble:What the Internet Is Hiding from You一書中提出的,他認(rèn)為以PageRank 為代表的搜索算法已經(jīng)成為過去,現(xiàn)在的搜索引擎可以時刻捕捉用戶的偏好,并據(jù)此為其定制個性化的搜索結(jié)果,這使得每個人都身處一個獨(dú)有的信息世界,即過濾氣泡,阻礙人們偶遇異質(zhì)信息①Pariser 在The Filter Bubble: What the Internet is Hiding from You 中對 “過濾氣泡” 的原始描述為 “The new generation of Internet filters looks at the things you seem to like—the actual things you've done, or the things people like you like—and tries to extrapolate…these engines create a unique universe of information for each of us—what I've come to call a filter bubble—which fundamentally alters the way we encounter ideas and in‐formation.”(pp. 10)。
如上所述,“過濾氣泡” 概念的初始定義非常清晰,強(qiáng)調(diào)了其與個性化推薦算法之間的密切關(guān)聯(lián),然而在后來的使用過程中卻發(fā)生了概念混用的情況。其中,早在互聯(lián)網(wǎng)推薦算法流行起來之前就出現(xiàn)的概念——“信息繭房”(information cocoons)是最常與之混淆的。 美國學(xué)者Sunstein[8]在Infotopia:How Many Minds Produce Knowledge一書中首次提出 “信息繭房”,并將其定義為一種特殊的信息世界,身處其中的人們只會聽到令自己感到舒適和愉悅的信息。目前,國內(nèi)的許多學(xué)術(shù)文獻(xiàn)和媒體文章均將由技術(shù)因素造成的 “過濾氣泡” 冠以“信息繭房” 之名,但兩者本質(zhì)上并不能等同:信息繭房是人們主動對信息進(jìn)行選擇的結(jié)果,而過濾氣泡則是人們被動接受算法推薦的個性化信息的結(jié)果。
近年來,流行的個性化推薦算法在迎合用戶喜好的同時,伴生著推薦質(zhì)量下降的問題,過濾氣泡的出現(xiàn)限制了每個人所能接收到的信息范圍,用戶正在逐步喪失信息自主權(quán),長此以往令人擔(dān)憂[9]。清楚認(rèn)識過濾氣泡,并提出應(yīng)對之策迫在眉睫,但國內(nèi)相關(guān)研究對這一概念內(nèi)涵的挖掘較為淺顯,研究進(jìn)展也相對遲緩。因此,本研究采取系統(tǒng)性綜述方法對國外過濾氣泡研究成果進(jìn)行分析、整合與展示,按照規(guī)范流程對文獻(xiàn)進(jìn)行搜索與篩選,并從中提取出研究脈絡(luò)和重要主題,旨在深化概念理解、探討未來的研究思路與發(fā)展趨勢。
雖然過濾氣泡是在近年來互聯(lián)網(wǎng)信息爆炸的背景下產(chǎn)生的,但是其理論基礎(chǔ)可以追溯到傳播學(xué)領(lǐng)域于20 世紀(jì)40 年代所提出的 “守門人理論”(gate‐keeping theory)。這一經(jīng)典理論認(rèn)為,信息在向受眾傳播的過程中存在著 “門區(qū)”(gate)[10],那里的“守門人”(gatekeepers) 決定了哪些信息可以通過、而哪些信息被拒之門外[11]。在傳統(tǒng)媒體時代,記者、編輯等新聞工作者扮演了 “守門人” 的角色,這些 “守門人” 會根據(jù)自身的經(jīng)驗(yàn)和判斷挑選出受眾可能感興趣的內(nèi)容,并將其呈現(xiàn)給受眾[12]。
Web 2.0 時代到來之后,政治、經(jīng)濟(jì)、科學(xué)等領(lǐng)域的信息得以在互聯(lián)網(wǎng)上快速、便捷地傳播,各類社交媒體、 搜索引擎等網(wǎng)絡(luò)平臺,如國外的Facebook、Google,國內(nèi)的新浪微博、百度等,逐漸替代了傳統(tǒng)媒體中的記者和編輯,在一定程度上成為了現(xiàn)代社會信息傳播過程中的 “守門人”[13]。為了應(yīng)對互聯(lián)網(wǎng)上日益增長的信息量,這些新的“守門人” 引入了 “個性化”(personalization) 這一手段,通過設(shè)計(jì)并應(yīng)用各種個性化推薦算法來實(shí)現(xiàn)信息的精準(zhǔn)推送。雖然個性化推薦能夠有效地緩解用戶的信息過載負(fù)擔(dān),但同時也在很大程度上使得人們更有可能接觸到自己已經(jīng)感興趣的信息,而其他信息被過濾掉。過度的個性化推薦會制造出一種單一的信息環(huán)境,令用戶局限于狹窄的信息接收范圍,將其困在過濾氣泡之中。
推薦系統(tǒng)(recommender system) 是信息過濾系統(tǒng)的重要組成部分,通過預(yù)測用戶對信息價(jià)值的評分來實(shí)現(xiàn)個性化的推薦[14],既免去了用戶查找信息的麻煩,又能準(zhǔn)確地與其興趣相匹配[15]。常見的個性化推薦算法主要包括以下幾類。
(1) 基于內(nèi)容的過濾(content-based filtering):根據(jù)目標(biāo)用戶以往喜歡或選擇的信息,推薦與之相似的更多信息,該方式依賴于用戶歷史數(shù)據(jù)分析和可用信息特征提取,核心在于計(jì)算信息內(nèi)容之間的相似度[16-17]。
(2) 協(xié)同過濾(collaborative filtering):可以分為基于信息(item-based) 和基于用戶(user-based)的協(xié)同過濾。基于信息的協(xié)同過濾,是指如果兩個信息條目同時被很多人喜歡,那么就可以認(rèn)為這兩個信息條目是相似的,可以向消費(fèi)了其中一個信息條目的用戶推薦另一個條目;基于用戶的協(xié)同過濾,是指向用戶推薦與之品味相似的其他用戶所喜歡的信息條目。協(xié)同過濾的核心在于根據(jù)用戶喜好計(jì)算信息之間的相似度[18]。
(3) 混合推薦(hybrid recommendation):將基于內(nèi)容的過濾、協(xié)同過濾等多種推薦算法結(jié)合起來使用,充分發(fā)揮各種算法的優(yōu)勢,彌補(bǔ)不足,從而有效地突破單一算法的固有限制[19]。
本研究采用系統(tǒng)性綜述的方法對國外近年來的過濾氣泡相關(guān)研究進(jìn)行梳理和總結(jié)。系統(tǒng)性綜述是一種識別、評價(jià)和解釋與特定研究問題、主題領(lǐng)域、感興趣現(xiàn)象有關(guān)的全部現(xiàn)有研究的方法[20],具有系統(tǒng)、全面、透明、可復(fù)制等優(yōu)點(diǎn)[21]。本研究參考系統(tǒng)性綜述的常用流程開展工作,具體如圖1所示。
圖1 系統(tǒng)性綜述工作流程
在搜索國外 “過濾氣泡” 相關(guān)文獻(xiàn)時,本研究首先選擇了覆蓋多個學(xué)科領(lǐng)域的綜合性數(shù)據(jù)庫Sci‐enceDirect、SAGE Journals、 SpringerLink 和Wiley Online Library,以及側(cè)重于社會學(xué)、管理學(xué)、政治學(xué)、心理學(xué)等人文社會科學(xué)研究的Emerald Manage‐ment Xtra 數(shù) 據(jù) 庫,分 別 以 “filter bubble(s)” 和 “in‐formation bubble(s)” 為查詢式,開展主題、標(biāo)題、摘要和關(guān)鍵詞字段的搜索;接著使用相同的查詢式在Google Scholar 和ResearchGate 中進(jìn)行搜索,補(bǔ)充了未被以上數(shù)據(jù)庫收錄的論文。此外,本研究還采用了反向搜索(backward search) 的策略,查看被已有綜述文章納入分析的文獻(xiàn),然后對現(xiàn)有搜索結(jié)果進(jìn)行補(bǔ)充(如Bruns[22]、Spohr[23])。文獻(xiàn)搜索工作于2020 年5 月進(jìn)行,初步得到153 篇論文。
由圖1 可知,經(jīng)過第1、2 步的搜索、去重,獲得了77 篇可能與過濾氣泡相關(guān)的論文,但還需要進(jìn)一步確定其是否符合本研究的綜述目標(biāo),因此,本文設(shè)定如下的文獻(xiàn)納入標(biāo)準(zhǔn):①發(fā)表在同行評審的期刊或是會議論文集上的英文論文;②提供了具體的研究設(shè)計(jì)和研究結(jié)果的實(shí)證論文,評論、社論等類型的論文被排除在外;③聚焦于過濾氣泡的研究論文,僅提到該現(xiàn)象但研究問題與之無關(guān)的論文被排除在外。
根據(jù)上述納入標(biāo)準(zhǔn),進(jìn)行第3 步的初步篩選之后得到69 篇相關(guān)論文,接著還需要對每篇論文開展質(zhì)量評估,以確保綜述對象的質(zhì)量。評估時主要考慮以下因素:①研究背景闡述是否清晰;②研究目標(biāo)及研究問題是否明確;③研究設(shè)計(jì)是否適用于研究目標(biāo);④數(shù)據(jù)采集方法是否合適,操作過程是否恰當(dāng);⑤數(shù)據(jù)分析方法是否合適,操作過程是否恰當(dāng);⑥研究結(jié)果是否可靠;⑦研究結(jié)論是否具有一定的深度和意義。經(jīng)過第4 步質(zhì)量評估完成二次篩選后,最終得到了61 篇高質(zhì)量的過濾氣泡研究論文的文獻(xiàn)集合。如表1 所示,這些論文大多發(fā)表于近五年,以期刊論文為主,廣泛涉及圖書情報(bào)學(xué)、計(jì)算機(jī)科學(xué)、社會學(xué)、心理學(xué)等多個學(xué)科領(lǐng)域,由此可見,過濾氣泡是一個跨學(xué)科的問題。
表1 文獻(xiàn)集特征分布
信息過濾或個性化推薦會大大降低人們所接觸信息的多樣性,這一觀點(diǎn)已經(jīng)得到普遍認(rèn)同,但是否已經(jīng)達(dá)到產(chǎn)生過濾氣泡的地步,是以往研究長期關(guān)注的一個問題。本研究梳理了涉及該問題的文獻(xiàn),從中提取了不同的甚至是相反的研究結(jié)論,并且發(fā)現(xiàn)過濾氣泡存在與否,在很大程度上取決于研究的角度及判斷的標(biāo)準(zhǔn),如表2 所示。
表2 與過濾氣泡是否存在有關(guān)的文獻(xiàn)梳理結(jié)果
4.1.1 過濾氣泡不存在或被夸大
有些認(rèn)為過濾氣泡不存在或被夸大的研究大部分都是面向用戶的研究,即通過問卷、訪談等自我報(bào)告方法,調(diào)查用戶使用網(wǎng)絡(luò)應(yīng)用的總體情況、日常瀏覽信息的一般習(xí)慣等[25-26]。這些研究發(fā)現(xiàn),大多數(shù)用戶會主動利用多個平臺來獲取信息,而且也會有意識地瀏覽觀點(diǎn)不同的信息,將自己暴露于一個多樣性較高的信息環(huán)境中[26-27]。 因此,Dutton 等[24]指出,技術(shù)對人類信息獲取行為的影響受到了高估,理論上的過濾氣泡在現(xiàn)實(shí)世界并不存在。
當(dāng)然,也有面向平臺的研究認(rèn)為,過濾氣泡不存在或被夸大。 Haim 等[31]、 Puschmann[32]、 Ne‐chushtai 等[33]以新聞網(wǎng) 站(如Google News) 為 背景,分析發(fā)現(xiàn),平臺推薦給不同用戶的新聞在來源和內(nèi)容上是高度同質(zhì)的,因此,這些研究者認(rèn)為在線新聞消費(fèi)過程中人們對過濾氣泡的擔(dān)憂可能被夸大了。針對Google 搜索引擎的一部分研究顯示,系統(tǒng)根據(jù)個人以往行為和偏好返回的搜索結(jié)果在不同用戶間并未表現(xiàn)出明顯的差別[29-30],Google 不僅不會將用戶困于過濾氣泡內(nèi),而且還會促進(jìn)跨意識形態(tài)的信息消費(fèi)[28]。
4.1.2 過濾氣泡真實(shí)存在
少量以社交媒體或音樂平臺為背景的研究認(rèn)為,這些平臺上確實(shí)存在著過濾氣泡。Bechmann等[34]將過濾氣泡理解為較低的信息相似性,即點(diǎn)擊的鏈接、瀏覽的信息內(nèi)容與其他人不存在重合,通過分析Facebook 上1000 名用戶在14 天內(nèi)獲得的個人推送發(fā)現(xiàn),確實(shí)存在少量用戶完全孤立于其他用戶,受困于過濾氣泡之中。Min 等[35]在微博上部署了128 個社交機(jī)器人并分析了這些機(jī)器人及其社交網(wǎng)絡(luò)接收到的信息,認(rèn)為過濾氣泡是社交媒體上的一種高度密集的用戶社區(qū),這些社區(qū)中的用戶具有相似的偏好,其星狀結(jié)構(gòu)會自發(fā)地排除異質(zhì)信息,造成群體極化。Wheeler-Mackta 等[39]調(diào)查了Pandora用戶的音樂播放習(xí)慣后指出,音樂平臺提供的個性化推薦功讓用戶不太可能主動挑戰(zhàn)其已有偏好,促進(jìn)了過濾氣泡的產(chǎn)生。
值得注意的是,針對Google 的另一部分研究卻認(rèn)為,該搜索引擎中是存在過濾氣泡的,因?yàn)椴煌脩舻玫降乃阉鹘Y(jié)果具有一定的差別[37],或者少數(shù)用戶得到的搜索結(jié)果有別于其他用戶[36]。
實(shí)際上,Pariser[7]在首次提出 “過濾氣泡” 概念時就帶有批評的意味,因此,這一概念本身就暗含著消極影響。但是本研究發(fā)現(xiàn),也有少數(shù)學(xué)者注意到過濾氣泡在特殊背景下的積極影響。
4.2.1 過濾氣泡的消極影響
信息多樣性的下降帶來了過濾氣泡[40]。由于人們常常意識不到過濾氣泡的存在,或者即使意識到其存在,卻不知道如何與之對抗,因此,更傾向于對過濾氣泡采取一種被動接受的態(tài)度[41-44]。由于缺少干預(yù),過濾氣泡在多個社會領(lǐng)域都造成了消極影響,其中在政治和健康領(lǐng)域尤為突出。
在過濾氣泡中,個體的意見容易被同質(zhì)化的群體聲音所淹沒,這會導(dǎo)致個人話語權(quán)面臨巨大的挑戰(zhàn)[45]、個體理性的力量將會減弱[46]、公眾的批判性思維能力會遭受影響[43]。 因此,Ribeiro等[43]根據(jù)在本國開展的一項(xiàng)調(diào)查研究推斷,在政治領(lǐng)域,過濾氣泡能夠在民主選舉等重要的公共事件上影響甚至故意引導(dǎo)人們的觀點(diǎn);加快了意識形態(tài)的極化,促進(jìn)了 “回音室” 的出現(xiàn),不利于社會團(tuán)結(jié)[47-48]。此外,因?yàn)檫^濾氣泡中大多只充斥著人們感興趣的信息,所以那些相對枯燥、復(fù)雜的話題,如政治、環(huán)境等重要的公共議題將會逐漸被動地退出社會大眾的視線[7,49-50],公共議程的發(fā)展將面臨遲滯。
由于過濾氣泡可以促進(jìn)信息的定向傳播,因此,在健康領(lǐng)域可能被利用來將蓄意編造的錯誤信息直接送達(dá)到特定的弱勢群體,最終威脅其生命健康[41,45]。例如,家長在社交媒體或搜索引擎中接觸到與兒童疫苗接種有關(guān)的錯誤信息后,可能會猶豫是否要給孩子接種疫苗,甚至選擇不給孩子接種疫苗,無意中讓孩子面臨感染常見可防疾病的風(fēng)險(xiǎn)[41,51]。
4.2.2 過濾氣泡的積極影響
盡管過濾氣泡的消極影響毋庸置疑,但它并非一無是處。首先,過濾氣泡是利用技術(shù)手段實(shí)現(xiàn)信息過濾的產(chǎn)物,確實(shí)能夠有效減輕人們的信息過載[47,52],不僅能節(jié)省信息搜尋和篩選的時間成本,而且還能獲取自己感興趣的信息。除此之外,特殊領(lǐng)域的過濾氣泡可能帶來意想不到的好處。例如,反性別歧視過濾氣泡為其參與者提供了一個免受性別歧視和社會質(zhì)疑的小空間,是她們物質(zhì)需求和安全感的重要來源[53]。社交軟件上的關(guān)系型過濾氣泡能夠幫助用戶找到與他們相似的人,使其得以更好地與陌生人分享個人興趣、品味乃至價(jià)值觀,有效地拓展了自己的社交圈[25]。
上述研究證據(jù)表明,過濾氣泡是一種真實(shí)的存在,可能在特定的網(wǎng)絡(luò)環(huán)境中表現(xiàn)得更為明顯。過濾氣泡在大多數(shù)情況下也是一種不利的存在,可能阻礙個人及社會的正常發(fā)展。因此,探討如何應(yīng)對過濾氣泡成為國外相關(guān)研究的落腳點(diǎn)。本研究基于文獻(xiàn)比較識別出應(yīng)對過濾氣泡的兩種策略:①通過信息過濾可視化降低過濾氣泡的影響;②通過個性化推薦算法優(yōu)化破除過濾氣泡。
4.3.1 信息過濾可視化
對信息過濾進(jìn)行可視化有利于增強(qiáng)用戶對過濾氣泡的感知[41],提升用戶對信息過濾過程的控制感[46,52],并鼓勵用戶主動接觸不同觀點(diǎn)的信息[24,54],從而削弱過濾氣泡可能帶來的不利影響。
以往最受關(guān)注的是針對在線評論的可視化,相關(guān)研究對評論內(nèi)容進(jìn)行收集、整合與展示,以一種更加直接的方式增加用戶對異質(zhì)信息的接觸,促進(jìn)用戶對不同觀點(diǎn)的思考和討論。Opinion Space 是一款在線評論瀏覽工具,它將一個網(wǎng)絡(luò)論壇中的評論投射到二維視圖中,每個點(diǎn)代表一條評論,觀點(diǎn)差異越大的評論相距越遠(yuǎn)。當(dāng)用戶瀏覽某條評論時,系統(tǒng)會提示用戶對自己認(rèn)同該評論觀點(diǎn)的程度進(jìn)行打分;一條評論越受不同價(jià)值取向的用戶認(rèn)同,視圖中對應(yīng)的點(diǎn)會變得越大。該可視化工具不僅使得多樣性的評論一覽無余,而且方便用戶發(fā)現(xiàn)那些引起廣泛共鳴的評論[55]。另一款在線評論瀏覽工具Reflect 在每條評論旁都設(shè)置了一個聆聽框,鼓勵其他用戶簡明扼要地重申評論者的觀點(diǎn)或是發(fā)表自己不同的意見,從而為用戶之間的相互傾聽與交流創(chuàng)造了機(jī)會[56]。ConsiderIt 是一個觀點(diǎn)審議平臺,它廣泛地邀請用戶就某一公共話題分別創(chuàng)建贊成和反對的觀點(diǎn)列表,以此來促進(jìn)正反觀點(diǎn)的互動,引導(dǎo)人們反思和權(quán)衡他人分享的不同看法[57-58]。
圍繞搜索引擎開展的可視化研究旨在幫助人們意識到搜索中過濾氣泡的存在。一款名為Bobble 的瀏覽器插件拓展了Google 搜索結(jié)果的可見性,針對同一查詢式,僅用戶自己可見的搜索結(jié)果以黃色背景顯示,同時,該用戶不可見而其他用戶可見的搜索結(jié)果以紅色背景顯示,這樣可以直觀地反映個性化的程度[59]。Tabrizi 等[60]提出了基于觀點(diǎn)的搜索范式(perspective-based search paradigm),認(rèn)為搜索應(yīng)該具有平等性,因而將搜索主題所涉及的不同觀點(diǎn)識別出來并展示給用戶,用戶可以在這些觀點(diǎn)中自由地選擇查看哪些搜索結(jié)果。這種做法充分尊重了用戶的自主權(quán),有利于提升用戶的批判性思維,避免偏聽偏信,從而增強(qiáng)搜索引擎的可信度。
針對社交媒體上的過濾氣泡,Nagulendra 等[61]專門創(chuàng)建了一種非常形象的可視化方式,即采用圓圈來表示過濾氣泡,圓圈內(nèi)的好友及其狀態(tài)更新是用戶原本可見的,而原本被過濾掉的內(nèi)容則顯示在圓圈外。在這個可視化界面上,用戶可以通過添加、刪除等操作改變氣泡所包含的內(nèi)容,從而使自己 “逃 離” 氣 泡。
此外,Munson 等[62]開發(fā)了一款名為Balancer 的瀏覽器插件,利用 “小人走鋼絲” 的簡筆畫來表現(xiàn)用戶在瀏覽器中的閱讀行為:分析其所讀內(nèi)容的傾向性,這個小人在鋼絲上會相應(yīng)地?cái)[動身體,從而提醒用戶其閱讀行為實(shí)際上是帶有偏向性的。
4.3.2 個性化推薦算法優(yōu)化
個性化推薦算法能夠?qū)崿F(xiàn)信息的精準(zhǔn)推送,但是過度的個性化會降低用戶所接收到的信息的多樣性,導(dǎo)致過濾氣泡的產(chǎn)生。因此,個性化推薦算法優(yōu)化的基本思路,在于降低個性化程度、提升信息多樣性,從而在根源上阻斷過濾氣泡的形成[63-64]。
在推薦過程中引入 “意外發(fā)現(xiàn)”(serendipity)機(jī)制一直是個性化推薦算法優(yōu)化的主要方向。信息獲取情境中的意外發(fā)現(xiàn)又稱為 “信息偶遇”(infor‐mation encountering)。不同于主動的、有目的的信息搜尋,信息偶遇具有低參與、低預(yù)期的特點(diǎn),偶遇經(jīng)歷可能帶來意料之外的價(jià)值,包括獲得新知識、發(fā)現(xiàn)新方向、實(shí)現(xiàn)社交效益等[65-66]。在推薦算法中添加適度的意外發(fā)現(xiàn)可以為用戶制造驚喜,避免用戶對接收到的信息產(chǎn)生厭倦;驚喜是一種積極的情感反應(yīng),有利于喚起思考、激發(fā)學(xué)習(xí)興趣,從而增強(qiáng)人們接觸多樣化信息的意愿[67-68]。
推薦算法中的意外發(fā)現(xiàn)應(yīng)該平衡信息新穎性和相關(guān)性之間的關(guān)系,涉及用戶建模和語義推薦兩個方面,基于內(nèi)容模式從用戶模型中識別可能是意外發(fā)現(xiàn)的那些概念并據(jù)此推薦信息[69]。 Symeonidis等[70]將新穎性表示為信息之間的距離,即目標(biāo)信息與用戶以往接收到的信息在所屬類別、文本特征等方面的相似度越低、距離越大,目標(biāo)信息的新穎性就越高,再結(jié)合用戶原本的信息偏好,為其推薦既新穎又可能感興趣的信息。Yokoyama 等[71]針對推特推文提出了“ 新鮮度導(dǎo)向”(freshness-oriented)的推薦方式,首先確定推文所包含的主題,若用戶之前很少接觸到該主題,則認(rèn)為推文具有較高的新鮮度,再根據(jù)用戶的偏好對新鮮度較高的推文進(jìn)行篩選推送。
值得注意的是,意外發(fā)現(xiàn)有助于信息多樣性的提升,同時也導(dǎo)致信息推薦的精準(zhǔn)性下降。為了解決這一問題,Lunardi[72]首先使用內(nèi)部多樣化算法(intra-diversifier) 生成一個候選推薦列表,再將該列表輸入過濾后多樣化算法(post-filtering diversifi‐er) 中得到最終的推薦列表,這樣將信息多樣化和信息過濾兩個過程結(jié)合起來,可以避免單一過程可能帶來次優(yōu)結(jié)果的情況。
盡管Pariser[7]在2011 年提出 “過濾氣泡” 概念時就指出了這一現(xiàn)象的普遍性,但令人意外的是,“過濾氣泡是否真的存在” 仍然是以往研究關(guān)注的重要問題,而且相關(guān)探討得到的結(jié)論出現(xiàn)了相互矛盾的情況。究其原因,這些研究對過濾氣泡的理解存在著明顯的差異,因而采取了不同的研究角度和判斷依據(jù)(見表2)。
在原始的概念表述中,Pariser[7]以搜索引擎為例,將過濾氣泡的產(chǎn)生歸因于個性化推薦算法。很顯然,他認(rèn)為算法并不是憑空存在的,其載體是搜索引擎、社交媒體等網(wǎng)絡(luò)平臺;不同的平臺提供信息的類別、方式、目標(biāo)等不盡相同,相應(yīng)地也會采用不同的算法。也就是說,算法是具有平臺屬性的,可能有的平臺所采用的算法會導(dǎo)致過濾氣泡,而有的卻不會。因此,對于過濾氣泡存在與否,基于不同的平臺得到的結(jié)論不一致是可以理解的。目前,互聯(lián)網(wǎng)資源的豐富性和可訪問性決定了用戶獲取信息的來源絕不是單一的,大多數(shù)人都會接觸到多個種類的網(wǎng)絡(luò)平臺以滿足其各個方面的需求,甚至?xí)谕环N類中同時使用多個平臺以擴(kuò)大信息的覆蓋面。即使單個平臺的算法個性化程度過高,其不利影響是有可能被其他平臺所平衡或消解的,這也是為什么以往面向用戶的相關(guān)研究均認(rèn)為過濾氣泡不存在或被夸大了。這些研究人員所考慮的范圍是用戶所處的整體信息空間,更關(guān)心用戶本身對過濾氣泡的認(rèn)知,而弱化了過濾氣泡與算法之間的關(guān)聯(lián)。
Pariser[7]最初在描繪“ 過濾氣泡” 時曾提到,“過濾氣泡” 是一個人所獨(dú)有的信息世界,并且這個信息世界中缺少異質(zhì)信息。然而之后的部分研究對過濾氣泡的理解在不同程度上逐漸偏離了這兩點(diǎn)。有的研究認(rèn)為,社交媒體上同質(zhì)化的用戶社區(qū)就是過濾氣泡[35],盡管這種用戶社區(qū)的形成離不開個性化推薦算法的作用,但其本質(zhì)上是 “回音室”(echo chambers),因?yàn)榘硕鄠€個體及其之間的緊密關(guān)系[73]。此外,有的研究認(rèn)為,過濾氣泡存在的根本依據(jù)是不同用戶所接觸到的信息具有較大差異,卻忽略了每位用戶自身所接觸到的信息應(yīng)該是很單調(diào)的[34,38]。事實(shí)上,多個用戶的信息差異性和單個用戶的信息多樣性是兩個相互獨(dú)立的變量,不難設(shè)想,在前者差異性很高的情況下,后者的多樣性也可以很高,這樣過濾氣泡是不存在的。
在深入分析了核心概念的初始定義及其理解誤區(qū)后,本研究認(rèn)為,“過濾氣泡” 具有三個基本特征:①過濾氣泡是在網(wǎng)絡(luò)平臺個性化推薦算法的作用下產(chǎn)生的;②每個過濾氣泡內(nèi)部的信息多樣性一定是很低的,且不同過濾氣泡之間的信息差異性有可能很高;③過濾氣泡是一種針對個體的存在,即一個過濾氣泡包裹著一位用戶。
過濾氣泡在減輕信息過載、提供情感和精神支持方面發(fā)揮了一定的積極作用,但對公民話語權(quán)、公共議題討論、健康信息傳播等方面確實(shí)帶來了更為普遍的不利影響。因此,如何有效應(yīng)對過濾氣泡一直都是研究人員關(guān)注的重點(diǎn)。本文第4.3 節(jié)梳理了兩大類應(yīng)對策略,從時間上來看,信息過濾可視化研究主要集中在2015 年以前,而2015 年至今的研究主要圍繞個性化推薦算法優(yōu)化展開,因此,可以通過圖2 表現(xiàn)過濾氣泡應(yīng)對思路的轉(zhuǎn)變。該轉(zhuǎn)變一方面源自計(jì)算機(jī)技術(shù)的發(fā)展、算法設(shè)計(jì)與分析手段日益成熟;另一方面,則源自人們對過濾氣泡問題認(rèn)識的深入,降低其影響只能 “治標(biāo)”,只有破除過濾氣泡或阻斷其形成才能“ 治本”。 當(dāng)然,目前該領(lǐng)域?qū)λ惴▋?yōu)化的探索尚處于初級階段,相關(guān)研究數(shù)量較少、優(yōu)化路徑較為單一,而且僅從技術(shù)角度思考問題,忽略了用戶個體在信息獲取活動中的主體地位。因此,深化推薦算法研究、進(jìn)一步拓寬過濾氣泡應(yīng)對思路應(yīng)該是該領(lǐng)域未來發(fā)展趨勢。
圖2 過濾氣泡應(yīng)對的思路轉(zhuǎn)變過程
鑒于過濾氣泡與個性化推薦算法的密切關(guān)系,深化以 “意外發(fā)現(xiàn)” 機(jī)制為核心的算法改進(jìn)依然是應(yīng)對過濾氣泡的主要手段之一。未來研究可以進(jìn)一步探索如何提高推薦信息的新穎性,也可以考慮在傳統(tǒng)精準(zhǔn)推薦的基礎(chǔ)上,通過調(diào)整排序(reranking)將用戶原本可能會忽視的信息推向更為顯著的位置,或通過反向推薦(modification) 讓用戶看到與之不同的人所不喜歡的信息[74]。此外,在個性化推薦工作中,融入以遞歸神經(jīng)網(wǎng)絡(luò)(recursive neural network)、 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural net‐work)、生成式對抗網(wǎng)絡(luò)(generative adversarial net‐works) 為代表的深度學(xué)習(xí)技術(shù),可以通過學(xué)習(xí)數(shù)據(jù)的潛在特征來捕捉用戶的深層次信息偏好,幫助其豐富個人興趣。
Bozdag[13]指出,信息在流向用戶的過程中會經(jīng)過層層過濾,除了個性化推薦外,信息源選擇與收集、信息選擇與優(yōu)先級排序、信息展示等多個技術(shù)環(huán)節(jié)都會通過相應(yīng)的算法實(shí)現(xiàn)信息的過濾,在不同程度上降低了信息多樣性。此外,該過程中也會發(fā)生人為過濾,不符合個人判斷、組織傾向、政府要求的信息都可能被刪除或拒絕。已有研究表明,在線信息審核(online censorship) 也會導(dǎo)致過濾氣泡的產(chǎn)生[75]。也就是說,過濾氣泡可能是多個環(huán)節(jié)共同作用的結(jié)果,而僅著眼于個性化推薦算法的改進(jìn)是存在局限性的,未來研究應(yīng)該充分考慮信息過濾的過程性,深入各個環(huán)節(jié),有針對性地設(shè)法提升信息多樣性,如豐富信息收集渠道、采用更靈活的信息排序操作、制定系統(tǒng)的信息審核規(guī)范、提供交互性強(qiáng)的信息展示方式等。
互聯(lián)網(wǎng)技術(shù),特別是推薦系統(tǒng)的發(fā)展,導(dǎo)致過濾氣泡問題日益顯著,相關(guān)研究在國外呈逐年遞增趨勢,在國內(nèi)卻由于概念混用而停滯不前。本研究首次采取系統(tǒng)性綜述的方法對國外過濾氣泡的研究成果進(jìn)行分析、整合與展示,以信息行為研究人員的眼光重新審視過濾氣泡的本質(zhì),揭示了過濾氣泡的基本特征,將其與 “信息繭房”“回音室” 等相似概念進(jìn)行初步辨析,以期推動研究人員對過濾氣泡的深入探索,為圖書情報(bào)領(lǐng)域?qū)^濾氣泡的進(jìn)一步研究提供參考。