中國互聯(lián)網(wǎng)絡信息中心發(fā)布的《第38次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示,基于用戶興趣的算法分發(fā)逐漸成為網(wǎng)絡新聞主要的分發(fā)方式。面對信息分發(fā)權力從人工編輯向智能算法的轉移和讓渡,學者圍繞算法的社會權力問題展開了深入討論,并提出“算法即權力”[1]、“媒介即算法”[2]等觀點。
隨著研究的深入,學者提出了不同看法,認為算法并不是孤立的決定性因素,而是處于一個由“規(guī)則、人、物、過程和資源”所構成的網(wǎng)絡中不可分割的一部分。[3]米歇爾·威爾森(Michele Willson)指出,算法內嵌于一個更廣大的生態(tài)系統(tǒng)之中,這個系統(tǒng)既包括技術——軟件、代碼、平臺和基礎設施,也包括人類的設計、意圖、用戶和使用。[4]因此,算法需要被放置于其所處的社會技術集合中進行分析,而用戶是集合的重要組成部分。
延續(xù)此思路,泰娜·布赫(Taina Bucher)強調,算法的社會權力來自人與算法之間循環(huán)的力量關系(force-relations),算法想象,即人們想象、認知和經(jīng)驗算法的方式,會影響實際的媒介使用和消費。[5]塔爾頓·吉萊斯皮(Tarleton Gillespie)以“占領華爾街”未登上推特“熱門話題”所引發(fā)的爭議為例,指出“在我們認為算法是什么、我們需要算法是什么,以及算法實際上是什么之間存在著張力關系?!盵6]圍繞“算法是什么”的問題,國內已經(jīng)涌現(xiàn)出較為豐富的研究成果,學者考察了平臺媒體的算法推薦機制、算法價值觀念等。然而中國語境下有關算法想象——“我們認為算法是什么”以及“我們需要算法是什么”——的學術成果尚不多見。
為了彌補國內算法研究用戶視角的缺失,本文試圖以微博“熱搜”為例,探討用戶對社會化媒體的算法想象。
2018年初,北京市網(wǎng)絡信息辦公室約談微博,要求其對“熱搜”等功能下線一周進行整改。此次整改為本研究的開展提供了契機:用戶對“熱搜”算法有怎樣的認知、評價和期待?用戶認為哪些內容應當/不應當上“熱搜”?面對算法系統(tǒng),用戶并不是被動的、缺乏抵抗力的,而是會運用實踐的藝術、巧妙的計謀和抵制的策略來將其納入日常生活實踐。[7]探究上述問題有助于我們更好地理解算法社會權力的復雜性。
根據(jù)微博發(fā)布的《微博熱搜榜2016產品報告》,“微博熱搜榜是全網(wǎng)最實時最權威的熱點排行榜,依據(jù)用戶的真實搜索量,呈現(xiàn)最新鮮、最熱門、最有料的資訊?!北疚倪x取微博“熱搜”作為研究對象,原因有二:
其一,“熱搜”功能是算法分發(fā)模式在社會化媒體的典型應用。西方傳播學界圍繞臉書、推特的“熱門話題”功能已經(jīng)開展了深入討論,中國語境下的相關研究有助于我們更好地理解算法的內嵌性,即算法在不同語境下的社會建構。
其二,“熱搜”在引導公共討論和流行文化方面發(fā)揮著重要作用。微博“熱搜”常常被認為是用戶關注和討論的“晴雨表”和“風向標”,其度量指標(metrics)日益成為一套對議題流行度和人物影響力進行測量、排序的合法化標準。[8]根據(jù)《微博熱搜榜2016產品報告》,用戶每日主動搜索2.5億次,引導1.35億搜索熱度,每人日均搜索超過12次。
如前所述,2018年初,微博“熱搜”功能下線一周進行整改,下線時間從1月27日21時至2月3日21時?!盁崴选毕戮€的一周,為用戶集中表達意見和觀點提供了契機。通過對相關討論話語進行深度挖掘,可以探知用戶對“熱搜”算法的認知、評價和期待。需要指出的是,多數(shù)用戶并不了解“熱搜”背后是算法在進行自動化地信息分發(fā),本文所探討的“算法想象”,更多是用戶對“熱搜”上榜規(guī)則的想象。
2018年4月19日,筆者請技術人員使用爬蟲軟件爬取了整改期間用戶發(fā)布的所有包含關鍵詞“熱搜榜”“整改”的微博內容,共獲取7719條。隨后對獲取結果進行了人工清理,剔除以下兩類內容:
第一類是包含關鍵詞但是與研究主題無關的微博,包括商業(yè)宣傳類、粉絲聲援類(如“黑我冪的那些人看你們以后怎么買熱搜榜黑她”)、個人情緒表達類(如包含不文明語言的微博)。在清理過程中,筆者發(fā)現(xiàn)所爬取的微博中有大量包含“#熱搜榜等版塊暫時下線整改#”話題,但是與研究主題無關的微博,例如“#熱搜榜等版塊暫時下線整改#新戰(zhàn)國七雄!我是齊國,你呢?”。
第二類是機構發(fā)布的純新聞內容或互動內容,包括媒體(如《中國日報》、澎湃新聞)、高校(如暨南大學團委、成理工程新鮮事兒)、商業(yè)組織(如璞拾婚紗攝影)。經(jīng)清理,最終獲取1863條有效微博。
基于對1863條有效微博的文本分析,筆者將用戶對微博“熱搜”的算法想象歸類分析如下:
第一類認同“熱搜”現(xiàn)有的算法分發(fā)模式,表達了對“熱搜”功能的依賴,以及對其下線整改的不適應。以下是用戶發(fā)布的較為典型的微博:“微博熱搜榜整改我像是與世隔絕,啥事都是后知后覺”,“熱搜榜整改的第一天,嚴重感覺到信息流通的滯慢”。
經(jīng)過詞頻分析,“想它”“想你”或“想念”共出現(xiàn)40次,“錯過”共出現(xiàn)34次,“與世隔絕”共出現(xiàn)28次,“慌”共出現(xiàn)23次,“不適應”“無從適應”則出現(xiàn)了11次。借用米切爾·斯蒂芬斯(Mitchell Stephens)的論述,“熱搜”下線損壞了用戶渴望新聞的“社會知覺”,其帶來的饋贈“不是關于特定事件的特定信息,而是能知覺‘任何’重大、有趣之事的信心。新聞……是一種意識,一種安全感?!盵9]
研究發(fā)現(xiàn),一部分用戶強烈依賴“熱搜”為其篩選信息和設置議程。例如,一位網(wǎng)民指出,“沒有‘熱搜’,感覺像是去吃飯沒有菜單一樣?!薄盁崴选北澈蟮乃惴ǜ鶕?jù)提前設定好的價值觀念,對搜索詞進行數(shù)據(jù)化、自動化、程序化地處理,然后以排行榜的方式供用戶瀏覽和點擊。在這個過程中,復雜的現(xiàn)實世界被轉化為了井然有序的信息條目。算法通過對信息條目進行收納、過濾和排名,決定哪些話題可以成為公眾關注的焦點,而哪些話題瞬間淹沒在信息的汪洋大海。根據(jù)議程設置理論,媒體對話題賦予的結構秩序將影響人們對其顯著性的認知和判斷。
第二類質疑和批評“熱搜”的分發(fā)模式,指出現(xiàn)存問題,并提出具體的整改意見和建議。用戶集中反映的問題如下:
其一,花錢買“熱搜”、撤“熱搜”,以及炒作、水軍、營銷號泛濫。正如尤爾根·哈貝馬斯所指出的,“那種僅僅由于暗中注入金錢或組織權力才能造成的公共意見,一旦這種社會權力來源昭示于眾,其可信性立刻就會化為烏有……公共領域是不能隨意‘制造’的?!盵10]如今,算法對公共領域的形塑成為西方學界討論的熱門話題之一。例如,2013年紐約大學召開了主題為“算法是公共領域信息流動的仲裁者嗎?”的學術會議,而漢堡大學則建立“算法化公共領域”(algorithmed public sphere)博士后研究網(wǎng)絡。
算法并非在真空中純技術性地運行,“買熱搜”“撤熱搜”背后是多個權力博弈主體的盤根錯節(jié)。盡管“熱搜”不是嚴格意義上的公共領域,但它發(fā)揮著沃爾特·李普曼(Walter Lippmann)所說的“聚光燈”和“探照燈”的作用,對人、物、話題的可見度(visibility)進行分配,在形塑公共討論方面發(fā)揮著重要作用。因此,作為信息流動仲裁者的算法不僅要滿足商業(yè)目標,還要承擔一定的社會責任。如一位用戶所言,“我也希望熱搜干干凈凈公公正正,多點陽光多點公平多點透明。”用戶期待一個免受金錢和組織權力干預的“熱搜”。
其二,明星瑣事霸占榜單。根據(jù)“微博熱搜榜”發(fā)布的報告,“熱搜榜”的主要內容集中在以下四個方面:娛樂類新聞資訊(明星動態(tài)、圈內八卦)占比34%,非娛樂類新聞資訊(時事新聞、社會事件、財經(jīng)新聞、體育新聞)占比27%,新生事物(數(shù)碼新品、美妝潮流、網(wǎng)紅新詞、熱議段子)占比25%,而影視綜藝(熱門電影、熱播電視劇、火爆綜藝)的占比為13%。娛樂性質的內容占據(jù)了主導地位,而嚴肅議題則處于邊緣化的狀態(tài)。
用戶表達了對明星霸占公共注意力資源的不滿。筆者爬取的一條微博較有代表性:“整天都在關注些明星,八卦,出軌,婚變,其實我們是被綁架的,我們更希望看到關于世界的,國家的,民生的,進步的,有價值的!”
針對上述問題,用戶主要提出了以下建議和意見:傳播正能量,反映人民群眾的真實關切;提高“熱搜”的公平性、公正性和真實性;整改其他相關問題,如強制關注、網(wǎng)絡暴力、謠言等。
第三類集中討論了政治權力對“熱搜”算法的規(guī)訓。針對此次整改,用戶的評論多以贊揚為主,如“給力”“喜大普奔”“瘋狂打call”“期待成果”“改頭換面”“大快人心”等,并有不少用戶懷念早期的“熱搜”,認為以前更為純粹和有看頭,內容多樣化且排名較為公正。
也有少部分用戶表達了對整改可能帶來的言論限制、信息審查、宣傳色彩過濃等問題的擔憂。用戶使用了諸如“新聞聯(lián)播”“太平盛世”“粉紅色”“主旋律”等表述來抵抗政策干預?!盁崴选彼l(fā)揮的社會動員、信息匯聚、輿論監(jiān)督等功能被這部分用戶突出強調。以下是較為典型的微博:“熱搜被整改是不是意味著新聞聯(lián)播里的生活即將來臨?”,“不該熱搜的可能確實下去了,但該熱搜的恐怕也更難上去了。” 包裹著技術的外衣,算法生成結果看起來渾然天成且不可避免。信息控制從明處走向了暗處,變得更加隱蔽,且難以察覺。
有學者提出算法新聞學研究的六種社會學路徑:政治和公共政策視角、經(jīng)濟視角、制度和場域視角、組織動力學視角、文化-歷史視角以及技術與新聞視角。其中,第一種路徑關注新聞業(yè)所處的政治情境,尤其是“公共政策決定如何促進或限制算法新聞的發(fā)展”。[11]面對政治權力的規(guī)訓,整改后的微博“熱搜”開始將導向正確納入算法價值要素,包括上線“新時代”版塊,優(yōu)先推薦正能量內容(如弘揚家庭和諧、愛崗敬業(yè)、友善互助、自強不息等中國傳統(tǒng)價值觀念的內容)。[12]
用戶也對此次整改的原因進行了討論和猜測,其中,“紫光閣地溝油”事件被認為是此次微博產品下線整改的導火索。2018年初,中共中央國家機關工作委員會《紫光閣》雜志社連發(fā)三條微博,批評嘻哈歌手PG one的歌詞低俗、教唆吸毒、侮辱女性。PG one的粉絲誤認為紫光閣是一家飯店,于是雇傭水軍刷“紫光閣地溝油”的話題,使其登上微博實時“熱搜”榜單。該事件成為用戶質疑“熱搜”真實性和公正性的典型案例。
值得指出的是,有少部分用戶意識到了“熱搜”背后算法所發(fā)揮的重要作用。例如,筆者爬取的一條微博的內容是:“熱搜榜被整改說白了就是準備換新算法,有些事能上有些事就不能上?!?可以預見的是,隨著算法分發(fā)逐漸成為主要的信息分發(fā)方式,用戶的算法素養(yǎng)也將逐漸提高。整體而言,此次整改促進了有關“熱搜”上榜規(guī)則的公共討論和思考,而對相關討論話語的深度挖掘有助于我們探知用戶對社會化媒體算法的認知、評價與期待。
本文以微博“熱搜”為研究對象,探討了用戶對社會化媒體的算法想象。研究發(fā)現(xiàn),“熱搜”發(fā)揮著重要的議程設置功能,網(wǎng)民對其批評主要集中在金錢干預、人民的聲音被邊緣化、上榜規(guī)則缺乏透明性和公平性。無論是西方的“占領華爾街”話題未登上推特“熱門話題”,還是中國的“紫光閣地溝油”登上微博“熱搜”,都引發(fā)了公眾的廣泛質疑。長此以往,榜單的公信力也將消失殆盡。由此可見,用戶想象、認知和經(jīng)驗算法的方式會影響具體的媒介使用和消費。因此,平臺媒體必須處理好“實際采用什么樣的算法”和“用戶想要什么樣的算法”之間的張力關系,而本文代表了對這種張力關系的初探,具有一定的學術價值。
學者在《理解社會化媒體邏輯》一文中指出,算法的權力主要體現(xiàn)在編程性(programmability):一方面是社會化媒體平臺刺激和引導用戶進行創(chuàng)造性或溝通性貢獻的能力;另一方面是用戶通過與這些被編碼的情境互動,轉而影響平臺信息流的能力。[13]楊保軍也認為,“算法即權力”的說法略有夸張,算法體現(xiàn)的不僅是技術的權力,還是其背后不同社會主體(包括創(chuàng)造算法的人、社會大眾)的權力。[14]通過對微博“熱搜”算法想象的研究,本文提供了思考算法社會權力的用戶視角,拓展了算法研究的視野。
此外,“熱搜”不僅是關于最新事實的信息交流活動,它同時也是時代精神的重要呈現(xiàn)窗口。自2020年3月1日起開始施行的《網(wǎng)絡信息內容生態(tài)治理規(guī)定》將“熱搜”列為重點環(huán)節(jié)。第十一條和第十二條指出,網(wǎng)絡信息內容服務平臺應當堅持主流價值導向,優(yōu)化信息推薦機制,加強版面頁面生態(tài)管理。當“熱搜”主要為明星瑣事、八卦娛樂提供展示舞臺,看臺上人們的精神世界也一定是浮躁荒蕪、百無聊賴。
學者指出,使用算法和大數(shù)據(jù)來識別公共議題帶來了公共領域新的結構轉移,“我們面臨的首要問題是理清哪些人、哪些話題在結構轉移中被邊緣化了?!盵15]當互聯(lián)網(wǎng)公共空間上哪些話題“熱門”、哪些話題“邊緣”越來越依賴算法來進行仲裁,學者需要對算法進行密切審視和調查,進而推動算法為人民的公共利益和民主生活服務。從這個方面來說,研究“熱搜”及其背后的算法也具有重要的社會價值。
最后,本研究尚存在一些不足,本文所爬取的微博并不能確保毫無疏漏。一方面,微博數(shù)據(jù)本身也存在被過濾、被刪除的問題;另一方面,也存在用戶使用策略性表達來避免發(fā)布內容被爬蟲軟件抓取的情況。未來研究可以通過問卷調查、焦點小組等研究方法,進一步豐富用戶視角下的算法研究。