關(guān)鍵詞、內(nèi)容生成與算法重組的傳播格局

2021-01-08 05:19張入遷

蘇州大學(xué)學(xué)報（哲學(xué)社會科學(xué)版） 2021年2期

全燕張入遷

(廣東外語外貿(mào)大學(xué) 新聞與傳播學(xué)院，廣東廣州 510006)

在以移動終端為中心的智能傳播時代，人類的所有信息行為都會被以數(shù)據(jù)形式存儲下來，海量的用戶信息為算法深度學(xué)習(xí)提供了樣本數(shù)據(jù)，也為傳播活動創(chuàng)造了新的機(jī)遇，于是一種基于算法技術(shù)的新型傳播形態(tài)——算法傳播誕生了。這種新型傳播從內(nèi)容生產(chǎn)、渠道組織、信息傳遞方式等方面都徹底顛覆了傳統(tǒng)的傳播模式，它以算法為綱，依據(jù)用戶關(guān)鍵詞生成定制化內(nèi)容，在進(jìn)行精準(zhǔn)推送的同時記錄用戶的反饋數(shù)據(jù)，并據(jù)此調(diào)整后續(xù)的內(nèi)容生成，從而形成了信息收集、內(nèi)容生成、精準(zhǔn)推送、效果追蹤、內(nèi)容調(diào)控的傳播閉環(huán)，其中，關(guān)鍵詞、內(nèi)容生成建構(gòu)了算法傳播的基本框架。

當(dāng)前算法傳播的研究主要集中在以下幾個方面：一是算法的內(nèi)容生成；(1)參見羅昕《算法媒體的生產(chǎn)邏輯與治理機(jī)制》，載《人民論壇·學(xué)術(shù)前沿》2018年第24期；陳昌鳳,師文《智能算法運用于新聞策展的技術(shù)邏輯與倫理風(fēng)險》，載《新聞界》2019年第1期；劉冰《新聞策展：從內(nèi)容整合展示到智能算法應(yīng)用》，載《中國出版》2019年第22期；彭蘭《增強(qiáng)與克制:智媒時代的新生產(chǎn)力》，載《湖南師范大學(xué)社會科學(xué)學(xué)報》2019年第4期；等等。二是算法的內(nèi)容分發(fā)(2)參見王茜《打開算法分發(fā)的“黑箱”——基于今日頭條新聞推送的量化研究》，載《新聞記者》2017年第9期；喻國明,曲慧《“信息繭房”的誤讀與算法推送的必要——兼論內(nèi)容分發(fā)中社會倫理困境的解決之道》，載《新疆師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2020年第1期；王斌,李宛真《如何戳破“過濾氣泡”算法推送新聞中的認(rèn)知窄化及其規(guī)避》，載《新聞與寫作》2018年第9期；楊保軍,杜輝《智能新聞:倫理風(fēng)險·倫理主體·倫理原則》，載《西北師大學(xué)報(社會科學(xué)版)》2019年第1期；林愛珺,劉運紅《智能新聞信息分發(fā)中的算法偏見與倫理規(guī)制》，載《新聞大學(xué)》2020年第1期；等等。；三是算法傳播的效果(3)參見聶靜虹,宋甲子《泛化與偏見:算法推薦與健康知識環(huán)境的構(gòu)建研究——以今日頭條為例》，載《新聞與傳播研究》2020年第9期；范紅霞,葉君浩《基于算法主導(dǎo)下的議程設(shè)置功能反思》，載《當(dāng)代傳播》2018年第4期；張志安《人工智能對新聞輿論及意識形態(tài)工作的影響》，載《人民論壇·學(xué)術(shù)前沿》2018年第8期；等等。；四是算法對于敘事方式與出版的模式創(chuàng)新(4)參見劉銀娣《從經(jīng)驗到算法:人工智能驅(qū)動的出版模式創(chuàng)新研究》，載《科技與出版》2018年第2期；王思《智能化時代新聞媒體特點與生產(chǎn)模式創(chuàng)新》，載《學(xué)習(xí)與實踐》2019年第1期；等等。。在上述研究中，算法傳播的整個過程被拆解成了多個部分，然而事實上，算法自主形成了一個完整的傳播網(wǎng)絡(luò)，在這個網(wǎng)絡(luò)中，算法不再只是充當(dāng)技術(shù)中介，而是成為一個超級傳播者，它依靠關(guān)鍵詞分析和自動化內(nèi)容生成，獨立完成了以往需要傳播組織內(nèi)部分工協(xié)同的多項工作，而受眾也演變?yōu)橛脩?，作為一個個網(wǎng)絡(luò)節(jié)點嵌入其中，并始終處于受控狀態(tài)。

為了深刻洞察算法重組傳播格局的動力機(jī)制和后果影響，需要從整體上對算法傳播的構(gòu)成和本質(zhì)加以把握。我們認(rèn)為，關(guān)鍵詞選取和內(nèi)容生成的效度是算法傳播取得合法性地位的關(guān)鍵，而對關(guān)鍵詞、內(nèi)容生成進(jìn)行源流考證，并分析它們?nèi)绾伪患{入智能化傳播體系，可以清晰觀察算法重組傳播的過程、邏輯及發(fā)展現(xiàn)狀，由此能夠進(jìn)一步探察算法傳播如何嵌入用戶行為，以及算法帶來傳播格局的裂變是如何改變社會現(xiàn)實的。

一、關(guān)鍵詞：信息生產(chǎn)場域的語義坐標(biāo)

關(guān)鍵詞作為節(jié)點化的用戶數(shù)據(jù)，是算法傳播發(fā)生的基礎(chǔ)，而關(guān)鍵詞最初是作為一個歷史學(xué)的名詞被提出，用來對語言和文化的意義進(jìn)行概括。早在20世紀(jì)初，德國便開啟了使用關(guān)鍵詞的歷史，其研究集中在社會與知識史上起著重要角色的詞匯字典上，被稱為“關(guān)于捕捉短語的研究”(Schlagwortforschung)和“概念的歷史”(Begriffsgeschichte)。[1]1935年，英國語言學(xué)家J.R.Firth提出，社會學(xué)上重要的詞可以被稱為焦點或者關(guān)鍵詞。[2]法語中也有一段很長的關(guān)鍵詞研究歷史，在20世紀(jì)50年代，法國詞典學(xué)家Georges Matoré(1953)討論了關(guān)鍵詞(mots clés)[3]，并認(rèn)為詞匯學(xué)是一門社會學(xué)學(xué)科。20世紀(jì)60年代，米歇爾·福柯(Michel Foucault)延續(xù)了這一傳統(tǒng)，他也有自己喜歡的關(guān)鍵詞，例如勞動、監(jiān)獄、瘋狂等。[4]1976年，雷蒙·威廉斯(Roymond Herry Williams)出版《關(guān)鍵詞：社會與文化的詞匯》一書，通過聚焦工業(yè)、民主、階級、藝術(shù)和文化這5個領(lǐng)域的關(guān)鍵詞，對整個社會的變遷進(jìn)行概括。1996年，英國語言學(xué)家John McHardy Sinclair繼而提出，關(guān)鍵詞可以長期用來作為意義單位的集合，他認(rèn)為語料庫提供了一個強(qiáng)有力的交際行為模型。[5]

除在歷史學(xué)、語言學(xué)、文化學(xué)、社會學(xué)等領(lǐng)域獲得關(guān)注外，關(guān)鍵詞同時也是計算科學(xué)領(lǐng)域的常見概念，并有著較為清晰的關(guān)鍵詞應(yīng)用歷程。1959年，英國倫敦大學(xué)語言學(xué)家夸克(Quirk)建立了英國口語和書面語的“英語用法調(diào)查”(The Survey of English Usage，簡稱SEU)語料庫，標(biāo)志著語料庫向計算機(jī)化發(fā)展，也成為關(guān)鍵詞檢索的元數(shù)據(jù)庫。1961年，以美國的費朗西斯(N.Francis)與捷克斯洛伐克的庫塞拉(H.Kucera)為首的語言學(xué)家和計算機(jī)專家在美國的布朗大學(xué)合作，一起建立了世界上最早的機(jī)讀語料庫，即布朗語料庫(Brown Corpus)。語料庫中的文本分為標(biāo)注文本與未標(biāo)注文本，可以根據(jù)關(guān)鍵詞進(jìn)行檢索，語料庫作為存放語言材料的數(shù)據(jù)庫被用于自然語言處理當(dāng)中。英國語言學(xué)家Mike Scott在1996年開發(fā)出Word Smith Tools軟件，這款軟件使用算法程序，根據(jù)詞語出現(xiàn)的頻率來確定關(guān)鍵詞。20世紀(jì)90年代，計算機(jī)搜索引擎的出現(xiàn)使關(guān)鍵詞成為一個高頻使用的詞語，并頻繁出現(xiàn)在網(wǎng)絡(luò)搜索的工具欄、新聞標(biāo)題、學(xué)術(shù)研究的規(guī)范格式、圖書館編目索引、計算機(jī)情報檢索等處。用戶在搜索框中輸入關(guān)鍵詞檢索內(nèi)容，算法依靠強(qiáng)大的計算能力與分析能力就能將搜索頁面呈現(xiàn)出來的內(nèi)容按照從高到低的權(quán)重進(jìn)行排列。

除搜索引擎、語義庫之外，關(guān)鍵詞也在其他方面使用，例如，當(dāng)用戶在瀏覽網(wǎng)頁、社交媒體、購物App等界面時，算法會對用戶的瀏覽足跡進(jìn)行記錄，并建立一個用戶個人的數(shù)據(jù)庫，緊接著對用戶的數(shù)據(jù)進(jìn)行分析與文本化處理，最后基于用戶自身的信息、網(wǎng)絡(luò)行為及歷史足跡篩選出專屬于用戶的關(guān)鍵詞。關(guān)鍵詞的選擇受到了用戶行為頻次的影響，當(dāng)用戶多次搜索或者瀏覽同一類型的內(nèi)容，算法便會生成相對應(yīng)的用戶關(guān)鍵詞。同時，關(guān)鍵詞也受到用戶差異化網(wǎng)絡(luò)行為的影響，當(dāng)用戶檢索、瀏覽與以往不同的內(nèi)容時，算法會生成新的關(guān)鍵詞。關(guān)鍵詞將用戶網(wǎng)絡(luò)足跡進(jìn)行總結(jié)概括，用戶足跡即從一個持續(xù)性的行為變成了由一個個關(guān)鍵詞組成的節(jié)點。

在互聯(lián)網(wǎng)發(fā)展早期，關(guān)鍵詞主要運用于門戶網(wǎng)站的目錄分類及搜索引擎中。用戶可以在門戶網(wǎng)站分類目錄中選取符合自身需求的子目錄，并在相對應(yīng)的子目錄中獲取自己想要的內(nèi)容。例如在以谷歌、百度為代表的搜索引擎中，用戶可以通過搜索關(guān)鍵詞獲得想要的信息，早期的關(guān)鍵詞也能滿足用戶并不算大的信息需求。隨著大數(shù)據(jù)的到來，用戶被大量冗余信息圍繞，與此同時，基于內(nèi)容的過濾方式與基于喜好的協(xié)同過濾方式也應(yīng)運而生，兩種技術(shù)集合形成了算法推薦系統(tǒng)(Recommender System)，算法推薦系統(tǒng)以用戶自身關(guān)鍵詞標(biāo)簽作為信息半徑，結(jié)合用戶的信息與瀏覽足跡，挑選并推送滿足用戶個性化需求的信息。

我們發(fā)現(xiàn)，算法時代的關(guān)鍵詞生成經(jīng)過了兩次編碼、解碼的過程。首先，算法將用戶足跡進(jìn)行解碼生成原始字節(jié)，再對其進(jìn)行編碼生成用戶數(shù)據(jù)，并儲存在用戶信息庫當(dāng)中。隨后算法進(jìn)行二次編碼，將數(shù)據(jù)進(jìn)行篩選，剔除多余用戶信息后進(jìn)行編碼，生成關(guān)鍵詞。關(guān)鍵詞的生成，是為了實現(xiàn)內(nèi)容的有效傳播，但其“選擇性認(rèn)知”會削弱傳播的信度。這是因為關(guān)鍵詞是由用戶信息、網(wǎng)絡(luò)足跡、心理等多種元素構(gòu)成的，處于底層的算法邏輯是用戶的偏好集合，而這種單一性、同質(zhì)性的邏輯結(jié)構(gòu)與多元化的信息需求相悖。關(guān)鍵詞的偏好性邏輯使算法能夠幫助用戶在日益復(fù)雜的媒體環(huán)境中導(dǎo)航，這種自動導(dǎo)航為算法平臺注入了用戶流量，從而使關(guān)鍵詞成為算法平臺的一個商業(yè)驅(qū)動力。由此可見，關(guān)鍵詞代表著用戶單方面的人格偏好，是對用戶偏向中性、厭惡性的數(shù)據(jù)進(jìn)行后置位排序與剔除之后的單向人格敘述。

經(jīng)過了解碼、編碼而形成的關(guān)鍵詞，包含了能指與所指兩個方面。“在傳播符號中，一個能指的形式可以有多個所指的意義，一個所指的意義也可以有多個能指的實體與之對應(yīng)?！盵6]但是在關(guān)鍵詞中，其能指與所指均為單一語義，在社會語境與情感表現(xiàn)中都表現(xiàn)為單一性偏好。雖然關(guān)鍵詞在用戶不同使用情景下代表不同的含義，但是算法的線性思維無法區(qū)分這些不同的含義，這導(dǎo)致用戶從一個立體的形象被壓縮成了一個個承載用戶足跡的節(jié)點化關(guān)鍵詞。用戶根據(jù)特定關(guān)鍵詞在社交網(wǎng)絡(luò)中形成趣緣、地緣社群，例如微博中的超話便是使用關(guān)鍵詞將具有同一偏好或處于同一地區(qū)的人群聚集在一起，形成社群，而這些社群中又形成了以關(guān)鍵詞為中心的私域流量。例如，快手以主播關(guān)鍵詞作為中心進(jìn)行私域流量聚集，與關(guān)鍵詞相關(guān)聯(lián)的用戶被引流進(jìn)入這個流量域中，并被整合到了一起，形成用戶間交往的場景，增強(qiáng)了圈子的互動性。我們看到，今天的關(guān)鍵詞不僅可以作為標(biāo)簽將相同屬性的用戶連接起來，也可以為內(nèi)容生成提供路徑，由此，一張內(nèi)容生成的網(wǎng)絡(luò)被關(guān)鍵詞建構(gòu)起來。

二、內(nèi)容生成：基于關(guān)鍵詞的語義描述

基于關(guān)鍵詞的內(nèi)容生成是算法傳播主體的構(gòu)成，而內(nèi)容生成的內(nèi)涵也經(jīng)歷了從網(wǎng)絡(luò)傳播到智能化傳播的演變過程。Web1.0時代曾打破了信息的單向傳播，網(wǎng)民的內(nèi)容生成主要集中在門戶網(wǎng)站、論壇等領(lǐng)域，例如天涯、貓撲等論壇的存在就形成了初期的社群傳播，但彼時的內(nèi)容生成僅限于網(wǎng)民間的發(fā)帖互動。Web2.0時代以社交傳播為主，微信、微博等社交媒體崛起，這一時期用戶之間的互動空前活躍，用戶內(nèi)容生成(UGC)作為一個新名詞被提出。與此同時，這個時期的用戶從Web1.0的偏向于“讀”變成了Web2.0的偏向于“寫”，個性化內(nèi)容得以彰顯。而Web3.0是一個強(qiáng)調(diào)智能化的精準(zhǔn)傳播時代，關(guān)鍵詞不僅可以作為搜索引擎、推送程序的文本，也為算法的內(nèi)容生成提供了語義連接點。這一時期，用戶的網(wǎng)絡(luò)數(shù)據(jù)被算法收集分析，算法依據(jù)其人口特征、網(wǎng)絡(luò)行為習(xí)慣、瀏覽內(nèi)容等因素生成節(jié)點化的關(guān)鍵詞，并將同類的具有聯(lián)系的關(guān)鍵詞連接起來形成語義網(wǎng)(Semantic Web)。

語義網(wǎng)這個概念在1988年被萬維網(wǎng)的發(fā)明者蒂姆·博納斯·李(Tim Berners-Lee)提出，研究者將其定義為以Web數(shù)據(jù)為基礎(chǔ)，以機(jī)器可以理解和處理的方式進(jìn)行鏈接所形成的語義網(wǎng)絡(luò)。[7]語義網(wǎng)起到了將關(guān)鍵詞連接起來的作用，并為算法的內(nèi)容生成提供了基礎(chǔ)。首先，語義網(wǎng)為內(nèi)容生成提供了方向，智媒時代強(qiáng)調(diào)的是個性化的內(nèi)容生成，用戶關(guān)鍵詞被語義網(wǎng)聚合起來，形成一張囊括用戶所有特性的網(wǎng)絡(luò)，算法根據(jù)不同用戶的關(guān)鍵詞聚合網(wǎng)絡(luò)，制定不同的內(nèi)容生成策略；其次，語義網(wǎng)也為內(nèi)容生成提供了素材，自Web2.0時代開始，活躍的專業(yè)機(jī)構(gòu)、自媒體會就同一件事情提供不同的視角，算法根據(jù)對事件不同層面的數(shù)據(jù)進(jìn)行語義概括并生成關(guān)鍵詞組，通過語義網(wǎng)勾連的關(guān)鍵詞組能夠協(xié)助勾勒出細(xì)節(jié)更加豐滿的內(nèi)容素材。

而切實的內(nèi)容生成還要取決于由關(guān)鍵詞組成的用戶畫像。一方面，算法通過爬蟲技術(shù)、網(wǎng)絡(luò)日志、平臺數(shù)據(jù)庫收集等手段將用戶網(wǎng)絡(luò)數(shù)據(jù)完整、全面地記錄下來；另一方面，通過物聯(lián)網(wǎng)傳感器(例如智能手環(huán)、智能眼鏡等設(shè)備)，算法也能夠?qū)ΜF(xiàn)實活動領(lǐng)域的數(shù)據(jù)進(jìn)行采集，同時將其與用戶網(wǎng)絡(luò)數(shù)據(jù)相整合，形成“線上+線下”活動領(lǐng)域的融合數(shù)據(jù)。算法依靠用戶的個人網(wǎng)絡(luò)數(shù)據(jù)、社交半徑、時空情景生成極具個人特色、迎合個人喜好的定制化內(nèi)容。但是用戶的閱讀喜好和習(xí)慣并不十分穩(wěn)定，算法需要根據(jù)用戶不同時期的數(shù)據(jù)變化預(yù)測出其需求的轉(zhuǎn)變，以提高內(nèi)容生成的精準(zhǔn)度。而內(nèi)容的定制化使得一些用戶感興趣、喜歡的邊緣性的長尾內(nèi)容的重要性得到了提升，用戶的小眾化需求也能得到滿足。與此同時，用戶的社會化內(nèi)容需求也得到呼應(yīng)，在社會性議題中，語義網(wǎng)同樣對用戶數(shù)據(jù)進(jìn)行關(guān)鍵詞標(biāo)注，附加語義并進(jìn)行連接，算法則根據(jù)語義網(wǎng)推測出實時的熱點話題，如微博熱搜榜便是依靠語義網(wǎng)所標(biāo)注的關(guān)鍵詞集合起來的。另外，社會性議題的內(nèi)容生成也是一種分眾化的內(nèi)容生成模式，算法會根據(jù)用戶的人口特征、行為特征、分布規(guī)律、趣緣特征、心理取向等方面的數(shù)據(jù)標(biāo)注關(guān)鍵詞，并形成語義網(wǎng)，進(jìn)行社會性內(nèi)容的生產(chǎn)。

賓夕法尼亞大學(xué)教授瓦斯(Watts)和康奈爾大學(xué)教授史楚蓋茨(Strogatz)在關(guān)于網(wǎng)絡(luò)結(jié)構(gòu)與知識擴(kuò)散的開拓性研究中提出了“小世界網(wǎng)絡(luò)”的概念，并總結(jié)出兩個特點：一方面是它的本地互動性強(qiáng)、網(wǎng)絡(luò)聚合程度高；另一方面是它也兼具了隨機(jī)網(wǎng)絡(luò)的特點，交往的范圍廣，節(jié)點之間平均路徑較短。[8]我們不妨假設(shè)，用戶身處的就是一個由關(guān)鍵詞構(gòu)成的“小世界網(wǎng)絡(luò)”中，其自身數(shù)據(jù)可以符號化為具有確定性的關(guān)鍵詞，并與隨機(jī)的社會化內(nèi)容的關(guān)鍵詞通過語義網(wǎng)連接起來，而算法的內(nèi)容生成就成為個性化內(nèi)容與社會化內(nèi)容的交織。這種基于不同屬性關(guān)鍵詞語義進(jìn)行內(nèi)容生成的方式被稱為“語義描述”(semantic description)，它具有結(jié)構(gòu)化的特點，即使用具體的框架，生成主題鮮明的內(nèi)容。算法將能夠表述內(nèi)容主題的關(guān)鍵詞放在標(biāo)題與簡介中，使用戶能夠直接根據(jù)這兩者判斷出內(nèi)容主旨。與此同時，算法通常也會將與用戶數(shù)據(jù)相對應(yīng)的關(guān)鍵詞展示出來，以此來吸引用戶的點擊、瀏覽。因此，算法的內(nèi)容生成總體上呈現(xiàn)出標(biāo)題、簡介吸引人，內(nèi)容模板化的特點。算法可以大批量地生成標(biāo)題關(guān)鍵詞與用戶喜好相對應(yīng)的內(nèi)容，這種“語義描述”的內(nèi)容生成方式也會使得“內(nèi)容農(nóng)場”(Content Farm)滋長。

在2006年初，美國Demand Media公司共同創(chuàng)建人羅森·布拉特(Rosenblatt)和肖恩·科洛(Shawn Colo)提出了一種新型創(chuàng)業(yè)公司的想法，后來被人們稱為“內(nèi)容農(nóng)場”，這個創(chuàng)意具體的操作是基于對最流行的網(wǎng)絡(luò)搜索查詢的分析，快速、廉價地創(chuàng)建文章和視頻。[9]內(nèi)容農(nóng)場嵌入在搜索引擎之中，指的是以垃圾內(nèi)容吸引用戶點擊的網(wǎng)站以及賬號。這些網(wǎng)站的經(jīng)營者通過爬蟲技術(shù)確定各大互聯(lián)網(wǎng)平臺的熱點關(guān)鍵詞，然后給撰稿人提供選題，撰稿人需要根據(jù)不同的選題快速產(chǎn)出內(nèi)容。例如臺灣Buzzhand網(wǎng)站，寫手在該網(wǎng)站上發(fā)表內(nèi)容后依靠瀏覽量獲取收益，為了賺取流量，將收益最大化，寫手按照每日熱點生成大量的吸睛、低俗內(nèi)容，并以標(biāo)題關(guān)鍵詞與界面圖片吸引用戶的點擊。隨著客戶端的普及，內(nèi)容農(nóng)場形式出現(xiàn)了“升級”，即由平臺賬號對內(nèi)容農(nóng)場網(wǎng)站進(jìn)行轉(zhuǎn)載，例如Facebook上的“每日健康”賬號就是對內(nèi)容農(nóng)場網(wǎng)站進(jìn)行轉(zhuǎn)載，并配上夸張的標(biāo)題、圖片、視頻，以迎合時下的社會熱點。

而智能化算法技術(shù)使內(nèi)容農(nóng)場的內(nèi)容生產(chǎn)跨入實時化、自動化階段，它能夠根據(jù)各個平臺的熱點抓取關(guān)鍵詞進(jìn)行內(nèi)容生成，例如算法可以快速生成與熱點事件發(fā)酵時不一樣的內(nèi)容，并通過標(biāo)題、簡介、視頻偽裝成事件的最新進(jìn)展，吸引用戶的眼球。算法極大地提高了內(nèi)容農(nóng)場的生產(chǎn)速率與效率，經(jīng)營者不再需要雇傭?qū)懯诌M(jìn)行內(nèi)容寫作，而是直接使用算法進(jìn)行內(nèi)容生成，而不顧內(nèi)容真實性及質(zhì)量的批量生產(chǎn)邏輯會使虛假、垃圾內(nèi)容大量存在，一旦用戶信以為真，便有可能導(dǎo)致謠言的傳播。2017年4月29日，臺灣“COCO大馬”網(wǎng)站使用算法抓取食品健康方面的關(guān)鍵詞“洗腎”，并以此發(fā)布文章《黑心陽春面導(dǎo)致臺灣人洗腎》，該文章引起用戶大量討論，COCOHK、健康新視界、每日健康等網(wǎng)站隨后發(fā)布相關(guān)內(nèi)容，同時通過賬號在Facebook、Twitter等平臺轉(zhuǎn)載，并利用搜索引擎優(yōu)化技術(shù)(Search Engine Optimization)提高該內(nèi)容在各大網(wǎng)站以及客戶端的搜索排名，引發(fā)轟動。該文章是算法的內(nèi)容農(nóng)場網(wǎng)站為了獲取瀏覽量而生成的虛假內(nèi)容，用戶在未認(rèn)清事實真相時產(chǎn)生了第三人效果，抱著寧可信其有、不可信其無的心態(tài)進(jìn)行內(nèi)容轉(zhuǎn)載，進(jìn)一步加劇謠言擴(kuò)散。由此可見，算法在內(nèi)容農(nóng)場上的應(yīng)用會加劇謠言發(fā)生與快速傳播的可能性，當(dāng)社會性事件剛發(fā)生、真相并不確鑿的情況下，算法通過抓取了各類虛假的信息，以此類數(shù)據(jù)生成了虛假內(nèi)容。用戶接觸到大量虛假信息，會產(chǎn)生恐怖，致使謠言叢生，而算法根據(jù)發(fā)酵過的謠言進(jìn)行二次生成，就形成了一個謠言生成的閉環(huán)系統(tǒng)。

由于算法并無法直接控制用戶的行為，所以需要生成符合用戶喜好的內(nèi)容，以吸引其點擊、瀏覽，因此標(biāo)題、內(nèi)容簡介及配圖便很重要。算法擅長識別文本與圖片，因此能夠生成與用戶相對應(yīng)的內(nèi)容。但算法在理解對話及因果關(guān)系這種偏向于邏輯的內(nèi)容上仍然存在很大的不足，所生成的內(nèi)容也會存在邏輯方面的欠缺。此外，算法的內(nèi)容生成是完全依靠自然語言理性所進(jìn)行的活動，缺少了人的感性意識，不過隨著“情緒識別”算法被亞馬遜、百度、微軟、IBM等公司提出并展開研究，算法已經(jīng)可以根據(jù)用戶的面部表情判斷其心情，并以此來調(diào)整后續(xù)程序的運行。我們有理由預(yù)測，未來的算法內(nèi)容生成將會集高效、準(zhǔn)確、客觀、感性等特點于一體，從而實現(xiàn)對個人更加精準(zhǔn)而全面的信息控制。

三、算法重組的傳播格局：基于關(guān)鍵詞和內(nèi)容生成的信息控制

算法以關(guān)鍵詞生成內(nèi)容，依靠語義網(wǎng)將內(nèi)容連接起來，并通過關(guān)鍵詞將用戶與內(nèi)容相勾連，形成一個全新的傳播格局，在這其中，算法集數(shù)據(jù)收集、內(nèi)容生成、信息推送、效果反饋以及算法調(diào)教于一身，幫助形成了一個傳播閉環(huán)。因此可以說，“算法傳播是以大數(shù)據(jù)為基礎(chǔ)，經(jīng)由智能媒體，依靠算法技術(shù)驅(qū)動的傳播，它是在傳播社會學(xué)意義上整體發(fā)生異變的一種傳播形態(tài),它的傳播對象、傳播內(nèi)容、傳播方式、傳播效果等均被納入可計算的框架內(nèi)，形成全新的傳播模式”[10]。而算法傳播依靠互聯(lián)網(wǎng)存在，并隨互聯(lián)網(wǎng)嵌入社會網(wǎng)絡(luò)之中，因此也成為社會重新媒介化的關(guān)鍵力量。

算法傳播是一個依靠數(shù)據(jù)驅(qū)動的自動化過程，它一改傳統(tǒng)傳播組織的科層制結(jié)構(gòu)，由算法獨立承擔(dān)傳播中的多重組織角色。我們看到，算法不僅是傳播者，還是把關(guān)人、生產(chǎn)者、中介、渠道、反饋者等，這使算法傳播脫離了人工干預(yù)，完全實現(xiàn)了傳播的實時、高效與精準(zhǔn)。算法傳播同時也是一個動態(tài)變化的過程，數(shù)據(jù)的反饋使得整個傳播過程一直處在循環(huán)修正之下，為的是更好地迎合用戶的喜好，形塑一個被用戶接納的現(xiàn)實世界，而用戶的認(rèn)知受到算法的影響，其行為習(xí)慣亦在每天的算法推薦內(nèi)容閱讀中養(yǎng)成。這也使我們熟悉的5W傳播模式已經(jīng)不再適用這種新傳播形態(tài)，可以說，算法重組了一個符合智能化傳播規(guī)律的新傳播格局。

在新的傳播格局中，為了保證傳播過程的穩(wěn)定性，消除不確定性，算法統(tǒng)率了整個傳播過程，其中關(guān)鍵詞、內(nèi)容生成在算法邏輯下根據(jù)特定的數(shù)據(jù)形成；精準(zhǔn)推送依據(jù)內(nèi)容關(guān)鍵詞與用戶關(guān)鍵詞之間的匹配度；用戶反饋為下一次算法傳播過程提供調(diào)整指令……可以說，算法傳播以關(guān)鍵詞和內(nèi)容生成為基礎(chǔ)構(gòu)建了一個穩(wěn)定的信息控制模式。而信息控制的實質(zhì)在于對數(shù)據(jù)的控制，通過數(shù)據(jù)控制，用戶被分解成了由關(guān)鍵詞組成的節(jié)點網(wǎng)絡(luò)，算法依據(jù)關(guān)鍵詞語義進(jìn)行內(nèi)容生成與推送。與此同時，算法實時監(jiān)測用戶的動態(tài)，用戶的反饋又將作用于新關(guān)鍵詞的生成，幫助算法學(xué)習(xí)對后續(xù)傳播過程進(jìn)行調(diào)教，至此，一個程序化的傳播閉環(huán)躍然紙上。

此外，算法根據(jù)用戶數(shù)據(jù)生成關(guān)鍵詞，并以此為本進(jìn)行內(nèi)容生成與推送，所依據(jù)的是用戶與互聯(lián)網(wǎng)文本之間的匹配度，若文本標(biāo)題、內(nèi)容關(guān)鍵詞與用戶匹配度較高，就會被算法標(biāo)記推送；反之，則會失去算法可見性。用戶在接收到不同內(nèi)容后，其效果可能會產(chǎn)生分野，即需求得到滿足或者未得到滿足，這期間用戶的瀏覽、分享、評論等行為數(shù)據(jù)均將會被記錄，算法會根據(jù)反饋調(diào)整內(nèi)容生成的模型，若反饋的效果良好，算法會進(jìn)一步固化既定的內(nèi)容生成模型；反之，則會對模型進(jìn)行更新。

我們發(fā)現(xiàn)，算法傳播依靠算法自身驅(qū)動力對信息網(wǎng)絡(luò)中的對象、關(guān)系、屬性、事件、過程進(jìn)行描述，符合拉圖爾提出的“授權(quán)”(delegation)概念，即算法執(zhí)行上述行為的這一過程不需要與人類進(jìn)行互動或額外的知識獲取。拉圖爾將授權(quán)分為四個步驟：翻譯、構(gòu)圖、黑箱、授權(quán)。[11]我們也可以根據(jù)這四個步驟探察算法獲得傳播主體性地位的過程。第一個步驟翻譯即用戶為了達(dá)到某個目的使用技術(shù)的過程，例如當(dāng)用戶想要做一首詩，卻無法獨立完成時，可以將具體的主題輸入給微軟小冰，借助算法生成特定主題詩句，但是結(jié)果不一定會讓用戶滿意。也就是說，當(dāng)技術(shù)參與到用戶的目標(biāo)行動中來時，最初的目標(biāo)可能會被改變，這個階段取決于用戶對于技術(shù)的使用。若是多個用戶與多種技術(shù)相互配合進(jìn)行活動，便需要進(jìn)入第二個步驟——構(gòu)圖，即不同的人與不同的技術(shù)合作負(fù)責(zé)不同的任務(wù)，構(gòu)成一個完整的行動過程，這個階段屬于用戶與技術(shù)的融合。當(dāng)技術(shù)變成產(chǎn)品時，便會出現(xiàn)第三個步驟——黑箱，例如當(dāng)算法被應(yīng)用到今日頭條當(dāng)中時，搜索引擎上所有的行動者會形成一個復(fù)雜的網(wǎng)絡(luò)，這里的行動者意為人類、技術(shù)、觀念等所有物體，在這個由復(fù)雜的網(wǎng)絡(luò)構(gòu)成的黑箱中，用戶與算法之間的聯(lián)合生產(chǎn)變得完全不透明，換句話說，用戶與算法之間的主客體關(guān)系開始模糊化，至此，“授權(quán)”開始發(fā)生。在算法傳播的過程中，隨著算法技術(shù)在數(shù)據(jù)收集、分析，內(nèi)容生成、內(nèi)容推送、效果反饋上的發(fā)展與成熟，算法能夠依靠自身進(jìn)行穩(wěn)定、完整的信息傳播，傳播過程中的不確定性消失，算法從而獲得了“授權(quán)”，即技術(shù)本身能夠完全接管向用戶傳遞信息的任務(wù)，這個時期的算法技術(shù)就完成了從客體到主體的轉(zhuǎn)換。而人的主體性也在算法技術(shù)獲得授權(quán)的過程中逐漸消逝。

眾所周知，傳統(tǒng)的傳播模式會受到傳播過程中噪音的影響，傳播效果也隨之發(fā)生改變，但是算法傳播是一個傳播的閉環(huán)，整個傳播過程的不確定性被排除，這也使傳播效果更趨穩(wěn)定，然而沒有噪音的介入也導(dǎo)致算法控制空前加劇。算法傳播的可計算性、可控性會使人的行為模式簡單化，并按照其預(yù)設(shè)好的內(nèi)容流動的邏輯進(jìn)行行動與反饋，算法以此來影響、控制、改變用戶的認(rèn)知、態(tài)度、行為，而用戶沉浸在算法傳播的擬態(tài)環(huán)境下，也將逐漸被算法馴化。很少有人會關(guān)注整個算法傳播的運行邏輯，這是因為算法對用戶的個性化培養(yǎng)會大幅度削弱用戶對其“黑箱”的質(zhì)疑，這導(dǎo)致算法偏見很多時候并無法被人識別。多倫多大學(xué)研究人員Deborah Raji與麻省理工研究人員Joy Buolamwini在對亞馬遜圖片識別系統(tǒng)Rekognition進(jìn)行研究后指出，該系統(tǒng)在對膚色較深的女性性別進(jìn)行檢測時，其錯誤率比判斷膚色較淺的男性性別高得多[12]，而這些人因檢測結(jié)果錯誤很可能會受到執(zhí)法人員的搜查?？梢?，當(dāng)算法的技術(shù)霸權(quán)增強(qiáng)時，自身帶有的偏見性的識別后果會導(dǎo)致對某些用戶的壓迫與歧視，形成用戶之間的不平等關(guān)系。

算法傳播依靠的是可量化的數(shù)據(jù)，可量化的數(shù)據(jù)的完整度以及質(zhì)量決定了內(nèi)容生成的質(zhì)量，換句話說，用戶的數(shù)據(jù)越是完備，所生成的內(nèi)容就越有質(zhì)量，也更能達(dá)到理想的傳播效果。而這些數(shù)據(jù)絕大部分來源于互聯(lián)網(wǎng)公司，媒體研究者尼克·庫爾德利(Nick Couldry)就將谷歌、亞馬遜、Facebook、百度、阿里巴巴等稱為社會量化部門(social quantification sector)，它們保存用戶每天的日常社會行為，用戶的每一次網(wǎng)絡(luò)點擊都被記錄下來，并轉(zhuǎn)化為可量化的數(shù)據(jù)。[13]能夠生產(chǎn)出更多優(yōu)質(zhì)數(shù)據(jù)的用戶普遍擁有更先進(jìn)的移動設(shè)備，也會更加主動參與到網(wǎng)絡(luò)事務(wù)當(dāng)中，并有更加寬廣的用戶足跡地圖。但還有一部分用戶媒介素養(yǎng)并不足夠，所產(chǎn)生的數(shù)據(jù)的數(shù)量及質(zhì)量無法與擁有優(yōu)質(zhì)數(shù)據(jù)的用戶對等，那么數(shù)字鴻溝就將持續(xù)擴(kuò)大，其結(jié)果是在算法傳播所構(gòu)成的擬態(tài)環(huán)境中形成“數(shù)字階級”(Digital class)。數(shù)字階級中的用戶被算法依據(jù)其提供數(shù)據(jù)的大小、質(zhì)量進(jìn)行劃分，處于更高階級的用戶會獲得更加充足與高質(zhì)量的內(nèi)容，而處于底層的用戶則面臨被垃圾信息、虛假信息所包圍的可能，他們也很難從這種信息繭房中掙脫出來。而算法傳播所形成的數(shù)字階級在很大程度上也是對于現(xiàn)實世界階級的固化。

除了形成數(shù)字鴻溝外，算法傳播還容易導(dǎo)致算法依賴乃至“成癮”。這表現(xiàn)在算法傳播能夠通過信息精準(zhǔn)推送來實現(xiàn)對用戶點擊行為的控制，并影響用戶對于具體事件的態(tài)度、觀點以及相關(guān)內(nèi)容后續(xù)的點擊行為。一方面，算法通過內(nèi)置的許多“先驗假設(shè)”和“限制參數(shù)”來為用戶的生活提供便利，幫助其做出決策[14]，以達(dá)到控制的效果；另一方面，算法還會根據(jù)用戶的經(jīng)驗數(shù)據(jù)進(jìn)行參數(shù)設(shè)置，設(shè)定可以推送與不可以推送內(nèi)容之間的界限，并且往往是以用戶的喜好作為參照。算法推送采取的是“瀑布流”的模式，即當(dāng)用戶閱讀完一則內(nèi)容后，緊接著會為用戶生成下一則內(nèi)容，使人逐漸產(chǎn)生媒介依存癥。這是由于算法作為“技術(shù)多巴胺”，會使用戶在飲用“科技癮品”——自動化生成內(nèi)容的過程中得到了自我滿足。而為了獲得更多的滿足感，用戶會進(jìn)行持續(xù)性內(nèi)容瀏覽，并在此過程中自覺產(chǎn)生積極反饋，持續(xù)為算法的深度學(xué)習(xí)飼喂數(shù)據(jù)，用戶的行為就這樣在無形中被算法操控。而當(dāng)用戶感覺到在算法平臺中可以獲得滿足感與快樂，且獲得這些感受的時間由自己控制，他們在算法平臺上逗留的時間和頻率也會大大增加，這被稱為“變率強(qiáng)化”(Variable Ratio Reinforcement)。[15]在這種機(jī)制的作用下，用戶注意力被算法平臺吸引，耗費過多精力于網(wǎng)絡(luò)世界后，難以從中抽離；而固化的內(nèi)容又會強(qiáng)化用戶的單一性思維，思考也隨之減少，導(dǎo)致無論在線上和線下，用戶都變得越來越像一個模式化的機(jī)器人。

在算法傳播過程中，用戶越依賴算法，算法的學(xué)習(xí)能力就會越強(qiáng)；而通過算法調(diào)教，用戶受控程度也會越深。當(dāng)算法根據(jù)用戶停留時長、評論、轉(zhuǎn)發(fā)分享等形式的反饋判定用戶需求被滿足時，會形成一種正向的反饋，帶有用戶原有關(guān)鍵詞的內(nèi)容被重復(fù)收集，原有用戶畫像被進(jìn)一步固化，算法的生成內(nèi)容會朝著偏好這一極端的方向走去；而當(dāng)算法判斷用戶需求未被滿足時，就會對原有的關(guān)鍵詞進(jìn)行重新排序，并根據(jù)用戶最新數(shù)據(jù)更新關(guān)鍵詞，修改用戶畫像并調(diào)整內(nèi)容生成的策略與方向。由此可見，算法傳播自動化生成與反饋相互作用、彼此影響，整個傳播過程處于實時更新的循環(huán)鏈當(dāng)中，隨著用戶數(shù)據(jù)的變化，算法能夠智能化地改變傳播的各個環(huán)節(jié)，迎合用戶各個階段的個性化需求。例如在傳播效果反饋階段，無論是瀏覽、評論還是轉(zhuǎn)發(fā)，都需要耗費時間，因此用戶在算法推薦頁面停留時間是算法進(jìn)行預(yù)測的不可或缺的一項指標(biāo)，為了盡量延長用戶的停留時間，算法會習(xí)得用戶喜好，推薦個性化的吸睛內(nèi)容，以此吸引用戶的注意力。這里值得強(qiáng)調(diào)的一點是，由于算法與用戶之間的互動是通過中介數(shù)據(jù)進(jìn)行的，所以算法得到的反饋并非完全為用戶是否得到滿足的真實反映，而可能只是用戶在內(nèi)容界面的行為信息，這也就是說用戶行為數(shù)據(jù)經(jīng)過語義描述所表達(dá)的意義并不一定符合用戶內(nèi)心真正想要表達(dá)的含義。但這并不妨礙算法繼續(xù)學(xué)習(xí)，只要用戶持續(xù)產(chǎn)生數(shù)據(jù)，傳播內(nèi)容和傳播效果就會無限接近個性化傳播的最優(yōu)狀態(tài)。

媒介學(xué)者馬歇爾·麥克盧漢(Marshall McLuhan)在《理解媒介——論人的延伸》中曾提出了“內(nèi)爆”(Implosion)的概念，他認(rèn)為，電力技術(shù)的應(yīng)用加速了媒介的發(fā)展，塑造了“內(nèi)爆”的環(huán)境，打破機(jī)械時代的時空距離。此后社會學(xué)者讓·鮑德里亞(Jean Baudrillard)發(fā)展了這個概念，他眼中的“內(nèi)爆”可以消除虛擬與現(xiàn)實之間的界限。在如今的算法傳播時代，現(xiàn)實與虛擬的界限被打破，算法制造的信息符號是我們賴以認(rèn)識世界的主要手段，通過虛擬的信息符號，算法可以建構(gòu)一個“仿真”的虛擬世界，進(jìn)而產(chǎn)生鮑德里亞所說的“超真實”的幻境。這種擬態(tài)環(huán)境使用戶具有身臨其境的感受，產(chǎn)生心理滿足感，并影響自身行為。但正如鮑德里亞所擔(dān)心的，“當(dāng)媒介在人與社會之間、人與人之間把任何互動通通內(nèi)爆為一個平面，內(nèi)爆為一個單向度的時空現(xiàn)實之際，整個社會交往和社會價值都被瓦解了”[16]。某種程度而言，算法傳播正依靠其無遠(yuǎn)弗屆的網(wǎng)絡(luò)建立了一個“內(nèi)爆”的社會，一方面，用戶在算法傳播所建造的擬態(tài)環(huán)境中成為數(shù)據(jù)的提供者以及被算法飼喂的個體，并被算法所推送的偏好性內(nèi)容所麻痹；另一方面，用戶被算法困在依靠自己網(wǎng)絡(luò)數(shù)據(jù)所建立起來的超級全景監(jiān)獄中，其在網(wǎng)絡(luò)中的交往行動潛移默化地受到了算法控制，而在超級全景監(jiān)獄的凝視中，用戶的價值觀也逐漸被算法型塑。

算法傳播使人在傳播活動中全面退讓，并將傳播的權(quán)力交給了智能算法，這雖能使人們從大數(shù)據(jù)潰決中獲得局部解放，但這種退讓也將人的主體性轉(zhuǎn)移給了算法。用戶在與算法的對話過程中，話語權(quán)會隨之降低，這也是算法傳播可以通過信息傳播控制社會的一個重要原因?？梢燥@見的是，整個傳播過程并非按照人的思維進(jìn)行運作，而是依靠代碼中內(nèi)嵌的邏輯，形成以個性化為中心的傳播格局，并在閉環(huán)式的運行中逐步窄化、私域化、商業(yè)化。受高度個性化的算法傳播影響，現(xiàn)實社會無疑也將面臨共識分裂、階層固化的風(fēng)險。

四、結(jié)語

就算法傳播的現(xiàn)狀來看，關(guān)鍵詞、內(nèi)容生成都是依靠網(wǎng)絡(luò)數(shù)據(jù)中概括出來的語義運行，而包含在數(shù)據(jù)中個人與社會情緒、心理、屬性、關(guān)系等，還無法輕易通過語義表述的層面被篩選過濾，然而解決這個矛盾似乎只是時間問題。2005年，美國未來學(xué)家雷·庫茲韋爾(Ray Kurzweil)在其著作《奇點臨近》(The Singularity Is Near)中做出預(yù)測，科學(xué)技術(shù)的發(fā)展將在2045年迎來“奇點”。[17]如果奇點真正來臨，人工智能將超過人類，用戶的數(shù)據(jù)就能夠完全被算法所理解。也許就在不久的未來，算法不再需要像現(xiàn)在一樣，必須通過分析在線數(shù)據(jù)預(yù)測現(xiàn)實世界的變動，而是能夠基于未經(jīng)加工與轉(zhuǎn)述的原始數(shù)據(jù)，精確生成關(guān)鍵詞與內(nèi)容，整個算法傳播系統(tǒng)也不再局限于滿足用戶偏好的邏輯，而是能夠根據(jù)用戶所處的場景進(jìn)行實時調(diào)整。到那時，算法傳播實現(xiàn)了與真實世界傳播的無縫契合，或?qū)⒊蔀槟軌蛘嬲凉M足人們需求的傳播形態(tài)。

然而當(dāng)算法進(jìn)化到比我們更懂得傳播法則，更懂人心的時刻，真實世界里的交流是否會逐漸萎縮？傳播的真諦是否從此改變？當(dāng)算法控制的“全球腦”(Global Brain)被掌握在占有數(shù)據(jù)最多的超級國家或寡頭互聯(lián)網(wǎng)公司，平臺帝國主義(Platform Imperialism)是否會成為新地緣政治中世界霸權(quán)的新形態(tài)？算法重組的傳播格局在未來具有無限發(fā)展的可能性，同時也蘊(yùn)含著巨大的發(fā)展風(fēng)險，無論如何，如何使智能化傳播朝著使世界更加美好的趨勢發(fā)展是我們應(yīng)該思考的問題，也是需要努力去實現(xiàn)的愿景。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

關(guān)鍵詞、內(nèi)容生成與算法重組的傳播格局

一、關(guān)鍵詞：信息生產(chǎn)場域的語義坐標(biāo)

二、內(nèi)容生成：基于關(guān)鍵詞的語義描述

三、算法重組的傳播格局：基于關(guān)鍵詞和內(nèi)容生成的信息控制

四、結(jié)語

一、關(guān)鍵詞：信息生產(chǎn)場域的語義坐標(biāo)

二、內(nèi)容生成：基于關(guān)鍵詞的語義描述

四、結(jié)語