国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)鍵詞、內(nèi)容生成與算法重組的傳播格局

2021-01-08 05:19張入遷
關(guān)鍵詞:語義算法內(nèi)容

全 燕 張入遷

(廣東外語外貿(mào)大學(xué) 新聞與傳播學(xué)院,廣東 廣州 510006)

在以移動終端為中心的智能傳播時代,人類的所有信息行為都會被以數(shù)據(jù)形式存儲下來,海量的用戶信息為算法深度學(xué)習(xí)提供了樣本數(shù)據(jù),也為傳播活動創(chuàng)造了新的機(jī)遇,于是一種基于算法技術(shù)的新型傳播形態(tài)——算法傳播誕生了。這種新型傳播從內(nèi)容生產(chǎn)、渠道組織、信息傳遞方式等方面都徹底顛覆了傳統(tǒng)的傳播模式,它以算法為綱,依據(jù)用戶關(guān)鍵詞生成定制化內(nèi)容,在進(jìn)行精準(zhǔn)推送的同時記錄用戶的反饋數(shù)據(jù),并據(jù)此調(diào)整后續(xù)的內(nèi)容生成,從而形成了信息收集、內(nèi)容生成、精準(zhǔn)推送、效果追蹤、內(nèi)容調(diào)控的傳播閉環(huán),其中,關(guān)鍵詞、內(nèi)容生成建構(gòu)了算法傳播的基本框架。

當(dāng)前算法傳播的研究主要集中在以下幾個方面:一是算法的內(nèi)容生成;(1)參見羅昕《算法媒體的生產(chǎn)邏輯與治理機(jī)制》,載《人民論壇·學(xué)術(shù)前沿》2018年第24期;陳昌鳳,師文《智能算法運用于新聞策展的技術(shù)邏輯與倫理風(fēng)險》,載《新聞界》2019年第1期;劉冰《新聞策展:從內(nèi)容整合展示到智能算法應(yīng)用》,載《中國出版》2019年第22期;彭蘭《增強(qiáng)與克制:智媒時代的新生產(chǎn)力》,載《湖南師范大學(xué)社會科學(xué)學(xué)報》2019年第4期;等等。二是算法的內(nèi)容分發(fā)(2)參見王茜《打開算法分發(fā)的“黑箱”——基于今日頭條新聞推送的量化研究》,載《新聞記者》2017年第9期;喻國明,曲慧《“信息繭房”的誤讀與算法推送的必要——兼論內(nèi)容分發(fā)中社會倫理困境的解決之道》,載《新疆師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2020年第1期;王斌,李宛真《如何戳破“過濾氣泡”算法推送新聞中的認(rèn)知窄化及其規(guī)避》,載《新聞與寫作》2018年第9期;楊保軍,杜輝《智能新聞:倫理風(fēng)險·倫理主體·倫理原則》,載《西北師大學(xué)報(社會科學(xué)版)》2019年第1期;林愛珺,劉運紅《智能新聞信息分發(fā)中的算法偏見與倫理規(guī)制》,載《新聞大學(xué)》2020年第1期;等等。;三是算法傳播的效果(3)參見聶靜虹,宋甲子《泛化與偏見:算法推薦與健康知識環(huán)境的構(gòu)建研究——以今日頭條為例》,載《新聞與傳播研究》2020年第9期;范紅霞,葉君浩《基于算法主導(dǎo)下的議程設(shè)置功能反思》,載《當(dāng)代傳播》2018年第4期;張志安《人工智能對新聞輿論及意識形態(tài)工作的影響》,載《人民論壇·學(xué)術(shù)前沿》2018年第8期;等等。;四是算法對于敘事方式與出版的模式創(chuàng)新(4)參見劉銀娣《從經(jīng)驗到算法:人工智能驅(qū)動的出版模式創(chuàng)新研究》,載《科技與出版》2018年第2期;王思《智能化時代新聞媒體特點與生產(chǎn)模式創(chuàng)新》,載《學(xué)習(xí)與實踐》2019年第1期;等等。。在上述研究中,算法傳播的整個過程被拆解成了多個部分,然而事實上,算法自主形成了一個完整的傳播網(wǎng)絡(luò),在這個網(wǎng)絡(luò)中,算法不再只是充當(dāng)技術(shù)中介,而是成為一個超級傳播者,它依靠關(guān)鍵詞分析和自動化內(nèi)容生成,獨立完成了以往需要傳播組織內(nèi)部分工協(xié)同的多項工作,而受眾也演變?yōu)橛脩?,作為一個個網(wǎng)絡(luò)節(jié)點嵌入其中,并始終處于受控狀態(tài)。

為了深刻洞察算法重組傳播格局的動力機(jī)制和后果影響,需要從整體上對算法傳播的構(gòu)成和本質(zhì)加以把握。我們認(rèn)為,關(guān)鍵詞選取和內(nèi)容生成的效度是算法傳播取得合法性地位的關(guān)鍵,而對關(guān)鍵詞、內(nèi)容生成進(jìn)行源流考證,并分析它們?nèi)绾伪患{入智能化傳播體系,可以清晰觀察算法重組傳播的過程、邏輯及發(fā)展現(xiàn)狀,由此能夠進(jìn)一步探察算法傳播如何嵌入用戶行為,以及算法帶來傳播格局的裂變是如何改變社會現(xiàn)實的。

一、關(guān)鍵詞:信息生產(chǎn)場域的語義坐標(biāo)

關(guān)鍵詞作為節(jié)點化的用戶數(shù)據(jù),是算法傳播發(fā)生的基礎(chǔ),而關(guān)鍵詞最初是作為一個歷史學(xué)的名詞被提出,用來對語言和文化的意義進(jìn)行概括。早在20世紀(jì)初,德國便開啟了使用關(guān)鍵詞的歷史,其研究集中在社會與知識史上起著重要角色的詞匯字典上,被稱為“關(guān)于捕捉短語的研究”(Schlagwortforschung)和“概念的歷史”(Begriffsgeschichte)。[1]1935年,英國語言學(xué)家J.R.Firth提出,社會學(xué)上重要的詞可以被稱為焦點或者關(guān)鍵詞。[2]法語中也有一段很長的關(guān)鍵詞研究歷史,在20世紀(jì)50年代,法國詞典學(xué)家Georges Matoré(1953)討論了關(guān)鍵詞(mots clés)[3],并認(rèn)為詞匯學(xué)是一門社會學(xué)學(xué)科。20世紀(jì)60年代,米歇爾·福柯(Michel Foucault)延續(xù)了這一傳統(tǒng),他也有自己喜歡的關(guān)鍵詞,例如勞動、監(jiān)獄、瘋狂等。[4]1976年,雷蒙·威廉斯(Roymond Herry Williams)出版《關(guān)鍵詞:社會與文化的詞匯》一書,通過聚焦工業(yè)、民主、階級、藝術(shù)和文化這5個領(lǐng)域的關(guān)鍵詞,對整個社會的變遷進(jìn)行概括。1996年,英國語言學(xué)家John McHardy Sinclair繼而提出,關(guān)鍵詞可以長期用來作為意義單位的集合,他認(rèn)為語料庫提供了一個強(qiáng)有力的交際行為模型。[5]

除在歷史學(xué)、語言學(xué)、文化學(xué)、社會學(xué)等領(lǐng)域獲得關(guān)注外,關(guān)鍵詞同時也是計算科學(xué)領(lǐng)域的常見概念,并有著較為清晰的關(guān)鍵詞應(yīng)用歷程。1959年,英國倫敦大學(xué)語言學(xué)家夸克(Quirk)建立了英國口語和書面語的“英語用法調(diào)查”(The Survey of English Usage,簡稱SEU)語料庫,標(biāo)志著語料庫向計算機(jī)化發(fā)展,也成為關(guān)鍵詞檢索的元數(shù)據(jù)庫。1961年,以美國的費朗西斯(N.Francis)與捷克斯洛伐克的庫塞拉(H.Kucera)為首的語言學(xué)家和計算機(jī)專家在美國的布朗大學(xué)合作,一起建立了世界上最早的機(jī)讀語料庫,即布朗語料庫(Brown Corpus)。語料庫中的文本分為標(biāo)注文本與未標(biāo)注文本,可以根據(jù)關(guān)鍵詞進(jìn)行檢索,語料庫作為存放語言材料的數(shù)據(jù)庫被用于自然語言處理當(dāng)中。英國語言學(xué)家Mike Scott在1996年開發(fā)出Word Smith Tools軟件,這款軟件使用算法程序,根據(jù)詞語出現(xiàn)的頻率來確定關(guān)鍵詞。20世紀(jì)90年代,計算機(jī)搜索引擎的出現(xiàn)使關(guān)鍵詞成為一個高頻使用的詞語,并頻繁出現(xiàn)在網(wǎng)絡(luò)搜索的工具欄、新聞標(biāo)題、學(xué)術(shù)研究的規(guī)范格式、圖書館編目索引、計算機(jī)情報檢索等處。用戶在搜索框中輸入關(guān)鍵詞檢索內(nèi)容,算法依靠強(qiáng)大的計算能力與分析能力就能將搜索頁面呈現(xiàn)出來的內(nèi)容按照從高到低的權(quán)重進(jìn)行排列。

除搜索引擎、語義庫之外,關(guān)鍵詞也在其他方面使用,例如,當(dāng)用戶在瀏覽網(wǎng)頁、社交媒體、購物App等界面時,算法會對用戶的瀏覽足跡進(jìn)行記錄,并建立一個用戶個人的數(shù)據(jù)庫,緊接著對用戶的數(shù)據(jù)進(jìn)行分析與文本化處理,最后基于用戶自身的信息、網(wǎng)絡(luò)行為及歷史足跡篩選出專屬于用戶的關(guān)鍵詞。關(guān)鍵詞的選擇受到了用戶行為頻次的影響,當(dāng)用戶多次搜索或者瀏覽同一類型的內(nèi)容,算法便會生成相對應(yīng)的用戶關(guān)鍵詞。同時,關(guān)鍵詞也受到用戶差異化網(wǎng)絡(luò)行為的影響,當(dāng)用戶檢索、瀏覽與以往不同的內(nèi)容時,算法會生成新的關(guān)鍵詞。關(guān)鍵詞將用戶網(wǎng)絡(luò)足跡進(jìn)行總結(jié)概括,用戶足跡即從一個持續(xù)性的行為變成了由一個個關(guān)鍵詞組成的節(jié)點。

在互聯(lián)網(wǎng)發(fā)展早期,關(guān)鍵詞主要運用于門戶網(wǎng)站的目錄分類及搜索引擎中。用戶可以在門戶網(wǎng)站分類目錄中選取符合自身需求的子目錄,并在相對應(yīng)的子目錄中獲取自己想要的內(nèi)容。例如在以谷歌、百度為代表的搜索引擎中,用戶可以通過搜索關(guān)鍵詞獲得想要的信息,早期的關(guān)鍵詞也能滿足用戶并不算大的信息需求。隨著大數(shù)據(jù)的到來,用戶被大量冗余信息圍繞,與此同時,基于內(nèi)容的過濾方式與基于喜好的協(xié)同過濾方式也應(yīng)運而生,兩種技術(shù)集合形成了算法推薦系統(tǒng)(Recommender System),算法推薦系統(tǒng)以用戶自身關(guān)鍵詞標(biāo)簽作為信息半徑,結(jié)合用戶的信息與瀏覽足跡,挑選并推送滿足用戶個性化需求的信息。

我們發(fā)現(xiàn),算法時代的關(guān)鍵詞生成經(jīng)過了兩次編碼、解碼的過程。首先,算法將用戶足跡進(jìn)行解碼生成原始字節(jié),再對其進(jìn)行編碼生成用戶數(shù)據(jù),并儲存在用戶信息庫當(dāng)中。隨后算法進(jìn)行二次編碼,將數(shù)據(jù)進(jìn)行篩選,剔除多余用戶信息后進(jìn)行編碼,生成關(guān)鍵詞。關(guān)鍵詞的生成,是為了實現(xiàn)內(nèi)容的有效傳播,但其“選擇性認(rèn)知”會削弱傳播的信度。這是因為關(guān)鍵詞是由用戶信息、網(wǎng)絡(luò)足跡、心理等多種元素構(gòu)成的,處于底層的算法邏輯是用戶的偏好集合,而這種單一性、同質(zhì)性的邏輯結(jié)構(gòu)與多元化的信息需求相悖。關(guān)鍵詞的偏好性邏輯使算法能夠幫助用戶在日益復(fù)雜的媒體環(huán)境中導(dǎo)航,這種自動導(dǎo)航為算法平臺注入了用戶流量,從而使關(guān)鍵詞成為算法平臺的一個商業(yè)驅(qū)動力。由此可見,關(guān)鍵詞代表著用戶單方面的人格偏好,是對用戶偏向中性、厭惡性的數(shù)據(jù)進(jìn)行后置位排序與剔除之后的單向人格敘述。

經(jīng)過了解碼、編碼而形成的關(guān)鍵詞,包含了能指與所指兩個方面。“在傳播符號中,一個能指的形式可以有多個所指的意義,一個所指的意義也可以有多個能指的實體與之對應(yīng)?!盵6]但是在關(guān)鍵詞中,其能指與所指均為單一語義,在社會語境與情感表現(xiàn)中都表現(xiàn)為單一性偏好。雖然關(guān)鍵詞在用戶不同使用情景下代表不同的含義,但是算法的線性思維無法區(qū)分這些不同的含義,這導(dǎo)致用戶從一個立體的形象被壓縮成了一個個承載用戶足跡的節(jié)點化關(guān)鍵詞。用戶根據(jù)特定關(guān)鍵詞在社交網(wǎng)絡(luò)中形成趣緣、地緣社群,例如微博中的超話便是使用關(guān)鍵詞將具有同一偏好或處于同一地區(qū)的人群聚集在一起,形成社群,而這些社群中又形成了以關(guān)鍵詞為中心的私域流量。例如,快手以主播關(guān)鍵詞作為中心進(jìn)行私域流量聚集,與關(guān)鍵詞相關(guān)聯(lián)的用戶被引流進(jìn)入這個流量域中,并被整合到了一起,形成用戶間交往的場景,增強(qiáng)了圈子的互動性。我們看到,今天的關(guān)鍵詞不僅可以作為標(biāo)簽將相同屬性的用戶連接起來,也可以為內(nèi)容生成提供路徑,由此,一張內(nèi)容生成的網(wǎng)絡(luò)被關(guān)鍵詞建構(gòu)起來。

二、內(nèi)容生成:基于關(guān)鍵詞的語義描述

基于關(guān)鍵詞的內(nèi)容生成是算法傳播主體的構(gòu)成,而內(nèi)容生成的內(nèi)涵也經(jīng)歷了從網(wǎng)絡(luò)傳播到智能化傳播的演變過程。Web1.0時代曾打破了信息的單向傳播,網(wǎng)民的內(nèi)容生成主要集中在門戶網(wǎng)站、論壇等領(lǐng)域,例如天涯、貓撲等論壇的存在就形成了初期的社群傳播,但彼時的內(nèi)容生成僅限于網(wǎng)民間的發(fā)帖互動。Web2.0時代以社交傳播為主,微信、微博等社交媒體崛起,這一時期用戶之間的互動空前活躍,用戶內(nèi)容生成(UGC)作為一個新名詞被提出。與此同時,這個時期的用戶從Web1.0的偏向于“讀”變成了Web2.0的偏向于“寫”,個性化內(nèi)容得以彰顯。而Web3.0是一個強(qiáng)調(diào)智能化的精準(zhǔn)傳播時代,關(guān)鍵詞不僅可以作為搜索引擎、推送程序的文本,也為算法的內(nèi)容生成提供了語義連接點。這一時期,用戶的網(wǎng)絡(luò)數(shù)據(jù)被算法收集分析,算法依據(jù)其人口特征、網(wǎng)絡(luò)行為習(xí)慣、瀏覽內(nèi)容等因素生成節(jié)點化的關(guān)鍵詞,并將同類的具有聯(lián)系的關(guān)鍵詞連接起來形成語義網(wǎng)(Semantic Web)。

語義網(wǎng)這個概念在1988年被萬維網(wǎng)的發(fā)明者蒂姆·博納斯·李(Tim Berners-Lee)提出,研究者將其定義為以Web數(shù)據(jù)為基礎(chǔ),以機(jī)器可以理解和處理的方式進(jìn)行鏈接所形成的語義網(wǎng)絡(luò)。[7]語義網(wǎng)起到了將關(guān)鍵詞連接起來的作用,并為算法的內(nèi)容生成提供了基礎(chǔ)。首先,語義網(wǎng)為內(nèi)容生成提供了方向,智媒時代強(qiáng)調(diào)的是個性化的內(nèi)容生成,用戶關(guān)鍵詞被語義網(wǎng)聚合起來,形成一張囊括用戶所有特性的網(wǎng)絡(luò),算法根據(jù)不同用戶的關(guān)鍵詞聚合網(wǎng)絡(luò),制定不同的內(nèi)容生成策略;其次,語義網(wǎng)也為內(nèi)容生成提供了素材,自Web2.0時代開始,活躍的專業(yè)機(jī)構(gòu)、自媒體會就同一件事情提供不同的視角,算法根據(jù)對事件不同層面的數(shù)據(jù)進(jìn)行語義概括并生成關(guān)鍵詞組,通過語義網(wǎng)勾連的關(guān)鍵詞組能夠協(xié)助勾勒出細(xì)節(jié)更加豐滿的內(nèi)容素材。

而切實的內(nèi)容生成還要取決于由關(guān)鍵詞組成的用戶畫像。一方面,算法通過爬蟲技術(shù)、網(wǎng)絡(luò)日志、平臺數(shù)據(jù)庫收集等手段將用戶網(wǎng)絡(luò)數(shù)據(jù)完整、全面地記錄下來;另一方面,通過物聯(lián)網(wǎng)傳感器(例如智能手環(huán)、智能眼鏡等設(shè)備),算法也能夠?qū)ΜF(xiàn)實活動領(lǐng)域的數(shù)據(jù)進(jìn)行采集,同時將其與用戶網(wǎng)絡(luò)數(shù)據(jù)相整合,形成“線上+線下”活動領(lǐng)域的融合數(shù)據(jù)。算法依靠用戶的個人網(wǎng)絡(luò)數(shù)據(jù)、社交半徑、時空情景生成極具個人特色、迎合個人喜好的定制化內(nèi)容。但是用戶的閱讀喜好和習(xí)慣并不十分穩(wěn)定,算法需要根據(jù)用戶不同時期的數(shù)據(jù)變化預(yù)測出其需求的轉(zhuǎn)變,以提高內(nèi)容生成的精準(zhǔn)度。而內(nèi)容的定制化使得一些用戶感興趣、喜歡的邊緣性的長尾內(nèi)容的重要性得到了提升,用戶的小眾化需求也能得到滿足。與此同時,用戶的社會化內(nèi)容需求也得到呼應(yīng),在社會性議題中,語義網(wǎng)同樣對用戶數(shù)據(jù)進(jìn)行關(guān)鍵詞標(biāo)注,附加語義并進(jìn)行連接,算法則根據(jù)語義網(wǎng)推測出實時的熱點話題,如微博熱搜榜便是依靠語義網(wǎng)所標(biāo)注的關(guān)鍵詞集合起來的。另外,社會性議題的內(nèi)容生成也是一種分眾化的內(nèi)容生成模式,算法會根據(jù)用戶的人口特征、行為特征、分布規(guī)律、趣緣特征、心理取向等方面的數(shù)據(jù)標(biāo)注關(guān)鍵詞,并形成語義網(wǎng),進(jìn)行社會性內(nèi)容的生產(chǎn)。

賓夕法尼亞大學(xué)教授瓦斯(Watts)和康奈爾大學(xué)教授史楚蓋茨(Strogatz)在關(guān)于網(wǎng)絡(luò)結(jié)構(gòu)與知識擴(kuò)散的開拓性研究中提出了“小世界網(wǎng)絡(luò)”的概念,并總結(jié)出兩個特點:一方面是它的本地互動性強(qiáng)、網(wǎng)絡(luò)聚合程度高;另一方面是它也兼具了隨機(jī)網(wǎng)絡(luò)的特點,交往的范圍廣,節(jié)點之間平均路徑較短。[8]我們不妨假設(shè),用戶身處的就是一個由關(guān)鍵詞構(gòu)成的“小世界網(wǎng)絡(luò)”中,其自身數(shù)據(jù)可以符號化為具有確定性的關(guān)鍵詞,并與隨機(jī)的社會化內(nèi)容的關(guān)鍵詞通過語義網(wǎng)連接起來,而算法的內(nèi)容生成就成為個性化內(nèi)容與社會化內(nèi)容的交織。這種基于不同屬性關(guān)鍵詞語義進(jìn)行內(nèi)容生成的方式被稱為“語義描述”(semantic description),它具有結(jié)構(gòu)化的特點,即使用具體的框架,生成主題鮮明的內(nèi)容。算法將能夠表述內(nèi)容主題的關(guān)鍵詞放在標(biāo)題與簡介中,使用戶能夠直接根據(jù)這兩者判斷出內(nèi)容主旨。與此同時,算法通常也會將與用戶數(shù)據(jù)相對應(yīng)的關(guān)鍵詞展示出來,以此來吸引用戶的點擊、瀏覽。因此,算法的內(nèi)容生成總體上呈現(xiàn)出標(biāo)題、簡介吸引人,內(nèi)容模板化的特點。算法可以大批量地生成標(biāo)題關(guān)鍵詞與用戶喜好相對應(yīng)的內(nèi)容,這種“語義描述”的內(nèi)容生成方式也會使得“內(nèi)容農(nóng)場”(Content Farm)滋長。

在2006年初,美國Demand Media公司共同創(chuàng)建人羅森·布拉特(Rosenblatt)和肖恩·科洛(Shawn Colo)提出了一種新型創(chuàng)業(yè)公司的想法,后來被人們稱為“內(nèi)容農(nóng)場”,這個創(chuàng)意具體的操作是基于對最流行的網(wǎng)絡(luò)搜索查詢的分析,快速、廉價地創(chuàng)建文章和視頻。[9]內(nèi)容農(nóng)場嵌入在搜索引擎之中,指的是以垃圾內(nèi)容吸引用戶點擊的網(wǎng)站以及賬號。這些網(wǎng)站的經(jīng)營者通過爬蟲技術(shù)確定各大互聯(lián)網(wǎng)平臺的熱點關(guān)鍵詞,然后給撰稿人提供選題,撰稿人需要根據(jù)不同的選題快速產(chǎn)出內(nèi)容。例如臺灣Buzzhand網(wǎng)站,寫手在該網(wǎng)站上發(fā)表內(nèi)容后依靠瀏覽量獲取收益,為了賺取流量,將收益最大化,寫手按照每日熱點生成大量的吸睛、低俗內(nèi)容,并以標(biāo)題關(guān)鍵詞與界面圖片吸引用戶的點擊。隨著客戶端的普及,內(nèi)容農(nóng)場形式出現(xiàn)了“升級”,即由平臺賬號對內(nèi)容農(nóng)場網(wǎng)站進(jìn)行轉(zhuǎn)載,例如Facebook上的“每日健康”賬號就是對內(nèi)容農(nóng)場網(wǎng)站進(jìn)行轉(zhuǎn)載,并配上夸張的標(biāo)題、圖片、視頻,以迎合時下的社會熱點。

而智能化算法技術(shù)使內(nèi)容農(nóng)場的內(nèi)容生產(chǎn)跨入實時化、自動化階段,它能夠根據(jù)各個平臺的熱點抓取關(guān)鍵詞進(jìn)行內(nèi)容生成,例如算法可以快速生成與熱點事件發(fā)酵時不一樣的內(nèi)容,并通過標(biāo)題、簡介、視頻偽裝成事件的最新進(jìn)展,吸引用戶的眼球。算法極大地提高了內(nèi)容農(nóng)場的生產(chǎn)速率與效率,經(jīng)營者不再需要雇傭?qū)懯诌M(jìn)行內(nèi)容寫作,而是直接使用算法進(jìn)行內(nèi)容生成,而不顧內(nèi)容真實性及質(zhì)量的批量生產(chǎn)邏輯會使虛假、垃圾內(nèi)容大量存在,一旦用戶信以為真,便有可能導(dǎo)致謠言的傳播。2017年4月29日,臺灣“COCO大馬”網(wǎng)站使用算法抓取食品健康方面的關(guān)鍵詞“洗腎”,并以此發(fā)布文章《黑心陽春面導(dǎo)致臺灣人洗腎》,該文章引起用戶大量討論,COCOHK、健康新視界、每日健康等網(wǎng)站隨后發(fā)布相關(guān)內(nèi)容,同時通過賬號在Facebook、Twitter等平臺轉(zhuǎn)載,并利用搜索引擎優(yōu)化技術(shù)(Search Engine Optimization)提高該內(nèi)容在各大網(wǎng)站以及客戶端的搜索排名,引發(fā)轟動。該文章是算法的內(nèi)容農(nóng)場網(wǎng)站為了獲取瀏覽量而生成的虛假內(nèi)容,用戶在未認(rèn)清事實真相時產(chǎn)生了第三人效果,抱著寧可信其有、不可信其無的心態(tài)進(jìn)行內(nèi)容轉(zhuǎn)載,進(jìn)一步加劇謠言擴(kuò)散。由此可見,算法在內(nèi)容農(nóng)場上的應(yīng)用會加劇謠言發(fā)生與快速傳播的可能性,當(dāng)社會性事件剛發(fā)生、真相并不確鑿的情況下,算法通過抓取了各類虛假的信息,以此類數(shù)據(jù)生成了虛假內(nèi)容。用戶接觸到大量虛假信息,會產(chǎn)生恐怖,致使謠言叢生,而算法根據(jù)發(fā)酵過的謠言進(jìn)行二次生成,就形成了一個謠言生成的閉環(huán)系統(tǒng)。

由于算法并無法直接控制用戶的行為,所以需要生成符合用戶喜好的內(nèi)容,以吸引其點擊、瀏覽,因此標(biāo)題、內(nèi)容簡介及配圖便很重要。算法擅長識別文本與圖片,因此能夠生成與用戶相對應(yīng)的內(nèi)容。但算法在理解對話及因果關(guān)系這種偏向于邏輯的內(nèi)容上仍然存在很大的不足,所生成的內(nèi)容也會存在邏輯方面的欠缺。此外,算法的內(nèi)容生成是完全依靠自然語言理性所進(jìn)行的活動,缺少了人的感性意識,不過隨著“情緒識別”算法被亞馬遜、百度、微軟、IBM等公司提出并展開研究,算法已經(jīng)可以根據(jù)用戶的面部表情判斷其心情,并以此來調(diào)整后續(xù)程序的運行。我們有理由預(yù)測,未來的算法內(nèi)容生成將會集高效、準(zhǔn)確、客觀、感性等特點于一體,從而實現(xiàn)對個人更加精準(zhǔn)而全面的信息控制。

三、算法重組的傳播格局:基于關(guān)鍵詞和內(nèi)容生成的信息控制

算法以關(guān)鍵詞生成內(nèi)容,依靠語義網(wǎng)將內(nèi)容連接起來,并通過關(guān)鍵詞將用戶與內(nèi)容相勾連,形成一個全新的傳播格局,在這其中,算法集數(shù)據(jù)收集、內(nèi)容生成、信息推送、效果反饋以及算法調(diào)教于一身,幫助形成了一個傳播閉環(huán)。因此可以說,“算法傳播是以大數(shù)據(jù)為基礎(chǔ),經(jīng)由智能媒體,依靠算法技術(shù)驅(qū)動的傳播,它是在傳播社會學(xué)意義上整體發(fā)生異變的一種傳播形態(tài),它的傳播對象、傳播內(nèi)容、傳播方式、傳播效果等均被納入可計算的框架內(nèi),形成全新的傳播模式”[10]。而算法傳播依靠互聯(lián)網(wǎng)存在,并隨互聯(lián)網(wǎng)嵌入社會網(wǎng)絡(luò)之中,因此也成為社會重新媒介化的關(guān)鍵力量。

算法傳播是一個依靠數(shù)據(jù)驅(qū)動的自動化過程,它一改傳統(tǒng)傳播組織的科層制結(jié)構(gòu),由算法獨立承擔(dān)傳播中的多重組織角色。我們看到,算法不僅是傳播者,還是把關(guān)人、生產(chǎn)者、中介、渠道、反饋者等,這使算法傳播脫離了人工干預(yù),完全實現(xiàn)了傳播的實時、高效與精準(zhǔn)。算法傳播同時也是一個動態(tài)變化的過程,數(shù)據(jù)的反饋使得整個傳播過程一直處在循環(huán)修正之下,為的是更好地迎合用戶的喜好,形塑一個被用戶接納的現(xiàn)實世界,而用戶的認(rèn)知受到算法的影響,其行為習(xí)慣亦在每天的算法推薦內(nèi)容閱讀中養(yǎng)成。這也使我們熟悉的5W傳播模式已經(jīng)不再適用這種新傳播形態(tài),可以說,算法重組了一個符合智能化傳播規(guī)律的新傳播格局。

在新的傳播格局中,為了保證傳播過程的穩(wěn)定性,消除不確定性,算法統(tǒng)率了整個傳播過程,其中關(guān)鍵詞、內(nèi)容生成在算法邏輯下根據(jù)特定的數(shù)據(jù)形成;精準(zhǔn)推送依據(jù)內(nèi)容關(guān)鍵詞與用戶關(guān)鍵詞之間的匹配度;用戶反饋為下一次算法傳播過程提供調(diào)整指令……可以說,算法傳播以關(guān)鍵詞和內(nèi)容生成為基礎(chǔ)構(gòu)建了一個穩(wěn)定的信息控制模式。而信息控制的實質(zhì)在于對數(shù)據(jù)的控制,通過數(shù)據(jù)控制,用戶被分解成了由關(guān)鍵詞組成的節(jié)點網(wǎng)絡(luò),算法依據(jù)關(guān)鍵詞語義進(jìn)行內(nèi)容生成與推送。與此同時,算法實時監(jiān)測用戶的動態(tài),用戶的反饋又將作用于新關(guān)鍵詞的生成,幫助算法學(xué)習(xí)對后續(xù)傳播過程進(jìn)行調(diào)教,至此,一個程序化的傳播閉環(huán)躍然紙上。

此外,算法根據(jù)用戶數(shù)據(jù)生成關(guān)鍵詞,并以此為本進(jìn)行內(nèi)容生成與推送,所依據(jù)的是用戶與互聯(lián)網(wǎng)文本之間的匹配度,若文本標(biāo)題、內(nèi)容關(guān)鍵詞與用戶匹配度較高,就會被算法標(biāo)記推送;反之,則會失去算法可見性。用戶在接收到不同內(nèi)容后,其效果可能會產(chǎn)生分野,即需求得到滿足或者未得到滿足,這期間用戶的瀏覽、分享、評論等行為數(shù)據(jù)均將會被記錄,算法會根據(jù)反饋調(diào)整內(nèi)容生成的模型,若反饋的效果良好,算法會進(jìn)一步固化既定的內(nèi)容生成模型;反之,則會對模型進(jìn)行更新。

我們發(fā)現(xiàn),算法傳播依靠算法自身驅(qū)動力對信息網(wǎng)絡(luò)中的對象、關(guān)系、屬性、事件、過程進(jìn)行描述,符合拉圖爾提出的“授權(quán)”(delegation)概念,即算法執(zhí)行上述行為的這一過程不需要與人類進(jìn)行互動或額外的知識獲取。拉圖爾將授權(quán)分為四個步驟:翻譯、構(gòu)圖、黑箱、授權(quán)。[11]我們也可以根據(jù)這四個步驟探察算法獲得傳播主體性地位的過程。第一個步驟翻譯即用戶為了達(dá)到某個目的使用技術(shù)的過程,例如當(dāng)用戶想要做一首詩,卻無法獨立完成時,可以將具體的主題輸入給微軟小冰,借助算法生成特定主題詩句,但是結(jié)果不一定會讓用戶滿意。也就是說,當(dāng)技術(shù)參與到用戶的目標(biāo)行動中來時,最初的目標(biāo)可能會被改變,這個階段取決于用戶對于技術(shù)的使用。若是多個用戶與多種技術(shù)相互配合進(jìn)行活動,便需要進(jìn)入第二個步驟——構(gòu)圖,即不同的人與不同的技術(shù)合作負(fù)責(zé)不同的任務(wù),構(gòu)成一個完整的行動過程,這個階段屬于用戶與技術(shù)的融合。當(dāng)技術(shù)變成產(chǎn)品時,便會出現(xiàn)第三個步驟——黑箱,例如當(dāng)算法被應(yīng)用到今日頭條當(dāng)中時,搜索引擎上所有的行動者會形成一個復(fù)雜的網(wǎng)絡(luò),這里的行動者意為人類、技術(shù)、觀念等所有物體,在這個由復(fù)雜的網(wǎng)絡(luò)構(gòu)成的黑箱中,用戶與算法之間的聯(lián)合生產(chǎn)變得完全不透明,換句話說,用戶與算法之間的主客體關(guān)系開始模糊化,至此,“授權(quán)”開始發(fā)生。在算法傳播的過程中,隨著算法技術(shù)在數(shù)據(jù)收集、分析,內(nèi)容生成、內(nèi)容推送、效果反饋上的發(fā)展與成熟,算法能夠依靠自身進(jìn)行穩(wěn)定、完整的信息傳播,傳播過程中的不確定性消失,算法從而獲得了“授權(quán)”,即技術(shù)本身能夠完全接管向用戶傳遞信息的任務(wù),這個時期的算法技術(shù)就完成了從客體到主體的轉(zhuǎn)換。而人的主體性也在算法技術(shù)獲得授權(quán)的過程中逐漸消逝。

眾所周知,傳統(tǒng)的傳播模式會受到傳播過程中噪音的影響,傳播效果也隨之發(fā)生改變,但是算法傳播是一個傳播的閉環(huán),整個傳播過程的不確定性被排除,這也使傳播效果更趨穩(wěn)定,然而沒有噪音的介入也導(dǎo)致算法控制空前加劇。算法傳播的可計算性、可控性會使人的行為模式簡單化,并按照其預(yù)設(shè)好的內(nèi)容流動的邏輯進(jìn)行行動與反饋,算法以此來影響、控制、改變用戶的認(rèn)知、態(tài)度、行為,而用戶沉浸在算法傳播的擬態(tài)環(huán)境下,也將逐漸被算法馴化。很少有人會關(guān)注整個算法傳播的運行邏輯,這是因為算法對用戶的個性化培養(yǎng)會大幅度削弱用戶對其“黑箱”的質(zhì)疑,這導(dǎo)致算法偏見很多時候并無法被人識別。多倫多大學(xué)研究人員Deborah Raji與麻省理工研究人員Joy Buolamwini在對亞馬遜圖片識別系統(tǒng)Rekognition進(jìn)行研究后指出,該系統(tǒng)在對膚色較深的女性性別進(jìn)行檢測時,其錯誤率比判斷膚色較淺的男性性別高得多[12],而這些人因檢測結(jié)果錯誤很可能會受到執(zhí)法人員的搜查??梢?,當(dāng)算法的技術(shù)霸權(quán)增強(qiáng)時,自身帶有的偏見性的識別后果會導(dǎo)致對某些用戶的壓迫與歧視,形成用戶之間的不平等關(guān)系。

算法傳播依靠的是可量化的數(shù)據(jù),可量化的數(shù)據(jù)的完整度以及質(zhì)量決定了內(nèi)容生成的質(zhì)量,換句話說,用戶的數(shù)據(jù)越是完備,所生成的內(nèi)容就越有質(zhì)量,也更能達(dá)到理想的傳播效果。而這些數(shù)據(jù)絕大部分來源于互聯(lián)網(wǎng)公司,媒體研究者尼克·庫爾德利(Nick Couldry)就將谷歌、亞馬遜、Facebook、百度、阿里巴巴等稱為社會量化部門(social quantification sector),它們保存用戶每天的日常社會行為,用戶的每一次網(wǎng)絡(luò)點擊都被記錄下來,并轉(zhuǎn)化為可量化的數(shù)據(jù)。[13]能夠生產(chǎn)出更多優(yōu)質(zhì)數(shù)據(jù)的用戶普遍擁有更先進(jìn)的移動設(shè)備,也會更加主動參與到網(wǎng)絡(luò)事務(wù)當(dāng)中,并有更加寬廣的用戶足跡地圖。但還有一部分用戶媒介素養(yǎng)并不足夠,所產(chǎn)生的數(shù)據(jù)的數(shù)量及質(zhì)量無法與擁有優(yōu)質(zhì)數(shù)據(jù)的用戶對等,那么數(shù)字鴻溝就將持續(xù)擴(kuò)大,其結(jié)果是在算法傳播所構(gòu)成的擬態(tài)環(huán)境中形成“數(shù)字階級”(Digital class)。數(shù)字階級中的用戶被算法依據(jù)其提供數(shù)據(jù)的大小、質(zhì)量進(jìn)行劃分,處于更高階級的用戶會獲得更加充足與高質(zhì)量的內(nèi)容,而處于底層的用戶則面臨被垃圾信息、虛假信息所包圍的可能,他們也很難從這種信息繭房中掙脫出來。而算法傳播所形成的數(shù)字階級在很大程度上也是對于現(xiàn)實世界階級的固化。

除了形成數(shù)字鴻溝外,算法傳播還容易導(dǎo)致算法依賴乃至“成癮”。這表現(xiàn)在算法傳播能夠通過信息精準(zhǔn)推送來實現(xiàn)對用戶點擊行為的控制,并影響用戶對于具體事件的態(tài)度、觀點以及相關(guān)內(nèi)容后續(xù)的點擊行為。一方面,算法通過內(nèi)置的許多“先驗假設(shè)”和“限制參數(shù)”來為用戶的生活提供便利,幫助其做出決策[14],以達(dá)到控制的效果;另一方面,算法還會根據(jù)用戶的經(jīng)驗數(shù)據(jù)進(jìn)行參數(shù)設(shè)置,設(shè)定可以推送與不可以推送內(nèi)容之間的界限,并且往往是以用戶的喜好作為參照。算法推送采取的是“瀑布流”的模式,即當(dāng)用戶閱讀完一則內(nèi)容后,緊接著會為用戶生成下一則內(nèi)容,使人逐漸產(chǎn)生媒介依存癥。這是由于算法作為“技術(shù)多巴胺”,會使用戶在飲用“科技癮品”——自動化生成內(nèi)容的過程中得到了自我滿足。而為了獲得更多的滿足感,用戶會進(jìn)行持續(xù)性內(nèi)容瀏覽,并在此過程中自覺產(chǎn)生積極反饋,持續(xù)為算法的深度學(xué)習(xí)飼喂數(shù)據(jù),用戶的行為就這樣在無形中被算法操控。而當(dāng)用戶感覺到在算法平臺中可以獲得滿足感與快樂,且獲得這些感受的時間由自己控制,他們在算法平臺上逗留的時間和頻率也會大大增加,這被稱為“變率強(qiáng)化”(Variable Ratio Reinforcement)。[15]在這種機(jī)制的作用下,用戶注意力被算法平臺吸引,耗費過多精力于網(wǎng)絡(luò)世界后,難以從中抽離;而固化的內(nèi)容又會強(qiáng)化用戶的單一性思維,思考也隨之減少,導(dǎo)致無論在線上和線下,用戶都變得越來越像一個模式化的機(jī)器人。

在算法傳播過程中,用戶越依賴算法,算法的學(xué)習(xí)能力就會越強(qiáng);而通過算法調(diào)教,用戶受控程度也會越深。當(dāng)算法根據(jù)用戶停留時長、評論、轉(zhuǎn)發(fā)分享等形式的反饋判定用戶需求被滿足時,會形成一種正向的反饋,帶有用戶原有關(guān)鍵詞的內(nèi)容被重復(fù)收集,原有用戶畫像被進(jìn)一步固化,算法的生成內(nèi)容會朝著偏好這一極端的方向走去;而當(dāng)算法判斷用戶需求未被滿足時,就會對原有的關(guān)鍵詞進(jìn)行重新排序,并根據(jù)用戶最新數(shù)據(jù)更新關(guān)鍵詞,修改用戶畫像并調(diào)整內(nèi)容生成的策略與方向。由此可見,算法傳播自動化生成與反饋相互作用、彼此影響,整個傳播過程處于實時更新的循環(huán)鏈當(dāng)中,隨著用戶數(shù)據(jù)的變化,算法能夠智能化地改變傳播的各個環(huán)節(jié),迎合用戶各個階段的個性化需求。例如在傳播效果反饋階段,無論是瀏覽、評論還是轉(zhuǎn)發(fā),都需要耗費時間,因此用戶在算法推薦頁面停留時間是算法進(jìn)行預(yù)測的不可或缺的一項指標(biāo),為了盡量延長用戶的停留時間,算法會習(xí)得用戶喜好,推薦個性化的吸睛內(nèi)容,以此吸引用戶的注意力。這里值得強(qiáng)調(diào)的一點是,由于算法與用戶之間的互動是通過中介數(shù)據(jù)進(jìn)行的,所以算法得到的反饋并非完全為用戶是否得到滿足的真實反映,而可能只是用戶在內(nèi)容界面的行為信息,這也就是說用戶行為數(shù)據(jù)經(jīng)過語義描述所表達(dá)的意義并不一定符合用戶內(nèi)心真正想要表達(dá)的含義。但這并不妨礙算法繼續(xù)學(xué)習(xí),只要用戶持續(xù)產(chǎn)生數(shù)據(jù),傳播內(nèi)容和傳播效果就會無限接近個性化傳播的最優(yōu)狀態(tài)。

媒介學(xué)者馬歇爾·麥克盧漢(Marshall McLuhan)在《理解媒介——論人的延伸》中曾提出了“內(nèi)爆”(Implosion)的概念,他認(rèn)為,電力技術(shù)的應(yīng)用加速了媒介的發(fā)展,塑造了“內(nèi)爆”的環(huán)境,打破機(jī)械時代的時空距離。此后社會學(xué)者讓·鮑德里亞(Jean Baudrillard)發(fā)展了這個概念,他眼中的“內(nèi)爆”可以消除虛擬與現(xiàn)實之間的界限。在如今的算法傳播時代,現(xiàn)實與虛擬的界限被打破,算法制造的信息符號是我們賴以認(rèn)識世界的主要手段,通過虛擬的信息符號,算法可以建構(gòu)一個“仿真”的虛擬世界,進(jìn)而產(chǎn)生鮑德里亞所說的“超真實”的幻境。這種擬態(tài)環(huán)境使用戶具有身臨其境的感受,產(chǎn)生心理滿足感,并影響自身行為。但正如鮑德里亞所擔(dān)心的,“當(dāng)媒介在人與社會之間、人與人之間把任何互動通通內(nèi)爆為一個平面,內(nèi)爆為一個單向度的時空現(xiàn)實之際,整個社會交往和社會價值都被瓦解了”[16]。某種程度而言,算法傳播正依靠其無遠(yuǎn)弗屆的網(wǎng)絡(luò)建立了一個“內(nèi)爆”的社會,一方面,用戶在算法傳播所建造的擬態(tài)環(huán)境中成為數(shù)據(jù)的提供者以及被算法飼喂的個體,并被算法所推送的偏好性內(nèi)容所麻痹;另一方面,用戶被算法困在依靠自己網(wǎng)絡(luò)數(shù)據(jù)所建立起來的超級全景監(jiān)獄中,其在網(wǎng)絡(luò)中的交往行動潛移默化地受到了算法控制,而在超級全景監(jiān)獄的凝視中,用戶的價值觀也逐漸被算法型塑。

算法傳播使人在傳播活動中全面退讓,并將傳播的權(quán)力交給了智能算法,這雖能使人們從大數(shù)據(jù)潰決中獲得局部解放,但這種退讓也將人的主體性轉(zhuǎn)移給了算法。用戶在與算法的對話過程中,話語權(quán)會隨之降低,這也是算法傳播可以通過信息傳播控制社會的一個重要原因??梢燥@見的是,整個傳播過程并非按照人的思維進(jìn)行運作,而是依靠代碼中內(nèi)嵌的邏輯,形成以個性化為中心的傳播格局,并在閉環(huán)式的運行中逐步窄化、私域化、商業(yè)化。受高度個性化的算法傳播影響,現(xiàn)實社會無疑也將面臨共識分裂、階層固化的風(fēng)險。

四、結(jié)語

就算法傳播的現(xiàn)狀來看,關(guān)鍵詞、內(nèi)容生成都是依靠網(wǎng)絡(luò)數(shù)據(jù)中概括出來的語義運行,而包含在數(shù)據(jù)中個人與社會情緒、心理、屬性、關(guān)系等,還無法輕易通過語義表述的層面被篩選過濾,然而解決這個矛盾似乎只是時間問題。2005年,美國未來學(xué)家雷·庫茲韋爾(Ray Kurzweil)在其著作《奇點臨近》(The Singularity Is Near)中做出預(yù)測,科學(xué)技術(shù)的發(fā)展將在2045年迎來“奇點”。[17]如果奇點真正來臨,人工智能將超過人類,用戶的數(shù)據(jù)就能夠完全被算法所理解。也許就在不久的未來,算法不再需要像現(xiàn)在一樣,必須通過分析在線數(shù)據(jù)預(yù)測現(xiàn)實世界的變動,而是能夠基于未經(jīng)加工與轉(zhuǎn)述的原始數(shù)據(jù),精確生成關(guān)鍵詞與內(nèi)容,整個算法傳播系統(tǒng)也不再局限于滿足用戶偏好的邏輯,而是能夠根據(jù)用戶所處的場景進(jìn)行實時調(diào)整。到那時,算法傳播實現(xiàn)了與真實世界傳播的無縫契合,或?qū)⒊蔀槟軌蛘嬲凉M足人們需求的傳播形態(tài)。

然而當(dāng)算法進(jìn)化到比我們更懂得傳播法則,更懂人心的時刻,真實世界里的交流是否會逐漸萎縮?傳播的真諦是否從此改變?當(dāng)算法控制的“全球腦”(Global Brain)被掌握在占有數(shù)據(jù)最多的超級國家或寡頭互聯(lián)網(wǎng)公司,平臺帝國主義(Platform Imperialism)是否會成為新地緣政治中世界霸權(quán)的新形態(tài)?算法重組的傳播格局在未來具有無限發(fā)展的可能性,同時也蘊(yùn)含著巨大的發(fā)展風(fēng)險,無論如何,如何使智能化傳播朝著使世界更加美好的趨勢發(fā)展是我們應(yīng)該思考的問題,也是需要努力去實現(xiàn)的愿景。

猜你喜歡
語義算法內(nèi)容
真實場景水下語義分割方法及數(shù)據(jù)集
內(nèi)容回顧溫故知新
哪種算法簡便
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
主要內(nèi)容
一種改進(jìn)的整周模糊度去相關(guān)算法
“吃+NP”的語義生成機(jī)制研究
情感形容詞‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的語義分析
漢語依憑介詞的語義范疇
崇义县| 清新县| 施甸县| 教育| 武胜县| 阳春市| 泰来县| 凭祥市| 饶阳县| 醴陵市| 长子县| 南陵县| 芦山县| 聂荣县| 清河县| 肇源县| 安吉县| 淳安县| 晋城| 天气| 喀什市| 旌德县| 托克托县| 承德市| 额尔古纳市| 保康县| 蒲江县| 赣榆县| 汶川县| 灯塔市| 稻城县| 庐江县| 高尔夫| 绩溪县| 乌苏市| 饶平县| 房产| 民勤县| 秀山| 金川县| 尤溪县|