国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

算法技術對信息分發(fā)機制的創(chuàng)新與反思

2019-04-04 03:40李煒娜
關鍵詞:算法內容用戶

李煒娜

(西北民族大學 新聞傳播學院,甘肅 蘭州 730124)

“算法(Algorithm)”源于計算機領域的專業(yè)概念,指一系列解決問題的清晰口令或代碼,用系統(tǒng)性方法描述解決具體問題的一種數(shù)據(jù)策略.而在人工智能和大數(shù)據(jù)推廣應用的今天,算法推薦應運而生.通過大數(shù)據(jù)分析和信息過濾機制,并根據(jù)用戶個性化需求,對信息進行深度智能分析來過濾優(yōu)化,以實現(xiàn)用戶信息的科學和深度的匹配.個性化推薦用戶的推薦算法已經成為內容生產的“標配”,在目前互聯(lián)網資本市場贏得了市場價值,成為了互聯(lián)網資本市場備受矚目的全新領域.在國外,算法型個性化信息推送以 Facebook 為代表的社交媒體和News Republic 新聞 APP的個性化推送應用、BuzzFeed新聞聚合網站以及Amazon 等電商為代表;在國內,較早使用算法推薦的是豆瓣,目前主要是以今日頭條、天天快報等算法類資訊平臺為代表.

1 互聯(lián)網信息分發(fā)的發(fā)展與模式類型

1.1 由線性信息模式到非線性分發(fā)平臺

從“人找信息”到“信息找人”、從門戶時代的“千人一面”到移動互聯(lián)網時代的“千人千面”,互聯(lián)網信息分發(fā)由信息分發(fā)1.0階段發(fā)展到信息分發(fā)2.0階段.基于底層媒介技術形態(tài)不同,傳統(tǒng)媒體的分發(fā)模式是一種以“內容為王”的固化的線性分發(fā)模式,主要依據(jù)信息產品的內容來決定分發(fā).新聞內容生產各個環(huán)節(jié)與分發(fā)環(huán)節(jié)相互依賴、密不可分,受眾所看到的是線性生產的相同信息產品.目前“數(shù)據(jù)技術思維”和“用戶本位思維”下的信息分發(fā)以2.0為主要模式.

目前,內容生產環(huán)節(jié)和分發(fā)環(huán)節(jié)已分離開來,新聞內容的分發(fā)已成為專業(yè)化的獨立部門,信息產品集社交、搜索、場景識別、個性化推送以及智能化識別為一體.信息分發(fā)2.0主要基于算法技術推薦和三大主流推薦系統(tǒng):一是基于內容的推薦系統(tǒng),二是基于協(xié)同過濾推薦,三是混合的推薦.例如:推薦算法應用最早的是電子商務網站“Amazon”,它在1998年就推出了基于項目的協(xié)同過濾算法,來處理數(shù)百萬商品,并為他的用戶提供精準信息推送.在我國,人工智能信息最早始于 2012 年的“今日頭條”,之后搜狐、網易新聞和微博、微信相繼在自身產品中添加算法技術,特別是在2016年末(如圖1),信息分發(fā)2.0 模式的逐步推廣,直至 2017 年,互聯(lián)網信息分發(fā)個性化精準推送系統(tǒng)的應用已超過68%.內容分發(fā)成了各大互聯(lián)網巨頭的核心爭奪資源點.阿里、騰訊等也先后建立起各自的信息分發(fā)機制.數(shù)據(jù)搜索引擎成為分發(fā)渠道中的核心技術.狀態(tài)空間盲目搜索包括廣度優(yōu)先搜索(Breadth-First-Search)、深度優(yōu)先搜索(Depth-First-Search);狀態(tài)空間啟發(fā)式搜索包括:A搜索算法(A search algorithm)、A*尋路(A*Search Algorithm) 、D*尋路(Dynamic A* Search Algorithm).例如:百度推出信息分發(fā)2.0模式,即“搜索+推薦”雙向智能適配結合的PUSH推薦模式,全面實現(xiàn)及時動態(tài)建模和實時匹配計算,將內容智能匹配給定向的用戶,以實現(xiàn)界面成像的“千人千面”“億人億面”.

圖1[1] 人工推送和算法推送演化發(fā)展數(shù)據(jù)

傳統(tǒng)的內容分發(fā)模式已無法解決海量的咨詢數(shù)據(jù)與用戶特定需求之間的矛盾,因此內容的匹配度和推薦精準度成為核心.內容和用戶之間從之前的弱鏈接發(fā)展成了新的強連接關系.

1.2 互聯(lián)網信息分發(fā)模式類型

1.2.1 人工采編型

這種信息分發(fā)模式多見于傳統(tǒng)媒體和Web1.0時期的媒體新聞客戶端和門戶網站,編輯和記者在這一時期仍掌握著內容生產領域的絕對主宰權,內容的把關和議程設置明顯,信息的內容生產和信息分發(fā)之間的邊界模糊,但其協(xié)同性較強地解決了所謂“頭部信息”的初級社會化分發(fā),仍缺乏受眾的個性化、場景化的信息分發(fā)意識.

1.2.2 社群分發(fā)型

以Web2.0的博客、微博、微信的社群化媒體為代表的“UGC——社交分發(fā)”,充分利用了互聯(lián)網時代中的“關系資源”,構成了信息產品生產線上的=的“數(shù)字勞工”.其分發(fā)信息的內容差異主要表現(xiàn)為與個體關聯(lián)網絡社群頻度、廣度、數(shù)量、程度對信息用戶的接觸以及消費等行為的相關度影響,因此,這一過程已經初步形成了信息內容生產對社群亞文化以及UGC價值共創(chuàng)的社群媒體運用意識.信息內容的價值大多由社交互動來評定信息的價值.

1.2.3 算法分發(fā)型

大數(shù)據(jù)技術推廣應用,以Web3.0人工智能化和場景化為特征,數(shù)據(jù)引擎成為內容“標配”,給用戶個性化的推薦以形成“千人千面”的資訊形態(tài).這種全新的信息場景適配方式和感知手段,不僅帶來了信息內容生產整合以及分發(fā)模式的變革,更重要的是重構了語境的轉變以及信息用戶的關系賦權.

2 算法技術對信息分發(fā)的路徑創(chuàng)新

2.1 信息分發(fā)2.0用戶路徑:“用戶身份檔案”的算法建模

算法技術應用于信息分發(fā)的最大優(yōu)勢是能夠科學地把控用戶的深度畫像,信息生產的最初環(huán)節(jié)以用戶的興趣為起點,以用戶的需求為終點.算法基于用戶數(shù)據(jù)化的興趣圖譜、社會關系圖譜、生活習慣圖譜等,定制用戶所需的個性化內容,打通了內容生產與信息需求的深度連接,優(yōu)化了數(shù)據(jù)化的新聞生產,帶動了業(yè)務發(fā)展和信息資源生產的研發(fā).目前所使用的用戶建模的手段有:①基于爬蟲(Spider 技術)、后臺數(shù)據(jù)庫以及個人信息檔案.②用戶網絡痕跡的用戶畫像還原.③用戶參與性的評論和轉發(fā)進行算法型推送.但其局限性多見于文本形式.通過文本語義標簽等進行預測和建構,若缺乏語義文本,對于協(xié)同過濾類推薦算法無法解決信息算法的冷啟動問題.如圖2所示,基于追蹤用戶閱讀行為的推薦算法,通過大數(shù)據(jù)資源庫獲取用戶各維度的信息,建立專屬個人的興趣圖譜.其最基本的維度包括用戶的性別、年齡、職業(yè)、教育信息、興趣愛好、地理位置等,以及用戶行為痕跡(包括點擊、瀏覽、評論、轉發(fā)、點贊、停留時長等).在用戶的“用戶畫像”系統(tǒng)建模中,性別和年齡可通過第三方社交關聯(lián)登錄獲得,用戶的地理位置可通過GPS定位獲得.除此之外,興趣類屬和場景化還原是通過模型數(shù)據(jù)評估和預測完成的,例如常見的協(xié)同過濾推薦模式.這一環(huán)節(jié)是算法型信息分發(fā)的關鍵,直接影響“用戶畫像”的還原度和信息分發(fā)的精準度以及用戶的產品體驗感.

圖2[2] 移動網絡算法技術的用戶信息建模

2.2 信息分發(fā)2.0內容生產路徑:重構新聞價值的頂層設計

傳統(tǒng)媒體時代整個信息制作流程遵循著塔奇曼的“新聞常規(guī)”,即依據(jù)新聞價值對信息進行流程化的加工和呈現(xiàn).而數(shù)字革命的發(fā)展拓展了信息生產領域邊界,同時也重構了新聞價值的內涵.以前學界界定的新聞價值主要涉及:真實性、時效性、顯著性、趣味性、接近性五大方面,而當今“大數(shù)據(jù)+”的思維下,“內容文本標簽”的意義和“邊生產+邊分發(fā)”的內容生產樣態(tài),使得新聞價值演化為:即時性、標簽性、交互性、情景性和世俗性.整個信息生產和分發(fā)在遵循重構后的新聞價值的標尺上,從選題策劃,信息采集,信息加工到信息反饋進行了頂層設計,形成了人機協(xié)同,相互校正的形態(tài),提升了對外部信息的抓取、整合以及場景適配的能力.

2.3 信息分發(fā)2.0平臺路徑:拓展平臺邊界擺脫“冷啟動”

算法技術應用的平臺路徑分為技術路徑和社群路徑.其中技術路徑最為直接的代表就是采用了第三方登錄的形式.一般采取“投靠原則”,即向“BAT”(百度、阿里巴巴和騰訊)靠攏,通過較為成熟和完善的平臺直接快速地獲取用戶的個人信息以及興趣圖譜,擺脫了算法冷啟動的困境.騰訊通過微信支付,可以拿到交易金額的數(shù)據(jù),但卻拿不到如商品名稱、商品單價等更有價值的交易數(shù)據(jù);而阿里巴巴除了豐富多元的電商交易數(shù)據(jù)外,還可通過菜鳥獲取倉儲物流的數(shù)據(jù),通過餓了么等獲取餐飲交易數(shù)據(jù),通過螞蟻金服獲取數(shù)據(jù)、通過盒馬獲取線下零售數(shù)據(jù)等.另外,人際社群路徑則建立在用戶協(xié)同機制的自組織傳播,用戶數(shù)量巨大,需要用戶生產與傳播內容,用戶之間交互,用戶與系統(tǒng)之間的信息交換,來不斷充實和完善數(shù)據(jù)庫,使得算法路徑從簡單走向復雜、從無序走向有序、從信息與用戶的弱鏈接走向強弱鏈接的交融互動.

2.4 信息分發(fā)2.0營銷路徑:重構信息價值變現(xiàn)思維

達拉斯·斯麥茲曾提出的“受眾商品論”在算法技術爭奪信息資源市場中,已失去它原有的解釋力,發(fā)展到今天“數(shù)字勞工商品”化,逐漸撥開了當下互聯(lián)網商業(yè)運作的迷霧.用戶不僅僅消費信息產品,同時也在生產和“搬運”著信息產品.例如喻國明老師提出如圖2數(shù)據(jù)平臺的資本運作流程中,個性推薦系統(tǒng)智能分辯用戶消費行為以及知識付費趨勢是關鍵.因此從廣告營銷角度講,推薦系統(tǒng)的數(shù)據(jù)提取、分析,廣告的投放,是一次從用戶量級到精準度的投放.廣告信息流產品打通了用戶搜索和信息獲取的便捷路徑,開始讓“廣告內容化”“投放定向化”“廣告交互化”,真正實現(xiàn)“千人千面”2.0廣告推送營銷模式,極大地降低廣告的投放成本,優(yōu)化了廣告宣傳渠道,形成了“利基市場”形態(tài)下的精準推送.

圖3 數(shù)據(jù)平臺的資本運作流程

3 算法技術對信息分發(fā)的范式創(chuàng)新

3.1 回歸“用戶本位”的傳播價值

傳播過程中受眾本位的傳播思想的理論支撐是“使用與滿足”,著名大眾文化理論家費斯克提出:受眾是意義的生產者,有能力根據(jù)自己的文化背景和社會經驗對文本進行解讀,從而生產出自己的文化,其閱讀行為是“在已有的文化知識與文本之間建立聯(lián)系”[3].算法型的信息推薦不僅激活信息資源的深度價值,使得用戶地位升級,更使“傳者本位”向“受眾本位”轉變,促成了用戶社交需求和價值認同的相互對接.情境,西方學者戈夫曼、梅羅維茨、伊尼斯等學者從不同維度闡釋其意義.在不同學術領域也可以找到情景的蹤影,例如社會學的situation,電影學的scene,物理學中的context field,以及舞蹈學中scenery等.其中具有代表性的媒介情境學創(chuàng)始人梅羅維茨則認為媒介的出現(xiàn),打破了社會交往中的前后臺區(qū)間,也經媒介產生了新的場景形態(tài).如鮑德里亞的著作《仿真與擬象》中解讀現(xiàn)實場景下的“擬象”.智能算法技術下,信息用戶逐步建構起自我創(chuàng)作與人機互動的模式,同時通過符號的表征形態(tài)延伸出自我沉浸的實際場景和虛擬場景之間的切換.

3.2 用戶關系賦權的新建構

基于算法技術的場景適配是未來信息資源的核心.場景的本質不僅要適配信息分發(fā)與提供精準服務,更要重構適合社會關系以及用戶賦權關鍵的助力.由于算法型場景適配從本質上革新了人與信息連接的方式,推動了信息生產以及分發(fā)的重心偏移,同時使得網絡社會化組成從差序格局、團體格局向開放、互動的分布式網絡轉型,這必將帶來更為隱秘的信息與用戶之間的新型賦權關系.

算法推送下的信息除更加小眾化、個性化、場景化外,還形成了一種平民化、交互性、協(xié)商式的敘事方式.互聯(lián)網算法作為一種新的權力來源,它對于用戶個體與主體權利被激活,將特定的“官方話語”“官方議題”以及被算法推送的“民間議題”被解構.這與以往信息傳播相比,已經發(fā)生了賦權范式性的變革.原本分散、微弱、邊緣化的用戶力量在互聯(lián)網算法技術的推動下形成聚合、延伸為主導力量,產生了更為深遠的信息內容“長尾效應”.

4 信息分發(fā)2.0的“算法風險”與優(yōu)化策略

4.1 算法“黑箱”:更隱蔽的算法偏見

人工智能和算法運用在新聞生產領域,在目前的技術維度上分為機器學習、自然語生成和處理、語音交互、視覺信息處理以及機器人技術,其中機器學習是整個新聞數(shù)據(jù)處理的關鍵所在.機器學習技術分為監(jiān)督式機器學習和無監(jiān)督式機器學習.無監(jiān)督式機器學習無固定數(shù)據(jù)輸入(出)以及運算模板,這種大數(shù)據(jù)處理方式將新聞生產置于“技術崇尚”和“科學神話”的“黑箱”中,而黑箱的內部運算透明度差且運算復雜讓人難以駕馭,例如:奧地利符號計算研究所的Christoph Koutschan博士曾在他的論文中談到了32個人核心的大數(shù)據(jù)算法,例如分支界定算法(Branch and Bound)、Buchberger算法、Diffie-Hellman密鑰交換算法、Dijkstra算法、LLL算法、Q-learning學習算法、RSA——公鑰加密算法、Struk turtensor算法等.“黑箱”中所產生的算法偏見就顯得愈發(fā)隱蔽.這其中的算法偏見包括算法設計者的偏見、數(shù)據(jù)輸入(出)的偏見,算法運算的偏見等.目前算法技術的發(fā)展在一定程度上顯示了場景適配力的精確性,但容易在實際信息分發(fā)中產生“噪音”.筆者認為其算法型推送的用戶場景的適配主要體現(xiàn)在以下幾點:①畫像的逼真性;②場景的高度還原性;③推送信息場景的偏移性.這些都在算法的黑箱中建構擬態(tài)環(huán)境,更為隱蔽地影響用戶的判斷和認知.

4.2 用戶“個人日報”:非制度性地建構“社會共情”

“信息繭房”是哈佛大學教授桑斯坦在《信息烏托邦》中提出的概念,指在信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的信息,久而久之會將自身桎梏于像蠶繭一般的“繭房”中[4].算法推薦在提升了分發(fā)信息的精準度及用戶信息產品的適配體驗的同時,不斷固化和狹窄化用戶對外部世界認知的邊界,在加固已有的認知偏見的同時對受眾進一步進行“社會共情”的建構.“信息孤島”讓人們開始反思技術帶來的雙面性.麥克盧漢理論中的“媒介即人的延伸”放在智能算法推薦技術中,無疑是對人體更深層次的延伸,是對人類認知、行為、思維功能的延伸.但盲目的技術崇拜只能將信息生產者與信息用戶的能動性扼殺,我們需要思考是否應該對技術設限,例如人工冷凍“標題黨”和給“熱點”降權.

4.3 算法技術的牢籠

北美媒介技術著名學者保羅·萊文森的“媒介進化理論”,對技術的迭代和發(fā)展持有一種較為樂觀的哲學態(tài)度.這種態(tài)度基于對“技術中立”的秉持.我們在算法的語境下所強調的“技術中立”,應是強調算法本身就是中立的,不做價值判斷,只看合不合規(guī),將選擇權交給讀者.但算法模型和個性化推薦系統(tǒng)都是人主觀創(chuàng)造的結果,是一系列代碼和程序經人之手,自然在數(shù)據(jù)提取、處理等環(huán)節(jié)不可避免地受到人的主觀影響,因此一味地將價值的選擇和判斷標準下放于用戶,會給算法技術背后埋下算法倫理的“陷阱”.算法技術本身不具有價值取向,但通過人工智能的篩選和識別,對內容的真?zhèn)?、?yōu)劣、雅俗等內容,很難進行充分“把關”,信息垃圾將無法避免.因此,應在工具理性和價值理性中找到平衡點,人、技術與倫理道德三者之間相互影響、融合交匯,應摒棄單一片面的技術決定論,形成算法背后較為客觀的社會技術整體互動論.例如:2018年4月“今日頭條”因發(fā)布低俗視聽信息受到了查處,這是因過于盲目迷信算法推薦和智能分發(fā)機制所致.在此之后“今日頭條”也在不斷探索一條算法技術整體互動之路,做好工具理性和價值理性之間的平衡.

4.4 算法分發(fā)技術的優(yōu)化策略

4.4.1 算法透明(algorithmic transparency)

讓算法“黑箱”增加透明度,無監(jiān)督式的機器算法與監(jiān)督式機器算法協(xié)作生產,同時在法律層面確保大數(shù)據(jù)的安全性.把算法素養(yǎng)納入新聞傳播教育的范疇中,提高新聞從業(yè)人員和公眾的數(shù)據(jù)專業(yè)技術和意識.

4.4.2 在深度挖掘用戶信息和“數(shù)字遺忘權”中找到平衡點

信息的分發(fā)基于用戶的興趣圖譜的清晰度,而這就要求數(shù)據(jù)挖掘的深度和精度.目前業(yè)界也在致力于用戶數(shù)據(jù)的深度挖掘,進一步進行流量爭奪,例如:百度的“聊新聞”通過人機交互進一步挖掘用戶潛在的需求,而這其中規(guī)避不了個人隱私權的探討,特別是近些年被關注的歐盟提出的“數(shù)字被遺忘權”.用戶個人數(shù)據(jù)意識的覺醒是一個技術時代的進步,但如何在“用戶思維”和“市場邏輯”中找到平衡點,將決定算法技術分發(fā)是否能在大數(shù)據(jù)時代既被用戶“叫好”,也被資本市場“叫座”.

4.4.3 優(yōu)化算法迭代效率,構建算法評估體系

想要不斷優(yōu)化算法的規(guī)則和策略,需要建立一個算法評估體系.這種評估體系從信息推薦系統(tǒng)的適配性入手,分析微觀的語義、詞頻等,以此進行實時監(jiān)控確保算法模型的科學實用性,同時需做到兼顧短期指標和長期指標、兼顧用戶圖譜指標和信息生態(tài)指標,必要的時候需要做具體要素的隔離統(tǒng)計和建模.只有建立長期的、穩(wěn)定的、高適配性的算法評估體系,才能保證反向的實時監(jiān)控,個性化信息分發(fā)模型的科學性、可適用性的充分發(fā)揮.

5 結語

用戶個性化的內容訴求逐漸覺醒,對信息的“量”的追逐轉變?yōu)閷热莸膬?yōu)質、精準的需求.人工智能算法技術使得移動端的內容創(chuàng)業(yè)從野蠻生長過渡到一個有秩化的發(fā)展階段,是人和媒介以及社會三者的更高境界的融合.而基于用戶建模的“算法”分發(fā)是否會有更多的“噪音”、是否會造成新的“知溝”“爬蟲”等技術,涉及侵權等問題,是人工智能面臨的挑戰(zhàn).人們應該包容地接納技術、靈活地使用技術、積極地發(fā)展技術的同時,更應該用理性的思想判斷迎接和使用大數(shù)據(jù).

猜你喜歡
算法內容用戶
內容回顧溫故知新
基于MapReduce的改進Eclat算法
Travellng thg World Full—time for Rree
進位加法的兩種算法
關注用戶
主要內容
關注用戶
一種改進的整周模糊度去相關算法
關注用戶
如何獲取一億海外用戶
禄劝| 当雄县| 宜阳县| 双峰县| 申扎县| 达州市| 绥江县| 石棉县| 昌乐县| 辽源市| 贡嘎县| 琼结县| 泰和县| 酉阳| 施甸县| 盘山县| 北海市| 溧水县| 慈利县| 綦江县| 西贡区| 辽阳县| 邓州市| 吴川市| 仁化县| 乐昌市| 株洲市| 盐亭县| 枝江市| 新野县| 寻乌县| 桦川县| 疏附县| 玉溪市| 普兰店市| 务川| 宁海县| 沧源| 磴口县| 沁阳市| 延津县|