摘 要 算法新聞是隨著算法產(chǎn)生的一種新的新聞形式,近年來隨著“信息繭房”等問題的廣泛討論隨之引出了對于算法新聞倫理的討論。值得注意的是,算法新聞倫理的研究需要考慮算法這一技術維度。算法新聞倫理聚焦于三個問題:一是算法作為一項技術對其進行研究的方式有哪些;二是算法新聞倫理的討論如何應用算法研究進行討論;三是算法新聞倫理的主要問題及其解決思路。
關鍵詞 算法新聞倫理;ITO;逆向工程
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2018)22-0081-03
近年來,機器生成新聞逐漸成為新聞制作生態(tài)系統(tǒng)的一部分,因而也模糊了新聞、計算機科學和統(tǒng)計之間的界限[1]。這類機器生成新聞有多種不同的表述,國內有學者總結了五種不同的說法,機器新聞,自動化新聞,數(shù)據(jù)驅動新聞,計算新聞,算法新聞[2]。在這五種說法中,最受學者們認同的是算法新聞這一提法。上述五種不同的表述都突出了算法新聞生產(chǎn)過程的不同特征,綜合各種不同的說法,可以概括出算法新聞較為綜合性的概念的表述:無人工干預,依托大數(shù)據(jù)資源,整合數(shù)學、計算機等多學科工具,以算法程序為核心生產(chǎn)新聞的過程。
隨著算法新聞的普及和迅速常態(tài)化,關于算法新聞的挑戰(zhàn)和倫理問題也逐漸開始成為學界關注的一個課題。顯著地如國內較為關注算法推薦新聞產(chǎn)生的“信息繭房”這一現(xiàn)象。新聞業(yè)發(fā)展至今,技術通常被視為輔助新聞過程的工具。然而,技術及其物質載體不被認為是新聞生產(chǎn)實踐重要的參與
者[3]。算法是算法新聞的核心參與者,因而,算法新聞倫理的討論必須考慮算法這一技術維度。
1 算法及其倫理研究方式
算法作為技術,研究存在著難度。首先是技術壁壘,其次是算法自身的不透明性,即俗稱的“黑匣子”。近幾年來有學者嘗試建立算法研究的模型,大致有三種:
一是被廣泛應用于算法相關研究的輸入—吞吐量—輸出(ITO)模型[4]。這個模型是根據(jù)市場所有類型的算法應用程序特征總結出的模型。輸入一般為大數(shù)據(jù),輸出為應用程序響應后的結果。有些情況下,輸出也作為下階段的輸入。模型的關鍵在于吞吐量這一中間環(huán)節(jié)。在這一環(huán)節(jié),主要是通過數(shù)據(jù)整理進行元素提取和相關性分配。
二是概念(聚集、可能性或概率、時間)與行為者(代碼、實踐、規(guī)范)所構成的一個3×3的矩陣[5]。這個矩陣勾勒了算法倫理研究的框架。即使算法是不穩(wěn)定的研究對象,隨時會調整,且不具備透明性,其倫理仍然可以通過重新描述一個倫理框架來進行系統(tǒng)的研究,以追蹤、操作的概念,然后在算法組合的要素中尋找這些概念的證據(jù)。
三是包含數(shù)據(jù)、算法模型、界面、推理四個階段的框架[6]。這四個階段主要是對信息從開始到最終到達終端用所經(jīng)歷的渠道描述。這一框架運用扎根理論,以焦點小組的方式收集了50名新聞傳播學界和業(yè)界的關于算法必須要透明的具體方面。
這三種算法研究模型,第一種側重于算法在運行過程中的選擇(過濾)與相關性匹配等機制。后兩種則聚焦于算法的不透明性。第二種矩陣框架試圖通過探究算法外部值得關注的問題而繞過探究“黑匣子”內部。第三種則是以透明為主題的一種算法研究框架。
借助于算法研究模型,可以探究算法新聞倫理的主要問題及倫理問題主要的責任對象以便于解決倫理問題。
2 算法新聞倫理
2.1 算法新聞中的權力遷移
算法新聞倫理可以從媒介/組織、專業(yè)/個人、社會/受眾三個領域進行討論。國外學者康斯坦丁·尼古拉斯·多爾將普勒爾的倫理多層責任體系(組織、專業(yè)、社會)與魏申貝格、馬利克和肖勒提出的媒介、個人和受眾領域這兩種不同的分類體系進行綜合得出以上三個領域[7]。算法新聞倫理之所以不同于傳統(tǒng)新聞倫理的討論,主要原因是算法的介入使媒介/組織與專業(yè)/個人領域面臨著權力的遷移。權力的遷移在組織/媒介系統(tǒng)的表現(xiàn)主要是由機器人負責收集信息[8]。如BuzzFeed實驗室開發(fā)的客戶端BuzzBot,負責收集如來自博客等網(wǎng)絡資源,從而代替了以往記者收集信息的工作。在專業(yè)/個人領域,原本由記者或編輯進行的諸如把關等環(huán)節(jié)大部分由算法程序代替,人類工作者只是輔助程序進行工作。由于掌握把關權力的算法以聚集或累積用戶注意力為目標,因而用戶接收到的信息則是以滿足受眾心理或觀點相似的“溺愛式”信息,直至深陷“信息繭房”而不自知[9]。不能忽視的一點是,算法背后的設計者連同算法一起獲得了這種權力。
多爾借助算法研究的ITO模型,從算法的輸入、輸出、吞吐量三個階段分析產(chǎn)生算法倫理問題的因素以及各領域權力遷移的對象。詳見表1。2.2 算法新聞倫理的現(xiàn)實問題
多爾為算法新聞倫理建構了理論基礎,但是現(xiàn)實中各領域對于算法新聞的認知以及現(xiàn)實中存在的問題仍需要研究。
2.2.1 數(shù)據(jù)、代碼、透明度:算法新聞倫理問題的關鍵因素
通過多爾的算法新聞倫理框架,可以看到數(shù)據(jù)、透明度、代碼是算法新聞倫理中的關鍵因素,而這三個指標正好是算法的研究內容。新聞制作過程中的數(shù)據(jù)總是面臨選擇,不論是采訪還是通過數(shù)據(jù)統(tǒng)計進行一個報道。現(xiàn)有數(shù)據(jù)的完整性、質量和可靠性對算法新聞至關重要,就像對其他形式的新聞報道一樣[1]。而國外的一些相關研究表明,算法新聞數(shù)據(jù)來源主要是社交媒體,并不具備多樣性,另外也難以保證數(shù)據(jù)的權威性。代碼作為算法的直接載體,正在代替記者和編輯幫助用戶篩選新聞,如何理解代碼的意圖將是未來需要進行研究的一個方向[10]。
算法新聞倫理與算法倫理相似,都面臨著透明度的問題。新聞媒體中算法透明度的概念是試圖闡明算法信息公開的機制。公開有關算法如何驅動各種計算系統(tǒng)的信息,將允許用戶確定操作中的價值、偏見或意識形態(tài),以便理解新聞產(chǎn)品的基本觀點。算法透明主要有兩個障礙:一是受制商業(yè)動機,無法披露;二是終端用戶無法理解披露的內容[6]。
2.2.2 組織/媒介、社會/受眾、專業(yè)/個人領域對于算法新聞的認知
多爾雖然分析了算法新聞倫理在三個領域的主要影響因素,但仍需要了解三個領域目前對于算法新聞的認知,以便認識到算法新聞面臨的現(xiàn)實問題。目前,學術界對于組織/媒介、社會/受眾領域進行了探究,尚未對專業(yè)/個人領域進行研究,如沒有以計算機技術精英為研究對象的文獻。
1)組織/媒介領域。目前,新聞機構,尤其是記者和編輯等人類工作者,對于算法這一技術的認識仍然存在質疑。國外有項研究專門探討了專業(yè)人士對這一技術的看法。參與者來自BBC、CNN和湯森路透社等較有影響力的新聞機構。這些記者擁有由一家領先技術供應商提供的機器人寫作軟件的第一手經(jīng)驗。結果表明記者對自動化的判斷存在質疑,包括算法新聞數(shù)據(jù)來源,以及算法的新聞敏感性[11]。
2)社會/受眾領域。受眾對于算法新聞的認知主要有以下三個特點。
首先,受眾對于算法新聞背后的算法并不了解。有研究對美國大學生關于新聞個性化和新聞優(yōu)先次序選擇標準等問題進行了考察。結果發(fā)現(xiàn),學生們基本上不知道新聞來源是否真實以及如何跟蹤用戶數(shù)據(jù),并運用編輯判斷來提供個性化結果[12]。
其次,受眾對包括算法選擇在內的所有方式都持有懷疑態(tài)度。但是,年輕人對算法選擇的認可程度更高,喜歡軟新聞的用戶更加認可算法選擇這一方式[13]。
再次,算法沒有人類記者創(chuàng)作的新聞受用戶歡迎。一項在線試驗通過更換不同主題的新聞,如金融,體育以及文章實際來源和聲明來源研究受眾對于計算新聞的感知,研究表明,不管實際來源是人類作者還是機器作者,人類作者的新聞更受測試者歡迎[13]。
3 算法新聞倫理問題解決思路
算法新聞倫理的主要問題在于算法本身的局限性,如數(shù)據(jù)來源單一且缺乏權威性,以及受眾對于算法新聞背后的算法質疑且不了解的矛盾現(xiàn)狀。如何知曉數(shù)據(jù)源以及在沒有技術背景的支撐下,受眾又該如何監(jiān)督算法新聞存在的倫理問題?
數(shù)據(jù)來源及其權威性問題需要增加數(shù)據(jù)審核功能,即如多媒體編程接口最好能夠在搜集到數(shù)據(jù)后對于數(shù)據(jù)進行審核。數(shù)據(jù)的發(fā)布平臺必須對數(shù)據(jù)進行審查,確保數(shù)據(jù)源權威性。數(shù)據(jù)源單一性主要是結構化數(shù)據(jù)的單一性,社會或國家機構可以在一個特定的時間發(fā)布機構相關數(shù)據(jù)。同時,非結構化數(shù)據(jù)也可以作為一種數(shù)據(jù)源,如已經(jīng)在用的個人博客等。
受眾監(jiān)督算法的一個可能的嘗試是通過“逆向工程”來實現(xiàn)。逆向工程是通過對領域知識、觀察和推理的嚴格檢查來闡明系統(tǒng)規(guī)范的過程,以揭示該系統(tǒng)如何工作的模型[6]。
逆向工程途徑的提出是基于算法總有其確定的輸入與輸出,這兩個端口可以幫助禪明算法的功能,而不用具體理解代碼及其中的算法。最常見的是利用應用程序接口API觀察訪問算法的輸入輸出。輸入也面臨兩種情況,可視和不可視,這就需要對輸入進行模擬和通過與設計者交談來觀察。但需要考慮到的是算法并不是一成不變的,相反,它是會隨時調整的。因而,通過逆向工程來了解算法新聞背后的算法運作機制仍然存在局限性。
參考文獻
[1]Carl-Gustav Linden.Decades of Automation in the Newsroom[J].Digital Journalism,2017,5(2):123-140.
[2]吳鋒.發(fā)達國家“算法新聞”的理論緣起、最新進展及行業(yè)影響[J].編輯之友,2018(5):48-54.
[3]Alex Primo,Gabriela Zago.Who And What Do Journalism?An actor-network perspective[J].Digital Journalism,2015,3(1):38-52.
[4]Latzer, M.;Hollnbuchner, K.; Just, N. & Saurwein, F. (2014).The economics of algorithmic selection on the Internet. Working Paper – Media Change & Innovation Division. University of Zurich, Zurich.
[5]MikeAnanny.Toward an Ethics of Algorithms:Convening,Observation,Probability, andTimel-iness[J] .Science, Technology,& Human Values,2015,41(1):93-117.
[6]Nicholas Diakopoulos , Michael Koliska.Algorithmic Transparency in the News Media[J].2016,5(7):809-828.
[7]Konstantin Nicholas D?rr,Konstantin Nicholas D?rr. Ethical challenges of algorithmi-c journalism[J].Digital Journalism,2017, 5(4):404-419.
[8]喻國明,楊瑩瑩,閆巧妹.算法即權力:算法范式在新聞傳播中的權力革命[J].編輯之友,2018(5):5-12.
[9]陳昌鳳,霍婕.權力遷移與人本精神:算法式新聞分發(fā)的技術倫理[J].新聞與寫作,2018(1):63-66.
[10]Matthew S. Weber , Allie Kosterich.Coding the News:The role of computer code in filtering and distributing news[J].Digital Journalism,2018,6(3),310-329.
[11]Neil Thurman, Konstantin D?rr ,Jessica Kunert.WHEN REPORTERS GET HANDS-ON WITHROBO-WRITING:Professionals consider automatedjournalisms capabilities and conse-quences[J].Digital Journalism, 2017,5(10) :240-1259.
[12]Elia Powers.MY NEWS FEED IS FILTERED?Awareness of news personalization amon-gcollege students[J].Digital Journalism,2017,5(10):1315-1335.
[13]Richard Fletcher, Rasmus Kleis Nielsen.Generalised scepticism: how people navigat-e news on socialmedia[J].INFORMATION, COMMUNICATION & SOCIETY,2018:1-19.
作者簡介:陳環(huán)環(huán),中央民族大學傳播學2017級碩士研究生,研究方向為計算傳播學。