郝 珊
(上海大學(xué) 上海美術(shù)學(xué)院 上海 200444)
科技的進(jìn)步讓人類(lèi)步入數(shù)字化時(shí)代,每日都產(chǎn)生大量的數(shù)據(jù),為了更好的展現(xiàn)和理解數(shù)據(jù),數(shù)據(jù)可視化愈加流行和重要,被新聞媒體、政府報(bào)告、數(shù)據(jù)情報(bào)分析等多個(gè)領(lǐng)域頻繁的使用。可視化能夠簡(jiǎn)潔地表示復(fù)雜的低層數(shù)據(jù),從數(shù)據(jù)中提取有用信息,掌握其含義并直觀表示結(jié)果[1]。良好的數(shù)據(jù)可視化是真、善、美的均衡,即正確的反映出數(shù)據(jù)的本質(zhì),有效的幫助公眾理解并實(shí)現(xiàn)數(shù)據(jù)及制作機(jī)構(gòu)的透明度,同時(shí)兼具藝術(shù)之美[2]。其中真是真實(shí)性,是數(shù)據(jù)可視化的基石。然而眾所周知,可視化如同所有交流形式,可能會(huì)存在誤導(dǎo)和扭曲。相較于文本,帶有誤導(dǎo)信息的數(shù)據(jù)可視化錯(cuò)誤更為隱蔽,以難以察覺(jué)的方式操縱人們的觀點(diǎn),引導(dǎo)性更強(qiáng)卻難以治理,因此數(shù)據(jù)可視化信息誤導(dǎo)相關(guān)研究開(kāi)始受到研究者們的關(guān)注。
數(shù)據(jù)可視化的制作與閱讀涉及到公眾的“數(shù)字素養(yǎng)”和“數(shù)據(jù)可視化素養(yǎng)”,而數(shù)據(jù)可視化信息誤導(dǎo)則涉及到“可視化批判性素養(yǎng)[3](Critical Thinking Assessment for Literacy In visualization)”,該概念2023年被研究者所提出,其擴(kuò)展了對(duì)可視化讀寫(xiě)能力的定義,并將可視化批判性素養(yǎng)定義為閱讀、理解和推理錯(cuò)誤或潛在可視化誤導(dǎo)的能力。但數(shù)據(jù)可視化信息誤導(dǎo)的研究是其基礎(chǔ),而當(dāng)前我國(guó)針對(duì)數(shù)據(jù)可視化信息誤導(dǎo)的研究有限,更遑論可視化批判性素養(yǎng)。西方研究歷史較長(zhǎng),其多元的研究值得參考借鑒。因此本文嘗試梳理數(shù)據(jù)可視化信息誤導(dǎo)發(fā)展脈絡(luò),探究具體研究方向并展望未來(lái)方向,為我國(guó)數(shù)據(jù)可視化信息誤導(dǎo)研究和可視化批判性素養(yǎng)的構(gòu)建提供參考。
當(dāng)前國(guó)內(nèi)對(duì)于數(shù)據(jù)可視化信息誤導(dǎo)的研究大多局限于新聞傳播領(lǐng)域,由于以可視化為主的數(shù)據(jù)新聞在該領(lǐng)域廣泛使用,引發(fā)學(xué)界業(yè)界和讀者對(duì)數(shù)據(jù)可視化誤導(dǎo)的關(guān)注。早期相關(guān)研究多存在于數(shù)據(jù)新聞相關(guān)書(shū)籍中,研究觀點(diǎn)較為分散,如方潔[4]給出數(shù)據(jù)新聞可視化錯(cuò)誤案例,從數(shù)據(jù)分析錯(cuò)誤、編碼元素如顏色、軸錯(cuò)誤等方面進(jìn)行可視化誤導(dǎo)分析;張超[5]從新聞倫理角度出發(fā),更為系統(tǒng)的從數(shù)據(jù)采集到數(shù)據(jù)可視化進(jìn)行可視化誤導(dǎo)方式闡述,并提出客觀性等設(shè)計(jì)原則。近期相關(guān)研究增加,毛良斌等[6]對(duì)數(shù)據(jù)新聞可視化信息誤導(dǎo)提出了一個(gè)分析框架,從概念誤導(dǎo)和解碼誤導(dǎo)兩個(gè)方面進(jìn)行解析。申琦等[7]區(qū)分行動(dòng)者與生產(chǎn)流程,從數(shù)據(jù)源到受眾解讀不同階段分析可視化問(wèn)題核查框架。而伴隨著數(shù)據(jù)可視化使用的不斷增長(zhǎng),業(yè)界關(guān)注同樣增多,如澎湃新聞[8]開(kāi)始針對(duì)數(shù)據(jù)可視化誤導(dǎo)持續(xù)關(guān)注報(bào)道。雖然對(duì)數(shù)據(jù)可視化信息誤導(dǎo)的研究有一定進(jìn)展,并開(kāi)始呈現(xiàn)結(jié)構(gòu)化發(fā)展,但相關(guān)概念并未統(tǒng)一,同時(shí)可視化誤導(dǎo)方式解讀各異,實(shí)證研究空缺[6]。從整體出發(fā)我國(guó)針對(duì)數(shù)據(jù)可視化信息誤導(dǎo)研究有限,因此需要進(jìn)一步了解與探索。
西方對(duì)數(shù)據(jù)可視化信息誤導(dǎo)研究時(shí)間較長(zhǎng),由于數(shù)據(jù)可視化涉及統(tǒng)計(jì)學(xué)、設(shè)計(jì)學(xué)等多個(gè)學(xué)科,早期分析來(lái)自統(tǒng)計(jì)學(xué)科,20世紀(jì)50年代有統(tǒng)計(jì)背景的Huff[9]便收集報(bào)紙和雜志中的可視化誤導(dǎo)撰寫(xiě)書(shū)籍,從數(shù)據(jù)角度出發(fā)分析導(dǎo)致可視化錯(cuò)誤的原因。其后相關(guān)研究逐漸增多,從數(shù)據(jù)分析、不同編碼元素如顏色、長(zhǎng)度以及不同可視化類(lèi)型如樹(shù)圖、地圖等多個(gè)角度探索可視化誤導(dǎo)所在。2015年專(zhuān)門(mén)面向信息可視化的會(huì)議IEEE Information Visualization開(kāi)始特別關(guān)注可視化誤導(dǎo),在會(huì)議中專(zhuān)門(mén)設(shè)立小組討論,并創(chuàng)建可視化陷阱畫(huà)廊(Vis Lies Gallery)[10]網(wǎng)頁(yè)以展示可視化中嚴(yán)重的感知、認(rèn)知和概念錯(cuò)誤案例,該網(wǎng)站每年都進(jìn)行相關(guān)案例更新。同年研究者展開(kāi)實(shí)證研究[11],對(duì)用戶如何閱讀理解可視化并發(fā)現(xiàn)誤導(dǎo)進(jìn)行測(cè)驗(yàn)。時(shí)至2020年相關(guān)研究人員從視覺(jué)分析流程出發(fā),系統(tǒng)化探索可視化誤導(dǎo)所在,對(duì)數(shù)據(jù)可視化誤導(dǎo)的研究起到了極大的推動(dòng)作用。雖然西方相關(guān)研究較為多元,針對(duì)單一圖表形式、可視化誤導(dǎo)具體方式和用戶認(rèn)知都有所涉獵,但其對(duì)于可視化信息誤導(dǎo)概念同樣并未統(tǒng)一,誤導(dǎo)方式用詞不同,針對(duì)認(rèn)知方向研究分散在不同會(huì)議之中,造成這些研究缺乏對(duì)現(xiàn)有研究的深度梳理,需要對(duì)當(dāng)前研究進(jìn)展和方向進(jìn)行相關(guān)文獻(xiàn)的統(tǒng)計(jì)分析和深入闡釋。
本文通過(guò)文獻(xiàn)分析方式展開(kāi)對(duì)數(shù)據(jù)可視信息誤導(dǎo)方向的研究。大數(shù)據(jù)時(shí)代的文獻(xiàn)分析應(yīng)以問(wèn)題為導(dǎo)向,標(biāo)準(zhǔn)化地篩選高質(zhì)量文獻(xiàn)以進(jìn)行精準(zhǔn)的分析研究[12]。本研究的文獻(xiàn)檢索范圍分為中西方兩部分。國(guó)內(nèi)研究首先通過(guò)知網(wǎng)CNKI搜索關(guān)鍵詞“數(shù)據(jù)可視化”、“誤導(dǎo)”查找,發(fā)現(xiàn)文章1篇。其后更改關(guān)鍵詞為“倫理”,增加CSSCI文章2篇。3篇文章均發(fā)表于2022年,且與數(shù)據(jù)新聞關(guān)聯(lián)。因此對(duì)數(shù)據(jù)新聞相關(guān)書(shū)籍進(jìn)行閱讀梳理,增加相關(guān)書(shū)籍4本。同時(shí)由于國(guó)內(nèi)數(shù)據(jù)新聞業(yè)界關(guān)注該問(wèn)題關(guān)注,補(bǔ)充業(yè)界相關(guān)報(bào)道5篇。
西方該方向的研究以設(shè)計(jì)學(xué)、數(shù)據(jù)可視化和人機(jī)交互領(lǐng)域?yàn)橹鳌J紫纫钥梢暬`導(dǎo)的參考文獻(xiàn)作為起點(diǎn),通過(guò)回顧被引和引用的出版物來(lái)擴(kuò)展范圍。搜索驅(qū)動(dòng)主要選擇了可視化領(lǐng)域高影響力的國(guó)際會(huì)議(ACM CHI、IEEE InfoVis、IEEE PacificVis、IV、IEEE EuroVis、IEEE ICCV)以及期刊(IEEE TVCG、IEEE CGA、ACM Transactions on Graphics、Computer Graphics Forum)收集了論文,時(shí)間截止到2023年,審核了摘要和全文后確定了76篇論文,其后根據(jù)參考文獻(xiàn)及其內(nèi)容增加了4本設(shè)計(jì)學(xué)書(shū)籍、3本統(tǒng)計(jì)學(xué)書(shū)籍和22篇新聞學(xué)、心理學(xué)、教育學(xué)、經(jīng)濟(jì)學(xué)領(lǐng)域的相關(guān)文章。
當(dāng)前我國(guó)對(duì)于數(shù)據(jù)可視化信息誤導(dǎo)并未有完整的概念,毛良斌等人[6]用詞為“可視化信息誤導(dǎo)”,申琦等人[7]用詞“視覺(jué)效果偏倚”,但未直接解釋概念。其他研究者多直接使用可視化錯(cuò)誤、可視化問(wèn)題、可視化陷阱等詞語(yǔ)進(jìn)行描述。
針對(duì)可視化信息誤導(dǎo)的概念,西方用詞也并不統(tǒng)一。實(shí)證研究的初始者Pandey等人[11]運(yùn)用詞匯“欺騙信息”并將其定義為:它是對(duì)信息圖形的描述,在設(shè)計(jì)時(shí)有意或者無(wú)意欺騙,可能會(huì)使人對(duì)信息和(或)其組成部分產(chǎn)生一種與實(shí)際信息不同的看法。Kong等人[13]借鑒新聞學(xué)中的misinformation并從讀者角度出發(fā)進(jìn)行改動(dòng),將可視化“誤導(dǎo)性信息”定義為:導(dǎo)致人對(duì)事實(shí)產(chǎn)生誤解的信息。其他研究者則使用了不同詞匯,Mcnutt等人[14]將失敗的可視化歸結(jié)并定義為“可視化迷霧”(visualization Mirages):任何一種可視化,粗略地閱讀可視化似乎支持來(lái)自數(shù)據(jù)的特定信息,但更加仔細(xì)地檢查可視化、其支撐的數(shù)據(jù)或分析過(guò)程會(huì)使支持過(guò)程無(wú)效,或產(chǎn)生重大懷疑。其在定義中注重了可視化的生產(chǎn)與消費(fèi)過(guò)程。Lee等人[15]將有問(wèn)題的可視化信息總結(jié)為“反可視化”(Counter-visualizations):用非正統(tǒng)的方式使用可視化。Lo等人[16]使用數(shù)據(jù)可視化“誤導(dǎo)信息”(misinformative information),并提出當(dāng)數(shù)據(jù)不支持預(yù)期的意圖,則很容易扭曲可視化使它看起來(lái)具有支持性,這會(huì)導(dǎo)致誤導(dǎo)。
綜合上述對(duì)于可視化誤導(dǎo)的概念,同時(shí)參考國(guó)內(nèi)新聞傳播領(lǐng)域給出的相關(guān)翻譯,本文使用“數(shù)據(jù)可視化信息誤導(dǎo)”,并提出其概念定義:數(shù)據(jù)可視化信息誤導(dǎo)是可視化在設(shè)計(jì)過(guò)程中,存在有意或者無(wú)意的誤導(dǎo)或欺騙性,或者不支持預(yù)期的設(shè)計(jì)意圖,導(dǎo)致可視化結(jié)果偏離數(shù)據(jù)本身應(yīng)揭示的規(guī)律和特征。用戶在閱讀可視化后,對(duì)其中的信息產(chǎn)生與實(shí)際信息/數(shù)據(jù)不同的看法,產(chǎn)生認(rèn)知偏差。如果對(duì)可視化的生產(chǎn)與消費(fèi)環(huán)節(jié)進(jìn)行細(xì)致的檢測(cè)與驗(yàn)證,就會(huì)發(fā)現(xiàn)其中的疑點(diǎn),并對(duì)該可視化產(chǎn)生質(zhì)疑。
從可視化信息誤導(dǎo)的概念可以發(fā)現(xiàn),在設(shè)計(jì)階段,數(shù)據(jù)可視化誤導(dǎo)可能是人為故意設(shè)置的,也可能是由于個(gè)人素養(yǎng)有限或技術(shù)水平受限等原因而無(wú)意識(shí)觸發(fā)的,甚至無(wú)法有效傳遞主旨信息也被視為誤導(dǎo)[17]。而在消費(fèi)階段,除了錯(cuò)誤的視覺(jué)指引,讀者自身的可視化素養(yǎng)同樣可能引發(fā)認(rèn)知錯(cuò)誤。而無(wú)論是何種誤導(dǎo)方式,最終結(jié)果是導(dǎo)致可視化結(jié)果偏離數(shù)據(jù)事實(shí)并產(chǎn)生認(rèn)知錯(cuò)誤。
對(duì)于數(shù)據(jù)可視化帶來(lái)的信息誤導(dǎo),我國(guó)集中在新聞傳播領(lǐng)域,其重要原因是數(shù)據(jù)新聞及其對(duì)可視化的運(yùn)用以及其在社交媒體平臺(tái)傳播熱度與廣度帶來(lái)的推動(dòng)。根據(jù)12篇國(guó)內(nèi)相關(guān)文獻(xiàn)可以發(fā)現(xiàn),隨著數(shù)據(jù)新聞在我國(guó)的應(yīng)用和教學(xué)開(kāi)展,最初部分學(xué)者如方潔[4]、吳小坤[18]等在數(shù)據(jù)新聞相關(guān)教材中引用錯(cuò)誤案例,為設(shè)計(jì)教學(xué)提供輔助。在此基礎(chǔ)之上,研究者們進(jìn)一步將數(shù)據(jù)可視化誤導(dǎo)與新聞倫理關(guān)聯(lián),如張超[5]從新聞生產(chǎn)的客觀性、透明度等倫理出發(fā),通過(guò)數(shù)據(jù)采集、分析和可視化三個(gè)角度進(jìn)行可視化錯(cuò)誤整理。申琦等[7]將新聞可視化產(chǎn)生的問(wèn)題稱(chēng)為“視覺(jué)效果偏倚”,從數(shù)據(jù)源、視覺(jué)生產(chǎn)和受眾解讀三個(gè)角度進(jìn)行分析。王禮耀[19]探究數(shù)據(jù)新聞可視化視覺(jué)框架,從數(shù)據(jù)聲明、映射構(gòu)型及審美慣例三個(gè)維度分析信息圖生產(chǎn)的真實(shí)性。從近期的研究可以看出,當(dāng)前研究部分的分析已經(jīng)呈現(xiàn)一定結(jié)構(gòu)性,其分析方向開(kāi)始趨向于從生產(chǎn)消費(fèi)角度出發(fā),分階段探討。同時(shí)業(yè)界如澎湃新聞、財(cái)新可視化實(shí)驗(yàn)室[20]以及搜狐等均對(duì)數(shù)據(jù)新聞中的可視化錯(cuò)誤案例進(jìn)行梳理與分析。同時(shí)期研究者嘗試提出治理方式,如針對(duì)數(shù)據(jù)新聞可視化,申琦等[7]提出從雙向素養(yǎng)、數(shù)據(jù)行動(dòng)與可視化基準(zhǔn)三個(gè)維度尋求可視化誤導(dǎo)治理方法。然而受制于相關(guān)理論研究有限,研究多提出于近期,難以看到在實(shí)踐中的解決效果,但從covid疫情期間的部分可視化誤導(dǎo)來(lái)看,對(duì)于數(shù)據(jù)可視化誤導(dǎo)的研究仍需要進(jìn)一步分析并增加不同角度、不同使用領(lǐng)域的深入探討,為實(shí)踐提供理論指導(dǎo)。
在收集的105篇西方文獻(xiàn)基礎(chǔ)上,本文根據(jù)研究使用方法和研究?jī)?nèi)容深度的差異,將西方相關(guān)研究分為3個(gè)發(fā)展階段。
第一階段:數(shù)據(jù)可視化具體誤導(dǎo)方式的發(fā)現(xiàn)階段。1954年Huff[9]在其著作《統(tǒng)計(jì)學(xué)會(huì)撒謊》中開(kāi)始分析誤導(dǎo)性可視化。該書(shū)出版后暢銷(xiāo)美國(guó)并引發(fā)了人們對(duì)“虛假信息”的普遍關(guān)注。隨后1985年Tufte[21〗在《定量信息的視覺(jué)顯示》中引入術(shù)語(yǔ)“圖形完整性(graphical integrity)”和“謊言因子(lie factors)”以闡述可視化扭曲信息的微妙方式。隨著可視化技術(shù)的提升和在報(bào)紙、廣告中的廣泛使用,針對(duì)具體圖表和編碼方式帶來(lái)的誤導(dǎo)如顏色[22]、面積[23]等開(kāi)始被研究人員廣泛探索。該階段研究主要針對(duì)單一可視化圖表,發(fā)現(xiàn)與解釋相關(guān)欺騙模式并提供規(guī)避誤導(dǎo)的指南。
第二階段:數(shù)據(jù)可視化誤導(dǎo)信息的實(shí)證階段。2015年起Pandey等人[11]開(kāi)始嘗試對(duì)欺騙性的圖表下定義與分類(lèi),并實(shí)證部分圖形失真技術(shù)與認(rèn)知偏差。針對(duì)數(shù)據(jù)可視化誤導(dǎo)的實(shí)證研究自此開(kāi)始,從此可視化信息誤導(dǎo)相關(guān)研究開(kāi)始不斷增加。第二階段不單針對(duì)圖表,將文本與可視化結(jié)合從整體出發(fā)的研究開(kāi)始出現(xiàn)[24],但重點(diǎn)依然是部分可視化圖表類(lèi)型如地圖[25]等。
第三階段:數(shù)據(jù)可視化信息誤導(dǎo)系統(tǒng)性框架分析階段。2019年Cairo[26]在其書(shū)籍《數(shù)據(jù)可視化陷阱(How chart lie)》中探究從看不見(jiàn)的數(shù)據(jù)到看得見(jiàn)的具體可視化設(shè)計(jì)中帶來(lái)的錯(cuò)誤,為后續(xù)分析打下基礎(chǔ)。2020年Mcnutt等人[14]提出了結(jié)構(gòu)性的可視化誤導(dǎo)信息分析方式,即通過(guò)視覺(jué)分析過(guò)程從生產(chǎn)過(guò)程的數(shù)據(jù)清理選擇到消費(fèi)過(guò)程的閱讀5個(gè)不同階段分析誤導(dǎo)所在,自此對(duì)于數(shù)據(jù)可視化誤導(dǎo)的分析有了系統(tǒng)的框架結(jié)構(gòu)。其后的研究人員在其基礎(chǔ)上對(duì)數(shù)據(jù)可視化誤導(dǎo)方式進(jìn)行了細(xì)致的挖掘,針對(duì)可視化信息誤導(dǎo)改進(jìn)的研究也不斷增加。該階段不同領(lǐng)域的研究人員均開(kāi)始注意到了數(shù)據(jù)可視化誤導(dǎo)可能帶來(lái)的問(wèn)題,如水文研究[27]、科學(xué)信息[28]等,研究范圍擴(kuò)大。同時(shí)將批判性思維與數(shù)據(jù)素養(yǎng)相關(guān)聯(lián),整體呈現(xiàn)多元的發(fā)展方向。
Correll等人[29]將數(shù)據(jù)可視化信息誤導(dǎo)研究分為3類(lèi),一是羅列可視化誤導(dǎo)具體方式;二是探究用戶的閱讀體驗(yàn),了解可視化誤導(dǎo)帶來(lái)的影響以及相關(guān)證據(jù);三是尋找對(duì)于誤導(dǎo)性可視化設(shè)計(jì)行為的檢測(cè)和防御。筆者在分析相關(guān)文獻(xiàn)后對(duì)于該分類(lèi)方式較為認(rèn)同,在這里將每個(gè)研究方向目前進(jìn)展進(jìn)行梳理總結(jié)。
該研究方向重點(diǎn)探究數(shù)據(jù)可視化中的誤導(dǎo)技巧,分析錯(cuò)誤案例及設(shè)計(jì)中錯(cuò)誤介入方式,作為未來(lái)檢測(cè)和預(yù)防工作的基礎(chǔ)。近年來(lái)研究者已經(jīng)給出了系統(tǒng)性的分析方法,2020年Mcnutt等人[14]將視覺(jué)分析過(guò)程分為數(shù)據(jù)選擇、準(zhǔn)備、設(shè)計(jì)驅(qū)動(dòng)、呈現(xiàn)以及閱讀這5個(gè)階段,并認(rèn)為欺騙與誤導(dǎo)是出現(xiàn)在單獨(dú)階段或不同階段疊加的過(guò)程之中。在其基礎(chǔ)之上,2022年Lo等人[16]對(duì)大量的可視化誤導(dǎo)案例進(jìn)行開(kāi)放編碼,總結(jié)出74種具體數(shù)據(jù)可視化錯(cuò)誤類(lèi)型(見(jiàn)表1)。Zheng等人[30]在圖表基礎(chǔ)之上更進(jìn)一步,從敘事可視化的概念出發(fā),推導(dǎo)出數(shù)據(jù)故事可視化生產(chǎn)消費(fèi)的步驟并分析每個(gè)階段誘發(fā)錯(cuò)誤信息的具體原因。同時(shí)將誤導(dǎo)分為作者誘導(dǎo)的讀者-不可檢測(cè)的錯(cuò)誤信息、作者誘導(dǎo)的讀者-可檢測(cè)的錯(cuò)誤信息和讀者誘導(dǎo)的錯(cuò)誤信息。與之略微不同的是Lisnic等人[31]以Twitter上的covid案例集為基礎(chǔ),進(jìn)行可視化誤導(dǎo)信息的分析,尋找給定主題下誤導(dǎo)的來(lái)源,并提出了邏輯錯(cuò)誤和結(jié)構(gòu)設(shè)計(jì)錯(cuò)誤兩個(gè)框架,認(rèn)為日??梢暬畔⒅羞壿嬪e(cuò)誤多于結(jié)構(gòu)設(shè)計(jì)錯(cuò)誤。當(dāng)前對(duì)于數(shù)據(jù)可視化中的誤導(dǎo)方式分析較為細(xì)致,但由于不同研究者出發(fā)點(diǎn)不同,如專(zhuān)門(mén)針對(duì)可視化圖表分析或從數(shù)據(jù)故事文章整體分析,因此研究仍然需要一個(gè)整理與匯總。同時(shí)由于可視化在日常生活中的廣泛使用,必然有一部分未曾發(fā)現(xiàn)的錯(cuò)誤在等待研究者的發(fā)掘。
表1 案例可視化誤導(dǎo)方式分類(lèi)表
第二個(gè)研究方向是探究用戶對(duì)于數(shù)據(jù)可視化信息誤導(dǎo)的解讀方式,了解認(rèn)知偏差和可視化素養(yǎng)如何甄別欺騙與誤導(dǎo)。如圖理解理論中所言:用戶需要執(zhí)行的閱讀任務(wù)一部分是問(wèn)題之間的轉(zhuǎn)譯,以及文本概念和圖形表示之間的映射,因此用戶的閱讀體驗(yàn)是研究者們關(guān)注的一個(gè)重點(diǎn)。Pandey等人[11]分析用戶教育水平、圖表熟悉度、視覺(jué)能力和認(rèn)知需求,探討這些因素如何影響可視化誤導(dǎo)信息閱讀中的認(rèn)知偏差。但研究沒(méi)有說(shuō)明個(gè)體差異因素之間的相關(guān)性,無(wú)法提供有力的結(jié)論。Geidner等人[32]發(fā)現(xiàn)對(duì)于欺騙性文字和圖片,用戶對(duì)圖表更有記憶度,但相同情況下圖表獲得的質(zhì)疑度更高。Laure等人[33]探究學(xué)習(xí)了可視化技能的用戶是否能察覺(jué)欺騙策略,結(jié)果顯示由于可視化相關(guān)課程講述了可視化的客觀性,導(dǎo)致學(xué)習(xí)者的過(guò)度信賴(lài),最終發(fā)現(xiàn)學(xué)習(xí)和未學(xué)習(xí)數(shù)據(jù)可視化者都難以察覺(jué)欺騙。由此可見(jiàn),針對(duì)可視化信息誤導(dǎo)需要進(jìn)行單獨(dú)的學(xué)習(xí)與指導(dǎo)。Zheng等人[30]在用戶實(shí)驗(yàn)中發(fā)現(xiàn)讀者認(rèn)為被誤導(dǎo)的一個(gè)可能方向是閱讀可視化時(shí)的重點(diǎn)不同,即用戶只在圖片中尋找其興趣點(diǎn),未能從整體角度完成對(duì)圖片和文字的閱讀。Holder等人[34]發(fā)現(xiàn)媒體使用隱藏可變性的條形圖可能導(dǎo)致“赤字框架效應(yīng)”,即認(rèn)為結(jié)果差異是由于群體缺陷造成,而非外部因素。這可能導(dǎo)致刻板印象和社會(huì)不公。
還有一部分研究者開(kāi)始將批判性思維與可視化素養(yǎng)相結(jié)合,探究如何發(fā)現(xiàn)與解決數(shù)據(jù)可視化信息誤導(dǎo)。如Chevalier等人[35]將批判性思維與可視化素養(yǎng)相結(jié)合,探究在早期教育中如何發(fā)現(xiàn)數(shù)據(jù)可視化誤導(dǎo)。Rodrigues等人[36]通過(guò)問(wèn)卷探究人們嘗試?yán)斫饪梢暬瘯r(shí)常犯的錯(cuò)誤,并將其與可視化素養(yǎng)結(jié)合,探討是否可以用于數(shù)據(jù)可視化教學(xué)。Lily等人[3]提出了可視化批判性素養(yǎng),并制定相關(guān)評(píng)估量表。但該方向與數(shù)據(jù)可視化信息誤導(dǎo)方式緊密關(guān)聯(lián),誤導(dǎo)方式是可視化批判素養(yǎng)的基礎(chǔ),當(dāng)前誤導(dǎo)方式分析不足導(dǎo)致該方向仍有極大發(fā)展空間。
第三個(gè)研究方向是進(jìn)行“防御”式設(shè)計(jì),尋找對(duì)抗誤導(dǎo)信息的方式,分析如何修復(fù)圖表錯(cuò)誤。一部分研究側(cè)重通過(guò)算法對(duì)數(shù)據(jù)可視化信息誤導(dǎo)進(jìn)行預(yù)防與提示。為了避免可視化誤導(dǎo)的產(chǎn)生,創(chuàng)作者可以通過(guò)在創(chuàng)作過(guò)程中仔細(xì)選擇默認(rèn)值[37]或通過(guò)可視化軟件的推薦系統(tǒng)如Tableau的Show me[38]進(jìn)行自動(dòng)圖表生成。其中部分研究從設(shè)計(jì)者角度出發(fā)嘗試降低可視化出錯(cuò)率,如Lee等人[39]針對(duì)多維數(shù)據(jù)設(shè)計(jì)了一個(gè)可視化數(shù)據(jù)探索工具,幫助設(shè)計(jì)者避免下鉆謬誤(錯(cuò)誤因果關(guān)系)。Wall等人[40]開(kāi)發(fā)自動(dòng)增強(qiáng)可視化分析的系統(tǒng)以減輕認(rèn)知偏差。
還有一部分通過(guò)算法研發(fā)自動(dòng)檢測(cè)及消除數(shù)據(jù)可視化信息誤導(dǎo)的方法,如McNutt等人[14]在視覺(jué)分析過(guò)程中提出了一種針對(duì)靜態(tài)圖表表面“可視化迷霧”的變形測(cè)試方法。Correll等人[41]設(shè)計(jì)了Visualint技術(shù),通過(guò)在可視化圖表中標(biāo)注錯(cuò)誤映射和表達(dá)的方式幫助讀者發(fā)現(xiàn)問(wèn)題。Chen等人[42]開(kāi)發(fā)了Vislinter,該系統(tǒng)可以自動(dòng)檢測(cè)可視化缺陷并給出修改建議。但是當(dāng)前檢測(cè)方法的通用性和普及性有待考證,且隨著技術(shù)手段的提升,數(shù)據(jù)可視化不一定單獨(dú)出現(xiàn),如很多新聞媒體會(huì)給可視化增加交互操作,或運(yùn)用視頻等更加難以檢測(cè)的視覺(jué)形式。針對(duì)多變的現(xiàn)實(shí)情況,自動(dòng)檢測(cè)以改進(jìn)數(shù)據(jù)可視化信息誤導(dǎo)的系統(tǒng)仍然有待研究人員的開(kāi)發(fā)。
數(shù)據(jù)可視化信息誤導(dǎo)概念和具體方式涉及到了數(shù)據(jù)安全與倫理,圖情界需要對(duì)該方向進(jìn)行關(guān)注。其概念由于不同學(xué)科領(lǐng)域用詞不同難以統(tǒng)一,同時(shí)數(shù)據(jù)可視化信息誤導(dǎo)涉及到數(shù)據(jù)采集清理、制作者設(shè)計(jì)選擇、閱讀平臺(tái)展現(xiàn)以及用戶個(gè)人體驗(yàn)多個(gè)不同流程和要素,雖然本文匯總提出了其概念,但仍然需要細(xì)究這些元素帶來(lái)的影響和理念變動(dòng)。其次,數(shù)據(jù)可視化信息誤導(dǎo)細(xì)分化研究是一個(gè)疊加式的積累過(guò)程,有3個(gè)具體方向。1)數(shù)據(jù)可視化信息誤導(dǎo)受到使用可視化的學(xué)科領(lǐng)域影響,如地理水文圖表誤導(dǎo)方式和社交媒體平臺(tái)可視化誤導(dǎo)方式有一定差異,不同領(lǐng)域用戶閱讀方式也各有差異,需要區(qū)分研究。2)數(shù)據(jù)可視化生產(chǎn)消費(fèi)流程同樣受到不同學(xué)科影響,如數(shù)據(jù)科學(xué)對(duì)數(shù)據(jù)清理分析部分產(chǎn)生的誤導(dǎo)有更加深入的了解,那么可視化是否還有更多的統(tǒng)計(jì)錯(cuò)誤/謬誤,哪些謬誤是難以察覺(jué)與檢測(cè)的,這些問(wèn)題需要專(zhuān)業(yè)的數(shù)據(jù)知識(shí)進(jìn)行解答。3)數(shù)據(jù)可視化素養(yǎng)不同,帶來(lái)的解碼結(jié)果不同,如針對(duì)疫情期間數(shù)據(jù)新聞報(bào)道Covid-19病例增長(zhǎng)情況圖表,在疫情爆發(fā)初期,人們發(fā)現(xiàn)對(duì)數(shù)刻度具有誤導(dǎo)性,使曲線變得平滑,然而對(duì)于掌握相關(guān)知識(shí)的人,使用其他方式如指數(shù)刻度反而具有誤導(dǎo)性。數(shù)據(jù)可視化素養(yǎng)的培養(yǎng)和規(guī)范化如何影響數(shù)據(jù)可視化信息誤導(dǎo)的認(rèn)知和理論,需要進(jìn)行進(jìn)一步探究與修訂。對(duì)該領(lǐng)域細(xì)分化的研究能夠產(chǎn)生更加細(xì)致的結(jié)論,為研究提供更廣闊的空間,也為數(shù)據(jù)可視化安全或者說(shuō)數(shù)據(jù)安全提供基礎(chǔ)。
對(duì)于用戶如何解讀數(shù)據(jù)可視化信息誤導(dǎo)、何種程度能夠發(fā)現(xiàn)可視化信息誤導(dǎo)仍需測(cè)試。因此在實(shí)證方面有3個(gè)發(fā)展方向。1)檢測(cè)影響用戶體驗(yàn)的具體因素,雖然當(dāng)前已證明注意力、信仰等對(duì)數(shù)據(jù)可視化誤讀有極大的影響,但僅靠這部分因素進(jìn)行評(píng)判測(cè)驗(yàn)并不充足,還需要探究有哪些其他因素同樣影響到用戶閱讀體驗(yàn),比如使用平臺(tái)、先驗(yàn)知識(shí)等,這些不同因素影響力如何需要實(shí)證檢驗(yàn)。2)西方的研究已經(jīng)證明對(duì)于誤導(dǎo)性可視化是需要習(xí)得的,而由于誤導(dǎo)方式的完整度有限,相關(guān)理論并未構(gòu)建完善,如何進(jìn)行教育、學(xué)習(xí)效果幾何并未有定論。相關(guān)理論能否幫助用戶甚至是制作者以及如何有效幫助需要進(jìn)一步實(shí)驗(yàn),這又和下一個(gè)研究方向互通。3)數(shù)據(jù)素養(yǎng)在塑造用戶閱讀可視化方面起著至關(guān)重要的作用,當(dāng)前西方的研究表明普通人的數(shù)據(jù)可視化素養(yǎng)水平有限,在解讀數(shù)據(jù)可視化方面存在局限性[43]。我國(guó)數(shù)據(jù)可視化素養(yǎng)的研究正在起步前行階段,對(duì)于新興的可視化批判性素養(yǎng)解讀暫時(shí)空缺,需要加快研究步伐,根植于本土發(fā)展,開(kāi)發(fā)適合我國(guó)國(guó)情和民情的數(shù)據(jù)可視化批判性素養(yǎng)量表進(jìn)行補(bǔ)充。
當(dāng)前的研究者雖然設(shè)計(jì)出一部分算法以針對(duì)數(shù)據(jù)可視化誤導(dǎo)信息,但大部分針對(duì)其中的某一個(gè)獨(dú)立問(wèn)題,如針對(duì)靜態(tài)圖表的變形或錯(cuò)誤的可視化標(biāo)注。由于相關(guān)理論并未構(gòu)建完善,防御系統(tǒng)的開(kāi)發(fā)程度自然有限。大部分研究開(kāi)發(fā)的程序并未應(yīng)用到相關(guān)實(shí)踐之中,且其檢測(cè)方式的通用性和普及性依然有待考證。而從covid-19全球公共衛(wèi)生事件中數(shù)據(jù)可視化誤導(dǎo)頻發(fā)可以察覺(jué),制作者的數(shù)據(jù)可視化素養(yǎng)有限,需要技術(shù)上的輔助。而隨著可視化技術(shù)的更新和進(jìn)步,靜態(tài)圖表的主流地位被廣受大眾喜愛(ài)的交互、游戲和視頻所威脅,如何檢測(cè)這部分視覺(jué)形式所產(chǎn)生的誤導(dǎo),該方向仍然處于待開(kāi)發(fā)的狀態(tài)。交互等技術(shù)對(duì)當(dāng)前數(shù)字社會(huì)重要性不言而喻,給出正向而良好的交互方式是數(shù)字社會(huì)的基礎(chǔ)要求。如何防御數(shù)據(jù)可視化交互和視頻中的錯(cuò)誤需要深入探究。
隨著數(shù)據(jù)可視化在公共話語(yǔ)與視覺(jué)平臺(tái)中占有一席之地,確??梢暬_性與真實(shí)性,向大眾傳播準(zhǔn)確的視覺(jué)信息是制作者的職責(zé)所在,我國(guó)圖情界需要涉足該領(lǐng)域。同時(shí),數(shù)據(jù)可視化批判性素養(yǎng)是可視化素養(yǎng)的一個(gè)分支,同樣是大數(shù)據(jù)情境下素養(yǎng)教育和研究的新方向,急需重視。我國(guó)需要增加對(duì)數(shù)據(jù)可視化信息誤導(dǎo)的討論,強(qiáng)化數(shù)據(jù)可視化安全、倫理等根基意識(shí),研究可視化批判性素養(yǎng)如何應(yīng)用到教育、科研等不同領(lǐng)域。在當(dāng)前的大數(shù)據(jù)環(huán)境下,將設(shè)計(jì)學(xué)、數(shù)據(jù)科學(xué)、數(shù)字人文等領(lǐng)域進(jìn)一步融合交叉,以構(gòu)建該領(lǐng)域我國(guó)學(xué)術(shù)話語(yǔ)體系。