喻國明 何睿
摘要:文章在對(duì)健康信息大數(shù)據(jù)的來源和分類的基礎(chǔ)上,從學(xué)術(shù)研究和實(shí)踐應(yīng)用兩個(gè)方面,分別闡釋了大數(shù)據(jù)在健康傳播與調(diào)查研究以及對(duì)個(gè)人、組織、社會(huì)等層面的可能影響。文章對(duì)如何運(yùn)用非結(jié)構(gòu)化的、大規(guī)模的、動(dòng)態(tài)化的大數(shù)據(jù)進(jìn)行有效健康傳播、實(shí)現(xiàn)科學(xué)化健康管理的問題亦有提及。
關(guān)鍵詞:
大數(shù)據(jù) 健康信息 健康傳播
由中國人民大學(xué)輿論研究所、國家癌癥中心和中國健康中心合作進(jìn)行的中國癌癥健康信息調(diào)查中,北京、合肥兩地試調(diào)查的數(shù)據(jù)顯示,經(jīng)常用計(jì)算機(jī)上網(wǎng)的被調(diào)查者,有76.3%的人表示會(huì)上網(wǎng)獲取健康信息;經(jīng)常使用手機(jī)和iPad等移動(dòng)終端上網(wǎng)的被調(diào)查者中有68.8%的人有搜尋健康信息的經(jīng)歷,但滿意度和可信度并不高,其中網(wǎng)絡(luò)健康信息的信任度僅有32.9%。[1]
因此,如何利用眾多的健康信息成為亟待解決的問題。不單單是一般民眾,對(duì)于政府或盈利組織、醫(yī)療機(jī)構(gòu)、社會(huì)系統(tǒng)來說,如何運(yùn)用醫(yī)療健康信息的大數(shù)據(jù)實(shí)現(xiàn)健康管理的目標(biāo),如何利用大數(shù)據(jù)帶來的重大機(jī)遇與積極影響,也是十分必要且重要的。那么,在健康傳播領(lǐng)域,大數(shù)據(jù)究竟會(huì)給我們帶來什么呢?
一、健康信息大數(shù)據(jù)的內(nèi)容來源
從目前來看,組成健康信息的大數(shù)據(jù)的內(nèi)容主要來自以下幾個(gè)方面:
1. 電子病歷和電子健康檔案等數(shù)據(jù)庫。主要記錄個(gè)人健康狀況、疾病狀況、就醫(yī)史及有關(guān)疾病案例的癥狀、治療信息等。在我國,電子病歷和電子健康數(shù)據(jù)庫尚處于建設(shè)階段,將于“十二五”末基本建成。
2. 醫(yī)療和健康信息網(wǎng)站,提供醫(yī)院、醫(yī)生信息查詢,醫(yī)患咨詢、門診預(yù)約、就醫(yī)經(jīng)驗(yàn)分享等信息和服務(wù),它通常依托于醫(yī)院或?qū)I(yè)從醫(yī)人員。
3. 社交網(wǎng)站健康信息。由政府、機(jī)構(gòu)或個(gè)人發(fā)布的與健康相關(guān)的內(nèi)容,并包含個(gè)人的健康行為、健康信息使用等情況。由于發(fā)布者多元化,信息質(zhì)量難免參差不齊。
4. 移動(dòng)終端發(fā)布的個(gè)人健康信息或行為數(shù)據(jù)。完整的數(shù)據(jù)應(yīng)當(dāng)包括時(shí)間和地點(diǎn)信息,因此,這一數(shù)據(jù)也由于移動(dòng)技術(shù)等的出現(xiàn)而較為容易獲得。
5. 健康、醫(yī)療物聯(lián)網(wǎng)。指將所有跟病人有關(guān)的系統(tǒng)如醫(yī)生、護(hù)士、藥品、器械等,系統(tǒng)地按照一定的標(biāo)準(zhǔn)和管理規(guī)范進(jìn)行有序管理。借助于物聯(lián)網(wǎng)技術(shù),通常利用遠(yuǎn)程技術(shù)實(shí)現(xiàn),如“移動(dòng)醫(yī)療”、遠(yuǎn)程無線健康監(jiān)護(hù)平臺(tái)等。
二、健康信息大數(shù)據(jù)的內(nèi)容分類
以上信息紛繁龐雜,從大數(shù)據(jù)使用和挖掘的角度上看,我們可以按照數(shù)據(jù)的性質(zhì)和內(nèi)容對(duì)其進(jìn)行分類,以期更好地探究這些健康數(shù)據(jù)的有效利用。如從健康關(guān)系中最重要的一方——一般個(gè)人來看,這些數(shù)據(jù)可以歸為三類。
1. 個(gè)人社會(huì)基本屬性類。通常指一般人口統(tǒng)計(jì)學(xué)特征,包括年齡、性別、職業(yè)、地區(qū)、受教育程度、職業(yè)、財(cái)產(chǎn)狀況、聯(lián)系方式、健康狀況等等。這類信息是針對(duì)人群分類的重要維度,它們往往與個(gè)人的健康行為和健康認(rèn)知有關(guān),如城市和農(nóng)村、不同年齡段的人群的健康意識(shí)可能有較大差別,而用戶的健康狀況直接決定著其對(duì)健康信息需要的迫切性和目的性,因此人口統(tǒng)計(jì)學(xué)特征是數(shù)據(jù)挖掘和實(shí)行健康管理的重要對(duì)象和內(nèi)容。
2. 健康興趣、需求與使用行為類。使用大數(shù)據(jù)分析可通過個(gè)人健康感知、危險(xiǎn)感知體現(xiàn)出來,包括與健康相關(guān)的生活習(xí)慣,如平常吸煙、生活習(xí)慣混亂等,如常讀的醫(yī)藥類書目、接觸的健康類節(jié)目等。
3. 人際、組織或社會(huì)關(guān)系類。網(wǎng)絡(luò)上的健康信息關(guān)系諸如個(gè)人與他人的互動(dòng)、關(guān)系網(wǎng)、朋友圈等。在社交媒體上,轉(zhuǎn)發(fā)、@、評(píng)論都是一種互動(dòng)關(guān)系:“每一個(gè)用戶都是一個(gè)網(wǎng)絡(luò)中的節(jié)點(diǎn)……如何利用用戶的關(guān)系網(wǎng)絡(luò)實(shí)現(xiàn)更有效的信息發(fā)布,是大數(shù)據(jù)時(shí)代媒體用戶關(guān)系管理的獨(dú)有課題?!盵2]
三、健康信息大數(shù)據(jù)的應(yīng)用可能性
健康信息大數(shù)據(jù)為我們提供了形形色色的信息,結(jié)構(gòu)化的數(shù)據(jù)和數(shù)據(jù)挖掘?qū)】敌畔⒌难芯亢蛯?shí)踐都將產(chǎn)生巨大的影響。在理論研究上,有助于健康調(diào)查與健康傳播進(jìn)行的各個(gè)過程;在實(shí)踐上,則會(huì)對(duì)社會(huì)各層面帶來巨大的影響。
(一)對(duì)健康傳播與相關(guān)研究的影響
1. 對(duì)健康信息傳播的影響:更精確地把握受眾與媒介。一方面,海量數(shù)據(jù)使得健康信息用戶面對(duì)海量信息時(shí)無所適從;另一方面,結(jié)構(gòu)化、歸類的大數(shù)據(jù)在某種程度上可減少或消除虛假信息,提高信息質(zhì)量。對(duì)健康傳播媒介來說,大數(shù)據(jù)也提供了科學(xué)了解、把握受眾的可能性,通過健康信息受眾的基本情況、需求偏好、信息使用行為與關(guān)系數(shù)據(jù)進(jìn)行歸類,可以實(shí)現(xiàn)健康傳播的高效性。
2. 對(duì)健康信息調(diào)查的影響:具有時(shí)空跨度的方法與效果。大數(shù)據(jù)也對(duì)健康信息調(diào)查提供了一定的參照與提示。一方面,亟待使用大數(shù)據(jù)分析視角來看待和處理龐雜的健康信息;另一方面,也為健康信息調(diào)查提供了可供對(duì)照的方法工具,貫穿于調(diào)查研究整個(gè)過程中,從數(shù)據(jù)搜集到數(shù)據(jù)處理,以及結(jié)果的驗(yàn)證都提供了有意義的參照。另外,利用大數(shù)據(jù)本身進(jìn)行受眾分析也成為可能。由于一般受眾調(diào)查通常具有短期、自我報(bào)告的主觀性,且難以反映文化、社會(huì)背景等深層次的原因與關(guān)涉;而電子病歷、社交網(wǎng)絡(luò)、個(gè)人健康歷史記錄等記錄的數(shù)據(jù)則更能反映持續(xù)的、具有時(shí)間空間跨度的真實(shí)情況,個(gè)人關(guān)系網(wǎng)類型、興趣、感知等,也更能反映其心理和社會(huì)文化層面的內(nèi)容。
(二)對(duì)社會(huì)各層面的影響
在應(yīng)用層面,健康信息大數(shù)據(jù)對(duì)不同的群體和社會(huì)層面產(chǎn)生了不同的影響。
1. 個(gè)人層面:健康信息用戶、健康專家。有研究者認(rèn)為,大數(shù)據(jù)的發(fā)展將使個(gè)性化醫(yī)療成為可能。[3]健康專家或醫(yī)生能夠根據(jù)健康信息用戶的各類數(shù)據(jù),提供適合個(gè)人的健康信息或治療方案,設(shè)定個(gè)性化的體檢套餐等,此外,也可根據(jù)個(gè)人的疾病史和生活習(xí)慣,提供疾病預(yù)防的建議。而測(cè)序技術(shù)的發(fā)展和普及,也提高了獲取更多人、物種的DNA信息和建立基因庫的可能性,個(gè)體全基因組信息的獲取,也有助于實(shí)現(xiàn)個(gè)性化診療服務(wù)。[4]
此外,利用大數(shù)據(jù)來研究健康恢復(fù)、患者間行為、醫(yī)患間行為也是值得關(guān)注的話題。[5]
2. 組織層面:健康產(chǎn)品服務(wù)商,健康組織或醫(yī)院,政府。對(duì)于藥品、器械等與醫(yī)療健康產(chǎn)品的生產(chǎn)商或服務(wù)商來說,分類化的大數(shù)據(jù)能夠幫助他們按照消費(fèi)者需求進(jìn)行有效和精準(zhǔn)的廣告營銷,提供高質(zhì)量的、個(gè)性化的產(chǎn)品服務(wù),并適時(shí)接收到使用者的反饋,減少消費(fèi)者流失率。
對(duì)于政府健康部門而言,普及健康信息、建立健康保險(xiǎn)系統(tǒng)、開展健康工程等也有賴于對(duì)民眾健康信息的搜集,對(duì)健康信息大數(shù)據(jù)的分析與挖掘能夠有效地與民眾進(jìn)行溝通,增加實(shí)施的有效性。
3. 社會(huì)層面:預(yù)測(cè)功能和“動(dòng)態(tài)化的健康信息時(shí)空地圖”。(1)預(yù)測(cè):大數(shù)據(jù)的核心功能。有學(xué)者認(rèn)為,大數(shù)據(jù)最核心的科學(xué)問題是預(yù)測(cè)。目前學(xué)術(shù)界主要關(guān)心兩類預(yù)測(cè)問題,一是趨勢(shì)預(yù)測(cè),二是缺失信息預(yù)測(cè)。[6]前者是對(duì)不確定的未來信息的科學(xué)推測(cè),后者是通過預(yù)測(cè)反推缺失的那部分信息。美國人利用健康信息大數(shù)據(jù)來防治流感,他們通過患者自我報(bào)告等信息,來預(yù)測(cè)可能的流感疫情爆發(fā),并提醒同一社區(qū)的人避免接觸表現(xiàn)出流感癥狀的人。醫(yī)生也可了解流感在不同州和地區(qū)流感擴(kuò)散的程度,有效預(yù)防流感疫情的蔓延。
因此,利用大數(shù)據(jù)預(yù)測(cè)疾病,尤其是傳染病,是十分有益的嘗試。此外,與生活方式相關(guān)的疾病,也可通過大數(shù)據(jù)進(jìn)行預(yù)測(cè)。
(2)“動(dòng)態(tài)化的健康信息時(shí)空地圖”。健康信息大數(shù)據(jù)在整個(gè)社會(huì),乃至全球的層面上,表現(xiàn)為提供了一種動(dòng)態(tài)化的、結(jié)合時(shí)間空間的行為分析工具。有學(xué)者稱之為“大數(shù)據(jù)視角的行為科學(xué)”。用它來分析健康數(shù)據(jù),就意味著不僅在空間上——通過移動(dòng)終端和應(yīng)用,[7]且在時(shí)間上——持續(xù)的自然狀態(tài)的記錄,都能夠充分理解人類的健康行為。通過長(zhǎng)時(shí)段的健康行為可以洞察人們的自然模式(他們傾向做什么)。也就是,大數(shù)據(jù)記錄的就是人們的生活本身。[8]
從這個(gè)層面上說,大數(shù)據(jù)改變了人們認(rèn)識(shí)健康信息的視角,為人們從更加完整的、社會(huì)結(jié)構(gòu)式的層面重新審視已有的信息提供了多種可能性。在此基礎(chǔ)上,人們進(jìn)行行為調(diào)整,反過來又會(huì)作用于信息記錄,因此行為與數(shù)據(jù)之間處于動(dòng)態(tài)的、持續(xù)的相互的聯(lián)系之中。
四、健康信息大數(shù)據(jù)面臨的問題與討論
雖然大數(shù)據(jù)為健康信息的應(yīng)用提供了諸多可能性,然而也不難發(fā)現(xiàn)其中存在的問題,這些問題阻礙其積極影響的發(fā)揮。
1. 健康信息數(shù)據(jù)質(zhì)量及真實(shí)性。海量數(shù)據(jù)尤以網(wǎng)絡(luò)為最大信息來源。在每天更新、五花八門的健康信息中,有些信息的真實(shí)性往往難以辨別。有研究者對(duì)微博上轉(zhuǎn)發(fā)率較高的健康醫(yī)療信息進(jìn)行分析發(fā)現(xiàn),專家對(duì)被調(diào)查微博信息的認(rèn)同率均值僅為25%,遠(yuǎn)遠(yuǎn)低于普通用戶對(duì)信息高達(dá)90.24%的認(rèn)同率。因此,針對(duì)健康信息的質(zhì)量問題,亟待構(gòu)建醫(yī)療健康信息質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)和指標(biāo),建立健全科學(xué)合理的信息質(zhì)量評(píng)價(jià)體系。[9]
此外網(wǎng)絡(luò)的匿名性,諸如微博僵尸粉等的大量存在,也會(huì)影響用戶屬性和關(guān)系數(shù)據(jù)的真實(shí)性。雖然在大數(shù)據(jù)的海洋里,其他數(shù)據(jù)會(huì)稀釋不真實(shí)的信息,但總體上會(huì)影響信息質(zhì)量,帶來信息計(jì)算時(shí)的誤差?,F(xiàn)在也有些從數(shù)據(jù)中剔除不良用戶的辦法,但不斷有新的問題出現(xiàn)而影響數(shù)據(jù)質(zhì)量。
2. 健康信息數(shù)據(jù)挖掘技術(shù)的難度。在擁有海量數(shù)據(jù)之后,首先遇到的難題是數(shù)據(jù)挖掘分析工具的專業(yè)性,這往往需要有計(jì)算機(jī)背景的人才。其次,最大的問題在于如何運(yùn)用它?!拔覀冞M(jìn)入了所謂的大數(shù)據(jù)時(shí)代,但大數(shù)據(jù)的定義不在于數(shù)據(jù)之大,而在于真的能夠把有史以來人類產(chǎn)生的所有活動(dòng)都變成數(shù)據(jù),并且在輸入到系統(tǒng)中以后,你能對(duì)這些數(shù)據(jù)進(jìn)行深度的整合、分析、挖掘、加工,并在這之后,去發(fā)現(xiàn)一些什么樣的心理模式,能夠產(chǎn)生什么樣的價(jià)值”,[10]而如何將數(shù)據(jù)挖掘和分析工具與醫(yī)療、傳播等專業(yè)信息結(jié)合,并進(jìn)行深度的解讀,是值得探討的問題。
參考文獻(xiàn):
[1] 中國人民大學(xué)輿論研究所.北京合肥居民癌癥健康信息調(diào)查報(bào)告[R].尚未公開出版.
[2] 陳娟.媒體的用戶關(guān)系管理應(yīng)建立基于大數(shù)據(jù)的管理理念[J].中國傳媒科技,2013(1).
[3] 姚志洪.醫(yī)療衛(wèi)生信息化10大視點(diǎn)[J].醫(yī)學(xué)信息學(xué)雜志, 2013(1).
[4] 馮海超.透視美國大數(shù)據(jù)爆發(fā)全景[J].互聯(lián)網(wǎng)周刊,2013(1).
[5] 宗乾進(jìn),袁勤儉,沈洪洲.國外社交網(wǎng)絡(luò)研究熱點(diǎn)與前沿[J]. 圖書情報(bào)知識(shí),2012(6).
[6] 周濤.復(fù)雜網(wǎng)絡(luò)的新挑戰(zhàn):如何從海量數(shù)據(jù)獲取信息[J].電子科技大學(xué)學(xué)報(bào),2013(1).
[7] Burton, Scott H; Tanner, Kesler W; Giraud-Carrier, Christophe G; West, Joshua H; Barnes, Michael D."Right Time, Right Place" Health Communication on Twitter: Value and Accuracy of Location Information [J].Journal of Medical Internet Research, 2012,14(6).
[8] 胡泳.移動(dòng)大趨勢(shì)與社會(huì)變遷[J].新聞愛好者,2013(1).
[9] 齊娜,宋立榮.醫(yī)療健康領(lǐng)域微博信息傳播中的信息[J].質(zhì)量問題科技導(dǎo)報(bào),2012,30(17).
[10] 胡泳.移動(dòng)大趨勢(shì)與社會(huì)變遷[J].新聞愛好者,2013(1).
(作者單位:中國人民大學(xué)新聞學(xué)院)