屈 宇
大數(shù)據(jù)時代將人類社會帶入數(shù)據(jù)利用的黃金時代,在學術(shù)領域,科研數(shù)據(jù)成為數(shù)據(jù)密集型研究的重要組成部分,它所具有的證據(jù)價值對于確定研究的完整性及科研項目的成功至關重要。然而,隨著數(shù)字化轉(zhuǎn)型進程中數(shù)據(jù)技術(shù)與個人信息的深度融合,科研數(shù)據(jù)應用的負面效應逐漸顯露,其中最主要的表現(xiàn)即為侵犯個人數(shù)據(jù)隱私,使得個人信息保護與數(shù)據(jù)充分利用之間形成對立,阻礙數(shù)據(jù)價值的進一步釋放,因此,對于科研數(shù)據(jù)的隱私風險展開治理成為必然。
科研數(shù)據(jù)涉及的隱私侵犯也是科技倫理失范最常見的表現(xiàn)之一,多指在數(shù)據(jù)收集、處理、共享與使用過程中違反道德原則和價值觀的行為,包括未經(jīng)授權(quán)收集個人敏感信息,未經(jīng)允許共享個人數(shù)據(jù)給第三方或用于未經(jīng)授權(quán)的目的等。發(fā)達國家普遍對科學研究進行倫理監(jiān)管以防范數(shù)據(jù)隱私風險,我國也在加快科技倫理失范的監(jiān)管進程,目前,國家科技倫理委員會已成立人工智能、生命科學、醫(yī)學三個專業(yè)委員會,相關領域科技倫理高風險活動清單正在擬定[1]。高??蒲袛?shù)據(jù)的隱私風險已成為科技倫理監(jiān)管的重點,從而對高??蒲袛?shù)據(jù)管理的實施主體——圖書館提出了新的要求。高校圖書館通過建設數(shù)據(jù)平臺或機構(gòu)知識庫等數(shù)據(jù)存儲設施,為高??蒲谢顒犹峁└采w科研生命周期和數(shù)據(jù)生命周期的數(shù)據(jù)管理,在監(jiān)管數(shù)據(jù)從收集、處理、存儲、發(fā)布到重用的流轉(zhuǎn)過程中,數(shù)據(jù)的法律問題尤其是數(shù)據(jù)隱私面臨考驗,對數(shù)據(jù)的順暢流轉(zhuǎn)構(gòu)成一定的困擾。如何規(guī)范數(shù)據(jù)流通、保護個人隱私以符合國家政策監(jiān)管要求成為高校圖書館科研數(shù)據(jù)管理工作的當務之急。故筆者梳理科學研究中容易發(fā)生數(shù)據(jù)隱私風險的活動,結(jié)合我國高校圖書館科研數(shù)據(jù)管理中數(shù)據(jù)隱私風險防范的實踐與不足,提出相應治理策略,以期助益?zhèn)€人數(shù)據(jù)隱私保護,促進高校科研數(shù)據(jù)的共享與利用。
科學研究中的數(shù)據(jù)來源多樣,與個人數(shù)據(jù)存在相當比例的交集,新型數(shù)據(jù)密集型人文社會科學研究、跨學科或交叉科學研究、大量生物學、醫(yī)學研究中的底層數(shù)據(jù)皆來自個人數(shù)據(jù)。個人數(shù)據(jù)是個人信息的電子化存在形態(tài),是與具體個人掛鉤的直接涉及某個人的知識的記錄或數(shù)值,包括姓名、地址、身份證件、個人特征等個人唯一標識符,以及健康狀況、遺傳信息、政治觀點、宗教信仰,甚至刑事犯罪記錄等特殊類別信息[2-3]。個人數(shù)據(jù)因其所承載的個人可識別信息而關涉人格尊嚴的典型形態(tài)——隱私,而隱私概念也進而在數(shù)據(jù)領域延伸形成數(shù)據(jù)隱私。數(shù)據(jù)隱私既包括數(shù)據(jù)中直接或間接蘊含的,涉及個人或組織的,不宜公開的,需要在數(shù)據(jù)收集、存儲、查詢、分析、發(fā)布等過程中加以保護的信息;也包括保護數(shù)據(jù)隱私的能力,如數(shù)據(jù)匿名化、數(shù)據(jù)擾動、數(shù)據(jù)加密等技術(shù)[4]。大數(shù)據(jù)時代,科研數(shù)據(jù)所具有的學術(shù)價值需要通過數(shù)據(jù)的廣泛傳播與重用來實現(xiàn),這就使得科學研究中的個人數(shù)據(jù)在生命周期的流轉(zhuǎn)中對數(shù)據(jù)隱私產(chǎn)生威脅,因此科研人員需對容易導致數(shù)據(jù)隱私風險的科研活動保持高度關注,注意隱私風險的防范,尤其在涉人類受試者研究和國際合作研究中。
大數(shù)據(jù)時代,社會信息化和智能化程度飛速提升,技術(shù)環(huán)境也發(fā)生了巨大的改變。一方面,新興科技革命大量發(fā)生在與個人生活或個人權(quán)利聯(lián)系更加緊密的信息科學與生命科學領域,激起眾多倫理與法律爭議;另一方面,人文社會科學研究轉(zhuǎn)向數(shù)據(jù)密集型研究范式,利用社交媒體、智能設備、網(wǎng)絡日志等獲取實時數(shù)據(jù)進行網(wǎng)絡分析、聚類分析或關聯(lián)分析成為熱門,也給個人隱私保護帶來威脅。大量包含人類受試者或參與者的新興領域研究或研究方法使科研活動成為潛在的數(shù)據(jù)隱私風險源,對人類社會長期形成的社會價值體系構(gòu)成正面挑戰(zhàn)。涉人類受試者研究固然以促進科學或推廣知識為宗旨,但因涉及到個人可識別信息的分析或收集,并且個人身份或相關信息已經(jīng)或易于被研究人員確定,就對個人隱私或保密性構(gòu)成了威脅[5]??蒲腥藛T須在進行以下類型研究時特別注意潛在的數(shù)據(jù)隱私風險。
(1)涉及個人可識別的受保護的健康信息的研究。此類研究中可能包含以任何格式(電子、紙質(zhì)或口頭)傳輸?shù)膸в锌勺R別個人的人口統(tǒng)計信息,涉及個人過去、現(xiàn)在或未來的身心健康、診斷、治療以及醫(yī)療保健等情況,可能帶有姓名、出生日期、住址、電話號碼、IP 地址等標識符,以及指紋、全臉照片等生物識別標識符,這些標識符均受隱私規(guī)則要求的約束,數(shù)據(jù)的濫用或無意暴露均可能導致隱私泄露。
(2)利用計算機和互聯(lián)網(wǎng)收集人類參與者數(shù)據(jù)進行研究。當研究人員使用各種軟件程序通過互聯(lián)網(wǎng)分發(fā)和收集調(diào)查數(shù)據(jù)、創(chuàng)建商業(yè)調(diào)查、第三方調(diào)查或通過電子郵件進行調(diào)查時,調(diào)查數(shù)據(jù)的托管、存儲、傳輸或刪除環(huán)節(jié)都有可能存在隱私泄露風險。
(3)使用社交網(wǎng)站或移動設備進行人類參與者研究。隨著社交網(wǎng)絡新媒體與技術(shù)如Facebook、Twitter、微信等的廣泛應用與發(fā)展,研究人員大量使用平臺數(shù)據(jù)進行數(shù)據(jù)挖掘、使用網(wǎng)絡爬蟲或被動收集數(shù)據(jù)以了解人類行為和趨勢,如果數(shù)據(jù)中的個人信息未能充分去識別,或數(shù)據(jù)被用于研究之外,就很容易產(chǎn)生倫理問題。Facebook 數(shù)據(jù)門事件即屬此類,劍橋大學心理學系講師 Kogan 聲稱以學術(shù)研究為目的獲取了Facebook 的用戶數(shù)據(jù),但數(shù)據(jù)脫離了學術(shù)用途,被轉(zhuǎn)移至劍橋分析公司用于影響選舉,并幫助特朗普2016 年贏得總統(tǒng)大選[6]。
(4)涉及已有數(shù)據(jù)或二手數(shù)據(jù)的研究。已有數(shù)據(jù)或二手數(shù)據(jù)是指研究開始前業(yè)已存在的不具有隱私風險的個人數(shù)據(jù),如已故者的歷史記錄和歷史檔案、可公開獲得的雖可識別但非私人信息的數(shù)據(jù)、匿名數(shù)據(jù)集等,這些通常不構(gòu)成人類受試者研究,但是已有數(shù)據(jù)或二手數(shù)據(jù)一旦與包含私人的、可識別信息的其他數(shù)據(jù)集混合,整個數(shù)據(jù)集就具有了潛在的敏感性,可能導致隱私侵犯。
隨著開放科學運動的深入,開放數(shù)據(jù)與開放的數(shù)據(jù)監(jiān)管設施為數(shù)據(jù)的全球流動提供了便利,數(shù)據(jù)跨境傳輸促進了國際科學界更多的合作,但也因地區(qū)規(guī)制的差異帶來新的數(shù)據(jù)隱私風險。事實上,對于個人數(shù)據(jù)隱私和安全的保護,不同的司法管轄區(qū)對數(shù)據(jù)隱私的范疇、約束、豁免不盡相同,法律規(guī)制普遍存在差異,如不事先加以了解并遵守,很容易在數(shù)據(jù)跨境流動中引發(fā)隱私風險,有可能導致嚴重的后果,阻礙數(shù)據(jù)傳輸與國際合作。
以歐盟《通用數(shù)據(jù)保護條例》GDPR 為例,這部法律雖然加強了整個歐洲個人數(shù)據(jù)隱私的保護與安全,但與世界其他國家或地區(qū)的法律規(guī)定不盡相同。首先,GDPR 適用范圍廣泛,它以數(shù)據(jù)主體的物理位置決定法規(guī)的適用性:在數(shù)據(jù)收集時實際位于歐洲經(jīng)濟區(qū)國家內(nèi)的個人數(shù)據(jù)(無論參與者是否歐洲經(jīng)濟區(qū)國家公民或居民)受GDPR 保護;在數(shù)據(jù)收集時實際位于歐洲經(jīng)濟區(qū)以外任何地方的個人數(shù)據(jù)(即使參與者是歐洲經(jīng)濟區(qū)國家的公民)不受GDPR 保護,但是,如果該數(shù)據(jù)在返回歐洲經(jīng)濟區(qū)后被使用、存儲或共享,則此類數(shù)據(jù)仍受GDPR 保護。歐洲以外發(fā)生的科學研究,當涉及以下任何一項時都會涉及個人數(shù)據(jù)隱私。(1)通過社交媒體招募的參與者居住在歐洲經(jīng)濟區(qū);(2)使用第三方處理器如Qualtrics、Skype 等從居住在歐洲經(jīng)濟區(qū)的參與者那里收集數(shù)據(jù);(3)直接接收來自歐洲經(jīng)濟區(qū)個人參與者或合作者的數(shù)據(jù),以及前往歐洲經(jīng)濟區(qū)收集參與者的數(shù)據(jù);(4)從合作者或其他第三方接收已被確定為受GDPR約束的數(shù)據(jù)時,都有可能受到GDPR 的管制。其次,GDPR 不僅保護可識別數(shù)據(jù),還保護編碼數(shù)據(jù),這與其他國家形成顯著差異。編碼數(shù)據(jù)已通過去識別、加密、身份驗證或訪問控制等手段來防止信息泄露,在美國,編碼數(shù)據(jù)不受隱私法保護,但GDPR 仍視之為個人數(shù)據(jù)。此外,對于匿名數(shù)據(jù),即便不再存在指向私人信息的代碼或鏈接,而且研究人員也無法將匿名信息與特定個人聯(lián)系起來,GDPR 仍要求有關匿名數(shù)據(jù)的任何電子記錄或紙質(zhì)記錄必須銷毀。GDPR還為個人數(shù)據(jù)引入“被遺忘權(quán)”,允許任何人類參與者可以隨時要求刪除他們的數(shù)據(jù)[7]。因此,如果科研數(shù)據(jù)的范疇或性質(zhì)適用GDPR,科研人員一定要嚴格遵守相關法規(guī)要求,包括關于知情同意、數(shù)據(jù)安全規(guī)則、及時通知任何安全漏洞的特殊規(guī)定,以及數(shù)據(jù)的被遺忘權(quán)等,未能遵守的科研人員甚至所在的科研機構(gòu)都可能面臨巨額罰金。
數(shù)據(jù)因其流通性、跨越性與可復制性而極易產(chǎn)生法律風險,全球范圍內(nèi)已有約120 個國家和地區(qū)制定了數(shù)據(jù)保護法規(guī)對其進行規(guī)制,其中歐盟的立法思路和系列保護規(guī)制對世界各國都產(chǎn)生了深遠影響。在1995 年和2016 年,歐盟先后頒布《個人數(shù)據(jù)保護指令》與《通用數(shù)據(jù)保護條例》(GDPR),針對數(shù)據(jù)收集、儲存、處理、披露等方面存在的各種風險進行規(guī)范,又在2022 年批準了《數(shù)據(jù)治理法案》,旨在從根本的人權(quán)視角來保護數(shù)據(jù)隱私,并在此基礎上促進創(chuàng)新[8]。歐盟不斷發(fā)展和完善對數(shù)據(jù)隱私的保護規(guī)制,強調(diào)在保護數(shù)據(jù)權(quán)利的同時防止數(shù)據(jù)流通受到干擾,這一治理理念很好地平衡了互聯(lián)網(wǎng)與大數(shù)據(jù)時代的多方需求。
我國與歐盟同為大陸法系,在數(shù)據(jù)利用的規(guī)制方面對歐盟多有借鑒,《科學數(shù)據(jù)管理辦法》以及《中共中央國務院關于構(gòu)建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(簡稱“數(shù)據(jù)二十條”)均對保障科學數(shù)據(jù)安全,增強數(shù)據(jù)要素共享提出明確要求[9-10]。但是,我國至今尚未出臺專門的數(shù)據(jù)隱私保護法,而是通過多部法律中的相關內(nèi)容以及多領域監(jiān)管規(guī)范對個人數(shù)據(jù)隱私實行間接的保護。其中私法方面以《中華人民共和國民法典》為主,在人格權(quán)立法中細化了隱私概念,增設“個人生活安寧”這一條款來強化對個人隱私的保護。公法方面,2017 年頒布的《中華人民共和國網(wǎng)絡安全法》規(guī)范了個人信息的保存和保護、法律責任、運營商對其行為的承諾等內(nèi)容;同年底,國家信息安全標準化技術(shù)委員會發(fā)布《信息安全技術(shù)個人信息安全規(guī)范》,對企業(yè)必須遵守的隱私政策進行規(guī)范,并加強了對生物特征識別的保護。2021年頒布的《中華人民共和國數(shù)據(jù)安全法》進一步明確了數(shù)據(jù)安全與隱私保護的法律責任,隨后,《個人信息保護法》正式施行,這是我國第一部專門針對個人信息保護的統(tǒng)領性法律文件,對公民個人、信息行業(yè)和監(jiān)管機關都影響重大?!秱€人信息保護法》借鑒了歐盟等發(fā)達國家的立法經(jīng)驗,對個人信息處理規(guī)則、權(quán)利、義務以及法律責任等進行了規(guī)制, 并授權(quán)國家網(wǎng)信部門作為主要監(jiān)管部門負責統(tǒng)籌協(xié)調(diào)個人信息保護和相關監(jiān)督管理工作。我國當前主要由《個人信息保護法》、《網(wǎng)絡安全法》和《數(shù)據(jù)安全法》中的個人信息保護內(nèi)容間接規(guī)制數(shù)據(jù)隱私,對個人數(shù)據(jù)而言,法律內(nèi)容的設定顯得寬泛,權(quán)限界定含糊,違法處罰指向不明,追責方式也以事后追責為主;且監(jiān)管部門更關注數(shù)據(jù)的安全,因而,現(xiàn)行法律及監(jiān)管對個人數(shù)據(jù)隱私的保護總體上顯得不夠直接和充分。
對于科研活動以及科研數(shù)據(jù)中的隱私風險,法律或監(jiān)管也未能體現(xiàn)出清晰的防范路徑。在法律規(guī)制方面未能明確界定科學研究中的隱私侵害行為,也缺乏對科研人員風險行為的底線約束,既有處罰主要側(cè)重一般社會行為下的隱私侵犯,并不適用于科學研究。此外,事后追責制、“知情同意”規(guī)則已逐漸不適應新時代場景下的實際效用。在監(jiān)管方面由于對數(shù)據(jù)獲取和傳輸?shù)膶彶槿笔Щ蚴杪┮差l頻造成隱私泄露,典型案例如華山醫(yī)院與華大基因未經(jīng)許可與牛津大學開展中國人類遺傳資源國際合作研究,并未經(jīng)許可將部分人類遺傳資源數(shù)據(jù)通過網(wǎng)絡跨境輸出,造成我國大量重要的人類遺傳資源非法外流,而類似的研究在歐洲或美國審查會非常嚴格[11]。
數(shù)據(jù)隱私保護是數(shù)據(jù)要素充分利用的前提,過于零散的規(guī)制不利于數(shù)據(jù)隱私保護的司法實踐和監(jiān)管,我國應積極學習發(fā)達國家數(shù)據(jù)規(guī)制的經(jīng)驗,盡快構(gòu)建數(shù)據(jù)隱私的立法體系,加速數(shù)據(jù)隱私專門立法進程。在相關立法方面,不僅應明確各級政府部門的職責、數(shù)據(jù)隱私的保障措施、數(shù)據(jù)各方主體的權(quán)利、責任及處罰條款等,還應在數(shù)據(jù)保護的范疇、流轉(zhuǎn)環(huán)節(jié)和風險類別方面進行細化,將個人數(shù)據(jù)擴展界定為從采集、存儲到傳播的各個環(huán)節(jié)都要對其進行保護的數(shù)據(jù),將數(shù)據(jù)從采集、存儲到傳播各個環(huán)節(jié)的隱私權(quán)益規(guī)范化與法制化,使各類型數(shù)據(jù)包括科研數(shù)據(jù)獲得確切的保護。而且,在立法作用方面要考慮前瞻性與預防性,變事后追責為事前預警,提高數(shù)據(jù)隱私保護的效果。同時,還要授權(quán)監(jiān)管機構(gòu)負責統(tǒng)籌,高效踐行法律,保障實施效果。
為了規(guī)避科研數(shù)據(jù)在收集、處理和流通過程中可能產(chǎn)生的風險,高校作為科學研究的重要陣地和科研活動的主要管理者,通常在國家法律法規(guī)框架內(nèi)以及科學管理部門監(jiān)管要求下,面向科研人員制定更為具體的規(guī)章制度來規(guī)范本校的科研活動,確保進行負責任的研究。制度內(nèi)容一般會包含隱私政策,特別對涉及個人隱私的人體研究給予基本的行為規(guī)范。如南京大學在《南京大學科學研究行為規(guī)范與學風建設管理辦法》中提到“在數(shù)據(jù)資料的采集與分析等方面,遵守誠實客觀原則?!辈⑶乙蟆白鹬匮芯繉ο螅òㄈ祟惡头侨祟愌芯繉ο螅T谏婕叭梭w的研究中,如在人體上進行研究、用人體細胞或組織器官等進行的實驗和根據(jù)人體研究數(shù)據(jù)所進行的研究等,必須遵守現(xiàn)行的國家法律法規(guī)和倫理道德要求,保護受試人的合法權(quán)益和個人隱私,并保障其知情同意權(quán)?!辈⑶乙蟆叭绨l(fā)現(xiàn)研究活動存在弊端或危害,應自覺暫緩或調(diào)整,甚至終止,并向該研究的主管部門通告?!钡芾磙k法對隱私風險高發(fā)的其他類型研究未及覆蓋,約束范疇有限[12]。對跨境合作項目,《南京大學關于加強境外科研項目管理的實施意見》中要求“各院系對項目研究計劃進行內(nèi)容論證,重點論證研究數(shù)據(jù)、研究方法、研究成果的意識形態(tài)安全管理風險”,監(jiān)管的重點在于意識形態(tài)安全,而數(shù)據(jù)跨境的隱私風險未能引起關注[13]。可見,高校層面對科研活動所涉數(shù)據(jù)隱私風險的監(jiān)管政策不夠全面和具體,存在監(jiān)管空白,對科研人員缺乏有效的規(guī)范。
此外,鑒于數(shù)據(jù)隱私具有系統(tǒng)化、復雜化特點,個體往往難以在短時間內(nèi)做出正確的判斷,高校在制度政策約束之外,理論上應采取必要的行動干預——倫理審核。如果不能對涉人類參與者的科研活動提前進行主動的倫理審核,待到研究產(chǎn)生的原始數(shù)據(jù)、衍生數(shù)據(jù)以及成果數(shù)據(jù)進入數(shù)據(jù)存儲設施,并通過數(shù)據(jù)平臺或機構(gòu)庫發(fā)布共享供用戶使用,就有可能陷入隱私困境,并最終阻礙數(shù)據(jù)的獲取與重用。曾經(jīng)就發(fā)生過有科研人員隱私意識薄弱,直到投稿到國外期刊被撤回,才知道文中涉人類參與者研究數(shù)據(jù)侵犯了個人隱私。歐美大學通常召集相關專業(yè)人士成立機構(gòu)審查委員會,對大學開展的涉人類參與者研究進行提前審核并處理投訴,以免違反研究倫理和監(jiān)管要求。以康乃爾大學為例,大學層面運營一個機構(gòu)審查委員會IRB(Institutional Review Board),該委員會基于聯(lián)邦法律,對校園所有涉及人類參與者的研究項目在研究開始前先進行審查,決定批準或豁免,以保護參加大學研究的個人權(quán)益;同時,IRB 還制定了多種指南,包括對不同司法管轄區(qū)隱私法律的指導、國際合作指導等等,引導研究人員正確使用外部政策、法規(guī)以及最佳實踐,盡最大可能規(guī)避潛在的數(shù)據(jù)隱私風險[14]。
在我國,倫理審核已在國家層面受到重視,2022 年 3 月,國家印發(fā)了《關于加強科技倫理治理的意見》,為防范科技風險,全面推動科技向善制定了規(guī)劃路線[15]。對科研項目的數(shù)據(jù)隱私風險,倫理審核通常立足以下基本原則:(1)確保知情同意程序充分和準確地向潛在參與者解釋了參與的可能風險, 包括其個人數(shù)據(jù)可能泄露的風險。(2)恰當?shù)乇Wo人類參與者信息的隱私或保密性,并在研究方案申請和同意書中記錄相關程序。(3)最小化參與者的潛在風險,包括與意外或惡意安全漏洞相關的風險。通過幫助研究人員在滿足研究安全的前提下設計和開展人類受試者研究,倫理審核既能保護參與研究的人類受試者的數(shù)據(jù)隱私,也能保護研究人員和大學自身。目前我國已有少數(shù)大學響應政策成立了研究倫理審查委員會,如2022 年12 月,中國科技大學與清華大學的科技倫理委員會先后成立,逐步開展特定領域的日??萍紓惱韺徍斯ぷ鱗16-17]。可以預見,倫理審核制將很快被越來越多的高校采用,這將有助于把科研活動對人的影響納入科技倫理治理的范疇,將研究中的數(shù)據(jù)隱私風險扼殺于搖籃,同時,也對圖書館在科研數(shù)據(jù)管理中開展隱私風險治理提供有力的支持。
科研數(shù)據(jù)管理已逐漸成為我國雙一流高校的標配,從提供數(shù)據(jù)存儲服務的數(shù)據(jù)平臺或機構(gòu)知識庫的建設來看,以高校圖書館為核心的科研數(shù)據(jù)管理服務廣受認可,高校圖書館也被認為是遵循數(shù)據(jù)生命周期進行數(shù)據(jù)監(jiān)管的最佳主體。據(jù)孫清玉等統(tǒng)計,近七成雙一流高校圖書館建設了數(shù)據(jù)平臺或機構(gòu)知識庫,開展高校科研數(shù)據(jù)的收集、利用與整合[18]。作為圖書館數(shù)據(jù)平臺或機構(gòu)知識庫數(shù)據(jù)監(jiān)管工作的一環(huán),數(shù)據(jù)隱私的保護主要通過隱私政策、技術(shù)保障和素養(yǎng)教育等措施來實施。
發(fā)布隱私條款或保護政策是防范數(shù)據(jù)隱私風險的重要手段,平臺或機構(gòu)庫通常在站點首頁或使用條款中添加隱私內(nèi)容,引導數(shù)據(jù)存儲者規(guī)避隱私風險。筆者在網(wǎng)絡調(diào)研中注意到部分平臺或機構(gòu)庫未披露隱私政策,而發(fā)布的隱私政策則大多過于簡單,常常聲明一句“不得用于研究之外”,顯得相當敷衍。西安交大知識門戶額外要求數(shù)據(jù)提交者和使用者明確告知個人信息的收集來源,以保證個人信息安全,不被出于商業(yè)性、公益目的或透露給任何外部單位及個人;復旦平臺發(fā)布了6 條隱私聲明,對信息的收集、使用、安全性、反饋與撤銷等作出簡要說明;北大平臺未在使用條款中集中展示隱私政策,而是將具體的隱私聲明納入各相應條款,要求用戶在上傳、下載、發(fā)布、提交、傳輸或傳播數(shù)據(jù)時不得侵犯個人隱私,隱私政策內(nèi)容相對豐富和全面,尤其對用戶提交數(shù)據(jù)中的個人身份信息識別、數(shù)據(jù)下載和使用時必須滿足的條件等進行了枚舉,并強調(diào)用戶提交的數(shù)據(jù)需滿足二手數(shù)據(jù)或知情同意等前提,但平臺不對提交的數(shù)據(jù)進行審查??傮w來看,數(shù)據(jù)平臺或機構(gòu)庫的隱私政策存在大量空缺或不完善,對科研人員缺乏具體的指導和明確的約束;雖然越是開放性好的平臺,隱私政策內(nèi)容也趨向豐富,但仍然與發(fā)達國家存在較大差異。歐美大學的圖書館通常會設置專門的隱私主頁,除發(fā)布詳盡的隱私政策外,更大量展示隱私相關知識、政策、法規(guī)(包括本國和他國的隱私法規(guī))、國際合作隱私風險、隱私許可等內(nèi)容,并積極提供隱私課程培訓、隱私風險咨詢、隱私評估以及最佳實踐來指導科研人員盡力規(guī)避數(shù)據(jù)隱私風險。我國高校和圖書館在制訂隱私政策內(nèi)容和提供隱私服務方面表現(xiàn)出嚴重的不足和滯后,難以滿足科學數(shù)據(jù)開放共享和重用必備的法律要求。
數(shù)據(jù)隱私還包括保護數(shù)據(jù)隱私的安全技術(shù)內(nèi)容。數(shù)據(jù)存儲依賴安全的計算機體系與新興的數(shù)據(jù)保密技術(shù),鑒于數(shù)據(jù)在其生命周期的每一環(huán)節(jié)都可能遭遇隱私泄露或其他不確定因素,平臺或機構(gòu)庫通常對數(shù)據(jù)從初始生成到終結(jié)歸檔或刪除的各階段施以技術(shù)手段保障數(shù)據(jù)的安全。北大平臺通過強調(diào)用戶信息的真實性、請求與審核機制、多層級群組化的訪問控制以及平臺日常維護與數(shù)據(jù)備份來保障平臺數(shù)據(jù)的安全,對平臺匯聚的一批具有極高影響力的精品調(diào)查類數(shù)據(jù)進行清洗加工,去識別隱私信息后再供用戶使用。復旦平臺主要存儲社科數(shù)據(jù),包含大量隱私數(shù)據(jù),但平臺只向外提供經(jīng)過脫敏已無法辨識的合計數(shù)據(jù),并采取適當?shù)陌踩雷o措施,防止FISR 控制下的信息丟失、濫用和篡改。西安交大知識門戶利用XJTU Academic Hub 屏蔽成果元數(shù)據(jù)中的個人隱私信息,最大限度保障個人信息安全。可以說,平臺或機構(gòu)庫通過數(shù)據(jù)清洗、匿名去標識化等脫敏技術(shù)以及傳統(tǒng)使用的定期升級、防病毒、加密、防火墻、身份驗證、軟件補丁、更新等技術(shù)措施對數(shù)據(jù)隱私安全構(gòu)成了基本保護。然而,隨著數(shù)據(jù)開放共享現(xiàn)實需求的不斷增長以及平臺數(shù)據(jù)存儲量的持續(xù)走高,尤其在向云存儲過渡的進程中,傳統(tǒng)的安全防護技術(shù)恐難防御層出不窮的新發(fā)安全漏洞,隱私泄露將成為數(shù)據(jù)安全的一大隱患。
數(shù)據(jù)素養(yǎng)關乎科研人員的數(shù)據(jù)技能和科研倫理道德,具備較高的數(shù)據(jù)素養(yǎng)尤其是隱私素養(yǎng)有助于科研人員清晰識別和主動規(guī)避數(shù)據(jù)隱私風險。目前,高校的數(shù)據(jù)素養(yǎng)教育還不普及,且目前開展的數(shù)據(jù)素養(yǎng)教育也以傳授數(shù)據(jù)技能為主,涉及隱私相關內(nèi)容很少。如北京大學圖書館、武漢大學圖書館開發(fā)的數(shù)據(jù)素養(yǎng)課程中涉及少量科研倫理以及數(shù)據(jù)隱私素養(yǎng)內(nèi)容,復旦大學社科數(shù)據(jù)平臺在這方面表現(xiàn)相對優(yōu)秀,在平臺“數(shù)字素養(yǎng)”模塊中專門針對“數(shù)字社會責任”開設了“法制道德規(guī)范”和“數(shù)字安全保護”課程,但大多數(shù)平臺或機構(gòu)庫尚不能提供針對性的教育內(nèi)容。隱私教育的缺乏不利于快速提升科研人員的隱私意識,僅依賴科研人員的自律難以有效防范數(shù)據(jù)隱私風險。
通過梳理高校在科研數(shù)據(jù)管理中防范隱私風險的現(xiàn)實表現(xiàn),可知高校圖書館的隱私政策及相關配套服務未能很好地約束或引導科研人員,亟需完善,在數(shù)據(jù)監(jiān)管平臺風險防控上技術(shù)較為陳舊,難以有效抵御網(wǎng)絡數(shù)據(jù)安全的威脅與隱私泄露。最為關鍵的是隱私素養(yǎng)教育內(nèi)容嚴重不足,遠不能快速提升科研人員對隱私風險防范能力,因此,高校科研數(shù)據(jù)隱私風險的防范僅依賴目前的實踐不足以獲得滿意的效果,無論從短期或長遠看,都將制約科研數(shù)據(jù)的流轉(zhuǎn)傳播和價值釋放。舉目研究界,科研數(shù)據(jù)隱私的防范與治理課題也未獲得足夠的關注與指引,學者們熱衷介紹各種隱私保護技術(shù),或者從理論層面探討大數(shù)據(jù)時代科學數(shù)據(jù)共享的倫理問題,只有少數(shù)研究探及實際應用,如羅蘭花等基于醫(yī)療數(shù)據(jù)開放共享過程中出現(xiàn)的隱私問題,面向數(shù)據(jù)生命周期構(gòu)建了一個隱私保護框架[19]。艾瓊等則從我國科研工作者獲取國外學術(shù)信息這一獨特角度談及隱私保護,并提出防范策略[20]。以及魏來等調(diào)研中外十余所大學科學數(shù)據(jù)管理平臺的隱私保護政策,為我國出臺相關法律法規(guī),明確具體保護措施提出了建議[21]。但正如盛小平等總結(jié),現(xiàn)有科研數(shù)據(jù)隱私的治理研究整體上還不成熟,需結(jié)合現(xiàn)有實踐進一步深化[22]。因此,科研數(shù)據(jù)隱私風險的治理仍需著眼于科研數(shù)據(jù)管理實踐,基于國家對數(shù)據(jù)隱私的法律保護以及大學層面開展的科技倫理審核,高校圖書館應在科研數(shù)據(jù)管理中深化數(shù)據(jù)生命周期隱私監(jiān)管,同時不遺余力地提高平臺隱私技術(shù)保護水平,以及對研究人員開展具有針對性的數(shù)據(jù)素養(yǎng)教育,指導科研人員正確使用外部政策、法規(guī)以及最佳實踐,盡最大可能規(guī)避潛在的數(shù)據(jù)隱私風險。
圖書館作為高校科研數(shù)據(jù)管理的實施主體,應在高??蒲谢顒又刑峁└采w科研生命周期和數(shù)據(jù)生命周期的數(shù)據(jù)安全防范措施,在科研數(shù)據(jù)平臺或機構(gòu)知識庫應用上制訂詳盡的隱私政策,對科研數(shù)據(jù)在收集、提交、上傳、發(fā)布、下載、傳輸或傳播等各個環(huán)節(jié)可能引發(fā)的隱私風險加以揭示,對科研人員潛在的風險行為進行明確的警示。實踐中,可以通過研制隱私風險清單供科研人員自查,并開展隱私咨詢來解答科研人員的疑惑,引導科研人員正確識別以及合理規(guī)避個人數(shù)據(jù)中的隱私風險。
由于當下科研人員對數(shù)據(jù)隱私風險的認知普遍不足,在科研數(shù)據(jù)管理中開展全生命周期隱私監(jiān)管就顯得頗有必要,有助于實時預警數(shù)據(jù)隱私風險,制止不當行為。具體而言:在數(shù)據(jù)管理規(guī)劃階段,平臺或機構(gòu)庫應審查研究項目是否經(jīng)過倫理審核批準,相關倫理或安全培訓有無完成,某些生物醫(yī)學領域的特別培訓需要強制完成。在數(shù)據(jù)處理與存儲階段,應審查研究人員對數(shù)據(jù)的描述,明確數(shù)據(jù)的類別,不同類別的數(shù)據(jù)可能導致不同程度的隱私風險,需要差異化管理,某些健康信息可能需要簽署特別的保密協(xié)議;對于數(shù)據(jù)的處理,應審查其合法性,確保經(jīng)過數(shù)據(jù)主體的同意并授權(quán),數(shù)據(jù)需經(jīng)過清洗去標識,確保不暴露個人隱私信息。在數(shù)據(jù)共享與利用階段,應確保用戶對數(shù)據(jù)流動和使用的知曉及同意,避免隱私數(shù)據(jù)的不正當分享,如果發(fā)生隱私泄漏,應立即向倫理審查委員會報告,以便采取恰當、及時的處理措施。如果數(shù)據(jù)涉及跨境傳輸,要特別重視法律的國別差異,尤其是GDPR,應注意數(shù)據(jù)的被遺忘權(quán)以及確保有效刪除等??傊跀?shù)據(jù)生命周期監(jiān)管的隱私治理,關鍵在于使數(shù)據(jù)在流轉(zhuǎn)的不同環(huán)節(jié)嚴格遵守法規(guī)和政策要求。通過隱私政策的間接引導以及數(shù)據(jù)全生命周期的主動監(jiān)管,可能有效制約科研數(shù)據(jù)引發(fā)的隱私風險。
數(shù)據(jù)隱私的治理還包括隱私保護技術(shù)的治理,應不斷更新平臺安全技術(shù),防止科研數(shù)據(jù)隱私的泄露。隨著云計算、大數(shù)據(jù)和邊緣計算等技術(shù)的發(fā)展,數(shù)據(jù)隱私保護技術(shù)也在不斷演進和完善,雖然任何技術(shù)都不可能帶來絕對的安全,但數(shù)據(jù)平臺或機構(gòu)庫應不斷追蹤科技發(fā)展,利用最新的技術(shù)營造相對最安全的數(shù)據(jù)存儲環(huán)境。隱私計算在歐美大學已普遍用于保護數(shù)據(jù)隱私,如康奈爾大學利用隱私計算中的可信執(zhí)行環(huán)境概念,對硬件在物理上加以保護,對軟件配置進行漏洞監(jiān)控,從而保障敏感數(shù)據(jù)安全;同時還提供隱私保護工具,如跟蹤攔截器等來破壞黑客位置定位,并使用多方安全計算技術(shù)為數(shù)據(jù)加密,避免隱私數(shù)據(jù)被第三方非法獲取[23]。我國醫(yī)療界對隱私計算已有試水,如王晨等發(fā)文介紹上海交通大學附屬瑞金醫(yī)院已使用數(shù)據(jù)分型、聯(lián)邦學習等隱私保護技術(shù)保障臨床科研數(shù)據(jù)平臺的安全[24]。利用新技術(shù)手段保障數(shù)據(jù)隱私安全,是高校科研數(shù)據(jù)隱私風險治理的重要一環(huán)。
高校圖書館的數(shù)據(jù)隱私治理還應重視加強科研人員的數(shù)據(jù)素養(yǎng)教育。目前,數(shù)據(jù)素養(yǎng)教育還不夠活躍,常隱身于信息素養(yǎng)教育,數(shù)據(jù)內(nèi)容還不充足,數(shù)據(jù)隱私內(nèi)容更顯稀缺,短期教育效果也不明顯,然而,治理是持續(xù)的,素養(yǎng)教育更應常抓不懈。針對科研數(shù)據(jù)管理中的數(shù)據(jù)隱私風險,圖書館應廣泛開發(fā)面向科學研究的隱私素養(yǎng)教育內(nèi)容,包括隱私風險識別、法律法規(guī)知識,隱私評估方法等,采用強制培訓、線上課程、小型研討會甚至素養(yǎng)競賽等豐富多彩的形式,提高科研人員對數(shù)據(jù)隱私風險的認知、對相關法律法規(guī)的了解,使他們更具有隱私意識,尊重個人隱私,主動防范數(shù)據(jù)隱私風險,進行負責任的科學研究。