蘇君華 宋帆帆
摘 要:用戶利用行為是其真實需求和行為價值觀的具體反映,挖掘、分析用戶行為數(shù)據(jù),刻畫用戶模型,有利于精準(zhǔn)把握用戶真實意圖,提升檔案信息服務(wù)能力。文章從用戶利用行為視角具體分析了檔案信息精準(zhǔn)服務(wù)價值,在此基礎(chǔ)上,從數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與存儲、檔案用戶興趣建模以及檔案信息精準(zhǔn)服務(wù)四個層面構(gòu)建運行機制,并有針對性地提出耦合路徑:以精細(xì)管理統(tǒng)籌精準(zhǔn)服務(wù),以資源要素保障精準(zhǔn)服務(wù),以數(shù)據(jù)素養(yǎng)推進精準(zhǔn)服務(wù),以法規(guī)技術(shù)維護隱私安全,從而確保檔案信息服務(wù)的精準(zhǔn)性、高效性和安全性。
關(guān)鍵詞:檔案信息;精準(zhǔn)服務(wù);用戶利用行為
分類號:G270.7
Research on Precise Service of Archives Information Based on User Utilization Behavior
Su Junhua, Song Fanfan
( School of Cultural Heritage and Information Management of Shanghai University, Shanghai 200444 )
Abstract: User utilization behavior is a concrete reflection of their real needs and behavioral values. By mining and analyzing user behavior data and characterizing user models, it is more conducive to accurately grasp the users true intentions and improve the ability of archives information service. From the perspective of user behavior, this paper analyzes the value meaning of precise service of archives information. Based on this, it builds its operating mechanism from four levels: data collection, data preprocessing and storage, archival user interest modeling, and precise service of archives information, and proposes a targeted coupling path: fine management to coordinate precise service, ensure precise service with resource elements, promote precise service with data literacy, and maintain privacy and security with laws and regulations to ensure the accuracy, efficiency and security of archives information service.
Keywords: Archives Information; Precise Service; User Utilization Behavior
1 前 言
大數(shù)據(jù)浪潮將社會推入數(shù)據(jù)富足供給的時代,[1]據(jù)IDC(國際數(shù)據(jù)公司)預(yù)測,2025年全球數(shù)據(jù)量將達到163ZB,是目前數(shù)據(jù)量的10倍;[2]2020年我國綜合檔案館館藏量也已達81789.8萬卷/件,相比2019年增加了10.8%。[3]大數(shù)據(jù)時代,檔案信息資源泛濫、無序及存取障礙與用戶精準(zhǔn)化需求之間的矛盾日益凸顯,[4]如何實現(xiàn)檔案用戶與信息服務(wù)的精準(zhǔn)定位,不斷提高檔案信息服務(wù)的個性化、智能化、精準(zhǔn)化,成為當(dāng)下關(guān)注的焦點。目前,學(xué)界對檔案信息精準(zhǔn)服務(wù)的研究主要集中于理論內(nèi)涵[5]、關(guān)鍵技術(shù)[6]、模式[7]等中觀層面以及精準(zhǔn)扶貧[8]、精準(zhǔn)推薦[9]等特定領(lǐng)域,從用戶利用行為視角進行研究還需深化。本文將以用戶利用行為為基點,在明確檔案信息服務(wù)價值的基礎(chǔ)上,從數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與存儲、檔案用戶興趣建模、檔案信息精準(zhǔn)服務(wù)角度入手,構(gòu)建運行機制并提出耦合路徑。
2 基于用戶利用行為的檔案信息精準(zhǔn)服務(wù)價值定位
大數(shù)據(jù)時代,檔案館通過挖掘用戶利用行為數(shù)據(jù)、揭示數(shù)據(jù)間的關(guān)系、構(gòu)建用戶行為興趣模型實現(xiàn)檔案信息服務(wù)的創(chuàng)新,提高檔案用戶滿意度,不僅將“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”理念貫穿整個服務(wù)流程,提高精準(zhǔn)服務(wù)效果;更凸顯了檔案館“為民服務(wù)”,提升了檔案館的社會形象。因此,從用戶利用行為視角積極探索檔案信息精準(zhǔn)服務(wù)運行機制,對推動新時代檔案事業(yè)發(fā)展具有重要價值。
2.1 優(yōu)化社會公眾體驗環(huán)境
檔案信息精準(zhǔn)服務(wù)是用戶隱性需求向顯性需求過渡,認(rèn)識、了解檔案文化,提升服務(wù)體驗和服務(wù)感知、優(yōu)化服務(wù)環(huán)境的過程。一方面,檔案信息精準(zhǔn)服務(wù)從源頭掌握用戶利用數(shù)據(jù),通過語義網(wǎng)、關(guān)聯(lián)技術(shù)等揭示用戶行為偏好、興趣特征,洞悉行為規(guī)律和變化趨勢,有針對性地開展智能推薦和個性化服務(wù),加強檔案館與用戶間的聯(lián)系,促進“用戶—檔案館—資源”間的深度融合。另一方面,檔案館通過用戶利用行為數(shù)據(jù)量化其服務(wù)評價指標(biāo)體系,有利于精準(zhǔn)把控問題,改善服務(wù)質(zhì)量,實現(xiàn)資源反哺和再生產(chǎn),提高檔案用戶服務(wù)的期望值。如通過統(tǒng)計檔案微信公眾號的用戶點贊數(shù)、在看數(shù)等顯性指標(biāo),從不同維度進行對比分析,明確各層級檔案微信平臺在資源內(nèi)容、傳播平臺等方面存在的短板,以制定提升戰(zhàn)略。
2.2 提升檔案資源開發(fā)效能
檔案信息開發(fā)與精準(zhǔn)服務(wù)的實現(xiàn)必須將檔案用戶利用行為置于首位,打破傳統(tǒng)以生產(chǎn)資料為導(dǎo)向的自在開發(fā)階段,深化以消費需求為導(dǎo)向的自覺開發(fā)階段,并不斷邁入以價值目標(biāo)為導(dǎo)向的自然開發(fā)階段,[10]統(tǒng)籌檔案信息資源存史資政、文化育人、信息服務(wù)功能,實現(xiàn)政治效益與文化效益的統(tǒng)一。一方面,這能夠解決當(dāng)前以檢索、編研為核心的檔案信息資源開發(fā)深度不足[11]問題。通過深入挖掘檔案信息所蘊含的知識,開發(fā)與檔案用戶信息需求相契合的產(chǎn)品,實現(xiàn)檔案資源與用戶需求的精準(zhǔn)關(guān)聯(lián)和服務(wù)匹配,推動檔案信息資源的深度開發(fā)。另一方面,還有利于推動傳統(tǒng)管理視角下檔案信息資源開發(fā)模式向檔案治理模式轉(zhuǎn)型,[12]助力檔案治理體系建設(shè)。
2.3 增強檔案館社會影響力
以用戶利用行為數(shù)據(jù)為基礎(chǔ)向社會公眾提供精準(zhǔn)服務(wù)強調(diào)服務(wù)的主動性和用戶的個性化,能夠更好地拉近檔案館與公眾之間的距離,凸顯“以人為本”的服務(wù)理念,彰顯檔案館服務(wù)的人文情懷,成功塑造檔案館親民的社會形象,提高檔案館公眾知曉度和社會美譽度。一方面,用戶利用行為是檔案用戶利用需求外在化和延伸化的具體體現(xiàn)。[13]通過興趣模型勾勒用戶需求場景,積極推動“需求導(dǎo)向型”服務(wù)模式,以不斷提高檔案館公共服務(wù)能力和影響力。另一方面,用戶利用行為是改善檔案信息服務(wù)效果的重要指標(biāo)。檔案館利用數(shù)字化平臺監(jiān)測用戶行為數(shù)據(jù),通過數(shù)據(jù)分析,準(zhǔn)確研判檔案信息服務(wù)效果,以調(diào)整服務(wù)策略,促進檔案服務(wù)升級。如“數(shù)字圖書館推廣工程”公眾號就是通過監(jiān)測后臺用戶行為數(shù)據(jù)調(diào)整服務(wù)策略[14]的最佳實踐。
3 基于用戶利用行為的檔案信息精準(zhǔn)服務(wù)運行機制
面向用戶利用行為的檔案信息精準(zhǔn)服務(wù)以數(shù)理化的形式刻畫用戶“數(shù)字足跡”,預(yù)測用戶潛在需求,提升服務(wù)質(zhì)量,是一種基于數(shù)據(jù)的服務(wù),真正踐行了“以用戶為中心”的理念。其主要由數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與存儲、檔案用戶興趣建模、檔案信息精準(zhǔn)服務(wù)四部分構(gòu)成(如圖1)。
3.1 數(shù)據(jù)采集
數(shù)據(jù)采集是實現(xiàn)檔案信息與用戶興趣模型精準(zhǔn)匹配的基礎(chǔ)。采集數(shù)據(jù)包括:檔案信息資源數(shù)據(jù)和用戶利用行為數(shù)據(jù)。前者可通過網(wǎng)絡(luò)爬蟲技術(shù)從檔案門戶網(wǎng)站、檔案微信平臺等獲取,如資源ID、標(biāo)題、關(guān)鍵詞等。后者指用戶的檢索、瀏覽、下載、收藏等行為,包括用戶ID、域名、URL、頁面停留時間、轉(zhuǎn)發(fā)、點贊、評論等數(shù)據(jù),全面揭示了用戶的顯性需求和隱性特征,是精準(zhǔn)刻畫用戶興趣模型的重要依據(jù)。一方面,可通過問卷調(diào)查、訪談法等常規(guī)方式進行采集,如Tzavela、Karatisou和Halapi等就運用半結(jié)構(gòu)化個體訪談法收集了72名青少年的網(wǎng)絡(luò)行為數(shù)據(jù)。[15]另一方面,還可利用用戶日志存儲系統(tǒng)、API爬蟲等技術(shù)對用戶在網(wǎng)絡(luò)環(huán)境中登錄、檢索、瀏覽、下載網(wǎng)站信息資源時系統(tǒng)自動生成的訪問日志、信息服務(wù)提供商的應(yīng)用程序接口數(shù)據(jù)以及社交媒體實時數(shù)據(jù)等進行采集。
3.2 數(shù)據(jù)預(yù)處理與存儲
由于所采集的數(shù)據(jù)類型豐富、結(jié)構(gòu)復(fù)雜,因此,需進行數(shù)據(jù)預(yù)處理,為后續(xù)分析做準(zhǔn)備。首先是數(shù)據(jù)清洗,即將臟數(shù)據(jù)(如重復(fù)值、缺失值)處理為適用于數(shù)據(jù)分析的干凈數(shù)據(jù),從而提高數(shù)據(jù)準(zhǔn)確性和完整性。其次是數(shù)據(jù)集成與轉(zhuǎn)換,即將分散于不同平臺(微信、微博、檔案網(wǎng)站等)的數(shù)據(jù)集中整合,并通過數(shù)據(jù)平滑、數(shù)據(jù)聚集、數(shù)據(jù)概化、數(shù)據(jù)規(guī)范化、屬性構(gòu)造等方式[16]實現(xiàn)數(shù)據(jù)轉(zhuǎn)換,經(jīng)集中轉(zhuǎn)化后的數(shù)據(jù)可存儲到用戶行為數(shù)據(jù)庫。最后是分詞處理,將《中國檔案主題詞表》加入自定義庫,并建立停用詞表,利用jieba分詞對采集的檔案信息資源進行切分,用做待處理的分析語料并存儲至檔案信息資源庫中。
3.3 檔案用戶興趣建模
檔案用戶興趣建模是實現(xiàn)檔案信息精準(zhǔn)服務(wù)的關(guān)鍵環(huán)節(jié),決定著服務(wù)質(zhì)量和用戶黏度。首先,利用TFIDF(詞頻-逆文檔頻率)從檔案信息資源庫中提取特征值。其次,利用LDA模型(又被稱為狄利克雷分布模型)計算文檔主題與特征詞的概率分布,從而得到每篇文檔所對應(yīng)的主題和主題詞,即“URL—文檔—主題號—主題詞”并保存于檔案信息資源主題庫。最后,通過URL映射每個用戶ID對應(yīng)的主題詞,統(tǒng)計其瀏覽時間、下載數(shù)據(jù)、評論數(shù)據(jù)等。同時根據(jù)用戶興趣的一般規(guī)律(用戶對主題關(guān)注度越高,瀏覽時間越長,產(chǎn)生下載、收藏、分享等行為的概率越大),將用戶不同的行為賦予不同權(quán)重,通過計算每個ID用戶對應(yīng)的主題特征值以衡量用戶興趣度大小,并對其進行排序選出Top-n的主題詞作為用戶興趣標(biāo)簽,從而構(gòu)建用戶興趣模型。
3.4 檔案信息精準(zhǔn)服務(wù)
精準(zhǔn)服務(wù)既是整個環(huán)節(jié)的目的和歸宿,也是數(shù)據(jù)采集的重要來源。其主要包括:①精準(zhǔn)推薦。檔案館依據(jù)用戶行為興趣模型采用協(xié)同過濾或內(nèi)容推薦等方式向用戶推送感興趣的檔案信息資源,實現(xiàn)檔案資源與用戶的關(guān)聯(lián)、檔案資源之間的關(guān)聯(lián)以及用戶之間的關(guān)聯(lián),進而節(jié)省用戶時間,提升服務(wù)效率,增強社會存在感。如美國國家檔案館基于協(xié)同過濾的交互推送服務(wù),通過Email或虛擬社區(qū)平臺預(yù)測用戶感興趣的資源,幫助用戶找到相應(yīng)頁面、組、事件等,[17]滿足用戶需求。②精準(zhǔn)定位。基于“物以類聚,人以群分”的原理,利用關(guān)聯(lián)技術(shù)對用戶需求的內(nèi)部關(guān)聯(lián)進行規(guī)范化語義描述,聚類不同用戶,實現(xiàn)用戶類型的精準(zhǔn)定位。如英國國家檔案館通過分析用戶數(shù)據(jù),依據(jù)不同用戶認(rèn)知水平高低、行為習(xí)慣和興趣偏好將用戶分為漫步者—初級用戶、探索者—中級用戶、追蹤者—高級用戶三種不同類型,[18]為其提供差異化服務(wù)。③定制服務(wù)。針對用戶興趣模型提供個性化的定制服務(wù),如定制瀏覽模式、定制檢索路徑等,滿足用戶個性化的信息需求。如中國家譜知識服務(wù)平臺提供地圖檢索形式,用戶可在地圖上任意繪制多邊形,定制個性化的地圖檢索方式,查詢相關(guān)信息。
4 基于用戶利用行為的檔案信息精準(zhǔn)服務(wù)耦合路徑
大數(shù)據(jù)時代,檔案信息精準(zhǔn)服務(wù)的實現(xiàn)應(yīng)堅持以用戶為導(dǎo)向,以用戶利用行為數(shù)據(jù)為基礎(chǔ),以精細(xì)管理為抓手,集聚各類資源要素,提升館員數(shù)據(jù)素養(yǎng),建立法規(guī)技術(shù)屏障,充分發(fā)揮檔案賦能社會的價值。
4.1 以精細(xì)管理統(tǒng)籌精準(zhǔn)服務(wù)
(1)加強過程監(jiān)管。檔案館應(yīng)本著“前端控制、全程管理”的理念,建立調(diào)查研究、精準(zhǔn)服務(wù)、服務(wù)反饋、服務(wù)改進等全過程循環(huán)體系,以達到優(yōu)化檔案信息服務(wù)流程、提升服務(wù)能力的目的。首先,要事前調(diào)研。即運用定量和定性研究方法調(diào)查用戶信息需求、檔案信息服務(wù)現(xiàn)狀及技術(shù)要點,明確實施精準(zhǔn)服務(wù)的必要性和可行性。其次,要事中監(jiān)測。由于用戶信息需求會受時間、情感、狀態(tài)等因素影響而變化,檔案人員需密切關(guān)注用戶行為動態(tài)軌跡,及時調(diào)整用戶興趣模型,監(jiān)測服務(wù)效果。最后,要事后評估。采用內(nèi)部評估、用戶評估、第三方評估等方式對檔案館精準(zhǔn)服務(wù)效果、服務(wù)方式等進行全面闡釋和比較分析,形成持續(xù)改進反饋意見表,以不斷完善用戶需求驅(qū)動下的服務(wù)模式。
(2)落實管理責(zé)任?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》指出:“全面建立和落實檔案工作責(zé)任制,優(yōu)化檔案工作檢查考核機制,各級黨委將檔案工作納入年度考核內(nèi)容?!盵19]因此,檔案館應(yīng)強化責(zé)任意識,落實管理責(zé)任,使檔案服務(wù)在新時代更具科學(xué)性和精準(zhǔn)性。一方面,明確工作職責(zé),確保管理規(guī)范化。檔案精準(zhǔn)服務(wù)是由檔案機構(gòu)、信息技術(shù)機構(gòu)以及用戶構(gòu)成的集數(shù)據(jù)采集、數(shù)據(jù)分析、信息服務(wù)為一體的有機系統(tǒng),需準(zhǔn)確劃分各主體部門開展精準(zhǔn)服務(wù)的職責(zé)(如表1)及階段性目標(biāo),做到既分工明確,又通力合作。另一方面,量化績效考核指標(biāo),調(diào)動館員積極性。如東莞市圖書館圍繞其事業(yè)發(fā)展目標(biāo)和用戶需求,運用平衡積分卡原理設(shè)定關(guān)鍵績效指標(biāo)及測量周期,通過各種渠道與各部室、員工溝通績效測量,實施績效獎勵。[20]
4.2 以資源要素保障精準(zhǔn)服務(wù)
(1)整合館藏資源。檔案館藏資源整合首先要解決技術(shù)系統(tǒng)異構(gòu)、數(shù)據(jù)結(jié)構(gòu)異構(gòu),以及檔案資源管理中條塊分割、各自為政所導(dǎo)致的“信息孤島”問題。如運用關(guān)聯(lián)數(shù)據(jù)解決非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)字檔案資源異構(gòu)問題,實現(xiàn)“資源孤島向互聯(lián)資源空間”[21]的轉(zhuǎn)變,使用戶只需一次搜索,便可發(fā)現(xiàn)全部檔案信息。其次,要整合同質(zhì)機構(gòu)資源。圖書館、檔案館、博物館是國家公共文化服務(wù)體系的重要組成部分,彼此獨立但又相互聯(lián)系,可采用合作制、項目制等方式整合檔案資源,促進交流與合作。如國際敦煌項目(IDP)融合圖博檔多個機構(gòu)參與,旨在向全世界各層次的使用者提供敦煌文獻圖像,促進互聯(lián)網(wǎng)免費獲取服務(wù)。[22]
(2)激活用戶數(shù)據(jù)。用戶行為數(shù)據(jù)是建立用戶興趣模型,實現(xiàn)精準(zhǔn)服務(wù)的前提,檔案館需調(diào)動一切資源要素激活用戶數(shù)據(jù)。一方面,擴大微博、微信等新媒體的運用,為用戶構(gòu)建良好的溝通平臺,實時掌握用戶反饋數(shù)據(jù),從而為全面完整地收集用戶行為數(shù)據(jù)提供來源。如美國國家檔案館將其賬號嵌入Facebook、Twitter、Pinterest、博客、Flicker、Youtube等多個第三方社交平臺,并利用谷歌分析活動工具來跟蹤用戶在檔案社交平臺上的數(shù)字足跡。[23]另一方面,建立專門的檔案服務(wù)評估反饋系統(tǒng),積累用戶原始數(shù)據(jù)。如英國國家檔案館(NAUK)構(gòu)建用戶反饋平臺,根據(jù)用戶反饋信息及時調(diào)整服務(wù)方式和內(nèi)容以滿足用戶的精準(zhǔn)服務(wù)需求。[24]
4.3 以數(shù)據(jù)素養(yǎng)推進精準(zhǔn)服務(wù)
(1)強化數(shù)據(jù)倫理。數(shù)據(jù)倫理是數(shù)據(jù)素養(yǎng)重要內(nèi)容之一??茖W(xué)、合法的數(shù)據(jù)倫理觀可以促進數(shù)據(jù)有效流動和增值,實現(xiàn)檔案信息服務(wù)的“提質(zhì)增效”,推動網(wǎng)絡(luò)空間信任體系的建設(shè)。在國家層面,應(yīng)建立體系框架限定采集利用數(shù)據(jù)的行為。如英國的《數(shù)據(jù)倫理框架》,明確數(shù)據(jù)倫理的原則,對數(shù)據(jù)采集、存儲、處理等全過程可能出現(xiàn)的倫理問題提出了規(guī)范性要求。[25]在組織層面,可于新一輪機構(gòu)改革中建立專門的“數(shù)據(jù)倫理”組織機構(gòu)或?qū)⑵浼{入“大數(shù)據(jù)管理局”“大數(shù)據(jù)中心”等機構(gòu)職能范疇中,為檔案數(shù)據(jù)素養(yǎng)的培育和數(shù)據(jù)倫理的提升奠定組織基礎(chǔ)。在個體層面,檔案館部門人員可自主學(xué)習(xí)相關(guān)知識,提高數(shù)據(jù)倫理意識。如廈門大學(xué)開設(shè)了《大數(shù)據(jù)導(dǎo)論》(通識課版)慕課,用戶可登錄中國大學(xué)生MOOC網(wǎng)站參與學(xué)習(xí),培養(yǎng)數(shù)據(jù)思維,增強數(shù)據(jù)安全意識,提高對數(shù)據(jù)的判斷和利用能力,從而形成“意識先行、全程防范”的良好格局,以更好姿態(tài)為用戶提供精準(zhǔn)服務(wù)。
(2)提升數(shù)據(jù)技能。數(shù)據(jù)技能是數(shù)據(jù)素養(yǎng)的重要組成部分,也是預(yù)測用戶需求,實現(xiàn)檔案信息精準(zhǔn)服務(wù)的必要條件。一方面,應(yīng)建立科學(xué)完善的教育體系。檔案信息的精準(zhǔn)服務(wù)在很大程度上取決于數(shù)據(jù)技能的高低,更取決于所培養(yǎng)的人才。因此,應(yīng)從源頭完善現(xiàn)有教育體系,豐富檔案課程內(nèi)容,如增設(shè)“Python實戰(zhàn)分析”“數(shù)據(jù)分析工具運用”等技術(shù)型選修課程,為檔案信息精準(zhǔn)化服務(wù)提供復(fù)合型人才。北卡羅來納大學(xué)教堂山分校信息與圖書館科學(xué)學(xué)院除開設(shè)電子文件管理、檔案與文件管理概述等常規(guī)檔案課程外,還開設(shè)了自然語言處理應(yīng)用、可視化分析、文本挖掘等操作技能型課程。[26]此外,可通過專題講座、培訓(xùn)等提高館員的業(yè)務(wù)能力。如中國科學(xué)院文獻情報中心自2014年起,就已圍繞“數(shù)據(jù)權(quán)益、數(shù)據(jù)共享、安全保護、獲取數(shù)據(jù)、分析數(shù)據(jù)、運用數(shù)據(jù)”等主題開展了系列講座。[27]
4.4 以法規(guī)技術(shù)維護隱私安全
(1)完善法律規(guī)范。“法者天下之公器”,法律規(guī)范是維護檔案用戶個人數(shù)據(jù)安全強有力的武器,是處理檔案用戶與社會關(guān)系的重要憑證,更是維系社會和諧穩(wěn)定、促進社會公平的良藥。因此,為保障檔案用戶數(shù)據(jù)的采集權(quán)、知情權(quán)和隱私權(quán),一方面應(yīng)強化《憲法(2018年修正)》《侵權(quán)責(zé)任法》《中華人民共和國網(wǎng)絡(luò)安全法》等法律法規(guī)中所涉數(shù)據(jù)隱私條款的運用,并輔以操作性強的實施細(xì)則、辦法等,明確個人數(shù)據(jù)的歸屬范疇以及非法下載、利用時需承擔(dān)的法律后果。另一方面,應(yīng)借鑒國外成熟的法規(guī)體系,如澳大利亞《1988年“隱私權(quán)法”》《2013年隱私條例》《澳大利亞隱私管理框架》《2018確保個人信息安全指南》等[28];美國《隱私法(1974)》《電子通信隱私法》《視頻隱私保護法》等,完善我國檔案數(shù)據(jù)隱私安全法律法規(guī)。
(2)嵌入信息技術(shù)?!翱萍际菄覐娛⒅保彩且?guī)避用戶“信息選擇焦慮”“信息選擇模糊”的有效措施,更是維系用戶數(shù)據(jù)隱私與精準(zhǔn)服務(wù)關(guān)系的重要紐帶。首先,要強化監(jiān)測追蹤技術(shù)。監(jiān)測追蹤技術(shù)通過跟蹤識別異常行為,準(zhǔn)確定位用戶信息,提高用戶利用行為的可追溯性,保障用戶數(shù)據(jù)隱私安全,增強檔案用戶與檔案館的信任度,促進檔案服務(wù)升級。如一旦發(fā)生數(shù)據(jù)泄露,可利用區(qū)塊鏈技術(shù)的時間戳和梅克爾樹技術(shù)追蹤、調(diào)查何時何地何人導(dǎo)致了數(shù)據(jù)泄露,[29]實現(xiàn)“責(zé)任到人”。其次,要固化加密保護技術(shù)。檔案館可選用非對稱加密、同態(tài)加密、多級加密、隱私保護選擇聚類算法等提高用戶行為數(shù)據(jù)的密級強度。如上海市浦東新區(qū)檔案館采用加密技術(shù)確保用戶信息與數(shù)字檔案在網(wǎng)絡(luò)空間的安全,[30]為精準(zhǔn)服務(wù)保駕護航。
*本文系國家社科基金項目“綜合檔案館社會影響力評價及提升策略研究”(項目編號:20BTQ106)階段性研究成果。
注釋與參考文獻
[1]朝樂門.信息資源管理理論的繼承與創(chuàng)新:大數(shù)據(jù)與數(shù)據(jù)科學(xué)視角[J].中國圖書館學(xué)報,2019,45(2):26-42.
[2]朱琳.《數(shù)據(jù)時代2025》預(yù)測2025年全球數(shù)據(jù)將攀升至163ZB[EB/OL].[2021-06-22].http://www.xinhuanet. com/fortune/2017-05/11/c_129601735.htm.
[3]國家檔案局政策法規(guī)司.2020年度全國檔案主管部門和檔案館基本情況摘要(二)[EB/OL].[2022-04-05]. https://www.saac.gov.cn/daj/zhdt/202108/6262a796fdc3487d93bf a7005acfe2ae.shtml.
[4]楊智勇,金波,周楓.“智慧型”檔案信息服務(wù)模式研究[J].檔案管理,2018(6):21-25.
[5][18]蘇君華,牟勝男.用戶畫像視域下檔案館精準(zhǔn)服務(wù):內(nèi)涵、機理及實現(xiàn)策略[J].檔案學(xué)通訊,2020(2):58-66.
[6]李財富,余林夕.基于檔案用戶小數(shù)據(jù)的精準(zhǔn)化檔案信息服務(wù)探析[J].檔案與建設(shè),2018(8):4-7.
[7]聶云霞,何金梅,肖坤.基于小數(shù)據(jù)的檔案信息服務(wù)精準(zhǔn)化研究[J].山西檔案,2021(2):5-13+24.
[8]張炎培.鞏固脫貧成果 服務(wù)鄉(xiāng)村振興——“十四五”時期青海精準(zhǔn)扶貧檔案工作探究[J].中國檔案,2021(5):24-25.
[9]李廣都,葉毅.基于公共服務(wù)理念的綜合檔案館數(shù)據(jù)精準(zhǔn)推薦服務(wù)分析[J].中國檔案,2019(2):70-71.
[10]王春暉.論檔案文化產(chǎn)品開發(fā)的導(dǎo)向[J].檔案學(xué)研究,2017(S2):87-89.
[11]趙躍.大數(shù)據(jù)時代檔案數(shù)據(jù)化的前景展望:意義與困境[J].檔案學(xué)研究,2019(5):52-60.
[12]張帆,吳建華.基于檔案治理的檔案信息資源開發(fā)模式轉(zhuǎn)型研究[J].檔案學(xué)通訊,2019(6):18-26.
[13]呂元智.基于用戶利用行為分析的檔案知識集成服務(wù)實現(xiàn)策略研究[J].檔案學(xué)通訊,2018(5):56-61.
[14]高馨,李曉彤.基于用戶行為數(shù)據(jù)分析的公共圖書館微信服務(wù)——以“數(shù)字圖書館推廣工程”微信公眾號為例[J].圖書館雜志,2020,39(6):56-60.
[15]TZAVELA EC,KARAKITSOU C,HALAPI E,et al. Adolescent digital profiles:A process-based typology of highly engaged internet users[J].Computers in Human Behavior,2017(69):246-255.
[16]白寧超.Python數(shù)據(jù)預(yù)處理:機器學(xué)習(xí)、人工智能 通用技術(shù)(1)[EB/OL].[2020-05-31].http://www.wjhsh. net/baiboy-p-sjycl.html.
[17]梁孟華.基于用戶興趣圖譜的數(shù)字檔案資源交互推送服務(wù)研究[J].檔案學(xué)研究,2019(2):81-87.
[19]中共中央辦公廳,國務(wù)院辦公廳.“十四五”全國檔案事業(yè)發(fā)展規(guī)劃[EB/OL].[2021-06-13].https://www. saac.gov.cn/daj/yaow/202106/.
[20]楊累,趙愛杰.基于事實的管理——東莞圖書館績效評價與過程管理的實踐思考[J].圖書館建設(shè),2013(7):15-19.
[21]王志宇,熊華蘭.語義網(wǎng)環(huán)境下數(shù)字檔案資源關(guān)聯(lián)與共享模式研究[J].檔案學(xué)研究,2019(5):114-119.
[22]賈瓊,王萍.數(shù)字人文視角下LAM資源整合路徑研究[J].情報科學(xué),2021,39(4):157-164.
[23]張江珊.美國國家檔案館社交媒體策略發(fā)展的比較研究及啟示[J].檔案學(xué)研究,2018(4):117-122.
[24]周林興,林騰虹.用戶畫像視域下智能化檔案信息服務(wù):現(xiàn)狀、價值、運行邏輯與優(yōu)化路徑[J].檔案學(xué)研究,2021(1):126-133.
[25]賀佳瀛.美國總務(wù)署草擬聯(lián)邦數(shù)據(jù)倫理框架[EB/ OL].[2021-05-31].https://baijiahao.baidu.com/s id=167730 6731850263652&wfr=spider&for=pc.
[26]NUC SCHOOL OF INFORMATION AND LIBRARY SCIENCE.Courses|sils.unc.edu[EB/OL].[2021-06-13].https://sils.unc.edu/courses.
[27]吳愛芝,王盛.高校圖書館數(shù)據(jù)素養(yǎng)教育體系設(shè)計研究——以北京大學(xué)圖書館為例[J].大學(xué)圖書館學(xué)報,2020,38(6):96-103.
[28]劉芮,譚必勇.數(shù)據(jù)驅(qū)動智慧服務(wù):澳大利亞政府?dāng)?shù)據(jù)治理體系及其對我國的啟示[J].電子政務(wù),2019(10):68-80.
[29]陳蘭杰,聞航.基于區(qū)塊鏈的開放政府?dāng)?shù)據(jù)個人隱私保護模型及實現(xiàn)機理研究[J].圖書館理論與實踐,2021(1):67-72.
[30]張丹.面向群體交互的檔案服務(wù)系統(tǒng)構(gòu)建——針對館員與用戶的分析[J].檔案學(xué)通訊,2021(1):58-65.