国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于小數(shù)據(jù)的檔案信息服務(wù)精準(zhǔn)化研究*

2021-08-04 02:41聶云霞何金梅肖坤
山西檔案 2021年2期
關(guān)鍵詞:檔案館精準(zhǔn)用戶

聶云霞 何金梅 肖坤

(南昌大學(xué)歷史系 南昌 330031)

0 引言

大數(shù)據(jù)時(shí)代,檔案部門以檔案用戶為中心,積極開展集豐富的檔案資源、智能化的服務(wù)系統(tǒng)、互動(dòng)化的服務(wù)體系、多元化的服務(wù)方式、個(gè)性化的服務(wù)內(nèi)容為一體的檔案信息服務(wù),取得了良好的社會(huì)效應(yīng)。但大數(shù)據(jù)時(shí)代信息超載現(xiàn)象嚴(yán)重,相對(duì)狹窄的信息通道中夾雜著太多價(jià)值密度低、冗余度高的“副信息”,給檔案信息服務(wù)實(shí)踐中個(gè)性化信息服務(wù)需求的滿足造成了一定困擾。在現(xiàn)有研究成果中,有學(xué)者指出在大數(shù)據(jù)時(shí)代檔案信息服務(wù)存在檔案信息服務(wù)體系缺乏一定的針對(duì)性,檔案服務(wù)定位缺少對(duì)用戶需求的分析[1],數(shù)字檔案館信息服務(wù)中服務(wù)理念相對(duì)落后,并且用戶研究不夠精細(xì),資源建設(shè)與用戶建設(shè)不同步[2]等問題。因此相較于大數(shù)據(jù)相關(guān)的思維所反映出的總體思路、智能思維、容錯(cuò)思維,小數(shù)據(jù)主要包括的個(gè)性思維、因果思維、精確定位和用戶參與等4個(gè)方面[3]在大數(shù)據(jù)時(shí)代引起學(xué)者們的關(guān)注,從另一種思路拓寬了開展精準(zhǔn)化檔案信息服務(wù)的可能性。

1 小數(shù)據(jù)與檔案小數(shù)據(jù)

1.1 小數(shù)據(jù)

2013年美國康奈爾大學(xué)Estrin Deborah教授在題為“Small Data,Where N = me”的報(bào)告中首次提出小數(shù)據(jù)的概念并肯定了其重要性,她指出從人們個(gè)人數(shù)字記錄中獲得的小數(shù)據(jù),包括訪問的社交網(wǎng)絡(luò)、搜索引擎、移動(dòng)運(yùn)營商、在線游戲和電子商務(wù)網(wǎng)站留下的數(shù)字痕跡將改變?nèi)藗兯伎己蛯?shí)踐的方式。[4]此后小數(shù)據(jù)的概念被不斷的豐富,并被廣泛應(yīng)用到公共服務(wù)以及電子商務(wù)中。目前學(xué)界對(duì)小數(shù)據(jù)的定義和大數(shù)據(jù)一樣,尚未形成完全共識(shí)。但和對(duì)大數(shù)據(jù)的“4V”特性的共識(shí)一樣,學(xué)界對(duì)于小數(shù)據(jù)具有數(shù)據(jù)總量小、結(jié)構(gòu)簡單、易控、價(jià)值密度高、隱私性強(qiáng)等特點(diǎn)已達(dá)成共識(shí)[5]。且從相關(guān)定義中可見,小數(shù)據(jù)的“小”并不僅僅是大數(shù)據(jù)的“大”的相對(duì)面,表示數(shù)據(jù)量的小,而是表示數(shù)據(jù)采集對(duì)象是一個(gè)個(gè)體。在大數(shù)據(jù)技術(shù)與檔案部門信息服務(wù)結(jié)合不斷深入的趨勢(shì)下,進(jìn)一步引入檔案小數(shù)據(jù),關(guān)注用戶個(gè)性化需求,基于小數(shù)據(jù)思維提供精準(zhǔn)化的檔案信息服務(wù)將形成檔案部門信息服務(wù)新模式,以提高公眾對(duì)于檔案信息服務(wù)的關(guān)注度和滿意度。

1.2 檔案小數(shù)據(jù)及其構(gòu)成

對(duì)小數(shù)據(jù)的概念分析,“檔案學(xué)在這方面的研究借鑒了鄰近學(xué)科的研究成果,如圖書館學(xué)、情報(bào)學(xué)以及計(jì)算機(jī)科學(xué)在該領(lǐng)域的研究?!盵6]當(dāng)前,在檔案學(xué)領(lǐng)域多將檔案小數(shù)據(jù)等同于檔案用戶小數(shù)據(jù)進(jìn)行研究。但“精準(zhǔn)”應(yīng)是自上而下和自下而上雙方向相結(jié)合的一種模式,既要從公眾淺層的實(shí)際需求出發(fā),還應(yīng)該從上層需求出發(fā),從社會(huì)發(fā)展的宏觀視野出發(fā),推送信息。[7]為達(dá)到精準(zhǔn)化的檔案信息服務(wù),結(jié)合“小數(shù)據(jù)”的概念和特征,筆者認(rèn)為檔案小數(shù)據(jù)主要包括但不限于檔案用戶小數(shù)據(jù)和檔案工作人員小數(shù)據(jù)。通過對(duì)兩者的收集和處理,既對(duì)檔案用戶信息需求進(jìn)行細(xì)粒度分析,又從檔案部門內(nèi)部優(yōu)化檔案信息服務(wù),從而提高檔案信息服務(wù)的精準(zhǔn)化。

1.2.1 檔案用戶小數(shù)據(jù)

通過對(duì)現(xiàn)有研究成果的梳理發(fā)現(xiàn),學(xué)者們將檔案用戶在利用檔案信息資源過程中產(chǎn)生的能展現(xiàn)用戶行為需求特征的各種數(shù)據(jù)集合[8],即在利用檔案的過程中產(chǎn)生的思維活動(dòng)、需求表達(dá)、利用行為等各種數(shù)據(jù)[5]都統(tǒng)稱為檔案用戶小數(shù)據(jù)。通過總結(jié)歸納,檔案用戶小數(shù)據(jù)應(yīng)是不同類型檔案用戶的背景數(shù)據(jù)與其在接受檔案館服務(wù)全過程中產(chǎn)生的表達(dá)需求、利用檔案等多種類型數(shù)據(jù)的集合。并根據(jù)檔案用戶小數(shù)據(jù)的特點(diǎn)和檔案利用行為過程,在用戶個(gè)體特征數(shù)據(jù)、行為監(jiān)測(cè)數(shù)據(jù)、外圍共享數(shù)據(jù)[9]三種類型的基礎(chǔ)上,將檔案用戶的檔案利用反饋數(shù)據(jù)單獨(dú)分類,以便結(jié)合檔案工作人員小數(shù)據(jù)優(yōu)化檔案信息服務(wù)模式。即檔案用戶小數(shù)據(jù)包括檔案用戶基本特征數(shù)據(jù)、檔案利用行為數(shù)據(jù)、檔案利用反饋數(shù)據(jù)以及其它社交共享數(shù)據(jù),其主要構(gòu)成見表1。

表1 檔案用戶小數(shù)據(jù)構(gòu)成

1.2.2 檔案工作人員小數(shù)據(jù)

檔案工作人員小數(shù)據(jù)是檔案館工作人員的背景數(shù)據(jù)以及在檔案工作全過程中產(chǎn)生的反映日常檔案工作特點(diǎn)的多種類型數(shù)據(jù)的集合,包括檔案工作人員基本特征數(shù)據(jù)、日常工作數(shù)據(jù)以及其它社交共享數(shù)據(jù),主要構(gòu)成如表2。與檔案用戶小數(shù)據(jù)關(guān)注用戶利用行為數(shù)據(jù)相比,檔案工作人員小數(shù)據(jù)更為關(guān)注檔案工作人員的工作日程、工作狀態(tài)等日常工作數(shù)據(jù)。對(duì)檔案工作人員小數(shù)據(jù)的采集是為了借助數(shù)據(jù)化反饋工作效率,結(jié)合檔案用戶反饋數(shù)據(jù)更好優(yōu)化檔案信息資源服務(wù)模式,從檔案部門內(nèi)部進(jìn)行自我調(diào)整。

表2 檔案工作人員小數(shù)據(jù)構(gòu)成

2 基于小數(shù)據(jù)開展檔案信息服務(wù)精準(zhǔn)化的可行性

檔案用戶個(gè)性化需求的滿足建立在檔案部門比檔案用戶更了解自身的信息需求上?!耙勒振R斯洛‘基本需求層次理論’,信息學(xué)家科亨(Kochen)將用戶信息需求劃分為客觀狀態(tài)層次的信息需求、認(rèn)識(shí)層次的信息需求、表達(dá)層次的信息需求三個(gè)層次?!盵10]如果用戶主動(dòng)到檔案部門進(jìn)行咨詢,說明用戶已經(jīng)有較為明確的信息需求,檔案部門根據(jù)其顯性的信息需求開展服務(wù)就能滿足用戶的需要。但是受檔案用戶受教育程度、知識(shí)結(jié)構(gòu)、工作崗位以及信息素養(yǎng)等因素影響的客觀狀態(tài)層次、認(rèn)識(shí)層次隱性的用戶未意識(shí)到,或者是已經(jīng)意識(shí)到而無法表達(dá)的信息需求需要檔案部門主動(dòng)挖掘。因此在全面推進(jìn)檔案數(shù)字化,逐漸構(gòu)建數(shù)據(jù)態(tài)檔案管理的過程中,在基于小數(shù)據(jù)思維采集檔案用戶產(chǎn)生的、與其相關(guān)的全方位數(shù)據(jù),通過數(shù)據(jù)分析工具的分析,可更好掌握和預(yù)測(cè)檔案用戶信息需求,并通過用戶的反饋數(shù)據(jù)以及檔案工作人員小數(shù)據(jù)不斷優(yōu)化檔案工作使得檔案信息服務(wù)更精準(zhǔn)。

2.1 檔案數(shù)字化的全面落實(shí)以及逐漸向檔案數(shù)據(jù)化推進(jìn)

2020年6月20日頒布的《中華人民共和國檔案法》第五章第三十八條明確“國家鼓勵(lì)和支持檔案館和機(jī)關(guān)、團(tuán)體、企業(yè)事業(yè)單位以及其他組織推進(jìn)傳統(tǒng)載體檔案數(shù)字化。”[11]目前,檔案信息化的工作重點(diǎn)仍在全面推進(jìn)檔案數(shù)字化階段,已經(jīng)取得了較大成績。但隨著信息技術(shù)發(fā)展、用戶需求的多元變化以及檔案數(shù)字化具體工作實(shí)踐的經(jīng)驗(yàn)總結(jié),檔案數(shù)據(jù)化引起檔案界的廣泛關(guān)注。具體來說,“檔案數(shù)據(jù)化是指檔案部門以用戶需求和業(yè)務(wù)需要為導(dǎo)向,將數(shù)字檔案資源(包括數(shù)字化轉(zhuǎn)換形成的數(shù)字檔案資源和歸檔電子文件)轉(zhuǎn)換為可供閱讀、分析和處理的檔案數(shù)據(jù)資源的過程?!盵12]檔案數(shù)據(jù)化被認(rèn)為是檔案數(shù)字化發(fā)展的新階段,可實(shí)現(xiàn)數(shù)據(jù)態(tài)、語義級(jí)的細(xì)粒度檔案管理?;跈n案用戶小數(shù)據(jù)的用戶需求細(xì)粒度分析與檔案信息資源的細(xì)粒度管理相結(jié)合將真正實(shí)現(xiàn)精準(zhǔn)化檔案信息服務(wù)。

2.2 關(guān)鍵技術(shù)已成熟落地且仍在不斷完善

檔案信息服務(wù)的精準(zhǔn)化離不開信息技術(shù)的支撐,李財(cái)富、林夕余提出用戶畫像技術(shù)、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、智能代理技術(shù)是檔案信息服務(wù)的關(guān)鍵技術(shù)。[8]以上技術(shù)在不斷的發(fā)展中已經(jīng)融入到各行各業(yè)的發(fā)展中,促進(jìn)行業(yè)內(nèi)服務(wù)方式的轉(zhuǎn)變。例如在相近學(xué)科圖書館學(xué)的研究中,根據(jù)不同類型用戶進(jìn)行細(xì)分,利用用戶畫像技術(shù)來構(gòu)建用戶群體畫像,為用戶提供差異化、精準(zhǔn)化、個(gè)性化的圖書館服務(wù)[13],給檔案信息服務(wù)提供了借鑒。在基于小數(shù)據(jù)的精準(zhǔn)化檔案信息服務(wù)模式中,用戶畫像技術(shù)通過檔案用戶以及工作人員的小數(shù)據(jù)的采集形成特定標(biāo)簽,建立檔案用戶和工作人員的全貌模型;數(shù)據(jù)倉儲(chǔ)技術(shù)的給檔案小數(shù)據(jù)建立一種體系化的信息存儲(chǔ)環(huán)境,形成一個(gè)綜合的、適合分析的數(shù)據(jù)環(huán)境;數(shù)據(jù)挖掘從檔案用戶小數(shù)據(jù)庫中挖掘出用戶感興趣的、潛在的有用信息。并且隨著技術(shù)創(chuàng)新、檔案人才培育等不斷發(fā)展,用戶畫像、數(shù)據(jù)倉儲(chǔ)以及數(shù)據(jù)挖掘與檔案信息服務(wù)之間的融合將更加深入和完善。

2.3 原始檔案用戶已有數(shù)據(jù)積累

有資料顯示,國家綜合檔案館2019年共提供1819.1萬卷/件次檔案利用,國家綜合檔案館專職人員22584人,國家專門檔案館專職人員3119人,部門檔案館專職人員1739人。[14]針對(duì)目前檔案資源利用情況,“檔案用戶數(shù)量相對(duì)其它行業(yè)要少得多,難以形成大規(guī)模的用戶數(shù)據(jù),因此一般不太可能進(jìn)行有效的大數(shù)據(jù)分析?!盵9]各省市檔案館可以依據(jù)目前已有的檔案用戶數(shù)據(jù)以及職工數(shù)據(jù)為基礎(chǔ)分別建立用戶和工作人員小數(shù)據(jù)。以江西省檔案館為例,2018年江西省檔案館接待利用檔案及資料2262人次,提供利用檔案資料43993卷/件次。[15]在提供檔案利用時(shí)全面記錄的查閱者的個(gè)人信息和查閱需求,為用戶小數(shù)據(jù)的建立打下了基礎(chǔ)。此外,江西省檔案館對(duì)本館檔案人員的數(shù)量、年齡以及學(xué)歷情況都做了較為詳細(xì)的公布,在一定程度上說明檔案館已經(jīng)掌握檔案館工作人員的部分?jǐn)?shù)據(jù)。

2.4 個(gè)人信息合法合規(guī)利用的法制環(huán)境初步形成

檔案用戶數(shù)據(jù)采集、利用是檔案信息服務(wù)精準(zhǔn)化實(shí)現(xiàn)的基礎(chǔ)。當(dāng)前,政府、企業(yè)和其它社會(huì)組織為實(shí)現(xiàn)高效社會(huì)服務(wù)、獲取經(jīng)濟(jì)利益等目的爭相開發(fā)利用數(shù)據(jù)資源。長久以來,公眾通過讓渡個(gè)人信息獲得便利服務(wù)的同時(shí),用戶數(shù)據(jù)無限制采集,不法分子盜取、買賣個(gè)人信息等行為嚴(yán)重侵害公民信息權(quán)的事件讓公眾處于恐慌之中。目前,國家通過制定相關(guān)法規(guī)政策來引導(dǎo)社會(huì)組織對(duì)個(gè)人信息的合法合規(guī)收集、處理和利用,以及通過對(duì)違法收集、處理和利用用戶信息的客戶端以及企業(yè)進(jìn)行約談、通報(bào)、懲罰、責(zé)令整改等方式提高政府、企業(yè)等社會(huì)組織合法合規(guī)利用個(gè)人信息的意識(shí)。2019年1月,中央網(wǎng)信辦、工業(yè)和信息化部、公安部、市場監(jiān)管總局四部門聯(lián)合發(fā)布《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》,“經(jīng)過一年的專項(xiàng)整治效果顯著,APP運(yùn)營者履行個(gè)人信息保護(hù)責(zé)任義務(wù)的能力和水平明顯提升”[16]。2020年5月28日第十三屆全國人民代表大會(huì)第三次會(huì)議審議通過《中華人民共和國民法典》[17],“構(gòu)建了自然人與信息處理者之間的基本權(quán)利義務(wù)框架,合理平衡保護(hù)個(gè)人信息與維護(hù)公共利益之間的關(guān)系(草案第一千零三十六條至第一千零三十八條)?!盵18]上述法律法規(guī)的制定和頒布實(shí)施,一方面給個(gè)人信息利用者吃了“定心丸”,保障了個(gè)人信息利用者的合法權(quán)益;另一方面也為個(gè)人信息保護(hù)上了“安全鎖”,消除了個(gè)人信息保護(hù)的安全隱患。當(dāng)前,我國公眾法律意識(shí)和信息權(quán)意識(shí)進(jìn)一步提升,我國個(gè)人信息保護(hù)法律體系也逐步建立健全,個(gè)人信息合法合規(guī)利用的法制環(huán)境已初步形成,這將為檔案信息精準(zhǔn)化服務(wù)提供更佳的外部環(huán)境。

3 基于檔案小數(shù)據(jù)的檔案信息服務(wù)精準(zhǔn)化服務(wù)模式

根據(jù)檔案信息服務(wù)的特征,從檔案小數(shù)據(jù)的采集、處理、存儲(chǔ)、服務(wù)以及模式優(yōu)化出發(fā),將基于小數(shù)據(jù)的檔案信息精準(zhǔn)服務(wù)模式分為檔案用戶層、檔案用戶小數(shù)據(jù)采集處理層、檔案小數(shù)據(jù)存儲(chǔ)層、檔案信息精準(zhǔn)服務(wù)層、服務(wù)模式優(yōu)化層五個(gè)層級(jí)(見圖1),以期實(shí)現(xiàn)精準(zhǔn)化的檔案信息服務(wù)。

圖1 基于檔案小數(shù)據(jù)的檔案信息服務(wù)精準(zhǔn)化服務(wù)模式

3.1 檔案用戶層

基于小數(shù)據(jù)的檔案信息服務(wù),檔案用戶既是數(shù)據(jù)的起點(diǎn),也是服務(wù)的回歸之處。因此,不管是出于數(shù)據(jù)采集以及服務(wù)的角度,檔案部門都應(yīng)與用戶層建立良性的交互關(guān)系。

3.2 檔案用戶小數(shù)據(jù)采集處理層

3.2.1 檔案用戶小數(shù)據(jù)的采集

檔案部門現(xiàn)在主要通過線上和線下給用戶提供檔案服務(wù),因此檔案用戶信息的采集也主要是通過這兩種方式。檔案用戶基本特征數(shù)據(jù)采集主要是在用戶主動(dòng)進(jìn)行線上、線下檔案咨詢或者參加檔案活動(dòng)時(shí)進(jìn)行。檔案部門通過制定規(guī)范、統(tǒng)一的格式在在開展線上和線下服務(wù)時(shí)采集檔案用戶基本特征小數(shù)據(jù),以便數(shù)據(jù)的利用;檔案利用活動(dòng)數(shù)據(jù)采集可通過線下視頻監(jiān)控設(shè)備、無線傳感器網(wǎng)絡(luò)采集,以及利用相關(guān)技術(shù)抓取線上用戶網(wǎng)絡(luò)搜索、瀏覽檔案信息的數(shù)據(jù);檔案利用反饋數(shù)據(jù)主要通過檔案館主動(dòng)進(jìn)行用戶回訪、問卷調(diào)查等方式結(jié)合用戶留言反饋采集獲取;用戶其它社交共享數(shù)據(jù)是檔案用戶在第三方社交平臺(tái)中產(chǎn)生的有關(guān)檔案信息的傳播數(shù)據(jù),可通過與第三方達(dá)成合作協(xié)議,通過其后臺(tái)數(shù)據(jù)庫獲取。

3.2.2 檔案用戶小數(shù)據(jù)的預(yù)處理

從檔案用戶的基本特征數(shù)據(jù)到其它社交共享數(shù)據(jù),檔案用戶小數(shù)據(jù)的價(jià)值密度、可控性、可用性在減弱,數(shù)據(jù)的總量、噪聲在增加。[19]檔案部門可通過對(duì)檔案用戶小數(shù)據(jù)進(jìn)行清洗、變換、歸約預(yù)處理,從而提升檔案用戶小數(shù)據(jù)的價(jià)值密度和可用性。在檔案用戶小數(shù)據(jù)采集實(shí)踐中,會(huì)因用戶填寫不規(guī)范、用戶持隱私保護(hù)的心態(tài)以及其它技術(shù)原因?qū)е虏杉降臋n案用戶小數(shù)據(jù)存在缺失、重復(fù)等情況。通過對(duì)檔案小數(shù)據(jù)的清洗,可刪除重復(fù)數(shù)據(jù)、補(bǔ)充缺失數(shù)據(jù)和去除異常數(shù)據(jù)。通過對(duì)檔案小數(shù)據(jù)的變換將通過多種方式采集的多種類型的檔案用戶小數(shù)據(jù)轉(zhuǎn)換成適合進(jìn)行檔案用戶信息需求分析的形式。數(shù)據(jù)歸約是在保證原有數(shù)據(jù)的完整性與有效性的基礎(chǔ)上,將降低數(shù)據(jù)規(guī)模,精簡數(shù)據(jù)量。[20]檔案用戶小數(shù)據(jù)規(guī)約的意義就是通過將檔案用戶小數(shù)據(jù)集的縮小,提高檔案部門在數(shù)據(jù)分析中對(duì)數(shù)據(jù)處理的速度,從而快速反應(yīng)檔案用戶的信息需求。

3.2.3 檔案用戶小數(shù)據(jù)的融合

“數(shù)據(jù)融合是對(duì)多個(gè)傳感器和信息源所提供的關(guān)于某一環(huán)境特征的不完整信息加以綜合,形成相對(duì)完整、一致的感知描述,從而實(shí)現(xiàn)更加準(zhǔn)確的識(shí)別和判斷功能,信息融合可以看成一種形式框架,目的是得到高品質(zhì)的有用信息?!盵21]檔案用戶小數(shù)據(jù)的融合包括內(nèi)容和時(shí)間兩個(gè)層面的融合。檔案小數(shù)據(jù)內(nèi)容上的融合是將通過線上、線下不同途徑獲得的有關(guān)的檔案用戶小數(shù)據(jù)進(jìn)行組合,豐富檔案用戶形象并通過不同數(shù)據(jù)來驗(yàn)證和提高數(shù)據(jù)的可信度。因?yàn)橛脩舻臄?shù)據(jù)是動(dòng)態(tài)且實(shí)時(shí)更新的,檔案用戶小數(shù)據(jù)時(shí)間上的融合將不同時(shí)間段采集到的檔案用戶數(shù)據(jù)進(jìn)行組合來呈現(xiàn)檔案用戶的實(shí)時(shí)需求。檔案用戶小數(shù)據(jù)的融合為公眾檔案信息需求的精準(zhǔn)化分析和預(yù)測(cè)奠定了基礎(chǔ)。

3.3 檔案小數(shù)據(jù)存儲(chǔ)層

檔案小數(shù)據(jù)存儲(chǔ)層包括對(duì)檔案用戶小數(shù)據(jù)和檔案工作人員小數(shù)據(jù)的存儲(chǔ)。檔案用戶以及檔案工作人員小數(shù)據(jù)除去基本特征數(shù)據(jù)具有相對(duì)穩(wěn)定性,檔案用戶利用活動(dòng)數(shù)據(jù)以及社交共享數(shù)據(jù),檔案工作人員的工作日程等數(shù)據(jù)均處于動(dòng)態(tài)變化中,因此小數(shù)據(jù)采集要注意實(shí)時(shí)更新、動(dòng)態(tài)存儲(chǔ)。由于數(shù)據(jù)采集的復(fù)雜性,加之采集到的檔案用戶小數(shù)據(jù)與公眾生活息息相關(guān),一旦丟失和泄露對(duì)檔案部門以及檔案用戶都會(huì)造成較大的負(fù)面影響,不僅公眾的個(gè)人信息可能會(huì)被惡意利用,給公眾帶來困擾和損失,檔案部門也會(huì)失去公眾的信任。因此檔案小數(shù)據(jù)的存儲(chǔ)一定要做好安全防護(hù)工作,避免數(shù)據(jù)的丟失和泄露。

3.4 檔案信息精準(zhǔn)服務(wù)推送層

檔案信息精準(zhǔn)服務(wù)包括檔案信息內(nèi)容精確性與檔案服務(wù)及時(shí)性兩方面。對(duì)檔案用戶已經(jīng)明確表達(dá)出來的檔案信息需求,檔案部門在已有檔案資源的基礎(chǔ)上盡可能地精準(zhǔn)、及時(shí)滿足檔案用戶的信息需求;對(duì)沒有滿足的信息需求,做出較為明確的解釋,以及提供給用戶一些其它獲取該檔案信息資源的建議。檔案館針對(duì)采集的反映檔案用戶客觀狀態(tài)以及認(rèn)識(shí)層次的檔案需求小數(shù)據(jù)通過用戶畫像等關(guān)鍵信息技術(shù)進(jìn)行數(shù)據(jù)挖掘以及檔案用戶分析,發(fā)現(xiàn)檔案用戶潛在的、沒有表達(dá)出來的檔案信息需求,通過檔案用戶信息需求的細(xì)粒度分析與檔案資源細(xì)粒度管理進(jìn)行匹配,提高檔案信息服務(wù)的效率,即在提供精準(zhǔn)的檔案信息服務(wù)的同時(shí)保證其及時(shí)性,還能通過對(duì)檔案小數(shù)據(jù)的分析進(jìn)行檔案用戶的檔案信息需求預(yù)測(cè),做到比檔案用戶更了解自己的需求。

3.5 檔案信息精準(zhǔn)服務(wù)優(yōu)化層

檔案信息精準(zhǔn)服務(wù)優(yōu)化層建立在檔案用戶檔案利用反饋數(shù)據(jù),以及檔案工作人員小數(shù)據(jù)之上。檔案用戶的反饋數(shù)據(jù)直觀表達(dá)了用戶的要求和建議,比如用戶建議檔案館推送內(nèi)容的形式要更加豐富等。檔案工作人員的小數(shù)據(jù)的處理與檔案用戶小數(shù)據(jù)的處理相似,通過對(duì)檔案工作人員的小數(shù)據(jù)的分析,在掌握檔案工作人員的性格特點(diǎn)、興趣特長以及工作方式的基礎(chǔ)上更好地優(yōu)化工作配置,提高檔案信息服務(wù)的效率。檔案信息精準(zhǔn)服務(wù)優(yōu)化層進(jìn)行的數(shù)據(jù)分析結(jié)果應(yīng)及時(shí)反饋給各個(gè)層級(jí),以優(yōu)化整體服務(wù)模式。

基于檔案小數(shù)據(jù)的檔案信息精準(zhǔn)服務(wù)模式,給檔案用戶的服務(wù)呈現(xiàn)出服務(wù)主動(dòng)、信息處理智能化、服務(wù)內(nèi)容個(gè)性化、信息傳播具有時(shí)效性以及服務(wù)流程不斷優(yōu)化等特征,讓用戶享受到更好的服務(wù)體驗(yàn),同時(shí)促進(jìn)檔案信息服務(wù)的社會(huì)化。

4 基于小數(shù)據(jù)的檔案信息服務(wù)精準(zhǔn)化實(shí)施策略

4.1 加快檔案資源的共建共享

檔案資源的共建共享是開展檔案信息服務(wù)精準(zhǔn)化的保障。檔案用戶的信息需求內(nèi)容、形式在朝著多元化發(fā)展,給檔案館服務(wù)提出了更高的要求,但是檔案館藏資源具有地域性、資源結(jié)構(gòu)相對(duì)固定等特點(diǎn)。為了滿足用戶個(gè)性化的檔案信息需求,提供精準(zhǔn)化的檔案信息服務(wù),檔案館應(yīng)加快檔案資源的共建共享,將檔案資源形成大的資源系統(tǒng),彌補(bǔ)檔案館藏資源單一的不足。目前各省市已經(jīng)在加快檔案資源的共建共享,例如上海、江蘇、浙江、安徽推進(jìn)長三角地區(qū)民生檔案“異地查檔、跨館服務(wù)”,廣西推進(jìn)北部灣經(jīng)濟(jì)區(qū)檔案信息資源共享平臺(tái)建設(shè)[22];川渝兩地檔案館簽署協(xié)議,“加快川渝地區(qū)民生檔案服務(wù)共享平臺(tái)建設(shè),擴(kuò)大民生檔案異地查檔跨館服務(wù)內(nèi)容和覆蓋范圍,努力實(shí)現(xiàn)檔案公共服務(wù)普惠共享”[23]。但檔案資源的共建共享應(yīng)基于檔案用戶需求,在此基礎(chǔ)上進(jìn)一步擴(kuò)大檔案資源共建的范圍。需要指出的是,檔案館資源共享建設(shè)是循序漸進(jìn)的過程,檔案館基于用戶小數(shù)據(jù)挖掘、分析出的公眾檔案信息需求不能因?yàn)槟壳白陨眇^藏資源的不足就忽視。因此在檔案資源無法達(dá)成共建共享之前,檔案部門之間也應(yīng)建有交流平臺(tái),將自身目前無法滿足的檔案需求進(jìn)行共享,將檔案用戶小數(shù)據(jù)進(jìn)行轉(zhuǎn)移,從而滿足用戶的信息需求,提高用戶的滿意度。

4.2 加強(qiáng)移動(dòng)終端服務(wù)的建設(shè)和推廣

“‘互聯(lián)網(wǎng)+’時(shí)代,人們更傾向于通過移動(dòng)終端查詢和獲取檔案信息”[24],而手機(jī)則是普及化程度最高的移動(dòng)終端代表。第46次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》數(shù)據(jù)顯示,截至2020年6月,我國網(wǎng)民規(guī)模達(dá)9.40億,手機(jī)網(wǎng)民規(guī)模達(dá)9.32億,網(wǎng)民使用手機(jī)上網(wǎng)的比例達(dá)99.2%。[25]“檔案館移動(dòng)終端服務(wù)將傳統(tǒng)的面對(duì)面服務(wù)和檔案信息網(wǎng)站服務(wù)等方式,拓展到移動(dòng)終端服務(wù)平臺(tái)上,為用戶提供實(shí)時(shí)可移動(dòng)服務(wù)?!盵26]2016年國家檔案局印發(fā)《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》提出,“檔案工作要主動(dòng)適應(yīng)經(jīng)濟(jì)發(fā)展新常態(tài),加強(qiáng)理念創(chuàng)新、手段創(chuàng)新,拓寬通過檔案網(wǎng)站和移動(dòng)終端開展檔案服務(wù)的渠道”[27]。“檔案APP是檔案機(jī)構(gòu)和組織以館藏檔案資源為依托,面向全社會(huì)開發(fā)的安裝于移動(dòng)終端的提供檔案服務(wù)的應(yīng)用開發(fā)軟件”[28],是開展移動(dòng)終端服務(wù)的有效途徑。但是截至2019年6月我國可供下載利用的檔案APP僅有22個(gè)[29],可見目前檔案移動(dòng)終端服務(wù)還處于起步階段。但公眾利用移動(dòng)終端已經(jīng)成為常態(tài),檔案部門可以通過檔案APP、微信公眾號(hào)、微信小程序等方式在移動(dòng)終端上與用戶建立直接聯(lián)系,越過檔案部門與公眾間長久存在的“信息鴻溝”,強(qiáng)化互動(dòng),根據(jù)采集到的用戶興趣、利用偏好等數(shù)據(jù)向用戶精準(zhǔn)推送個(gè)性化的服務(wù)內(nèi)容。并且在用戶的利用中進(jìn)行利用反饋數(shù)據(jù)的采集,從而更好地進(jìn)行檔案信息精準(zhǔn)推送。

4.3 重視檔案潛在用戶的開發(fā)與匯聚

當(dāng)前,我國檔案館的用戶規(guī)模正呈上升趨勢(shì),但是上升幅度小,用戶粘性不高。并且因?yàn)樵陂L期發(fā)展中檔案館與公眾之間存在距離感,導(dǎo)致公眾對(duì)檔案館及檔案資源認(rèn)知較為薄弱,限制檔案用戶規(guī)模的有效擴(kuò)大,因此存在較大規(guī)模的潛在用戶?!皬臋n案的視角來說,沒有被服務(wù)好的用戶群體就是潛在用戶群體,這一群體雖然具有潛在的信息需求,但是并沒有被檔案信息機(jī)構(gòu)服務(wù)過?!盵30]面對(duì)檔案館的現(xiàn)實(shí)用戶,可通過對(duì)用戶小數(shù)據(jù)的深度挖掘形成個(gè)人標(biāo)簽來增加現(xiàn)實(shí)用戶的粘性,如網(wǎng)易云、淘寶等APP生成個(gè)人年度數(shù)據(jù)報(bào)告為例,就在用戶中引起很大的反響。但相對(duì)檔案館沒有服務(wù)過的潛在用戶,檔案館就無法獲得其用戶數(shù)據(jù),檔案部門可通過加強(qiáng)與其它客戶端之間合作,如利用跨平臺(tái)分享、轉(zhuǎn)發(fā)等方式,通過現(xiàn)實(shí)用戶將相關(guān)檔案信息內(nèi)容轉(zhuǎn)發(fā)至微信好友、微信朋友圈、QQ空間等社交平臺(tái),激發(fā)潛在用戶的一些檔案需求,并在分享中擴(kuò)大檔案信息資源的可獲取方式來轉(zhuǎn)化潛在用戶,形成潛在用戶的匯聚。

4.4 實(shí)現(xiàn)檔案“大小數(shù)據(jù)”的融合發(fā)展

英國數(shù)學(xué)家托馬斯·克倫普在《數(shù)字人類學(xué)》一書中指出,“數(shù)據(jù)的本質(zhì)是人,分析數(shù)據(jù)就是在分析人類族群自身,數(shù)據(jù)產(chǎn)生于人類社會(huì)的各種活動(dòng),其價(jià)值也在于服務(wù)人類社會(huì),讓生活變得更加美好”[31]。因此,不管是檔案大數(shù)據(jù)、還是檔案小數(shù)據(jù)都是為了更好地給用戶提供檔案信息服務(wù),只是兩者之間數(shù)據(jù)關(guān)注點(diǎn)和處理方式不同而已。因此,基于小數(shù)據(jù)的檔案信息精準(zhǔn)化服務(wù)并不是完全與大數(shù)據(jù)進(jìn)行剝離,獨(dú)占鰲頭。兩者之間是相互融合的關(guān)系,只有相互融合才能更好地推進(jìn)檔案信息的精準(zhǔn)化服務(wù)。就如在基于小數(shù)據(jù)的檔案信息精準(zhǔn)化服務(wù)模式中的優(yōu)化層級(jí),對(duì)檔案用戶反饋數(shù)據(jù)以及檔案工作人員小數(shù)據(jù)的分析就需要大數(shù)據(jù)的嵌入,進(jìn)行統(tǒng)計(jì)分析,從而將外部反饋與內(nèi)部自我優(yōu)化進(jìn)行聯(lián)動(dòng),達(dá)到整個(gè)服務(wù)模式的自我優(yōu)化的效果。

5 結(jié)語

大數(shù)據(jù)時(shí)代,信息環(huán)境隨著信息技術(shù)的發(fā)展與應(yīng)用變得更加復(fù)雜,多種類型的海量信息造成信息過載,給公眾帶來信息困擾。信息精準(zhǔn)化服務(wù)是用戶面對(duì)信息過載所渴求的,也是信息服務(wù)機(jī)構(gòu)提升用戶滿意度的必然之路。檔案部門以用戶為中心,將用戶小數(shù)據(jù)與檔案部門實(shí)際信息服務(wù)情況相結(jié)合,利用發(fā)展成熟的信息技術(shù)進(jìn)行數(shù)據(jù)挖掘、需求分析和預(yù)測(cè),為檔案用戶提供個(gè)性化和精準(zhǔn)化的檔案信息服務(wù),符合檔案館“以人為本”的服務(wù)定位,是技術(shù)驅(qū)動(dòng)與內(nèi)容挖掘相結(jié)合的有力探索。但值得注意的是,基于小數(shù)據(jù)的檔案信息精準(zhǔn)服務(wù)必須以保護(hù)數(shù)據(jù)安全、防止檔案用戶個(gè)人隱私以及檔案工作人員隱私的泄露為前提,只有讓公眾信任,與公眾建立良性數(shù)據(jù)采集與保護(hù)機(jī)制,才能保證檔案信息服務(wù)不斷朝精準(zhǔn)化發(fā)展完善。

猜你喜歡
檔案館精準(zhǔn)用戶
基于用戶和電路的攻擊識(shí)別方法
2021少兒出版用戶觸達(dá)能力指數(shù)
精準(zhǔn)防返貧,才能穩(wěn)脫貧
關(guān)于智慧檔案館與數(shù)字檔案館的關(guān)系探討
精準(zhǔn)扶貧 齊奔小康
信用卡資深用戶
精準(zhǔn)扶貧二首
when與while檔案館
北京市第三屆“檔案館日”活動(dòng)預(yù)告
科隆檔案館突然坍塌