張佳+冉虎+崔杰
[摘 要] 本文在探究了大數(shù)據(jù)時(shí)代下高校檔案面臨的問(wèn)題及應(yīng)對(duì)思路的基礎(chǔ)上提出一個(gè)高校電子檔案管理模型。模型將高校內(nèi)各個(gè)系統(tǒng)和高校檔案云平臺(tái)作為數(shù)據(jù)源,利用數(shù)據(jù)挖掘與云存儲(chǔ)技術(shù),支持檔案查詢、檔案推薦和檔案公開(kāi),有效解決了大數(shù)據(jù)時(shí)代檔案工作面臨的問(wèn)題。
[關(guān)鍵詞] 大數(shù)據(jù);高校;電子檔案;信息化
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 21. 067
[中圖分類號(hào)] G270.7;TP311.13 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2017)21- 0156- 03
0 引 言
高校電子檔案是指高校在日常事務(wù)、教學(xué)、科研等過(guò)程中形成的對(duì)國(guó)家和社會(huì)具有保存價(jià)值并歸檔保存的電子文件,和傳統(tǒng)的紙質(zhì)檔案相比,電子檔案能夠有效地讓工作變得更加快捷、方便。大數(shù)據(jù)時(shí)代,信息化得到深入發(fā)展,高校電子檔案工作面臨許多挑戰(zhàn),如何在大數(shù)據(jù)背景下管理電子檔案是一個(gè)值得研究的問(wèn)題。
1 高校電子檔案工作面臨的問(wèn)題
在大數(shù)據(jù)時(shí)代,高校師生對(duì)信息的需求更加多樣,而傳統(tǒng)的檔案提供模式已經(jīng)不能有效滿足需求,高校電子檔案工作面臨著利用不充分、公開(kāi)程度低、服務(wù)方式落后和歸檔需求增大等問(wèn)題。
1.1 電子檔案歸檔需求增大
大數(shù)據(jù)時(shí)代,高校檔案用戶信息需求呈現(xiàn)出多元化、個(gè)性化的發(fā)展趨勢(shì),內(nèi)容涉及教育教學(xué)、科研管理及基礎(chǔ)建設(shè)等各個(gè)方面,檔案來(lái)源渠道也由原來(lái)單一的由歸檔部門(mén)提供電子版檔案擴(kuò)大到學(xué)校管理中的學(xué)生管理系統(tǒng)、OA系統(tǒng)、圖書(shū)管理系統(tǒng)等每一個(gè)信息系統(tǒng)。隨著電子檔案種類及來(lái)源渠道增多,電子檔案的數(shù)量也相應(yīng)增多。大數(shù)據(jù)時(shí)代下高校電子檔案多種類、多渠道、多數(shù)量的特點(diǎn)對(duì)現(xiàn)有的檔案信息系統(tǒng)在服務(wù)方式、軟件質(zhì)量和硬件設(shè)備上都提出了更高的要求。
1.2 電子檔案公開(kāi)程度低
隨著國(guó)家信息公開(kāi)制度的完善,大量檔案將逐步向社會(huì)公開(kāi),電子檔案公開(kāi)、共享是高校檔案發(fā)展的必要路徑。高校檔案部門(mén)往往囿于自身單一資源中,與其他部門(mén)交流有限,幾乎不向社會(huì)公開(kāi)檔案資源。高校電子檔案公開(kāi)程度低,既不符合發(fā)展趨勢(shì),又造成檔案資源浪費(fèi)。
1.3 電子檔案利用不充分
當(dāng)前高校檔案的利用流程一般是首先由師生提出查檔需求,檔案工作人員根據(jù)需求進(jìn)行查詢并提供檔案。而高校師生檔案利用意識(shí)不強(qiáng),查檔率低,導(dǎo)致檔案利用量??;檔案工作人員對(duì)所提供檔案幾乎不進(jìn)行加工,導(dǎo)致利用價(jià)值低,這就使得高校電子檔案基本處于一種被動(dòng)的封閉狀態(tài)。
1.4 電子檔案服務(wù)方式落后
一方面,目前多數(shù)高校檔案部門(mén)還是采用打印電子檔案的方式為師生提供服務(wù),載體單一、信息時(shí)效性低,沒(méi)有將電子檔案作為提供服務(wù)的直接形式。另一方面,常見(jiàn)的檔案信息管理系統(tǒng),功能簡(jiǎn)單、界面單調(diào),少有系統(tǒng)能夠?yàn)橛脩籼峁┛梢暬牟樵兘缑婊蛘咧鲃?dòng)向用戶推送信息。大數(shù)據(jù)時(shí)代用戶信息獲取意識(shí)越來(lái)越主動(dòng),勢(shì)必對(duì)檔案獲取方式提出更高的要求,對(duì)檔案進(jìn)行內(nèi)容挖掘,主動(dòng)推送檔案是電子檔案服務(wù)的發(fā)展目標(biāo)。
2 高校電子檔案工作應(yīng)對(duì)的思路
針對(duì)上述問(wèn)題,本文嘗試通過(guò)提高軟硬件配置,利用云存儲(chǔ)和數(shù)據(jù)挖掘技術(shù)提供解決方案。
2.1 提高軟硬件配置
利用云存儲(chǔ)創(chuàng)建電子檔案云平臺(tái),解決高校電子檔案歸檔需求大、公開(kāi)程度低的問(wèn)題。一方面,提高軟硬件配置,擴(kuò)大電子檔案存儲(chǔ)空間,主動(dòng)擴(kuò)展電子檔案收集渠道,把每一個(gè)高校管理系統(tǒng)都設(shè)置為內(nèi)部電子檔案來(lái)源渠道,解決歸檔需求大的問(wèn)題;另一方面,通過(guò)在高校之間創(chuàng)建電子檔案云平臺(tái),使高校檔案信息資源匯成一張網(wǎng)絡(luò),各個(gè)高校檔案館之間通過(guò)共建云平臺(tái)上傳、下載電子檔案,實(shí)現(xiàn)電子檔案資源共享、公開(kāi),解決高校電子檔案公開(kāi)程度低的問(wèn)題。
2.2 利用數(shù)據(jù)挖掘技術(shù)解決高校電子檔案利用不充分、檔案服務(wù)方式落后的問(wèn)題
一方面,通過(guò)對(duì)檔案目錄信息和信息的挖掘發(fā)現(xiàn)檔案收集工作的重點(diǎn),通過(guò)對(duì)檔案數(shù)據(jù)的挖掘可以找出檔案管理人員和檔案利用人員與檔案實(shí)體的關(guān)系,進(jìn)而提高電子檔案利用率。另一方面,通過(guò)數(shù)據(jù)挖掘?qū)n案進(jìn)行分類,提高檔案檢索效率;通過(guò)對(duì)檔案利用情況挖掘找出檔案內(nèi)容與檔案利用人員的關(guān)系,根據(jù)發(fā)掘出的關(guān)系有針對(duì)性地向師生推送個(gè)性化檔案,做到主動(dòng)服務(wù)。
3 大數(shù)據(jù)時(shí)代高校電子檔案管理模型
根據(jù)上述分析,筆者嘗試提出大數(shù)據(jù)時(shí)代下高校電子檔案管理模型,如圖1。模型分為輸入、存儲(chǔ)和輸出三個(gè)部分,首先從校內(nèi)各系統(tǒng)和高校檔案云平臺(tái)上搜集信息,經(jīng)過(guò)檔案鑒定和數(shù)據(jù)挖掘后,可支持檔案查詢、檔案推薦和檔案公開(kāi)。
3.1 輸入部分
模型數(shù)據(jù)源分為校內(nèi)和校外兩大類。
校內(nèi)數(shù)據(jù)源包括學(xué)生信息為主的學(xué)生管理信息系統(tǒng),教師信息為主的OA辦公系統(tǒng)以及其他系統(tǒng)如圖書(shū)管理系統(tǒng)、博物館管理系統(tǒng)等。學(xué)生管理系統(tǒng)包含學(xué)生成績(jī)單、錄檢表、畢業(yè)證號(hào)等信息,辦公OA系統(tǒng)包括公文流轉(zhuǎn)、辦會(huì)辦活動(dòng)等信息,這兩個(gè)系統(tǒng)基本涵蓋了高校日常運(yùn)作的大部分?jǐn)?shù)據(jù),是檔案室主要存儲(chǔ)對(duì)象。圖書(shū)管理系統(tǒng)提供師生借閱圖書(shū)數(shù)據(jù)、學(xué)校藏書(shū)數(shù)據(jù)等,博物館管理系統(tǒng)提供學(xué)校歷史數(shù)據(jù)等,這些系統(tǒng)提供更多的輔助教學(xué)數(shù)據(jù),極大豐富了電子檔案的數(shù)量和種類,使電子檔案更加立體化。
校外信息源指多家高校聯(lián)合建立的高校檔案云平臺(tái)。云存儲(chǔ)是指通過(guò)集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量不同類型的存儲(chǔ)設(shè)備通過(guò)應(yīng)用軟件集合起來(lái)協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問(wèn)功能的一個(gè)系統(tǒng)。在平時(shí)工作中,往往會(huì)遇到需要參考或借閱其他高校檔案的問(wèn)題,需要各個(gè)高校之間檔案相互補(bǔ)充;也存在不同高校存放相當(dāng)數(shù)量的相同檔案,從整個(gè)教育系統(tǒng)來(lái)講,產(chǎn)生了檔案冗余,是對(duì)存儲(chǔ)資源的浪費(fèi)。高校檔案云平臺(tái)就是利用云存儲(chǔ)技術(shù)在高校之間建立電子檔案存儲(chǔ)、利用的數(shù)據(jù)云,各個(gè)高校通過(guò)該平臺(tái)可以上傳及下載電子檔案,便捷了檔案的異地查閱,減少了本地?cái)?shù)據(jù)庫(kù)存儲(chǔ)負(fù)擔(dān),也為高校電子檔案公開(kāi)提供了技術(shù)支持。endprint
3.2 處理部分
處理部分主要指檔案鑒定和數(shù)據(jù)挖掘兩個(gè)功能模塊。
按照國(guó)際檔案理事會(huì)1984年出版的《檔案術(shù)語(yǔ)詞典》為檔案鑒定下的定義是:“根據(jù)文件的檔案價(jià)值來(lái)決定如何對(duì)其進(jìn)行最后處置的檔案工作基本職能,也稱為評(píng)價(jià)、審查、選擇或選留”,檔案鑒定具體包括完整性鑒定、原始性鑒定、真實(shí)性鑒定、準(zhǔn)確性鑒定以及文件檔案價(jià)值的鑒定。模型中檔案鑒定模塊是通過(guò)機(jī)器學(xué)習(xí)算法完成檔案鑒定,把符合鑒定規(guī)則的檔案選擇出來(lái),留存到模型中,進(jìn)行下一步處理,不符合鑒定規(guī)則的則退回原系統(tǒng)。檔案鑒定是檔案管理中的重要內(nèi)容,模型借助計(jì)算機(jī)技術(shù)進(jìn)行檔案鑒定,提高了鑒定效率。
數(shù)據(jù)挖掘模塊是對(duì)模型搜集的大量的、不完全的、有噪聲的、模糊的、隨機(jī)的檔案信息進(jìn)行分析,挖掘出深層次相關(guān)聯(lián)的檔案以及用戶檔案使用習(xí)慣等。該模塊對(duì)模型中的電子檔案進(jìn)行關(guān)聯(lián)分析、聚類分析、分類及預(yù)測(cè),挖掘結(jié)果支持電子檔案的信息檢索、信息推薦、可視化輸出等。通過(guò)數(shù)據(jù)挖掘,實(shí)現(xiàn)對(duì)電子檔案的深層次分析,提高利用價(jià)值。
3.3 輸出部分
模型的輸出部分有檔案查詢、檔案推薦以及檔案公開(kāi)三個(gè)模塊。
檔案查詢模塊即用戶可以通過(guò)搜索引擎檢索電子檔案或者通過(guò)分類目錄查找電子檔案。相比普通的檔案管理系統(tǒng),模型可查詢的電子檔案更為廣泛,涵蓋本部門(mén)、其他部門(mén)及其他高校的檔案信息,為師生提供全方位的參考。
另一個(gè)是根據(jù)數(shù)據(jù)挖掘的結(jié)果,模型可以結(jié)合用戶檢索行為和檢索詞為用戶推薦相關(guān)電子檔案,提高檢索效率。
檔案推薦模塊有兩大功能:一個(gè)是根據(jù)數(shù)據(jù)挖掘的結(jié)果,按照用戶興趣在適當(dāng)節(jié)點(diǎn)為用戶主動(dòng)推送個(gè)性化電子檔案,例如在6月份為招生就業(yè)部門(mén)工作人員推送歷年各省錄取分?jǐn)?shù)線;另一個(gè)是結(jié)合用戶檢索行為和檢索詞為用戶推薦相關(guān)電子檔案,例如當(dāng)用戶檢索“招聘”,模型將在檢索界面推薦“人才引進(jìn)”“高層次人才”“高校自主招聘”等相關(guān)檢索詞。檔案推薦改變了以往高校檔案被動(dòng)的工作方式,為用戶提供更具有針對(duì)性的檔案,節(jié)省了用戶查找、過(guò)濾信息的時(shí)間。
檔案公開(kāi)是指模型將可以公開(kāi)的電子檔案自動(dòng)發(fā)送到高校檔案云平臺(tái),以待其他高校查閱,檔案公開(kāi)模塊有助于長(zhǎng)久、穩(wěn)定地做好高校檔案公開(kāi)工作。
4 結(jié) 語(yǔ)
科技的進(jìn)步改變了傳統(tǒng)的信息獲取方式,海量的數(shù)據(jù)開(kāi)始躍入人們的視線,大數(shù)據(jù)成為社會(huì)的關(guān)注焦點(diǎn)。本文探究了大數(shù)據(jù)時(shí)代高校電子檔案工作所面臨的問(wèn)題及應(yīng)對(duì)思路,并基于此提出高校電子檔案管理模型。模型應(yīng)用云存儲(chǔ)技術(shù),使收集、處理大量電子檔案成為可能,這就向檔案“全歸檔”邁進(jìn)了一步,同時(shí)運(yùn)用數(shù)據(jù)挖掘技術(shù)深化了檔案價(jià)值、增強(qiáng)了用戶體驗(yàn)。
然而,模型還需要進(jìn)一步充實(shí)。如何確保云存儲(chǔ)技術(shù)下的檔案安全;校內(nèi)各系統(tǒng)信息繁雜,檔案鑒定的規(guī)則如何制定;高校檔案云平臺(tái)的技術(shù)如何實(shí)現(xiàn)等。今后將著力探究模型在技術(shù)層面的實(shí)現(xiàn)。
主要參考文獻(xiàn)
[1]王學(xué)娟,楊陽(yáng),閆桂蓮. 淺談大數(shù)據(jù)時(shí)代下承德高校電子檔案管理存在的問(wèn)題和對(duì)策[J].承德醫(yī)學(xué)院學(xué)報(bào),2016,33(6):537-539.
[2]賀纏虎.知識(shí)管理——現(xiàn)代高校檔案工作的新思路[J].蘭臺(tái)世界,2014(20):29-31.
[3]張峻山.大數(shù)據(jù)時(shí)代高校學(xué)生檔案管理與利用探討[J].黑龍江史志,2015(9).
[4]侯英杰.“大數(shù)據(jù)”背景下高校檔案工作發(fā)展思路探析[J].城建檔案,2015(6):76-78.
[5]曹勤民.從“獨(dú)享”走向“共享”——論高校檔案信息資源社會(huì)價(jià)值的實(shí)現(xiàn)路徑[J].檔案學(xué)通訊,2012(5):49-52.
[6]郭文東. 云存儲(chǔ)的剖析[J]. 數(shù)字通信世界, 2016(3):51-53.
[7]劉東斌. 檔案鑒定——鑒定什么——檔案鑒定基本問(wèn)題思考之四[J]. 檔案管理,2006(5):17-22.
[8]劉國(guó)能. 檔案鑒定工作內(nèi)容、原則、標(biāo)準(zhǔn)與方法——檔案鑒定工作及其改革(之二)[J]. 中國(guó)檔案, 2005(9):32-34.
[9]黃華. 數(shù)據(jù)挖掘分析在檔案管理方面的應(yīng)用[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2009(4):81-82.
[10]方昀,郭偉.云計(jì)算技術(shù)對(duì)檔案信息化的影響和啟示[J].檔案學(xué)研究,2010(4):70-73.endprint