国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)湖技術(shù)在檔案信息資源共建中的應(yīng)用

2018-01-24 01:31:48李曼尋
山西檔案 2018年2期
關(guān)鍵詞:資源用戶信息

文 / 李曼尋

大數(shù)據(jù)時(shí)代檔案信息資源具有數(shù)量龐大、來(lái)源及類型多樣、形式多元等特點(diǎn),傳統(tǒng)的檔案管理與服務(wù)模式已經(jīng)不能適應(yīng)新技術(shù)環(huán)境下檔案用戶個(gè)性化、多元化、高效化和智能化的檔案信息利用需求。革新檔案工作服務(wù)模式,打破“信息孤島”的困局,加快實(shí)現(xiàn)檔案信息資源共建共享,日益成為時(shí)代發(fā)展的要求和廣大檔案用戶的心聲。[1]數(shù)據(jù)湖技術(shù)作為一種不同于原始數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)架構(gòu),支持所有的數(shù)據(jù)類型,可以保存大量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的原始數(shù)據(jù),并將原始數(shù)據(jù)分類存儲(chǔ)到不同的數(shù)據(jù)池,在各數(shù)據(jù)池里對(duì)數(shù)據(jù)進(jìn)行優(yōu)化整合,并轉(zhuǎn)化成容易分析的統(tǒng)一存儲(chǔ)格式。用戶可以根據(jù)不同需要來(lái)挖掘數(shù)據(jù)資源,分析數(shù)據(jù)內(nèi)容,發(fā)掘數(shù)據(jù)價(jià)值并加以利用。具體來(lái)說(shuō),數(shù)據(jù)池是能夠存儲(chǔ)大量來(lái)源、格式不同數(shù)據(jù)的存儲(chǔ)空間,而數(shù)據(jù)湖則相當(dāng)于包含多個(gè)數(shù)據(jù)池的巨大數(shù)據(jù)存儲(chǔ)世界。[2]如果把一張磁盤(pán)上存儲(chǔ)的數(shù)據(jù)比喻成一滴水,那么一個(gè)能夠承載一座城市海量數(shù)據(jù)的大數(shù)據(jù)中心,就可以被稱作是這個(gè)城市的數(shù)據(jù)湖。[3]數(shù)據(jù)湖技術(shù)作為大數(shù)據(jù)環(huán)境下產(chǎn)生的一種新技術(shù)、新架構(gòu),已被初步應(yīng)用于商業(yè)、交通、氣象等領(lǐng)域,并取得了一定的成效。因此,將數(shù)據(jù)湖技術(shù)應(yīng)用于檔案信息資源共建,對(duì)實(shí)現(xiàn)我國(guó)檔案工作現(xiàn)代化具有重要作用。

一、數(shù)據(jù)湖技術(shù)的特點(diǎn)

數(shù)據(jù)湖與大數(shù)據(jù)在概念的內(nèi)涵和外延上有許多相似之處。大數(shù)據(jù)是一種捕獲、管理、存儲(chǔ)、分析和處理數(shù)據(jù)的能力都遠(yuǎn)遠(yuǎn)超過(guò)傳統(tǒng)常規(guī)數(shù)據(jù)庫(kù)軟件工具的數(shù)據(jù)集合,是需要新的處理模式才能具有更強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn),大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。[4]根據(jù)大數(shù)據(jù)的特征,筆者認(rèn)為數(shù)據(jù)湖技術(shù)具有以下特點(diǎn)。

(一)存儲(chǔ)空間海量化

在大數(shù)據(jù)時(shí)代,數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),傳統(tǒng)數(shù)據(jù)庫(kù)的架構(gòu)難以適應(yīng)數(shù)據(jù)量瘋長(zhǎng)的情況,存儲(chǔ)空間有限。因此,需要一個(gè)新的可以滿足海量存儲(chǔ)需求的“容器”來(lái)作為大數(shù)據(jù)的支撐。 數(shù)據(jù)湖就是那個(gè)可以存儲(chǔ)海量數(shù)據(jù)的龐大“容器”。它匯聚吸收各個(gè)數(shù)據(jù)源流,容納散落在各處的數(shù)據(jù),存儲(chǔ)空間巨大。

(二)存儲(chǔ)格式兼容化

從功能角度分析,數(shù)據(jù)湖技術(shù)面向多數(shù)據(jù)源和所有數(shù)據(jù)種類,可以快速地存儲(chǔ)、錄入和計(jì)算大量來(lái)源不同、格式迥異的原始數(shù)據(jù),包括文本、圖片、聲音、網(wǎng)頁(yè)等各種無(wú)序的非結(jié)構(gòu)化數(shù)據(jù),把不同種類的數(shù)據(jù)匯集到一起,對(duì)數(shù)據(jù)進(jìn)行管理并在數(shù)據(jù)之間建立鏈接,具有很強(qiáng)的兼容性。

(三)數(shù)據(jù)類型多樣化

數(shù)據(jù)湖中存儲(chǔ)的數(shù)據(jù)凌亂紛繁,包含多種類型,具有多樣化的特點(diǎn)。從數(shù)據(jù)特征角度分析,如果把每一種數(shù)據(jù)看成是一種顏色,那么數(shù)據(jù)湖就相當(dāng)于一個(gè)匯集多種色彩的調(diào)色盤(pán),就像把不同的色彩融合在一起會(huì)形成新的色彩一樣,不同種類的數(shù)據(jù)通過(guò)智能化集成等方式結(jié)合在一起,可能會(huì)產(chǎn)生新的甚至高于原始數(shù)據(jù)的價(jià)值。

(四)數(shù)據(jù)處理高速化

數(shù)據(jù)湖技術(shù)能將各數(shù)據(jù)池中的原始數(shù)據(jù)快速轉(zhuǎn)化為可以直接提取、分析、使用的標(biāo)準(zhǔn)格式,統(tǒng)一、優(yōu)化數(shù)據(jù)結(jié)構(gòu)并對(duì)數(shù)據(jù)進(jìn)行分類存儲(chǔ),根據(jù)用戶需要從數(shù)據(jù)池中對(duì)數(shù)據(jù)進(jìn)行快速的挖掘、查詢、選擇和處理,并實(shí)時(shí)傳遞給用戶,同時(shí)對(duì)數(shù)據(jù)的使用量和使用頻率等因素進(jìn)行實(shí)時(shí)、精準(zhǔn)的計(jì)算,分析用戶的信息需求,為數(shù)據(jù)的收集、攝取、管理和開(kāi)放提供參考。

(五)數(shù)據(jù)價(jià)值增值化

數(shù)據(jù)湖中的原始數(shù)據(jù)根據(jù)類別被提取到不同的數(shù)據(jù)池中,在數(shù)據(jù)池中被標(biāo)準(zhǔn)化后,再根據(jù)其在未來(lái)被提取利用可能性的大小,決定該數(shù)據(jù)存儲(chǔ)的最終位置,并在它們之間建立起一定的聯(lián)系,使用概率較小的數(shù)據(jù)被存儲(chǔ)在文檔數(shù)據(jù)池中并重新被標(biāo)準(zhǔn)化。用戶可以從數(shù)據(jù)池中大量挖掘、提純數(shù)據(jù),分析數(shù)據(jù)間的關(guān)聯(lián)并用于特定需求。這種數(shù)據(jù)處理模式既可以令高使用率的數(shù)據(jù)充分發(fā)揮價(jià)值甚至實(shí)現(xiàn)增值,也能使那些長(zhǎng)期不被挖掘的低價(jià)值數(shù)據(jù)煥發(fā)新的活力,重新被利用并創(chuàng)造出新的價(jià)值。

二、數(shù)據(jù)湖技術(shù)在檔案信息資源共建中應(yīng)用的必要性

(一)數(shù)據(jù)湖技術(shù)有助于增強(qiáng)檔案信息資源共建意識(shí)

古人逐水而居,今人逐數(shù)據(jù)興業(yè)。大數(shù)據(jù)時(shí)代的到來(lái)令檔案機(jī)構(gòu)在管理思維與管理方法等方面都發(fā)生了深刻的變革。對(duì)于國(guó)務(wù)院提出的“運(yùn)用互聯(lián)網(wǎng)和大數(shù)據(jù)加強(qiáng)橫向聯(lián)系,讓數(shù)據(jù)多跑路,群眾少跑腿”的要求,[5]檔案機(jī)構(gòu)有必要思考從何種角度和層次運(yùn)用何種方式和技術(shù),去開(kāi)發(fā)、管理、利用和開(kāi)放檔案信息資源,以實(shí)現(xiàn)公共檔案信息資源的共建、共管和共享。與原有數(shù)據(jù)庫(kù)工具將數(shù)據(jù)分開(kāi)存儲(chǔ)不同,數(shù)據(jù)湖技術(shù)將抽象的海量數(shù)據(jù)概念比喻為具體的“數(shù)據(jù)湖”和“數(shù)據(jù)池”,就如同“江河入?!币粯?,可以在未知需求之前收集數(shù)據(jù),將不同來(lái)源的原始數(shù)據(jù)集中遷移到一個(gè)平臺(tái),具有巨大的潛力。數(shù)據(jù)湖技術(shù)還支持跨共享基礎(chǔ)架構(gòu)的多種數(shù)據(jù)訪問(wèn)模式,面向所有用戶,方便各種用戶按照不同需求配置或重新配置數(shù)據(jù),滿足他們所能想象的任何需求。數(shù)據(jù)湖技術(shù)通過(guò)改變數(shù)據(jù)存儲(chǔ)策略,減少檔案工作者的工作量,轉(zhuǎn)變服務(wù)觀念和服務(wù)思維,節(jié)約用戶時(shí)間并實(shí)現(xiàn)用戶自助服務(wù),促進(jìn)檔案工作業(yè)態(tài)的升級(jí)轉(zhuǎn)型。因此,數(shù)據(jù)湖技術(shù)的應(yīng)用可以增強(qiáng)檔案信息資源共建意識(shí),為檔案機(jī)構(gòu)之間進(jìn)行共建合作、創(chuàng)新共建方式帶來(lái)靈感。

(二)數(shù)據(jù)湖技術(shù)為檔案信息資源存儲(chǔ)提供新平臺(tái)

在大數(shù)據(jù)時(shí)代,電子檔案信息種類繁多,數(shù)量呈爆炸式增長(zhǎng)。為了在浩如煙海的電子檔案信息中捕捉到有價(jià)值的可利用的信息,需要一個(gè)能夠容納無(wú)窮多數(shù)據(jù)信息的巨大信息庫(kù),以便在滿足龐大存儲(chǔ)需求的同時(shí),精準(zhǔn)而快速地對(duì)數(shù)據(jù)進(jìn)行捕獲、分析、加工和處理。而常規(guī)的數(shù)據(jù)庫(kù)工具似乎已經(jīng)不能充當(dāng)這樣的信息庫(kù)來(lái)發(fā)揮這些功能。因此,需要一個(gè)新的可擴(kuò)展的具備這些功能的架構(gòu)來(lái)為數(shù)據(jù)提供存儲(chǔ)平臺(tái)——數(shù)據(jù)湖。在檔案信息資源共建的過(guò)程中,數(shù)據(jù)湖可以作為后臺(tái)數(shù)據(jù)融合載體容納所有數(shù)據(jù),包括長(zhǎng)時(shí)間的原始數(shù)據(jù)以及任何已處理的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行優(yōu)化整合,充分發(fā)揮“包容”和“兼容”的作用,為數(shù)據(jù)存儲(chǔ)提供一個(gè)檔案機(jī)構(gòu)范圍內(nèi)的集中平臺(tái),推進(jìn)檔案信息資源共建,從而加速實(shí)現(xiàn)檔案信息資源共享。

(三)數(shù)據(jù)湖技術(shù)有助于創(chuàng)新檔案信息資源共建方式

技術(shù)的革新會(huì)引起管理方式的變革和用戶需求的轉(zhuǎn)變,大數(shù)據(jù)時(shí)代預(yù)示著電子檔案會(huì)以數(shù)據(jù)流的形式動(dòng)態(tài)地生成、快速地甄別、實(shí)時(shí)地存儲(chǔ)。因而用戶對(duì)于檔案信息服務(wù)方式提出了更高的要求,對(duì)檔案信息數(shù)據(jù)獲取、處理的時(shí)效性和準(zhǔn)確性等需求將更為強(qiáng)烈。[6]數(shù)據(jù)湖技術(shù)可以在不犧牲數(shù)據(jù)結(jié)構(gòu)的情況下實(shí)時(shí)攝取、存儲(chǔ)檔案數(shù)據(jù),及時(shí)將數(shù)據(jù)轉(zhuǎn)化為適當(dāng)?shù)母袷讲⒎诸惔鎯?chǔ)到各數(shù)據(jù)池中,且不受初始模式?jīng)Q策的限制,不需要預(yù)定義的模型就能對(duì)數(shù)據(jù)進(jìn)行分析,使檔案機(jī)構(gòu)更容易收集所有類型與大小的數(shù)據(jù),并將其放于集中的平臺(tái)上。數(shù)據(jù)湖技術(shù)還能為各檔案機(jī)構(gòu)進(jìn)行檔案信息資源共建提供合作平臺(tái)和技術(shù)媒介,當(dāng)用戶要進(jìn)行數(shù)據(jù)訪問(wèn)時(shí),可以自行從數(shù)據(jù)池中提取有用的數(shù)據(jù),并在線進(jìn)行判析、選取、細(xì)化和豐富,從而實(shí)現(xiàn)跨層級(jí)、跨部門(mén)、跨地域、跨系統(tǒng)的檔案信息資源查詢和利用。因此,數(shù)據(jù)湖技術(shù)既為檔案信息資源共建提供了技術(shù)保障,也為創(chuàng)新檔案信息資源共建方式開(kāi)辟了新的路徑。

(四)數(shù)據(jù)湖技術(shù)有助于提高檔案信息資源共建效率

隨著網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)技術(shù)等信息技術(shù)的出現(xiàn),檔案信息形式和檔案信息資源范疇隨之改變,電子檔案大量涌現(xiàn)。若繼續(xù)用傳統(tǒng)的思維和方法對(duì)檔案信息資源進(jìn)行整理、加工和處理,不但難以從檔案信息資源中挖掘出高價(jià)值的有效信息,長(zhǎng)此以往,可能會(huì)造成用戶體驗(yàn)不佳、用戶對(duì)檔案機(jī)構(gòu)的信任感降低甚至缺失等后果。數(shù)據(jù)湖技術(shù)可以在保管數(shù)據(jù)的基礎(chǔ)上,在各機(jī)構(gòu)之間進(jìn)行實(shí)時(shí)的檔案數(shù)據(jù)交互,允許多點(diǎn)采集和多個(gè)數(shù)據(jù)訪問(wèn)點(diǎn),提高數(shù)據(jù)的靈活性、可訪問(wèn)性和訪問(wèn)速度。同時(shí),數(shù)據(jù)湖技術(shù)還能進(jìn)行高性能的數(shù)據(jù)分析,實(shí)時(shí)統(tǒng)計(jì)、運(yùn)算各類數(shù)據(jù)的提取和利用情況,既為檔案機(jī)構(gòu)采集檔案信息提供決策依據(jù),也為檔案信息資源共建平臺(tái)開(kāi)發(fā)、更新和開(kāi)放檔案數(shù)據(jù)信息提供參考,優(yōu)化檔案利用服務(wù)工作,從而提高檔案信息資源共建的效率。

三、數(shù)據(jù)湖技術(shù)應(yīng)用于檔案信息資源共建的優(yōu)化策略

(一)與云計(jì)算技術(shù)結(jié)合優(yōu)化檔案信息存儲(chǔ)

檔案機(jī)構(gòu)是政府長(zhǎng)久保存檔案的基地,數(shù)據(jù)湖技術(shù)是大數(shù)據(jù)環(huán)境下的產(chǎn)物,在檔案保管方面具有持久性的特點(diǎn),這在一定程度上為檔案機(jī)構(gòu)保存檔案和進(jìn)行檔案信息資源共建提供了助力。但凡事都有兩面性,數(shù)據(jù)管理及利用不善易形成“數(shù)據(jù)沼澤”。數(shù)據(jù)湖中有很多數(shù)據(jù)永遠(yuǎn)不會(huì)刪除,對(duì)于使用率較高的檔案信息,其歸置和處理還比較容易,但有些低利用率的歷史檔案信息除了偶爾能發(fā)揮分析作用,更多的是沉淀在數(shù)據(jù)池中,被用戶忽視,難以抵消其容量成本。[7]長(zhǎng)年累月的低價(jià)值數(shù)據(jù)堆砌,會(huì)導(dǎo)致數(shù)據(jù)湖中無(wú)用數(shù)據(jù)泛濫,使數(shù)據(jù)湖有慢慢演變成“數(shù)據(jù)沼澤”的風(fēng)險(xiǎn)。為了避免此類情況的發(fā)生,檔案機(jī)構(gòu)必須采取有效措施加以防范。

具體來(lái)看,檔案機(jī)構(gòu)可以將數(shù)據(jù)湖技術(shù)與云計(jì)算技術(shù)相結(jié)合,共同作用于檔案信息資源共建,從而優(yōu)化檔案信息的存儲(chǔ),并形成“天上有‘云’,地下有‘湖’”的檔案信息存儲(chǔ)模式。數(shù)據(jù)湖之上可以飄著多個(gè)“云”,天上的“云”負(fù)責(zé)收集、計(jì)算和分析終端用戶的行為數(shù)據(jù),為地下的“湖”實(shí)時(shí)制定數(shù)據(jù)存儲(chǔ)決策提供助力,從而保證完整的數(shù)據(jù)洞察和分析能力;“湖”里的數(shù)據(jù)池負(fù)責(zé)優(yōu)化檔案數(shù)據(jù)的存儲(chǔ)格式和結(jié)構(gòu),保持高度敏捷性并根據(jù)需要對(duì)數(shù)據(jù)進(jìn)行再配置,以實(shí)現(xiàn)檔案信息價(jià)值的持續(xù)保持和再利用。[8]就像興修水利一樣,筑湖蓄能——存儲(chǔ)和引入新數(shù)據(jù),建站發(fā)電——處理和配置數(shù)據(jù),開(kāi)閘放“水”——開(kāi)放和利用數(shù)據(jù),發(fā)揮數(shù)據(jù)湖技術(shù)基礎(chǔ)設(shè)施的乘數(shù)效應(yīng),[9]減少存儲(chǔ)成本的投入,避免存儲(chǔ)空間的浪費(fèi)。

(二)采取多種措施保障數(shù)據(jù)湖中檔案信息安全

數(shù)據(jù)湖技術(shù)的架構(gòu)可以簡(jiǎn)單理解為將所有的雞蛋放在一個(gè)籃子里,在數(shù)據(jù)湖中很多數(shù)據(jù)都是以易于讀取的格式存儲(chǔ)于數(shù)據(jù)池中,就像一個(gè)雞蛋在籃子里受到撞擊會(huì)波及到其它雞蛋一樣,如果數(shù)據(jù)湖技術(shù)的架構(gòu)不夠安全,一旦其中一個(gè)數(shù)據(jù)池的安全遭到破壞,那么數(shù)據(jù)湖中所有的數(shù)據(jù)將有可能被未知方訪問(wèn)、篡改甚至損壞,從而使檔案信息安全受到威脅和挑戰(zhàn)。因此,我們必須加大檔案信息安全防范的力度,加強(qiáng)檔案信息安全保障技術(shù)研究,建立堅(jiān)實(shí)的檔案信息安全壁壘,實(shí)現(xiàn)多個(gè)方面的安全控制。

首先,檔案機(jī)構(gòu)可以將Kerberos用于用戶身份驗(yàn)證,同時(shí)依據(jù)用戶的角色、信用情況和檔案利用目的等指標(biāo),設(shè)置不同等級(jí)的數(shù)據(jù)訪問(wèn)和使用權(quán)限。其次,檔案機(jī)構(gòu)可以對(duì)數(shù)據(jù)湖中的檔案信息按密級(jí)和重要程度進(jìn)行分類,將密級(jí)高、重要程度深的檔案信息設(shè)置為WORM(Write Once Read Many)模式,從而在不影響數(shù)據(jù)應(yīng)用訪問(wèn)的前提下有效地防止數(shù)據(jù)破壞和篡改。再次,檔案機(jī)構(gòu)可以將數(shù)據(jù)湖中所有檔案信息的副本離線存儲(chǔ)在另外的可信任的數(shù)據(jù)信息第三方存儲(chǔ)庫(kù),實(shí)現(xiàn)數(shù)據(jù)的異地備份,并支持離線數(shù)據(jù)和訪問(wèn)端數(shù)據(jù)的加密,從而為檔案信息安全提供雙重技術(shù)保障。最后,檔案機(jī)構(gòu)可以設(shè)立檔案信息系統(tǒng)安全等級(jí)保護(hù)機(jī)制,建立健全檔案信息安全防范體制,在制度上實(shí)現(xiàn)對(duì)檔案信息安全的保護(hù)。

(三)完善與數(shù)據(jù)湖技術(shù)相關(guān)的法律法規(guī)與標(biāo)準(zhǔn)

《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中強(qiáng)調(diào),要加快檔案信息資源整合,推進(jìn)檔案信息資源共建進(jìn)程,實(shí)現(xiàn)檔案信息資源的開(kāi)放共享。而關(guān)于如何樹(shù)立檔案機(jī)構(gòu)在大數(shù)據(jù)環(huán)境下的檔案信息共建意識(shí),調(diào)動(dòng)人們學(xué)習(xí)使用數(shù)據(jù)湖技術(shù)來(lái)進(jìn)行檔案信息資源共建的熱情和積極性,以及對(duì)于數(shù)據(jù)湖技術(shù)的基礎(chǔ)設(shè)施建設(shè)方案、資金、人才引進(jìn)和培養(yǎng)等問(wèn)題怎么解決,目前還沒(méi)有具體的政策來(lái)給予引導(dǎo)和支持。這些“硬件”問(wèn)題的解決,需要相關(guān)的法律法規(guī)與標(biāo)準(zhǔn)等“軟件”武器作為解決方案的支撐和保障。

自2010年至今,我國(guó)已頒發(fā)了部分與數(shù)字檔案信息資源建設(shè)相關(guān)的技術(shù)方面的行業(yè)標(biāo)準(zhǔn)或地方標(biāo)準(zhǔn),如《DA/T 49-2012特殊和超大尺寸紙質(zhì)檔案數(shù)字圖像輸出到所謂膠片上的技術(shù)規(guī)范》《DA/T 57-2014數(shù)字檔案COM和COLD技術(shù)規(guī)范》《DA/T 57-2014檔案關(guān)系型數(shù)據(jù)庫(kù)轉(zhuǎn)換為XML文件的技術(shù)規(guī)范》《DB22/T 2237-2015質(zhì)量技術(shù)監(jiān)督行政處罰案卷電子檔案制作及管理規(guī)范》[10]等,但缺乏國(guó)家層面的關(guān)于某一技術(shù)應(yīng)用于檔案信息資源建設(shè)的法律法規(guī)與標(biāo)準(zhǔn)。因此,筆者建議盡快從國(guó)家層面補(bǔ)充完善應(yīng)用數(shù)據(jù)湖技術(shù)進(jìn)行檔案信息資源建設(shè)的法律法規(guī)與標(biāo)準(zhǔn)。例如,制定《檔案數(shù)據(jù)匯聚政策》《檔案信息開(kāi)放規(guī)則》《檔案信息資源共建標(biāo)準(zhǔn)》《數(shù)據(jù)湖技術(shù)在檔案實(shí)踐工作中的應(yīng)用指南及規(guī)范》《檔案機(jī)構(gòu)應(yīng)用數(shù)據(jù)湖技術(shù)共建檔案信息資源的原則》等,從而消除檔案機(jī)構(gòu)在檔案信息資源共建中的各種疑慮和顧忌,推進(jìn)檔案機(jī)構(gòu)依法治理和開(kāi)放檔案信息資源,使法律成為助力檔案機(jī)構(gòu)運(yùn)用數(shù)據(jù)湖技術(shù)進(jìn)行檔案信息資源共建的基本依據(jù)和有力工具,以加速檔案信息資源共建的進(jìn)程。

(四)實(shí)施“先行先試”,推進(jìn)數(shù)據(jù)湖技術(shù)的廣泛運(yùn)用

長(zhǎng)期以來(lái),我國(guó)在經(jīng)濟(jì)發(fā)展上存在著區(qū)域之間發(fā)展不平衡的特點(diǎn),經(jīng)濟(jì)的發(fā)展程度影響文化事業(yè)的建設(shè)。檔案事業(yè)屬于文化事業(yè)的范疇,地區(qū)間的經(jīng)濟(jì)差異必然會(huì)對(duì)檔案信息資源共建工作的進(jìn)行形成一定的影響。李克強(qiáng)總理在2018年政府工作報(bào)告中強(qiáng)調(diào):“團(tuán)結(jié)凝聚力量,實(shí)干創(chuàng)造未來(lái)。”[11]因此,檔案機(jī)構(gòu)之間應(yīng)該加強(qiáng)交流協(xié)作,達(dá)成相關(guān)的檔案信息資源共建協(xié)議,共同探討推進(jìn)數(shù)據(jù)湖技術(shù)廣泛應(yīng)用于檔案信息資源共建的方案。筆者認(rèn)為,檔案機(jī)構(gòu)可以實(shí)行“先行先試”的策略,在經(jīng)濟(jì)較發(fā)達(dá)、有條件的地區(qū),優(yōu)先嘗試數(shù)據(jù)湖技術(shù)在檔案信息資源共建上的建設(shè)和運(yùn)營(yíng),摸索、積累一定的經(jīng)驗(yàn)后,再通過(guò)“發(fā)達(dá)地區(qū)帶動(dòng)欠發(fā)達(dá)、不發(fā)達(dá)地區(qū)”的模式,加快推廣數(shù)據(jù)湖技術(shù)應(yīng)用于檔案信息資源共建工作的速度,并使其慢慢輻射至全國(guó)。

與此同時(shí),各級(jí)政府也要采取一定的措施,在相關(guān)政策優(yōu)惠方面給予欠發(fā)達(dá)、不發(fā)達(dá)地區(qū)的檔案機(jī)構(gòu)一定的幫助。例如,各級(jí)政府可以通過(guò)財(cái)政撥款、技術(shù)扶持、引進(jìn)培養(yǎng)復(fù)合型檔案專業(yè)人才以及施行統(tǒng)一的數(shù)據(jù)湖技術(shù)應(yīng)用規(guī)范和制度等方式,加快這些地區(qū)檔案信息資源共建工作的發(fā)展步伐,并盡可能地縮小不同區(qū)域間檔案機(jī)構(gòu)的差異。因此,實(shí)施“先行先試”可以促進(jìn)數(shù)據(jù)湖技術(shù)在不同地區(qū)檔案實(shí)踐工作中的同步應(yīng)用,推動(dòng)各地區(qū)檔案機(jī)構(gòu)在檔案信息資源共建中形成良好合作,打造屬于檔案領(lǐng)域的智能數(shù)據(jù)湖,從而讓用戶真正地從中受益。

[1]韋慧.天津:數(shù)據(jù)湖打破公共數(shù)據(jù)孤島[N].經(jīng)濟(jì)參考報(bào),2017-11-09.

[2]郭文惠.數(shù)據(jù)湖技術(shù)——一種更好的大數(shù)據(jù)存儲(chǔ)架構(gòu)[J].電腦知識(shí)與技術(shù),2016(30):4-6.

[3]范海杰.數(shù)據(jù)湖技術(shù),沉淀一座城市的數(shù)據(jù)[N].徐州日?qǐng)?bào),2017-07-28.

[4]李屹蕃.電子文件新概念:這些新詞出現(xiàn)在電子文件管理論壇上,出現(xiàn)在國(guó)家社科基金項(xiàng)目2018年度課題指南上[EB/OL].http://mp.weixin.qq.com/s/A-Nb2YEU5cBAHG1T8oAWPA,2017-12-22/2018-03-27.

[5]任力.大數(shù)據(jù)技術(shù)時(shí)代檔案信息管理思維與方式的變革[J].科技資訊,2016(32):23-24.

[6]何振,楊文,唐思慧,邢文明.大數(shù)據(jù)時(shí)代檔案學(xué)教育的新常態(tài)與實(shí)踐拓展[J].檔案學(xué)研究,2016(1):117-123.

[7]George Crump.除了成本,你還要關(guān)注的數(shù)據(jù)湖技術(shù)架構(gòu)隱憂[EB/OL].https://searchstorage.techtarget.com.cn/6-15630/,2015-09-13/2018-03-30.

[8]邱燕娜.數(shù)據(jù)湖技術(shù)不能成為數(shù)據(jù)沼澤[N].中國(guó)計(jì)算報(bào),2015-09-28.

[9]馬利.建設(shè)政府?dāng)?shù)據(jù)湖技術(shù)[N].人民政協(xié)報(bào),2017-03-14.

[10]王寧.快來(lái)看看最新的檔案法律法規(guī)標(biāo)準(zhǔn)有哪些[EB/OL].http://mp.weixin.qq.com/s/tIwV4iZL4L-y3gdYHt9k cg,2017-03-17/2018-03-31.

[11]宋雅彤.深入學(xué)習(xí)《報(bào)告》,原來(lái)檔案界有這么多事兒密切相關(guān)[EB/OL].http://mp.weixin.qq.com/s/FyO1bTULqwqDqMTPx Dwx7g,2018-03-08/2018-03-31.

猜你喜歡
資源用戶信息
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
展會(huì)信息
巧家县| 荥经县| 阳春市| 巫山县| 松溪县| 页游| 蓝山县| 屏东县| 铜陵市| 错那县| 泉州市| 蒲城县| 临泽县| 徐水县| 宣城市| 师宗县| 秦安县| 竹北市| 平利县| 黄浦区| 启东市| 海林市| 海原县| 威远县| 贺州市| 凤凰县| 罗山县| 石景山区| 荔波县| 海宁市| 江川县| 苏州市| 宁南县| 印江| 嘉善县| 团风县| 科尔| 香港 | 江山市| 会泽县| 加查县|