張倩
(南京藝術(shù)學(xué)院綜合檔案室,江蘇南京,210013)
高校檔案大數(shù)據(jù)業(yè)務(wù)流程重組研究*
張倩
(南京藝術(shù)學(xué)院綜合檔案室,江蘇南京,210013)
文章借鑒業(yè)務(wù)流程重組的基本原理和大數(shù)據(jù)理念,通過(guò)考察傳統(tǒng)高校檔案業(yè)務(wù)流程的內(nèi)容構(gòu)成,分析現(xiàn)階段高校檔案業(yè)務(wù)流程中存在的突出問(wèn)題,探究高校檔案大數(shù)據(jù)業(yè)務(wù)流程重組的核心內(nèi)容,提出將高校檔案業(yè)務(wù)流程由傳統(tǒng)的職能型組織結(jié)構(gòu)改造為流程型組織機(jī)構(gòu),建立“全息式采集、分布式存儲(chǔ)、關(guān)聯(lián)式挖掘、可視化發(fā)布”的業(yè)務(wù)流程。
大數(shù)據(jù) 高校檔案 業(yè)務(wù)流程重組
當(dāng)前,高校館藏檔案信息數(shù)據(jù)量呈急劇增長(zhǎng)之勢(shì),且數(shù)據(jù)存儲(chǔ)、查詢(xún)、分析的形式與方法也變得異常復(fù)雜,針對(duì)原來(lái)相對(duì)小量、靜態(tài)、結(jié)構(gòu)化的“小數(shù)據(jù)”而存在的檔案信息處理方式,已難以應(yīng)對(duì)海量數(shù)據(jù)發(fā)展之需。本文借鑒業(yè)務(wù)流程重組的基本原理和大數(shù)據(jù)應(yīng)用的發(fā)展理念,通過(guò)剖析高校檔案業(yè)務(wù)流程的內(nèi)容構(gòu)成及其存在問(wèn)題,提出高校檔案大數(shù)據(jù)業(yè)務(wù)流程重組的構(gòu)建方案和實(shí)施步驟。
綜觀(guān)國(guó)內(nèi)高校檔案業(yè)務(wù)流程長(zhǎng)期依據(jù)的標(biāo)準(zhǔn),主要存在三種說(shuō)法。一是“六環(huán)節(jié)說(shuō)”,指將檔案管理的業(yè)務(wù)流程分為收集、整理、鑒定、保管、統(tǒng)計(jì)、利用等六個(gè)環(huán)節(jié),其中,前五個(gè)環(huán)節(jié)是檔案管理機(jī)構(gòu)內(nèi)部的基礎(chǔ)性業(yè)務(wù)工作,后一環(huán)節(jié)是指對(duì)外部開(kāi)放的檔案業(yè)務(wù)工作。二是“八環(huán)節(jié)說(shuō)”,即檔案管理包括收集、整理、鑒定、保管、檢索、統(tǒng)計(jì)、編研、利用等八項(xiàng)工作內(nèi)容。三是“分層次說(shuō)”,認(rèn)為檔案業(yè)務(wù)的管理方法不應(yīng)在單一層次上羅列具體內(nèi)容,而應(yīng)采用按層次劃分法進(jìn)行分層管理。它將檔案管理的核心業(yè)務(wù)劃分為第一層次的工作內(nèi)容,將各項(xiàng)具體業(yè)務(wù)劃分為第二層次的工作內(nèi)容。
無(wú)論是“六環(huán)節(jié)說(shuō)”“八環(huán)節(jié)說(shuō)”,還是“分層次說(shuō)”,在大數(shù)據(jù)應(yīng)用面前都露出了不適應(yīng)的窘境。對(duì)此,筆者認(rèn)為,高校檔案界迫切需要突破傳統(tǒng)紙質(zhì)檔案管理理念(Paper Mind)的束縛,盡快探尋到可適應(yīng)高校檔案大數(shù)據(jù)發(fā)展要求的業(yè)務(wù)流程模式與標(biāo)準(zhǔn)。
2.1 高校檔案界普遍缺乏對(duì)檔案數(shù)據(jù)潛在價(jià)值的全新認(rèn)知
首先,面對(duì)大數(shù)據(jù)的應(yīng)用價(jià)值,高校檔案管理者尚未摒棄“數(shù)據(jù)小農(nóng)”心態(tài)。目前,江蘇省高校檔案管理機(jī)構(gòu)普遍存在著“數(shù)據(jù)割據(jù)”和“數(shù)據(jù)孤島”現(xiàn)象,檔案信息資源的開(kāi)發(fā)與利用處于“小農(nóng)經(jīng)濟(jì)”狀態(tài)。究其原因,除受資金、技術(shù)等物質(zhì)投入和管理體制方面的影響之外,檔案管理者大數(shù)據(jù)意識(shí)缺乏是阻礙大數(shù)據(jù)技術(shù)在高校檔案界落地的主要因素。
第二,面對(duì)“大數(shù)據(jù)風(fēng)暴”的沖擊,高校檔案界仍習(xí)慣于將原有傳統(tǒng)檔案管理模式套入新媒體建立的框架中作徒勞之爭(zhēng)。多數(shù)高校檔案管理機(jī)構(gòu)仍在按老套路做舊事情,看似在不斷地收集信息,卻甚少對(duì)信息進(jìn)行分析、篩選與總結(jié);普遍承認(rèn)信息收集匱乏的短處,卻不愿承認(rèn)信息駕馭力的缺乏。
2.2 傳統(tǒng)“小數(shù)據(jù)”模式下的高校檔案業(yè)務(wù)流程無(wú)法滿(mǎn)足“大數(shù)據(jù)”開(kāi)發(fā)利用
首先,在檔案數(shù)據(jù)的采集方面,高校檔案管理機(jī)構(gòu)尚未建立檔案數(shù)據(jù)體系化的采集與積累機(jī)制。目前,江蘇省一些高校檔案管理機(jī)構(gòu)不但沒(méi)有重視采集元數(shù)據(jù),而且極少關(guān)注非結(jié)構(gòu)性數(shù)據(jù),特別是還未建立檔案數(shù)據(jù)體系化的采集與積累機(jī)制。為客觀(guān)評(píng)判江蘇省高校檔案管理機(jī)構(gòu)對(duì)檔案資源的開(kāi)發(fā)應(yīng)用能力,筆者借鑒EIU評(píng)判應(yīng)用大數(shù)據(jù)的企業(yè)能力等級(jí)標(biāo)準(zhǔn),對(duì)被測(cè)評(píng)對(duì)象作了全面分析:一是將采集的數(shù)據(jù)擱置、遺忘,或不加以應(yīng)用的高校檔案館(室),認(rèn)定為最低等級(jí)的“數(shù)據(jù)浪費(fèi)者”(Data Wasters)。二是將表面上數(shù)據(jù)泛濫,但并未達(dá)到大數(shù)據(jù)應(yīng)用要求的高校檔案館(室),認(rèn)定為第二等級(jí)的“數(shù)據(jù)采集者”(Data Collector)。三是將已經(jīng)做好應(yīng)用于戰(zhàn)略決策和投資的準(zhǔn)備,但水平還有限的高校檔案館(室),認(rèn)定為第三等級(jí)的“積極的數(shù)據(jù)管理者”(Aspiring Data Managers)。四是將走在大數(shù)據(jù)應(yīng)用的最前沿,且具有先進(jìn)開(kāi)發(fā)技能的高校檔案館(室),認(rèn)定為第四等級(jí)(最高等級(jí))的“戰(zhàn)略數(shù)據(jù)管理者”(Strategic Data Manager)。按分類(lèi)標(biāo)準(zhǔn)評(píng)估后發(fā)現(xiàn),目前江蘇省多數(shù)高校檔案管理機(jī)構(gòu)處于第二到第三等級(jí)之間,檔案館(室)之間合作意識(shí)不強(qiáng),致使檔案信息資源共享的整體優(yōu)勢(shì)大打折扣。
第二,在檔案數(shù)據(jù)的鑒定方面,傳統(tǒng)的檔案鑒定模式將被“全數(shù)據(jù)模式”取代。長(zhǎng)期以來(lái),由鑒定人員逐件逐張地審查原始文件的檔案鑒定方法(即直接鑒定法),在“小數(shù)據(jù)”范圍內(nèi)比較有效,但隨著檔案數(shù)據(jù)量的急劇增長(zhǎng),這種鑒定模式已呈行將崩潰之勢(shì)。
第三,在檔案數(shù)據(jù)的質(zhì)量方面,高校檔案管理機(jī)構(gòu)的數(shù)字檔案尚未實(shí)現(xiàn)“大數(shù)據(jù)化”。目前,江蘇省不少高校檔案館(室)尚未對(duì)數(shù)字檔案文本的內(nèi)容進(jìn)行數(shù)據(jù)化處理,實(shí)際只儲(chǔ)藏著原始紙質(zhì)檔案資料的掃描圖片。將數(shù)字檔案圖片轉(zhuǎn)化為可處理的數(shù)據(jù)化內(nèi)容,是建立大數(shù)據(jù)資源庫(kù)的有效途徑,不僅可打造開(kāi)放的知識(shí)世界,而且能最大限度地釋放檔案信息數(shù)據(jù)的潛藏價(jià)值。
第四,在檔案數(shù)據(jù)的利用方面,高校檔案管理機(jī)構(gòu)的檔案數(shù)據(jù)尚不具備加工增值效能。目前,江蘇省高校檔案管理工作主要疲于應(yīng)付眾多短期需求,且基本是對(duì)原始檔案信息的低層次利用,檔案機(jī)構(gòu)普遍缺乏加工增值的技術(shù)手段,特別是一旦形成決策方案后,幾乎不再重新使用已用于決策的數(shù)據(jù)。對(duì)此,筆者認(rèn)為,利用大數(shù)據(jù)技術(shù)推動(dòng)檔案數(shù)據(jù)由“一次性消耗式”向“可塑性增值式”利用模式轉(zhuǎn)型已勢(shì)在必行,檔案數(shù)據(jù)只有被不斷開(kāi)發(fā)利用,才能使其使用價(jià)值產(chǎn)生翻倍遞增的效應(yīng)。
2.3 檔案大數(shù)據(jù)加工與分析所需的知識(shí)基礎(chǔ)與技術(shù)力量薄弱
很多高校檔案管理者雖已意識(shí)到自己積累了大量的數(shù)據(jù)資產(chǎn),但卻沒(méi)有可操作的方案來(lái)挖掘館藏檔案大數(shù)據(jù)的使用價(jià)值。形象地說(shuō),許多高校檔案管理機(jī)構(gòu)在守著“金山討飯吃”。不具備“采礦”的先進(jìn)手段,高校檔案管理機(jī)構(gòu)將難以發(fā)掘檔案信息數(shù)據(jù)潛藏的寶貴價(jià)值。
目前,國(guó)內(nèi)高校之間的檔案管理信息化水平存在較大差別,多數(shù)地方院校因受人力物力所限,館藏檔案信息資源的儲(chǔ)備能力落伍。對(duì)此,筆者認(rèn)為,檔案信息化建設(shè)是一項(xiàng)科技含量很高的專(zhuān)業(yè)性工作,引進(jìn)類(lèi)似“數(shù)據(jù)科學(xué)家”的綜合型人才,已是高校檔案管理機(jī)構(gòu)的當(dāng)務(wù)之急。
檔案機(jī)構(gòu)可加強(qiáng)與大數(shù)據(jù)科研人員的合作,特別要借助可視化技術(shù)等,將檔案大數(shù)據(jù)應(yīng)用做到既直觀(guān)又易用,使高校檔案館(室)甚至個(gè)人也可按需購(gòu)買(mǎi)數(shù)據(jù)分析服務(wù)等來(lái)享用檔案大數(shù)據(jù)資源。
3.1 業(yè)務(wù)流程重組的概念
業(yè)務(wù) 流 程 重 組(Business Process Reengineering,BPR)是由美國(guó)著名的管理學(xué)家最早提出的一種管理思想,其強(qiáng)調(diào):以業(yè)務(wù)流程為改造對(duì)象和中心,以關(guān)心用戶(hù)的需求和滿(mǎn)意度為目標(biāo),利用現(xiàn)代的管理手段對(duì)現(xiàn)有的業(yè)務(wù)流程進(jìn)行根本地再思考和徹底地再設(shè)計(jì),并最大限度地實(shí)現(xiàn)技術(shù)上的功能集成和管理上的職能集成,建立全新的流程型組織結(jié)構(gòu),從而實(shí)現(xiàn)企業(yè)經(jīng)營(yíng)在成本、質(zhì)量、服務(wù)和速度等方面的戲劇性改善。這一理論對(duì)探索高校檔案大數(shù)據(jù)業(yè)務(wù)流程的模式創(chuàng)新具有重要的指導(dǎo)意義。
3.2 高校檔案大數(shù)據(jù)業(yè)務(wù)流程重組的實(shí)施步驟
數(shù)據(jù)專(zhuān)家指出:大數(shù)據(jù)應(yīng)用的分析結(jié)果,需要經(jīng)過(guò)數(shù)據(jù)的采集、預(yù)處理、存儲(chǔ)、分析和挖掘等多道環(huán)節(jié)才能最終呈現(xiàn)出來(lái)[1]。因此,借鑒業(yè)務(wù)流程重組的基本原理,按照檔案數(shù)據(jù)化管理與服務(wù)的自然順序和需求特點(diǎn),對(duì)傳統(tǒng)的紙質(zhì)檔案業(yè)務(wù)流程進(jìn)行科學(xué)調(diào)整與精簡(jiǎn),不僅勢(shì)在必行,而且切實(shí)可行。筆者認(rèn)為可將高校檔案業(yè)務(wù)流程由傳統(tǒng)的職能型組織結(jié)構(gòu)改造為流程型組織機(jī)構(gòu),即建立“全息式采集、分布式存儲(chǔ)、關(guān)聯(lián)式挖掘、可視化發(fā)布”的業(yè)務(wù)流程。
(1)建立“全息式采集”業(yè)務(wù)流程的實(shí)施步驟
第一,在進(jìn)行“全介體、全方位、全天候”的檔案信息數(shù)據(jù)采集之前,必須先搞清楚有哪些問(wèn)題需要解決,并找到解決具體問(wèn)題的途徑與措施。例如,可采取匯總用戶(hù)利用案例的辦法,每季度出一本案例集,并將梳理日常業(yè)務(wù)作為發(fā)現(xiàn)問(wèn)題的“抓手”,認(rèn)真研究用戶(hù)實(shí)際應(yīng)用中的共性問(wèn)題,高度關(guān)注還有哪些障礙需要克服,以便找到制定檔案數(shù)據(jù)采集業(yè)務(wù)策略的客觀(guān)依據(jù)和解決問(wèn)題的途徑與措施。
第二,針對(duì)需要解決的問(wèn)題,科學(xué)制定“全息式采集”的策略方案與業(yè)務(wù)流程。首先,要從發(fā)現(xiàn)大數(shù)據(jù)的過(guò)程開(kāi)始,明確館藏?cái)?shù)據(jù)。其次,要明確數(shù)據(jù)位置,由誰(shuí)負(fù)責(zé)保管。再次,要明確目前這些數(shù)據(jù)是怎么使用的,其依賴(lài)的第三方數(shù)據(jù)源是什么,有多少數(shù)據(jù)和數(shù)據(jù)源是重合的。同時(shí),要關(guān)注“重復(fù)數(shù)據(jù)”的規(guī)律與特征,因?yàn)檫@既是研究制定大數(shù)據(jù)采集策略方案與業(yè)務(wù)流程的科學(xué)依據(jù),也是評(píng)估驗(yàn)證大數(shù)據(jù)采集策略執(zhí)行效果的重要基礎(chǔ)。
第三,關(guān)注館藏?cái)?shù)據(jù)資源中缺少什么信息數(shù)據(jù),積極探尋獲取所缺信息數(shù)據(jù)的方案。大數(shù)據(jù)的采集,是指注重獲取全部數(shù)據(jù)而非隨機(jī)數(shù)據(jù);大數(shù)據(jù)的整理,是指注重解決混雜性而非精確性;大數(shù)據(jù)的分析,是指挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系而非因果關(guān)系。因此,我們要按照“應(yīng)收盡收”的原則,盡快健全檔案信息數(shù)據(jù)采集制度,竭盡所能地實(shí)施“全息式”采集。
第四,健全檔案大數(shù)據(jù)互操作協(xié)議,創(chuàng)新信息資源整合共享機(jī)制。目前,高校內(nèi)部已建立了教務(wù)、科研、財(cái)務(wù)、資產(chǎn)等多種單功能的信息管理系統(tǒng),但甚少與檔案管理系統(tǒng)建立接口,導(dǎo)致各類(lèi)異構(gòu)信息系統(tǒng)中的數(shù)據(jù)無(wú)法進(jìn)行互操作。因此,我們要針對(duì)高校內(nèi)部數(shù)據(jù)分割的窘境,加快制定檔案大數(shù)據(jù)互操作協(xié)議的業(yè)務(wù)規(guī)制與考核標(biāo)準(zhǔn);針對(duì)高校之間的“信息孤島”問(wèn)題,著力完善檔案信息數(shù)據(jù)的科學(xué)整合與資源共享機(jī)制,尤其要通過(guò)搭建檔案大數(shù)據(jù)智能處理平臺(tái),智能鏈接“分散孤立、類(lèi)型各異”的檔案大數(shù)據(jù)集,加快推進(jìn)校內(nèi)各部門(mén)乃至高校之間跨領(lǐng)域檔案大數(shù)據(jù)資源的互通互享。
需要指出的是,盲目地收集信息數(shù)據(jù),是當(dāng)前大數(shù)據(jù)投資回報(bào)率過(guò)低的原因之一[2]。如何在海量的檔案信息數(shù)據(jù)中找到真正有價(jià)值的內(nèi)容,讓自己擁有“奧康姆的剃刀”?這是高校檔案管理者需在實(shí)踐中不斷深入探究的課題。
(2)建立“分布式存儲(chǔ)”業(yè)務(wù)流程的實(shí)施步驟
第一,按照數(shù)據(jù)屬性特征構(gòu)建不同的存儲(chǔ)方式。首先,在高校檔案大數(shù)據(jù)智能處理平臺(tái)中將采集到的各類(lèi)元數(shù)據(jù)分為結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的大數(shù)據(jù)。其次,要借助大數(shù)據(jù)技術(shù),創(chuàng)建分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)系統(tǒng)和分布式數(shù)據(jù)流處理系統(tǒng)(這是針對(duì)結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的大數(shù)據(jù)分別量身定制的三種存儲(chǔ)方式)[3]。再次,要將經(jīng)過(guò)鑒定的結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的大數(shù)據(jù),分門(mén)別類(lèi)地進(jìn)行存儲(chǔ)。
第二,搭建高校檔案海量大數(shù)據(jù)智能存儲(chǔ)平臺(tái)。將TB、PB級(jí)乃至EB級(jí)的海量檔案大數(shù)據(jù)存放在大規(guī)模的分布式集群服務(wù)器上,可保證數(shù)據(jù)的讀寫(xiě)效率、安全性和可靠性。目前,HDFS(Hadoop Distributed File System)就是一個(gè)典型的海量數(shù)據(jù)存儲(chǔ)系統(tǒng)。它作為主流的開(kāi)源云計(jì)算系統(tǒng)Hadoop的核心構(gòu)件之一,由于具有低成本、高度容錯(cuò)、支持大數(shù)據(jù)集等多方面的應(yīng)用優(yōu)點(diǎn),已成為解決高校檔案大數(shù)據(jù)存儲(chǔ)問(wèn)題的首選方案之一。
第三,夯實(shí)和提升數(shù)據(jù)質(zhì)量管理功能。首先,要把分布式存儲(chǔ)的檔案大數(shù)據(jù)進(jìn)行轉(zhuǎn)換,可使用Google Refine、80Legs等格式轉(zhuǎn)換工具;Grep、Turk和BigSheets等工具,則可用于數(shù)據(jù)分析[4]。其次,要最大限度地凝練可信數(shù)據(jù),切實(shí)提高數(shù)據(jù)資源整體質(zhì)量標(biāo)準(zhǔn)的規(guī)范性。再次,要根據(jù)信息數(shù)據(jù)的生命周期,對(duì)存儲(chǔ)的各種不同結(jié)構(gòu)類(lèi)型的檔案大數(shù)據(jù)建立“體檢”(價(jià)值檢測(cè))、“保養(yǎng)”(技術(shù)優(yōu)化)和“淘汰”(冗余刪除)等智能處理機(jī)制,不斷提升高校檔案大數(shù)據(jù)的凈化質(zhì)量。
(3)建立“關(guān)聯(lián)式挖掘”業(yè)務(wù)流程的實(shí)施步驟
第一,了解和掌握檔案大數(shù)據(jù)關(guān)聯(lián)挖掘業(yè)務(wù)的基本原理。“檔案大數(shù)據(jù)關(guān)聯(lián)挖掘”(Association Rule Mining)工作原理是:運(yùn)用大數(shù)據(jù)關(guān)聯(lián)挖掘的開(kāi)發(fā)工具(計(jì)算機(jī)算法模式),對(duì)檔案大數(shù)據(jù)實(shí)施靜態(tài)和動(dòng)態(tài)的數(shù)據(jù)分析評(píng)估,揭示(預(yù)測(cè))有價(jià)值的數(shù)據(jù)信息。
第二,建立科學(xué)的檔案大數(shù)據(jù)關(guān)聯(lián)挖掘管理流程。傳統(tǒng)的檔案管理業(yè)務(wù)流程是:出現(xiàn)問(wèn)題→邏輯分析→找出因果關(guān)系→提出解決方案。這種事后“救火”的操作流程較為被動(dòng),無(wú)法預(yù)測(cè)未來(lái)的發(fā)展情勢(shì)和提供解決問(wèn)題的應(yīng)對(duì)預(yù)案。大數(shù)據(jù)關(guān)聯(lián)挖掘技術(shù)的核心作用在于“預(yù)測(cè)”。其業(yè)務(wù)流程是:搜集數(shù)據(jù)→量化分析→找出關(guān)聯(lián)關(guān)系→預(yù)測(cè)未來(lái)結(jié)果→提出優(yōu)選方案。這是一種正向思維模式,其主動(dòng)性的工作方式和操作流程,不僅符合檔案數(shù)據(jù)網(wǎng)絡(luò)化、智能化、個(gè)性化管理的特性需要,而且是管理和挖掘檔案大數(shù)據(jù)資源的有效措施。
第三,選擇檔案大數(shù)據(jù)關(guān)聯(lián)挖掘的開(kāi)發(fā)工具?!百?gòu)物籃分析”(Market Basket Analysis)是目前比較先進(jìn)的大數(shù)據(jù)關(guān)聯(lián)挖掘工具,它依托云計(jì)算技術(shù),不僅能對(duì)用戶(hù)行為等大數(shù)據(jù)作分析評(píng)估,而且可揭示相關(guān)聯(lián)想(Association)的規(guī)則,特別是通過(guò)梳理和剖析事物之間的相互關(guān)系,可挖掘(預(yù)測(cè))出以前無(wú)法發(fā)現(xiàn)的細(xì)節(jié)信息,使高校檔案信息的智能關(guān)聯(lián)推薦更為精確、更有預(yù)見(jiàn)性,服務(wù)方式則更加符合個(gè)性化需求。
(4)建立“可視化發(fā)布”業(yè)務(wù)流程的實(shí)施步驟
第一,了解和掌握基于計(jì)算機(jī)圖形學(xué)和圖像處理可視化分析(Visualization Analysis)的工作原理?!耙粡垐D片等于1000個(gè)字”[5],這是對(duì)大數(shù)據(jù)可視式發(fā)布技術(shù)最形象的比喻??梢暬治龅墓ぷ髟硎牵簩n案大數(shù)據(jù)壓縮轉(zhuǎn)換成圖形或圖像,并在各類(lèi)終端設(shè)備的屏幕上以簡(jiǎn)單直觀(guān)的方式展示出來(lái)。應(yīng)用這項(xiàng)技術(shù),不僅能更好地展現(xiàn)檔案大數(shù)據(jù)分析結(jié)果或監(jiān)測(cè)數(shù)據(jù)背后的信息,而且可以幫助用戶(hù)更好地發(fā)掘檔案大數(shù)據(jù)潛藏的寶貴價(jià)值。
第二,注重開(kāi)發(fā)可視化發(fā)布技術(shù)的應(yīng)用優(yōu)勢(shì)。這項(xiàng)技術(shù)的應(yīng)用優(yōu)勢(shì)主要有三:一是運(yùn)用動(dòng)畫(huà)、趨勢(shì)線(xiàn)、圖形等視覺(jué)效果技術(shù),能開(kāi)發(fā)出豐富多彩的可視化分析結(jié)果,有利于提高推介結(jié)果被用戶(hù)接受的可能性。二是通過(guò)優(yōu)化檔案大數(shù)據(jù)智能處理平臺(tái)的人機(jī)交互界面,主動(dòng)推介“玩”的方式,有利于吸引用戶(hù)對(duì)檔案大數(shù)據(jù)分析過(guò)程進(jìn)行調(diào)整。三是通過(guò)建立技術(shù)融合機(jī)制,讓分析結(jié)果發(fā)布到Web應(yīng)用系統(tǒng)和移動(dòng)終端設(shè)備交互展示,有利于強(qiáng)化平臺(tái)黏度。數(shù)據(jù)專(zhuān)家預(yù)言:未來(lái)大數(shù)據(jù)的采集、展示和交互,必將朝著移動(dòng)的、即時(shí)的、泛在的方向發(fā)展[6]。
第三,注重不斷豐富可視化技術(shù)的展示形式。目前,具有代表性的可視化展示形式主要有:氣泡圖、樹(shù)狀圖、平行坐標(biāo)軸、時(shí)間軸、網(wǎng)絡(luò)圖、標(biāo)簽云、堆棧圖、地圖、熱力圖、流程圖、標(biāo)簽云等幾十種圖例。經(jīng)考察發(fā)現(xiàn),相比傳統(tǒng)的表格、餅圖、柱狀圖等數(shù)據(jù)圖,可視化發(fā)布技術(shù)能夠變得更加豐富多彩、更具吸引力。我們?cè)跇?gòu)建高校檔案大數(shù)據(jù)智能處理平臺(tái)的過(guò)程中,應(yīng)當(dāng)根據(jù)實(shí)踐應(yīng)用的需要,主動(dòng)與專(zhuān)業(yè)技術(shù)服務(wù)提供商進(jìn)行溝通,以利設(shè)計(jì)者能夠提供更多具有時(shí)代氣息的創(chuàng)新佳品。
第四,注重集成信息圖工具的遴選。目前,有一種與可視化發(fā)布技術(shù)非常接近且有時(shí)能夠互相替換使用的技術(shù)叫“信息圖”(InfoGraphic)。該技術(shù)不僅能使無(wú)“生命”的數(shù)據(jù)顯示出趣味和生命力,而且便于在網(wǎng)絡(luò)上傳播和收藏。不同之處在于,可視化發(fā)布技術(shù)基本上是全自動(dòng)的,而“信息圖”要靠手工定制。據(jù)調(diào)研發(fā)現(xiàn),“信息圖”已是當(dāng)今“輕閱讀”的寵兒,可以廣泛應(yīng)用到高校檔案展示領(lǐng)域,各高校檔案管理機(jī)構(gòu)可根據(jù)自己所需用途和投資條件進(jìn)行選擇。
*本文為2011年度國(guó)家社科項(xiàng)目“基于互操作協(xié)議標(biāo)準(zhǔn)的檔案信息資源整合模式研究”(項(xiàng)目編號(hào):11CTQ030),2016年度江蘇省檔案局科技項(xiàng)目“區(qū)域性高校數(shù)字檔案資源共享平臺(tái)建設(shè)研究”(項(xiàng)目編號(hào):2016-13)研究成果之一。
[1]楊正洪.《智慧城市——大數(shù)據(jù)、物聯(lián)網(wǎng)和云計(jì)算之應(yīng)用》[M].北京:清華大學(xué)出版社,2014:17.
[2]李德偉等.《大數(shù)據(jù)小故事》[M].北京:中國(guó)標(biāo)準(zhǔn)出版社,2014:110.
[3]楊巨龍.《大數(shù)據(jù)技術(shù)全解:基礎(chǔ)、設(shè)計(jì)、開(kāi)發(fā)與實(shí)踐》[M].北京:電子工業(yè)出版社,2014:9.
[4]張新程等.《物聯(lián)網(wǎng)關(guān)鍵技術(shù)》[M].北京:人民郵電出版社,2011:38.
[5]大衛(wèi)·芬雷布.《大數(shù)據(jù)云圖》[M].杭州:浙江人民出版社,2014:178.
[6]趙勇等.《大數(shù)據(jù)革命——理論、模式與技術(shù)創(chuàng)新》[M].北京:電子工業(yè)出版社,2014:109.
張 倩,女,南京藝術(shù)學(xué)院綜合檔案室副研究館員,主要研究方向?yàn)闄n案信息化建設(shè)。
Study on Big Data Business Process Reengineering of University Archives
Zhang Qian
(Comprehensive Archives Office of Nanjing University of the Arts,Nanjing,Jiangsu,210013)
Referring to the principle of Business Process Reengineering and the idea of the development of big data technology,this paper investigates the contents of the traditional archives business process and its existing problems in colleges and universities,and explores the core content of the business process reengineering of university archives and puts forward to reform the university archives business process from the traditional functional organization structure to the process type organization,in order to establish the business process of holographic collection,distributed storage, association mining,visual publishing.
Big Data;University Archives;Business Process Reengineering
G271