■滿雪萍
(廣東省地質(zhì)局第五地質(zhì)大隊,廣東 肇慶 526000)
據(jù)統(tǒng)計,每年全球數(shù)據(jù)泄露事件頻發(fā),數(shù)據(jù)安全問題已經(jīng)成為全球范圍內(nèi)的重大問題。各個國家均非常重視數(shù)據(jù)安全,甚至都逐步細(xì)化各個行業(yè)的數(shù)據(jù)安全。以檔案行業(yè)為例,2016年的《關(guān)于進(jìn)一步加強(qiáng)檔案安全工作的意見》提出保障檔案信息數(shù)據(jù)真實(shí)安全;2020年的《中華人民共和國檔案法》提出保障檔案數(shù)字資源的安全保存;2021年的《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》提出提升檔案數(shù)字資源安全管理能力。
檔案數(shù)據(jù)作為價值豐富的檔案資源,是確鑿的事實(shí)存照和重要的社會記憶。檔案數(shù)據(jù)安全關(guān)乎國家安全、社會安全和個人安全,必須高度重視檔案數(shù)據(jù)安全。根據(jù)檔案數(shù)據(jù)安全治理能力成熟度模型,維護(hù)檔案數(shù)據(jù)安全就要切實(shí)提升數(shù)據(jù)安全過程的檔案數(shù)據(jù)安全治理能力。本文將基于檔案數(shù)據(jù)安全治理能力成熟度模型的數(shù)據(jù)安全過程,探究檔案數(shù)據(jù)安全治理能力問題,主要是在評價能力指標(biāo)的基礎(chǔ)上提出有益建議。
結(jié)構(gòu)方程模型是一種綜合評估方法,兼顧了因子分析方法的因果關(guān)系和路徑分析方法的影響關(guān)系,能夠?qū)崿F(xiàn)多個變量之間的關(guān)系量化研究,能夠?qū)撛谧兞颗c潛在變量之間,潛在變量與測定變量之間的關(guān)系進(jìn)行定量判斷,是有效的多變量分析方法。本研究將采用結(jié)構(gòu)方程模型,分析基于數(shù)據(jù)安全過程的檔案數(shù)據(jù)安全治理能力指標(biāo)。
基于數(shù)據(jù)安全過程,可以界定一級潛在變量為檔案數(shù)據(jù)安全,二級潛在變量為檔案數(shù)據(jù)采集安全、檔案數(shù)據(jù)處理安全、檔案數(shù)據(jù)存儲安全、檔案數(shù)據(jù)利用安全、檔案數(shù)據(jù)傳播安全。測量變量為采集源頭、采集范圍、采集流程、數(shù)據(jù)脫敏、數(shù)據(jù)清洗、數(shù)據(jù)抽取、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)糾正、存儲數(shù)據(jù)庫、存儲備份、儲存監(jiān)管、數(shù)據(jù)公開、數(shù)據(jù)共享、數(shù)據(jù)訪問、內(nèi)網(wǎng)-外網(wǎng)傳播、整體-部分傳播、自由-限制傳播。具體指標(biāo)體系見表1。
表1 指標(biāo)體系
問卷采用5級李克特量表形式進(jìn)行指標(biāo)評估,測定表量為檔案數(shù)據(jù)安全,潛在變量為檔案數(shù)據(jù)采集安全、檔案數(shù)據(jù)處理安全、檔案數(shù)據(jù)存儲安全、檔案數(shù)據(jù)利用安全、檔案數(shù)據(jù)傳播安全,二級潛在變量為采集源頭等。主要針對各個指標(biāo)進(jìn)行1~5分評分,分值越高,表示指標(biāo)正面評價越高。
樣本數(shù)據(jù)來自于網(wǎng)絡(luò)問卷調(diào)查?;谘芯恳暯菫閿?shù)據(jù)安全過程的檔案數(shù)據(jù)安全治理能力,要求調(diào)查對象必須對檔案數(shù)據(jù)安全具有一定的了解,為了確保調(diào)查對象的合理性,主要通過圖書館論壇和經(jīng)管之家平臺的“檔案數(shù)據(jù)”主題獲取調(diào)查讀者,隨機(jī)抽取200名能夠獲取有效聯(lián)系方式的網(wǎng)友,進(jìn)行網(wǎng)絡(luò)問卷調(diào)查,整理問卷結(jié)果得到176份有效問卷,問卷有效率為88%。
1.信度檢驗(yàn)
信度檢驗(yàn)的目的是評估問卷數(shù)據(jù)是否可靠。一般來說,可以通過Cronbach's a系數(shù)值進(jìn)行評估。如果Cronbach's a系數(shù)值大于0.7,就可以說明問卷數(shù)據(jù)可靠。本研究采用SPSS軟件進(jìn)行信度檢驗(yàn),Cronbach's a系數(shù)值見附表1。檔案數(shù)據(jù)采集安全、檔案數(shù)據(jù)處理安全、檔案數(shù)據(jù)存儲安全、檔案數(shù)據(jù)利用安全、檔案數(shù)據(jù)傳播安全的 Cronbach's a 系數(shù)值分別為 0.817、0.778、0.823、0.807、0.759、0.810,整體 Cronbach's a 系數(shù)值為 0.844,均大于0.7,說明問卷數(shù)據(jù)通過信度檢驗(yàn)。
附表1 Cronbach's a系數(shù)
2.效度檢驗(yàn)
效度檢驗(yàn)的目的是評估問卷數(shù)據(jù)是否有效。一般來說,可以通過KMO值和Bartlett球度檢驗(yàn)進(jìn)行評估,如果KMO值大于0.7,并且Bartlett球度檢驗(yàn)顯著性水平小于0.05,就可以說明問卷數(shù)據(jù)有效。本研究采用SPSS軟件進(jìn)行效度檢驗(yàn),KMO值和Bartlett球度檢驗(yàn)結(jié)果見表2。KMO值為0.917,大于0.7,且Bartlett球度檢驗(yàn)的顯著性水平為0.012,小于0.05,說明問卷數(shù)據(jù)通過效度檢驗(yàn)。
表2 KMO檢驗(yàn)和Bartlett球度檢驗(yàn)
結(jié)構(gòu)方程模型是否合理有效需要進(jìn)行驗(yàn)證,常用的驗(yàn)證方法為擬合優(yōu)度指標(biāo),具體包括絕對擬合指標(biāo)、增值擬合指標(biāo)和簡約擬合指標(biāo)三種類型,擬合優(yōu)度系數(shù)指標(biāo)只有符合一定條件,模型才有效,本研究采用AMOS軟件進(jìn)行結(jié)構(gòu)方程模型分析,擬合系數(shù)值見附表2。絕對擬合指數(shù)、增值擬合指數(shù)、簡約擬合指數(shù)的擬合情況均表現(xiàn)為良好。
結(jié)構(gòu)方程模型分析路徑可以反映影響關(guān)系,T值能夠反映顯著性水平,一般來說,T>3表示P<0.01,表示潛在變量對測定表量具有非常顯著影響,T>1.96表示P<0.05,表示潛在變量對測定表量具有顯著影響,如果T<1.96,表示潛在變量對測定表量沒有影響。基于AMOS軟件進(jìn)行結(jié)構(gòu)方程模型分析,統(tǒng)計路徑系數(shù)及T值的附表3。
附表3 擬合系數(shù)統(tǒng)計
附表4 路徑系數(shù)及T值
檔案數(shù)據(jù)安全治理能力方面。檔案數(shù)據(jù)采集安全指標(biāo)、檔案數(shù)據(jù)處理安全指標(biāo)、檔案數(shù)據(jù)存儲安全指標(biāo)、檔案數(shù)據(jù)利用安全指標(biāo)、檔案數(shù)據(jù)傳播安全指標(biāo)的路徑系數(shù)分別為 0.841、0.8466、0.899、0.837、0.822,均大于 0,T值分別為 6.214、6.375、6.891、6.211、6.138,均大于 3。說明檔案數(shù)據(jù)采集安全、檔案數(shù)據(jù)處理安全、檔案數(shù)據(jù)存儲安全、檔案數(shù)據(jù)利用安全、檔案數(shù)據(jù)傳播安全對檔案數(shù)據(jù)安全治理能力均具有非常顯著的正向作用。
檔案數(shù)據(jù)采集安全方面。采集流程指標(biāo)的路徑系數(shù)為0.763,大于0,T值為5.471,大于3;而采集源頭指標(biāo)、采集范圍指標(biāo)的T值分別為1.552,1.543,均小于1.96。說明僅有采集流程對檔案數(shù)據(jù)采集安全具有非常顯著的正向作用。
檔案數(shù)據(jù)處理安全方面。數(shù)據(jù)脫敏指標(biāo)、數(shù)據(jù)清洗指標(biāo)、數(shù)據(jù)抽取指標(biāo)、數(shù)據(jù)集成指標(biāo)、數(shù)據(jù)變換指標(biāo)、數(shù)據(jù)糾正指標(biāo)的路徑系數(shù)分別為 0.752、0.749、0.732、0.724、0.774、0.798,均大于 0,T 值分別為 5.342、5.269、5.174、5.043、5.789、5.889,均大于 3。說明數(shù)據(jù)脫敏、數(shù)據(jù)清洗、數(shù)據(jù)抽取、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)糾正對檔案數(shù)據(jù)處理安全均具有非常顯著的正向作用。
檔案數(shù)據(jù)存儲安全方面。存儲數(shù)據(jù)庫指標(biāo)、存儲備份指標(biāo)、儲存監(jiān)管指標(biāo)的路徑系數(shù)分別為0.652、0.699、0.531,均大于 0,T 值分別為 4.768、4.823、4.552,均大于3。說明存儲數(shù)據(jù)庫、存儲備份、儲存監(jiān)管對檔案數(shù)據(jù)存儲安全均具有非常顯著的正向作用。
檔案數(shù)據(jù)利用安全方面。數(shù)據(jù)訪問指標(biāo)的路徑系數(shù)為0.621,大于0,T值為4.445,大于3;而數(shù)據(jù)公開指標(biāo)、數(shù)據(jù)共享指標(biāo)的T值分別為1.402、1.413,均小于1.96。說明僅有數(shù)據(jù)訪問對檔案數(shù)據(jù)利用安全具有非常顯著的正向作用。
檔案數(shù)據(jù)傳播安全方面。內(nèi)網(wǎng)-外網(wǎng)傳播指標(biāo)、整體-部分傳播指標(biāo)、自由-限制傳播指標(biāo)的路徑系數(shù)分別為 0.576、0.555、0.523,均大于 0,T 值分別為 3.696、3.673、3.421,均大于3。說明內(nèi)網(wǎng)-外網(wǎng)傳播、整體-部分傳播、自由-限制傳播對檔案數(shù)據(jù)傳播安全均具有非常顯著的正向作用。
綜上所述,基于檔案數(shù)據(jù)安全過程視角,檔案數(shù)據(jù)安全治理能力要求做到檔案數(shù)據(jù)采集安全、檔案數(shù)據(jù)處理安全、檔案數(shù)據(jù)存儲安全、檔案數(shù)據(jù)利用安全、檔案數(shù)據(jù)傳播安全。結(jié)合數(shù)據(jù)采集、處理、存儲、利用和傳播安全的具體影響指標(biāo),提出檔案數(shù)據(jù)安全治理能力提升路徑如下。
檔案數(shù)據(jù)采集方面。一方面,規(guī)范化檔案數(shù)據(jù)的采集渠道,在信息數(shù)據(jù)爆炸時代,檔案數(shù)據(jù)的采集要注重權(quán)威性和可靠性,不僅要避免重復(fù)性的多頭采集,也要規(guī)避超范圍的過度采集,嚴(yán)把數(shù)據(jù)采集來源,確保采集到檔案數(shù)據(jù)的真實(shí)性與有效性;另一方面,標(biāo)準(zhǔn)化檔案數(shù)據(jù)采集格式,在現(xiàn)代化信息工具下,檔案數(shù)據(jù)的呈現(xiàn)形式豐富多樣,既有文字,也有圖片,還有音頻視頻,應(yīng)當(dāng)按照不同類型的檔案數(shù)據(jù)進(jìn)行統(tǒng)一化采集,不僅要制定統(tǒng)一的采集程序,也要通過標(biāo)準(zhǔn)化編碼轉(zhuǎn)化數(shù)據(jù)類型,確保采集到檔案數(shù)據(jù)的可比較性和可用性。
檔案數(shù)據(jù)處理方面。一方面,加強(qiáng)檔案數(shù)據(jù)的科學(xué)化分類,當(dāng)前的檔案數(shù)據(jù)不僅存在殘缺冗余的情形,也存在多源異構(gòu)的情況,對繁雜的檔案數(shù)據(jù)應(yīng)當(dāng)進(jìn)行有效分類以便于存儲和統(tǒng)計,可以按照檔案數(shù)據(jù)的屬性與特征,或者是按照檔案數(shù)據(jù)的功能與應(yīng)用,進(jìn)行科學(xué)合理的多元分類;另一方面,加強(qiáng)暗桿數(shù)據(jù)的有效化清洗,當(dāng)前的檔案數(shù)據(jù)不僅存在死數(shù)據(jù)的問題,也存在冷數(shù)據(jù)的不足,對低質(zhì)量的檔案數(shù)據(jù)應(yīng)當(dāng)進(jìn)行必要清洗以便于應(yīng)用和使用,可以針對多方位收集到的檔案數(shù)據(jù)進(jìn)行比對校驗(yàn),更正明顯錯誤數(shù)據(jù),剔除明顯重復(fù)數(shù)據(jù),注重檔案數(shù)據(jù)清洗脫敏,得到高質(zhì)量檔案數(shù)據(jù)。
檔案數(shù)據(jù)存儲方面。一方面,優(yōu)化檔案數(shù)據(jù)安全存儲機(jī)制,基于檔案數(shù)據(jù)的重要性程度和保密性質(zhì),制定安全有效的檔案數(shù)據(jù)存儲制度和保密制度,注重存儲數(shù)據(jù)庫的選擇與完善,選擇安全性能穩(wěn)定的存儲數(shù)據(jù)庫,并結(jié)合檔案數(shù)據(jù)特征不斷完善存儲數(shù)據(jù)庫,確保檔案數(shù)據(jù)的安全存儲與長期存儲;另一方面,健全檔案數(shù)據(jù)安全監(jiān)測機(jī)制,基于檔案數(shù)據(jù)的存儲要求和豐富類型,選擇使用壽命長且容量大的存儲介質(zhì),注重檔案數(shù)據(jù)的加密與備份,構(gòu)建存儲檔案數(shù)據(jù)的安全監(jiān)測系統(tǒng),加強(qiáng)數(shù)據(jù)實(shí)時監(jiān)控與監(jiān)測,杜絕存儲檔案數(shù)據(jù)可能存在的安全隱患,確保檔案數(shù)據(jù)的安全存儲與有效存儲。
檔案數(shù)據(jù)利用方面。一方面,嚴(yán)格規(guī)范檔案數(shù)據(jù)的訪問權(quán)限,根據(jù)檔案數(shù)據(jù)的保密性質(zhì)和保密程度,設(shè)置不同等級的訪問權(quán)限,對于一般安全的檔案數(shù)據(jù),可以公開共享,設(shè)置無門檻或者是低門檻訪問權(quán)限,對于中高度安全的檔案數(shù)據(jù),則應(yīng)當(dāng)規(guī)范落實(shí)身份授權(quán),設(shè)置高門檻訪問權(quán)限,只允許限定的用戶進(jìn)行訪問;另一方面,嚴(yán)格把控檔案數(shù)據(jù)的使用應(yīng)用,根據(jù)檔案數(shù)據(jù)的隸屬部門,針對具有知識產(chǎn)權(quán)的檔案數(shù)據(jù)要加強(qiáng)使用監(jiān)督,不僅要有效防范檔案數(shù)據(jù)的濫用行為,也要堅決處置檔案數(shù)據(jù)未經(jīng)許可和非授權(quán)使用的行為,還要重度預(yù)防檔案數(shù)據(jù)的泄露行為,推動檔案數(shù)據(jù)的正當(dāng)使用。
檔案數(shù)據(jù)傳播方面。一方面,區(qū)分內(nèi)網(wǎng)和外網(wǎng)傳播,對于機(jī)構(gòu)組織的內(nèi)部檔案數(shù)據(jù),設(shè)置安全的防火墻確保內(nèi)網(wǎng)傳播,對于大眾開放的檔案數(shù)據(jù),積極推進(jìn)外網(wǎng)平臺的共享與傳播,同時要做好內(nèi)外網(wǎng)的物理隔離,在必要的內(nèi)外網(wǎng)檔案數(shù)據(jù)傳播交換過程中,確保安全有序;另一方面,區(qū)分整體和部分傳播,對于不同傳播范圍的檔案數(shù)據(jù),做好分域控制,對于不同用戶對象的檔案數(shù)據(jù),做好分級控制,對于不同敏感程度的檔案數(shù)據(jù),做好分類防護(hù),對于不同保密等級的檔案數(shù)據(jù),做好劃控處理,選擇性地選取部分檔案數(shù)據(jù)進(jìn)行傳播。