葛佳歡 楊淑峰 徐歡歡
摘要:隨著信息化的不斷發(fā)展,數(shù)據(jù)作為人工智能和大數(shù)據(jù)的核心要素,將對(duì)教育領(lǐng)域發(fā)展帶來深刻影響,如何使用和管理數(shù)據(jù)成為已成為當(dāng)前學(xué)校信息化建設(shè)的重點(diǎn)和難點(diǎn)。文章以臺(tái)州科技職業(yè)學(xué)院為例,探索如何在數(shù)字化改革背景下深化校園數(shù)據(jù)治理,力求營造校園數(shù)據(jù)治理生態(tài),推動(dòng)學(xué)校各領(lǐng)域的數(shù)字化改革工作。
關(guān)鍵詞:數(shù)字化改革;數(shù)據(jù)治理;數(shù)據(jù)目錄
中圖法分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A
Exploration of deepening campus data governance underbackground of digital reform
—Taking 'Taizhou Vocational College of Science& Technology as an example
GE Jiahuan,YANGShufeng,XUHuanhuan
(Taizhou Vocational College of Science&.Technology,Taizhou,Zhejiang 318020,China)
Abstract:With the continuous development of informatization, data , as the core element of artificialintelligence and big data , will have a profound impact on the development of the education field.Howto use and manage data has become a key difficulty in the current school informatization construction.Taking Taizhou Vocational College of Science&.Technology as an example,this paper explores how todeepen campus data governance in the context of digital reform , striving to create a campus datagovernanceecosystem,and promoting digital reform in various fields of the school.
Key words: digital reform,data governance,data directory
1 引言
2021年3月15日,教育部發(fā)布的《教育部關(guān)于加強(qiáng)新時(shí)代教育管理信息化工作的通知》提道,推動(dòng)教育決策由經(jīng)驗(yàn)驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)變,提高教育數(shù)據(jù)管理水平。隨后,浙江省也印發(fā)《浙江省教育領(lǐng)域數(shù)字化改革工作方案》《2021年浙江省教育領(lǐng)域數(shù)字化改革工作要點(diǎn)》的通知,指出數(shù)據(jù)是現(xiàn)代教育體系建設(shè)過程中的重要生產(chǎn)要素和核心驅(qū)動(dòng)力。由此可見,數(shù)據(jù)在學(xué)校的信息化發(fā)展過程中占據(jù)了越來越重要的地位。隨著數(shù)據(jù)容量的快速積累、數(shù)據(jù)質(zhì)量和運(yùn)算能力的不斷提高,如何使用和管理數(shù)據(jù)已成為教育領(lǐng)域的一個(gè)重要課題[1]。
2 存在的問題
目前,大部分高職院校在“十三五”期間已初步完成了“數(shù)字化校園平臺(tái)”建設(shè),建立了基礎(chǔ)數(shù)據(jù)庫,數(shù)據(jù)的容量也越來越大。隨著業(yè)務(wù)數(shù)據(jù)的不斷積累,學(xué)校對(duì)數(shù)據(jù)管理的要求越來越高,相應(yīng)的弊端也逐漸顯現(xiàn)。以臺(tái)州科技職業(yè)學(xué)院為例,目前數(shù)據(jù)管理主要存在四個(gè)問題。
2.1 數(shù)據(jù)缺乏統(tǒng)一標(biāo)準(zhǔn)
學(xué)校擁有眾多信息管理系統(tǒng),各個(gè)系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,各自為政,“信息孤島”仍然存在,沒有形成定義明確、格式統(tǒng)一、職責(zé)明確的數(shù)據(jù)標(biāo)準(zhǔn)。部門之間存在數(shù)據(jù)重復(fù)、數(shù)據(jù)混亂現(xiàn)象,導(dǎo)致跨部門數(shù)據(jù)交換共享困難。比如,“在校生統(tǒng)計(jì)”分為“在籍(包括休學(xué)、參軍)”“在校(真正在學(xué)校上學(xué)的學(xué)生,還可能包括成教學(xué)生)”“在籍在?!睅追N類型,各個(gè)部門關(guān)注的重點(diǎn)不一樣,就會(huì)形成不同的定義,最后統(tǒng)計(jì)的數(shù)據(jù)相互之間就會(huì)有出入,造成數(shù)據(jù)不統(tǒng)一。
2.2 數(shù)據(jù)質(zhì)量不高
前期信息系統(tǒng)建設(shè)普遍存在“重功能輕數(shù)據(jù)”的情況,缺少整體數(shù)據(jù)標(biāo)準(zhǔn)規(guī)劃,無校核機(jī)制,導(dǎo)致問題數(shù)據(jù)不斷積累,數(shù)據(jù)統(tǒng)計(jì)不準(zhǔn)確,影響各項(xiàng)報(bào)表準(zhǔn)確性,許多預(yù)期需求無法實(shí)現(xiàn),對(duì)學(xué)校上層的決策和分析也帶來不同程度的影響。
2.3 數(shù)據(jù)存在安全隱患
數(shù)據(jù)安全管理工作機(jī)制不完善,部分信息系統(tǒng)數(shù)據(jù)授權(quán)管理不嚴(yán),缺乏管控,可能造成數(shù)據(jù)濫用和隱私數(shù)據(jù)泄露情況。部分師生缺乏數(shù)據(jù)安全責(zé)任意識(shí),對(duì)安全隱患不夠重視,系統(tǒng)賬號(hào)弱密碼、亂授權(quán)和系統(tǒng)操作、數(shù)據(jù)填報(bào)不認(rèn)真現(xiàn)象比較普遍。學(xué)校部分網(wǎng)絡(luò)建設(shè)與運(yùn)維服務(wù)采用外包形式,由于承包商的技術(shù)水平和責(zé)任意識(shí)參差不齊[2],并不能完全保障數(shù)據(jù)安全。
2.4 數(shù)據(jù)管理責(zé)任不明確
因缺乏數(shù)據(jù)全生命周期管理,出現(xiàn)數(shù)據(jù)質(zhì)量問題時(shí)無法溯源。并且,由于數(shù)據(jù)交換技術(shù)復(fù)雜,業(yè)務(wù)人員難以進(jìn)行數(shù)據(jù)交換管理操作,無法實(shí)現(xiàn)數(shù)據(jù)“誰產(chǎn)生、誰維護(hù)、誰負(fù)責(zé)”。
3 數(shù)字化改革背景下深化校園數(shù)據(jù)治理思路
以數(shù)字化改革為抓手,全面推進(jìn)學(xué)校治理體系和治理能力的現(xiàn)代化建設(shè),提升校園整體“智治”水平,成為高職院校推動(dòng)“雙高”建設(shè)的一個(gè)重點(diǎn)目標(biāo),其中推動(dòng)校園數(shù)據(jù)治理是實(shí)現(xiàn)該目標(biāo)的一個(gè)重要途徑。本文以我校當(dāng)前的數(shù)據(jù)治理環(huán)境為基礎(chǔ),探索在數(shù)字化改革背景下深化校園數(shù)據(jù)治理的一種思路。
3.1 數(shù)據(jù)確權(quán)
數(shù)據(jù)確權(quán)是大數(shù)據(jù)應(yīng)用和數(shù)據(jù)產(chǎn)業(yè)發(fā)展必須解決的核心問題之一,它針對(duì)不同來源的數(shù)據(jù),以法律形式明確其產(chǎn)權(quán)歸屬,推動(dòng)數(shù)據(jù)整合,加速數(shù)據(jù)共享和流通,從而激活龐大的數(shù)據(jù)資產(chǎn)價(jià)值和創(chuàng)新應(yīng)用,使數(shù)據(jù)產(chǎn)業(yè)得以迅速發(fā)展[3]。數(shù)據(jù)確權(quán)可以解決我校的數(shù)據(jù)管理責(zé)任不明確,無法精確溯源的問題。對(duì)學(xué)校各個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)行摸底排查,并對(duì)學(xué)校的部門組織架構(gòu)、管理機(jī)制、數(shù)據(jù)管理現(xiàn)狀進(jìn)行針對(duì)性調(diào)研了解,確定權(quán)威數(shù)據(jù)來源,建立標(biāo)準(zhǔn)統(tǒng)一、職責(zé)明確、結(jié)構(gòu)清晰的校園數(shù)據(jù)目錄,確保數(shù)據(jù)歸屬責(zé)任明確。
數(shù)據(jù)目錄是數(shù)據(jù)共享和實(shí)現(xiàn)數(shù)據(jù)前后臺(tái)聯(lián)通、業(yè)務(wù)與數(shù)據(jù)管理聯(lián)動(dòng)的載體。對(duì)于我校而言,以目錄的形式,將數(shù)據(jù)按照業(yè)務(wù)屬性或部門歸屬,劃分到各個(gè)目錄中,可以按照目錄對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、監(jiān)測(cè)和溯源,包括資產(chǎn)內(nèi)容、資產(chǎn)質(zhì)量等,如圖1所示。比如,按照部門劃分,可以分為人事處(教師發(fā)展中心)、信息中心(圖書館)、計(jì)劃財(cái)務(wù)處、學(xué)生處(學(xué)生工作部、武裝部)、后勤管理處等部門。
3.2 元數(shù)據(jù)血緣關(guān)系梳理
元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),如數(shù)據(jù)庫的配置、表編目信息等[4]。元數(shù)據(jù)的血緣關(guān)系描述的是一種層次結(jié)構(gòu),即目標(biāo)數(shù)據(jù)來源于哪些源數(shù)據(jù),又生成了哪些子數(shù)據(jù)。血緣關(guān)系的梳理可以為學(xué)校數(shù)據(jù)的合規(guī)性提供驗(yàn)證手段,幫助業(yè)務(wù)部門與 IT 支撐部門實(shí)現(xiàn)信息共享、提升協(xié)調(diào)工作效率。對(duì)學(xué)校各業(yè)務(wù)部門進(jìn)行實(shí)地的走訪調(diào)研,以明確數(shù)據(jù)來源。調(diào)研的內(nèi)容主要包括:(1)各業(yè)務(wù)部門數(shù)據(jù)現(xiàn)狀。了解業(yè)務(wù)部門內(nèi)部數(shù)據(jù)的生產(chǎn)過程、數(shù)據(jù)存放的形式等;(2)數(shù)據(jù)來源。確定本部門、其他部門產(chǎn)生的權(quán)威數(shù)據(jù)以及交叉維護(hù)的數(shù)據(jù);(3)數(shù)據(jù)字典。是否有數(shù)據(jù)字典,信息是否正確完整,電子格式或紙質(zhì)文檔;(4)數(shù)據(jù)交換與共享。對(duì)外提供數(shù)據(jù)面臨的問題、使用其他業(yè)務(wù)部門數(shù)據(jù)面臨的問題;(5)研究數(shù)據(jù)質(zhì)量問題。討論現(xiàn)階段發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量問題,分析原因,討論處理方式;(6)數(shù)據(jù)分析需求。本部門的數(shù)據(jù)分析需求及其他部門對(duì)本部門數(shù)據(jù)的分析需求;(7)可用的數(shù)據(jù)標(biāo)準(zhǔn)資源?,F(xiàn)有系統(tǒng)哪些代碼、元數(shù)據(jù)可以采集引用為校級(jí)標(biāo)準(zhǔn);(8)數(shù)據(jù)質(zhì)量問題。當(dāng)前已經(jīng)明確有哪些數(shù)據(jù)問題,數(shù)據(jù)質(zhì)量檢測(cè)規(guī)則、管理流程和制度。
最后,根據(jù)調(diào)研結(jié)果,確定數(shù)據(jù)血緣關(guān)系表。
3.3 元數(shù)據(jù)治理
元數(shù)據(jù)治理是對(duì)數(shù)據(jù)進(jìn)行采集、清洗及轉(zhuǎn)換,并生成標(biāo)準(zhǔn)化數(shù)據(jù)倉庫的過程,也是數(shù)據(jù)治理的核心步驟。對(duì)全校的所有數(shù)據(jù)進(jìn)行采集,采集的數(shù)據(jù)對(duì)象包括業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù),重要的線下文件中的數(shù)據(jù),來自于網(wǎng)絡(luò)系統(tǒng)的日志數(shù)據(jù)、來自于各物聯(lián)網(wǎng)系統(tǒng)的物聯(lián)網(wǎng)數(shù)據(jù)和來自互聯(lián)網(wǎng)的外部數(shù)據(jù)等。采集完成后,進(jìn)行數(shù)據(jù)質(zhì)量檢查,繼而通過結(jié)構(gòu)化數(shù)據(jù)清洗、轉(zhuǎn)換的手段進(jìn)行數(shù)據(jù)質(zhì)量的提升,并生成標(biāo)準(zhǔn)化數(shù)據(jù)倉庫。
3.3.1 數(shù)據(jù)采集
數(shù)據(jù)采集可以通過批量采集或者已有數(shù)據(jù)導(dǎo)入的方式進(jìn)行,通過 MySQL 數(shù)據(jù)庫進(jìn)行存儲(chǔ)。對(duì)采集后的原始數(shù)據(jù)進(jìn)行識(shí)別理解,從中挑選出有效的數(shù)據(jù)。數(shù)據(jù)識(shí)別完成后,通過配置 ETL 接口的方式,將原始數(shù)據(jù)采集為目標(biāo)數(shù)據(jù)。
3.3.2 數(shù)據(jù)質(zhì)量檢查
數(shù)據(jù)質(zhì)量是保證數(shù)據(jù)應(yīng)用效果的基礎(chǔ)。數(shù)據(jù)質(zhì)量檢查是數(shù)據(jù)治理中的重要一環(huán),是通過數(shù)據(jù)反哺業(yè)務(wù),發(fā)揮數(shù)據(jù)價(jià)值的基石,也是大數(shù)據(jù)建設(shè)的重要前提。設(shè)定質(zhì)量檢查規(guī)則,包括但不限于對(duì)產(chǎn)品對(duì)數(shù)據(jù)資產(chǎn)數(shù)據(jù)空置率、填充率、合規(guī)性、總量、用戶量、數(shù)據(jù)重復(fù)率、數(shù)據(jù)格式驗(yàn)證、數(shù)據(jù)一致性通用數(shù)據(jù)質(zhì)量規(guī)則進(jìn)行自定義配置。通過數(shù)據(jù)質(zhì)量檢查,可以獲得干凈、清晰、完整的數(shù)據(jù)。系統(tǒng)從數(shù)據(jù)使用的角度監(jiān)控?cái)?shù)據(jù)資產(chǎn)的質(zhì)量,并以可視化報(bào)告的形式反映質(zhì)量問題,輔助學(xué)校不斷地提升數(shù)據(jù)質(zhì)量。
3.3.3 數(shù)據(jù)清洗轉(zhuǎn)換
數(shù)據(jù)清洗轉(zhuǎn)換可以解決數(shù)據(jù)中存在的大部分結(jié)構(gòu)性問題和小部分內(nèi)容性問題,從而提升數(shù)據(jù)質(zhì)量,主要是對(duì)原始數(shù)據(jù)中存在的明顯錯(cuò)誤進(jìn)行識(shí)別和處理,包括遺漏值處理、噪音數(shù)據(jù)處理、不一致數(shù)據(jù)處理等內(nèi)容。針對(duì)遺漏值處理,可以采取人工處理或者自動(dòng)處理的方法,當(dāng)發(fā)現(xiàn)一個(gè)記錄的屬性值有遺漏時(shí),通過查找原始的記錄,或者請(qǐng)業(yè)務(wù)專家手工填補(bǔ)所缺失的數(shù)值,以及通過已有的程序自動(dòng)處理。噪音數(shù)據(jù)主要是指錯(cuò)誤數(shù)據(jù)和重復(fù)數(shù)據(jù),可分為內(nèi)噪聲數(shù)據(jù)和外噪聲數(shù)據(jù)。針對(duì)噪音數(shù)據(jù)處理,可根據(jù)整體數(shù)據(jù)的數(shù)據(jù)分布來辨識(shí),并進(jìn)行適當(dāng)處理。
3.3.4 標(biāo)準(zhǔn)化數(shù)據(jù)倉庫
標(biāo)準(zhǔn)化數(shù)據(jù)倉庫用來支持全校的流程服務(wù)、數(shù)據(jù)調(diào)用、交換共享、大數(shù)據(jù)分析、精準(zhǔn)管理、科學(xué)決策等事務(wù)。對(duì)采集的結(jié)構(gòu)化數(shù)據(jù)提供標(biāo)準(zhǔn)化存儲(chǔ)服務(wù)。確保數(shù)據(jù)的組織方式和存儲(chǔ)結(jié)構(gòu)符合學(xué)校的校級(jí)數(shù)據(jù)標(biāo)準(zhǔn)相關(guān)要求。整個(gè)數(shù)據(jù)倉庫的建設(shè)都依照數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行建模分類和格式規(guī)范,生成相應(yīng)的數(shù)據(jù)倉庫表結(jié)構(gòu),通過采集學(xué)校的各種有價(jià)值數(shù)據(jù),按照質(zhì)量要求進(jìn)行清洗治理,按照數(shù)據(jù)標(biāo)準(zhǔn)的格式進(jìn)行建模,利用大數(shù)據(jù)基礎(chǔ)技術(shù)架構(gòu)進(jìn)行存儲(chǔ),從而形成標(biāo)準(zhǔn)化數(shù)據(jù)倉庫。圖2為數(shù)據(jù)治理核心內(nèi)容。
3.4 數(shù)據(jù)安全
數(shù)據(jù)安全管理是指通過技術(shù)手段,對(duì)數(shù)據(jù)的安全進(jìn)行定級(jí),保證數(shù)據(jù)資產(chǎn)使用過程的安全。數(shù)據(jù)安全是數(shù)據(jù)共享、開放的前提,也是數(shù)據(jù)管理的底線。針對(duì)我校數(shù)據(jù)管理存在的安全威脅,按照數(shù)據(jù)安全相關(guān)法律政策的要求和高校實(shí)際的業(yè)務(wù)場(chǎng)景,通過評(píng)估數(shù)據(jù)安全風(fēng)險(xiǎn)、制定數(shù)據(jù)安全管理制度規(guī)范,對(duì)數(shù)據(jù)進(jìn)行安全分級(jí)分類,根據(jù)不同安全等級(jí),對(duì)數(shù)據(jù)定制不同的申請(qǐng)審批和使用策略,全方位地保證數(shù)據(jù)的安全,建立體系化的數(shù)據(jù)保障措施,為充分發(fā)揮數(shù)據(jù)價(jià)值提供安全可靠的環(huán)境,從而保證數(shù)據(jù)被合法合規(guī)、安全地采集、傳輸、存儲(chǔ)和使用。圖3為數(shù)據(jù)安全測(cè)試界面。
4 結(jié)束語
目前,相關(guān)部門高度重視數(shù)字化改革工作,明確提出要建設(shè)網(wǎng)絡(luò)強(qiáng)國、數(shù)字中國,國家“十四五”規(guī)劃專門設(shè)置“加快數(shù)字化發(fā)展建設(shè)數(shù)字中國”章節(jié),并對(duì)加快建設(shè)數(shù)字經(jīng)濟(jì)、數(shù)字社會(huì)、數(shù)字政府,營造良好數(shù)字生態(tài)作出明確部署。數(shù)字化改革也是浙江省近年來的熱點(diǎn)和重點(diǎn)工作,相關(guān)部門對(duì)其高度重視,多次召開數(shù)字化改革工作推進(jìn)會(huì)。在數(shù)字化時(shí)代,深化數(shù)據(jù)治理,對(duì)于支撐高校教學(xué)、科研和管理,推動(dòng)學(xué)校數(shù)字化改革系統(tǒng)迭代、整體提升都起到至關(guān)重要的作用。本文提出的深化校園數(shù)據(jù)治理的解決思路,可以將分散、無序的“碎片化”數(shù)據(jù)轉(zhuǎn)換成有效的資產(chǎn),實(shí)現(xiàn)從無序到關(guān)聯(lián)、從靜態(tài)到動(dòng)態(tài)、從隱性到顯性,從數(shù)據(jù)到價(jià)值的轉(zhuǎn)換。同時(shí),可以加快推動(dòng)數(shù)據(jù)的開放與共享,打破“數(shù)據(jù)孤島”,提升數(shù)據(jù)質(zhì)量,真正助推學(xué)校打造特色鮮明的高水平高職院校。
參考文獻(xiàn):
[1]梁正,吳培熠.數(shù)據(jù)治理的研究現(xiàn)狀及未來展望[ J].陜西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版).2021,50(2):65?71.
[2]呂庚.新時(shí)期下職業(yè)院校數(shù)字化校園安全隱患及應(yīng)對(duì)策略[J].現(xiàn)代職業(yè)教育.2019(36):44?45.
[3]杜振華,茶洪旺.數(shù)據(jù)確權(quán)是大數(shù)據(jù)應(yīng)用的核心[ J].重慶社會(huì)科學(xué),2016(8):21.
[4]程世豪.面向元數(shù)據(jù)血緣關(guān)系的映射技術(shù)及實(shí)現(xiàn)[ D].成都:西南財(cái)經(jīng)大學(xué),2020.
作者簡(jiǎn)介:
葛佳歡(1987—),碩士,研究方向:信息技術(shù)。