賈 玥,徐奕卓,李 磊
(1.遼寧師范大學(xué) 科研處;2.大連市第48中學(xué);3.遼寧師范大學(xué) 網(wǎng)絡(luò)信息中心,遼寧 大連 116029)
近年來(lái),隨著互聯(lián)網(wǎng)、云計(jì)算、移動(dòng)通信等技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模不斷擴(kuò)大,形成了海量的數(shù)據(jù)流,大數(shù)據(jù)時(shí)代悄然而至.大數(shù)據(jù)的出現(xiàn),正在引發(fā)全球范圍內(nèi)技術(shù)變革與思維方式的轉(zhuǎn)變.高等院校的科學(xué)研究在提升學(xué)??傮w水平,強(qiáng)大后備力量方面起著重要的作用,是高校職能不可或缺的一部分,而高??蒲泄芾聿块T作為高??蒲泄芾砗头?wù)部門,其管理水平的高低將影響著學(xué)校科研的發(fā)展.隨著高校信息化的推進(jìn),高校各業(yè)務(wù)部門建立并運(yùn)行著管理信息系統(tǒng),但各個(gè)管理信息系統(tǒng)大多獨(dú)立運(yùn)行、數(shù)據(jù)不共享,產(chǎn)生了多個(gè)信息孤島,這給科研管理工作帶來(lái)不便.同時(shí),科研管理信息系統(tǒng)采集眾多數(shù)據(jù),數(shù)據(jù)冗余度高,缺乏有效的挖掘,無(wú)法對(duì)科研評(píng)估及決策制定提供有效支持.隨著大數(shù)據(jù)的發(fā)展,數(shù)據(jù)的有效采集和清洗及數(shù)據(jù)挖掘技術(shù)應(yīng)用于科研管理,必將會(huì)提高科研管理的水平和能力,進(jìn)而促進(jìn)高??蒲泄ぷ鞯慕】蛋l(fā)展.
大數(shù)據(jù),也稱為巨量資料或海量數(shù)據(jù),通過(guò)科學(xué)實(shí)驗(yàn)、測(cè)試、統(tǒng)計(jì)等途徑獲取數(shù)據(jù),并大規(guī)模、長(zhǎng)期的存儲(chǔ)、分析、統(tǒng)計(jì)、測(cè)量這些數(shù)據(jù),并應(yīng)用于實(shí)際地科學(xué)研究、決策、技術(shù)設(shè)計(jì)等方面[1].大數(shù)據(jù)不僅是一種有效的研究方法,也是一種思維創(chuàng)新方式,對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析是它的核心價(jià)值所在[2].數(shù)據(jù)體量大(volumes)、數(shù)據(jù)處理速度快(value)、數(shù)據(jù)類別大且類型多樣(variety)和數(shù)據(jù)真實(shí)性高且密度低(veracity)是大數(shù)據(jù)的四個(gè)基本特征.
隨著信息技術(shù)的發(fā)展,高校日益重視校園信息化建設(shè),各高?!皵?shù)字化校園”逐步完成,部分高校已提出建設(shè)“智慧校園”.目前,高校教務(wù)管理系統(tǒng)、人事管理系統(tǒng)、自動(dòng)化辦公系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、研究生管理系統(tǒng)、科研管理系統(tǒng)等投入使用.高??蒲泄芾硐到y(tǒng)的使用方便了科研管理人員的的管理工作,但隨著科研項(xiàng)目的增加,科研數(shù)據(jù)量的不斷增加,科研管理系統(tǒng)無(wú)法滿足科研管理人員的需求,主要表現(xiàn)在:
首先,科研管理系統(tǒng)無(wú)法與校內(nèi)其他部門系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)共享.目前,大多數(shù)高??蒲泄芾硐到y(tǒng)是獨(dú)立運(yùn)行的系統(tǒng),無(wú)法與校內(nèi)人事管理系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、自動(dòng)化辦公系統(tǒng)、研究生系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)共享,這就導(dǎo)致科研管理部門需要定期從校內(nèi)這些管理系統(tǒng)平臺(tái)導(dǎo)入所需的數(shù)據(jù),如從人事系統(tǒng)中導(dǎo)入新入職教工基本信息、財(cái)務(wù)管理系統(tǒng)中導(dǎo)入科研項(xiàng)目經(jīng)費(fèi)信息、研究生管理系統(tǒng)中導(dǎo)入研究生參與項(xiàng)目情況及發(fā)表成果情況等.無(wú)法實(shí)現(xiàn)數(shù)據(jù)共享,一方面科研管理人員無(wú)法實(shí)時(shí)掌握數(shù)據(jù)變化,另一方面數(shù)據(jù)導(dǎo)入導(dǎo)出數(shù)據(jù)準(zhǔn)確度減低且增加科研管理人員的工作量.
其次,科研管理系統(tǒng)“重?cái)?shù)據(jù)量、輕數(shù)據(jù)展示”.高校科研管理系統(tǒng)主要功能為:科研項(xiàng)目、科研成果、科研經(jīng)費(fèi)的錄入、修改等;簡(jiǎn)單的多條件數(shù)據(jù)查詢;生成報(bào)表等.科研管理系統(tǒng)對(duì)數(shù)據(jù)統(tǒng)計(jì)結(jié)果通常以Excel表格形式展示,展示形式比較單一,數(shù)據(jù)量較多時(shí)展示效果不直觀,缺乏人性化顯示.
第三,科研管理系統(tǒng)缺乏輔助決策功能.目前,科研管理系統(tǒng)積累了大量的原始數(shù)據(jù),但對(duì)數(shù)據(jù)的利用只是簡(jiǎn)單的查詢和統(tǒng),缺乏對(duì)數(shù)據(jù)內(nèi)在信息的挖掘和分析,無(wú)法給科研管理人員和校內(nèi)更高層次的管理人員提供決策支持.
將大數(shù)據(jù)引入高校科研管理,通過(guò)數(shù)據(jù)采集、清洗、挖掘等技術(shù)可以對(duì)校內(nèi)多個(gè)信息系統(tǒng)中數(shù)據(jù)進(jìn)行處理,通過(guò)準(zhǔn)確采集各信息系統(tǒng)中的數(shù)據(jù),保證數(shù)據(jù)的全面性;通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理,分析科研數(shù)據(jù)間的相關(guān)性,可挖掘出數(shù)據(jù)中隱藏的信息,進(jìn)而將有價(jià)值的信息提取出來(lái),從而為高??蒲泄芾頉Q策提供更有價(jià)值的數(shù)據(jù)參考和信息支持[3].
Kettle是一款國(guó)外開源的ETL工具,純java編寫,可以在 Window、Linux、Unix 上運(yùn)行,允許不同數(shù)據(jù)庫(kù)的數(shù)據(jù)同步,數(shù)據(jù)處理高效穩(wěn)定.高校科研管理數(shù)據(jù)不僅涉及本校各個(gè)職能部門,還涉及上級(jí)管理機(jī)構(gòu).對(duì)于校內(nèi)職能部門之間數(shù)據(jù)同步,可以采用spoon程序調(diào)度方式,定時(shí)調(diào)度不同部門間數(shù)據(jù)同步作業(yè),為提高同步效率,可設(shè)定不同時(shí)間點(diǎn)同步不同部門間的數(shù)據(jù),如設(shè)定每天24:00同步人事管理系統(tǒng)中人員信息,每天2:00同步財(cái)務(wù)管理系統(tǒng)中項(xiàng)目經(jīng)費(fèi)信息等.不同上級(jí)管理機(jī)構(gòu)所需要的數(shù)據(jù),通常數(shù)據(jù)項(xiàng)和數(shù)據(jù)類型不同、可采用kettle工具配置上級(jí)管理機(jī)構(gòu)所需數(shù)據(jù)的導(dǎo)入導(dǎo)出過(guò)程,需要提交數(shù)據(jù)時(shí)利用圖形化界面操作即可所需數(shù)據(jù).
科研數(shù)據(jù)往往通過(guò)Excel表格展示,數(shù)據(jù)展示比較單一,為了更人性化的展示科研數(shù)據(jù),可以利用Python庫(kù)繪制3D柱狀圖、3D直方圖等.
現(xiàn)今,高校科研管理人員普遍“重申請(qǐng)、輕結(jié)題”,忽視對(duì)項(xiàng)目過(guò)程的管理,導(dǎo)致部分項(xiàng)目在約定年限內(nèi)不能完成或突擊倉(cāng)促完成,完成質(zhì)量不高.引入項(xiàng)目管理思想[4],對(duì)項(xiàng)目從立項(xiàng)到結(jié)題利用信息化手段實(shí)現(xiàn)全過(guò)程的管理.項(xiàng)目申報(bào)、項(xiàng)目批準(zhǔn)、項(xiàng)目經(jīng)費(fèi)管理、項(xiàng)目中級(jí)檢查,項(xiàng)目變更、項(xiàng)目成果錄入等過(guò)程均需要網(wǎng)絡(luò)提交和審批,這樣既可以減少人為處理項(xiàng)目帶來(lái)的誤操作,又能提高工作效率.科研管理人員定期通過(guò)系統(tǒng)報(bào)表可以直觀的看出各個(gè)項(xiàng)目的完成情況,對(duì)于進(jìn)展緩慢的項(xiàng)目可提醒項(xiàng)目組成員.
高??蒲袛?shù)據(jù)不斷積累,數(shù)據(jù)量巨大,可利用大數(shù)據(jù)數(shù)據(jù)挖掘技術(shù)挖掘出有用的信息,為科研評(píng)估及決策提供有效的支持[5].數(shù)據(jù)挖掘過(guò)程首先是采集校內(nèi)外數(shù)據(jù),通過(guò)采集校內(nèi)所有信息系統(tǒng)中科研數(shù)據(jù)信息及科研相關(guān)的信息,如從人事系統(tǒng)中獲取教職工個(gè)人基本信息,研究生系統(tǒng)中采集導(dǎo)師信息、所帶研究生信息及研究生發(fā)表的研究成果等,財(cái)務(wù)管理系統(tǒng)中采集項(xiàng)目到賬及支出情況等,收集校外信息,如兄弟院??蒲许?xiàng)目及成果數(shù)量等;第二步數(shù)據(jù)清洗,主要包括檢查數(shù)據(jù)一致性、處理無(wú)效值和缺失值等;第三步,進(jìn)行數(shù)據(jù)挖掘,主要方法有:關(guān)聯(lián)規(guī)則分析,如可通過(guò)關(guān)聯(lián)分析分析教職工申報(bào)項(xiàng)目成功的相關(guān)因素,聚類分析,如可聚類分析兄弟院校的成果評(píng)價(jià)表得出更科學(xué)更適合本校的成果評(píng)估標(biāo)準(zhǔn).
隨著信息化技術(shù)日漸成熟,數(shù)據(jù)積累能力的不斷提升,大數(shù)據(jù)及其分析技術(shù)在電子商務(wù)、政府決策、金融管理、市場(chǎng)分析等方面被廣泛應(yīng)用.把大數(shù)據(jù)分析技術(shù)應(yīng)用于高??蒲泄芾眍I(lǐng)域,對(duì)進(jìn)一步完善高校管理體制、科研平臺(tái)建設(shè)與管理、項(xiàng)目管理、經(jīng)費(fèi)管理、成果及知識(shí)產(chǎn)權(quán)等方面工作發(fā)揮著重要作用.同時(shí),大數(shù)據(jù)分析能夠可觀的反映高校在科研管理工作中存在的問(wèn)題,為高校科研工作進(jìn)一步發(fā)展提供重要的技術(shù)支持.
參考文獻(xiàn):
〔1〕胡德維.大數(shù)據(jù)“革命”教育[N].光明日?qǐng)?bào),2013-10-19(5).
〔2〕維克托·邁爾·舍恩伯格.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2012.
〔3〕譚建豪.數(shù)據(jù)挖掘技術(shù)[M].北京:中國(guó)水利水電出版社,2009.
〔4〕彭劍鋒.戰(zhàn)略人力資源管理理論、實(shí)踐與前沿[M].北京:中國(guó)人民大學(xué)出版社,2014.
〔5〕王鳴.科研管理信息系統(tǒng)的數(shù)據(jù)挖掘應(yīng)用探討[J].瓊州學(xué)院學(xué)報(bào),2014,2(20):152-153.
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2018年3期