俞嘯 袁文濤 金宏飛 萬紅 張立
摘 要:在高??蒲泄芾磉^程中,不斷增長的統(tǒng)計指標和數據量成為影響教師科研數據統(tǒng)計與分析的重要問題,文章利用智能信息處理和數據挖掘方法建立高??蒲谐晒畔⒅悄芙y(tǒng)計分析平臺。一方面,通過系統(tǒng)平臺的構建,統(tǒng)計科研成果信息,提供各種分析報表,為科研工作者和相關管理人員提供實時的科研成果動態(tài)信息。另一方面,將關聯分析算法應用到分析系統(tǒng)中,挖掘出科研成果與影響因素之間的內在的關聯關系,為科學的科研管理和服務方法提供決策支持。
關鍵詞:科研成果;統(tǒng)計管理;智能分析;決策支持
中圖分類號:TP391 文獻標志碼:A 文章編號:2095-2945(2018)29-0085-03
Abstract: In the process of scientific research management in colleges and universities, the increasing statistical indexes and the amount of data have become an important problem that affects the statistics and analysis of teachers' scientific research data. This paper uses intelligent information processing and data mining methods to set up an intelligent statistical analysis platform of scientific research information in colleges and universities. On the one hand, through the construction of the system platform, statistical information of scientific research results, provide a variety of analysis reports, to provide real-time dynamic information of scientific research results for scientific research workers and relevant managers. On the other hand, the association analysis algorithm is applied to the analysis system to find out the internal relationship between the scientific research results and the influencing factors, so as to provide decision support for scientific research management and service methods.
Keywords: scientific research achievements, statistical management, intelligent analysis, decision support
2018年7月24日國務院發(fā)布了《國務院關于優(yōu)化科研管理提升科研績效若干措施的通知》,《通知》中指出要強化科研項目績效評價,實行科研項目績效分類評價,充分調動科研人員積極性,多出高水平成果[1]??蒲谐晒臄盗亢唾|量是衡量高??蒲心芰Φ闹匾笜?,同時也是反映高校綜合校力的標準之一。及時準確的將科研成果信息進行統(tǒng)計分析,對于掌握學校科研發(fā)展現狀,合理制定發(fā)展規(guī)劃,推動科研工作發(fā)展有著重要作用[2]。隨著高校招生規(guī)模和師資力量的擴大,高??蒲谐晒臄祿看蠓黾樱羰褂脗鹘y(tǒng)的半人工方式進行管理和數據分析,不僅會大大增大管理工作復雜程度,而且容易發(fā)生錯誤。面對海量的數據,如何實現科研成果信息高效維護和管理,充分對數據進行整合挖掘并提取有用的信息,進而為高校的科研發(fā)展提供決策支持是當前亟待解決的問題[3]。
針對高??蒲谐晒芾硇实拖碌默F狀,本文提出通過引進高??蒲谐晒芾硐到y(tǒng),提高管理效率,同時加強我國的高??蒲行畔⒒芾斫ㄔO,進而促進我國高??蒲兴降奶岣叩南敕ā@矛F代信息技術搭建高??蒲谐晒畔⒅悄芙y(tǒng)計分析系統(tǒng),實現科研成果的統(tǒng)計、檢索、轉化和管理的統(tǒng)一化標準化。建立以高校科研管理工作中為主導的綜合信息管理平臺,充分發(fā)揮信息技術的優(yōu)勢將云計算、智能信息處理、數據挖掘等技術應用在科研成果的管理和統(tǒng)計分析上來,提高信息的安全性和信息統(tǒng)計分析的準確性高效性,為高校科研管理和相關計劃的制定提供真實有效的依據,具有重要的理論意義及推廣價值。
1 系統(tǒng)分析與研究內容
1.1 數據存儲與服務接口設計
系統(tǒng)需要為各類科研成果數據提供統(tǒng)一的服務標準和接口,在科研成果內容訪問方面需要綜合考慮服務接口的兼容性、有效性和服務效率。要求數據存儲中心能夠滿足服務訪問量和數據存儲邏輯結構的需要,即利用各種手段,為不同種類的科研成果數據建立統(tǒng)一的存儲結構,并提供標準的服務層抽象,建立研究成果信息分析庫,為后續(xù)利用信息、提煉知識、解決問題等應用提供基礎條件。
1.2 系統(tǒng)模塊設計與性能需求
系統(tǒng)的軟件模塊包含用戶信息管理模塊、權限管理模塊、科研人員信息管理模塊,科研成果信息管理模塊(論文、著作、知識產權等),科研項目信息管理模塊等部分組成。為了提高系統(tǒng)的訪問效率和安全性,還需要增加相關的算法模塊,主要包括信息過濾算法模塊、快速搜索算法模塊、隱私保護模塊、關聯分析算法模塊、推薦算法模塊等。在提供科研成果信息管理與查詢服務的同時滿足系統(tǒng)訪問性能的需求。
1.3 感興趣信息推送與科研成果關聯因素分析
依據科研工作者和管理人員的訪問行為構建模型并從成果分析平臺中挖掘出用戶感興趣的信息,針對不同用戶的需求,為用戶提供個性化定制和精確推薦兩種方式。信息定制是主動獲取信息的方式,用戶通客戶端的平臺,向信息綜合服務平臺定制感興趣的信息;精確推薦方式是以用戶訪問的行為為統(tǒng)計分析的基礎,為用戶提供科研成果信息的定期推送服務。采用關聯因素分析算法對科研成果的多種影響因素進行關聯分析,從而更好為科研和管理提供決策支持,采用Apriori算法來提高系統(tǒng)分析的整體性能。
2 系統(tǒng)研發(fā)
2.1 軟件系統(tǒng)研發(fā)
系統(tǒng)的研發(fā)采用開發(fā)平臺是Microsoft Visual Studio 2013,該平臺軟件由微軟公司2010年4月推出,是目前最為流行的平臺開發(fā)軟件,其操作界面簡潔,功能強大,可以實現C、C++、C#、VB、SQLServer 等諸多語言的編程開發(fā)。并且 Microsoft Visual Studio 2013還支持在Windows Server 2012平臺下的創(chuàng)建智能設備應用程序、應用程序、網絡應用程序、網絡服務和Office插件等。
采用WPF(Windows Presentation Foundation)技術完成應用系統(tǒng)界面設計,WPF是由微軟公司發(fā)布的新型的計算機圖形學表現層技術[4],WPF技術是基于.NET的,需要HTML、XML以及Flash等軟件技術和硬件圖形化技術的支持。它為模塊化顯示接口、二維三維圖形開發(fā)、多媒體業(yè)務以及文檔接口提供了統(tǒng)一的描述和操作方法,WPF可以給開發(fā)人員和設計人員提供更優(yōu)良的開發(fā)平臺,用于開發(fā)客戶端應用程序,給用戶創(chuàng)造更優(yōu)的視覺效果。WPF技術的出現使得豐富功能的實現成為可能,其中Windows系統(tǒng)中個性化的半透明效果的窗體是WPF技術的一個具體實例,總體來說,WPF技術的出現使用戶對于視覺沖擊的追求得到滿足。WPF能夠提升終端用戶的體驗質量以及對界面接口的高級需求,采用基于XML的XAML為界面描述語言,便于前臺界面的設計與維護。系統(tǒng)論文信息管理與查詢分析界面如圖1所示。
在數據庫方面,系統(tǒng)采用開源的MySQL數據庫。MySqL的核心數據操作支持多線程編程機制,在線程方面,它是一個輕量級的過程,不僅為用戶提供了靈活性,而且還較少的利用了系統(tǒng)資源[5]。MySqL的內存調配系統(tǒng)基于線程,具備快速和穩(wěn)定的特性,所以可以不間斷使用而不用擔心其穩(wěn)定性,當面對大規(guī)模的數據庫查詢時,MySqL可以提供高效率的的運行支持。MySqL能夠支持有WHERE語句和查詢的SELECT語句的一切函數和操作符。在同一個查詢中,MySqL可以混合并使用不同的數據庫表,并且查詢將變得更加簡單快捷。
2.2 關聯分析算法設計
為了綜合分析各因素對科研成果產出的影響,從而為科研和相關管理工作提供決策支持,需要在科研成果信息統(tǒng)計分析綜合服務平臺中挖掘多個影響因素之間的關聯規(guī)則。挖掘數據中關聯規(guī)則可以抽象為兩個步驟:第一,在數據中挖掘出所有頻繁項集。第二,對頻繁項集進行迭代,尋找同時滿足最小置信度以及最小支持度強關聯規(guī)則。采用Apriori算法[6]分析科研成果相關科研人員、成果數量、研究經歷等信息的關聯模型,挖掘出科研成果與影響因素之間的內在的關聯關系。經過關聯分析后,系統(tǒng)統(tǒng)計的科研人員之間的關聯度結果如圖2所示。
2.3 數據安全設計
科研成果信息管理系統(tǒng)中存在部分科研者隱私相關的信息,系統(tǒng)面向公共網絡開放接口時,需要增加對數據安全的考慮。同時考慮保證數據的私密性和傳輸速度兩個方面的因素,這里采用AES算法對隱私數據進行加密處理。
AES算法主要包含:有限域(GF,28)、有限域上的多項式、有限域上的字節(jié)運算、有限域上的字運算[7]。其中有限域的定義為:結構
圖3所示為AES算法加密過程。解密過程是加密過程的逆過程。這兩個過程使用同一個密鑰,明文P為未經過加密的數據,密鑰K是用來加密明文的密碼。在對稱加密算法中,加密與解密的密鑰相同,為加密者與解密者協(xié)商產生,不可泄露,否則會被攻擊者還原密文。C為經過加密函數處理后的數據。設定AES算法加密函數為E,則C=E(K,P)。P表示明文、K代表密鑰、C是密文。處理過程中,把明文P與密鑰K當作加密函數的輸入,那么加密函數E將會把密文C輸出。同樣,將密文和密鑰作為輸入,經過AES算法解密函數將會得到明文P。
3 結束語
高校科研成果信息智能統(tǒng)計分析系統(tǒng)實現了高??蒲腥藛T科研成果信息的常規(guī)管理操作,利用AES算法保證了數據的安全性,同時利用關聯算法挖掘出科研人員與科研成果間的關聯關系,為學校有關決策部門提供了準確的數據,克服了當前高校各部門間數據交流的障礙,實現了數據的高效共享。實現了科研成果記錄、檢索、轉化、統(tǒng)計分析的智能化,提高了科研管理人員的工作效率,同時對高??蒲谐晒D化具有指導性意義。
參考文獻:
[1]國務院.國務院關于優(yōu)化科研管理提升科研績效若干措施的通知[EB/OL].http://www.gov.cn/zhengce/content/2018-07/24/content_53
08787.htm.2018-07-24.
[2]楊麗英.高校教師科研信息管理系統(tǒng)的設計與實現[D].吉林大學,2016.
[3]周麗琴.高??蒲薪y(tǒng)計信息數字化管理研究——基于江蘇高校的實證研究[J].科技管理研究,2015,35(21):102-106.
[4]趙燕東,涂佳炎,劉圣波,等.基于WPF的糧倉三維激光測繪系統(tǒng)設計與開發(fā)[J].農業(yè)工程學報,2016,32(11):265-270.
[5]康文杰,王勇,俸皓.云平臺中MySQL數據庫高可用性的設計與實現[J].計算機工程與設計,2018,39(01):296-301.
[6]黃文成,賈立,彭道剛,等.基于Apriori的關聯規(guī)則算法及其在電廠中的應用[J].系統(tǒng)仿真學報,2018,30(01):266-271.
[7]崔琦,王思翔,段曉毅,等.一種AES算法的快速模板攻擊方法[J].計算機應用研究,2017,34(06):1801-1804.
[8]陳莊,葉成蔭.基于AES和ECC的云審計數據加密方案[J].計算機科學,2017,44(S1):333-335+371.
[9]張偉.基于ARM的數據加密算法實現[D].南京理工大學,2006.