薛雙
摘 要:信息技術(shù)的持續(xù)創(chuàng)新和廣泛應(yīng)用,推動科學研究進入大數(shù)據(jù)時代,既給高校科學研究管理帶來了新機遇,也提出了新挑戰(zhàn)。新技術(shù)理念的出現(xiàn)需要新的管理思維,通過分析科研數(shù)據(jù)管理出現(xiàn)了哪些新的特征,在充分了解大數(shù)據(jù)管理的基礎(chǔ)上探討在當前環(huán)境下高??蒲泄芾砟J礁镄碌男滤悸?,對未來科研數(shù)據(jù)管理的研究方向做進一步思考。
關(guān)鍵詞:大數(shù)據(jù); 互聯(lián)網(wǎng); 科研數(shù)據(jù)管理
引言
科研數(shù)據(jù)作為對自然,社會現(xiàn)象和科學實驗等活動的定量記錄,是科學技術(shù)發(fā)展的重要基礎(chǔ)??茖W研究和商業(yè)在內(nèi)的各個領(lǐng)域已被推向前所未有的“大數(shù)據(jù)”時代,能夠可視化日益龐大和復雜的數(shù)據(jù),是科學研究必須適應(yīng)的一個新事實。高校作為科研前沿,積累了大量的科研數(shù)據(jù)。如何在如此大量的信息中有效管理科研數(shù)據(jù)是科研管理的重中之重。
1大數(shù)據(jù)時代科研數(shù)據(jù)管理新特征
1.1 形式多樣化
大數(shù)據(jù)時代,科研數(shù)據(jù)的來源不再是單一的文本數(shù)據(jù),而是變成了視頻等各種形式的多媒體數(shù)據(jù)。隨著信息化程度的不斷提高,各種非標準化數(shù)據(jù)的比例會越來越高,傳統(tǒng)的關(guān)系數(shù)據(jù)庫對數(shù)據(jù)結(jié)構(gòu)的一致性要求越來越高,無法處理如此龐大的混合數(shù)據(jù)集。大數(shù)據(jù)技術(shù)將使用更先進的信息技術(shù)對元數(shù)據(jù)進行打包、分類和過濾,以獲得過去未被注意到的細節(jié)和新發(fā)現(xiàn)。例如,新興的分析工具Spark是一個在大數(shù)據(jù)時代快速處理數(shù)據(jù)分析的框架。它易于操作,不需要用戶的任何編碼知識。一些大型軟件供應(yīng)商(如Microsoft和Salesforce)引入了新的分析工具:Microsoft R Server和Lightning CRM平臺,非編碼器也可以創(chuàng)建應(yīng)用程序來查看數(shù)據(jù)。
1.2 重視關(guān)聯(lián)性
在傳統(tǒng)數(shù)據(jù)時代,我們獲得的數(shù)據(jù)少、結(jié)構(gòu)單一。使用傳統(tǒng)的數(shù)學方法,便可以計算出數(shù)據(jù)之間的因果關(guān)系。然而,在大數(shù)據(jù)時代,數(shù)據(jù)體量大,結(jié)構(gòu)復雜。研究人員可以從多個方面,視角和領(lǐng)域分析實驗數(shù)據(jù),并探索研究對象之間的相關(guān)性,而不只是對設(shè)計實驗的癡迷和驗證假設(shè)。當然,關(guān)注關(guān)聯(lián)性并不意味著放棄傳統(tǒng)的因果關(guān)系研究,大數(shù)據(jù)技術(shù)主要處理具有相關(guān)性的過程數(shù)據(jù)。
1.3 預(yù)見新趨勢
傳統(tǒng)的科研小數(shù)據(jù)因果關(guān)系的研究資料非常簡單,實驗結(jié)果因缺乏多元化的數(shù)據(jù)來補充的限制,因此實驗結(jié)果缺乏擴展性和可持續(xù)性。在大數(shù)據(jù)時代,未來形勢的預(yù)測是科研數(shù)據(jù)的最重要的研究。只有不斷補充數(shù)據(jù)和不斷豐富模型,才可以預(yù)測地更準確,為高??茖W研究管理做決策判斷、出臺文件政策提供科學合理的依據(jù)。大學如何使用這些數(shù)據(jù)來產(chǎn)生有價值、有意義的科研成果;如何利用這些數(shù)據(jù)來預(yù)測未來科研發(fā)展方向是一個亟待解決的問題。數(shù)據(jù)挖掘是近十年來信息科學領(lǐng)域備受重視的交叉學科,這門學科興起的因素之一就是能分析過去、指導現(xiàn)在、為未來作決策分析。
2大數(shù)據(jù)情境下科研管理模式革新
2.1完善高??蒲泄芾頂?shù)據(jù)庫
高校應(yīng)該主動迎接大數(shù)據(jù)時代的到來,準確和真實的研究數(shù)據(jù)庫是一個重要的基礎(chǔ)和前提,為實現(xiàn)科研管理的變化。高校和科研院所可整合科研管理系統(tǒng),以方便內(nèi)部科研管理,但仍有待提高許多領(lǐng)域。在不同的高校采用不同制造商的系統(tǒng)將導致不同的科研情況和系統(tǒng)使用情況,以及不同的數(shù)據(jù)準確性之間的數(shù)據(jù)兼容性。今后各科研系統(tǒng)要盡量實現(xiàn)數(shù)據(jù)的標準化,維護人員更新及時、保證數(shù)據(jù)準確性才能推動大數(shù)據(jù)時代建設(shè)科研管理的基礎(chǔ)變革。
2.2構(gòu)建科研數(shù)據(jù)交流與分析平臺
目前,高??蒲泄芾淼臄?shù)據(jù)庫作為科研數(shù)據(jù)的第一手資料,但考慮到數(shù)據(jù)安全與數(shù)據(jù)所有權(quán)益等原因,機構(gòu)內(nèi)的共享平臺,基本未實現(xiàn)開放共享,從而限制了科研數(shù)據(jù)獲取利用。
2.3 可視化應(yīng)用
可視化通過提供統(tǒng)計或交互式視覺表現(xiàn)的軟件系統(tǒng)來幫助人們探索和解釋復雜的數(shù)據(jù),它能有效簡化提煉數(shù)據(jù)流,幫助使用者交互篩選有用數(shù)據(jù)。大數(shù)據(jù)時代的可視化不同于以往,現(xiàn)今主要是基于并行算法設(shè)計技術(shù),高效地處理和分析特定數(shù)據(jù)集的特性,直觀的可視環(huán)境也方便了科研管理人員可從紛雜無序的數(shù)據(jù)中解脫出來,尋找新的研究切入點。多屏顯示可視化環(huán)境通過高速網(wǎng)絡(luò)連接的圖形服務(wù)器驅(qū)動顯示器墻陣列,實現(xiàn)大運算量的并行計算和超高分辨率的顯示的功能,它能從多方面增進研究人員探索的工作效率,促進更好地進行空間思維、促進科研人員之間的溝通。例如:高分辨率的地理航拍圖像是其中一個優(yōu)勢應(yīng)用,基于SAGE環(huán)境下的JuxtaView軟件以及其并行環(huán)境,可快速顯示由多塊高分辨率圖像組成的地理航拍數(shù)據(jù)顯示,目前得到了廣泛應(yīng)用。
2.4 個性化、專業(yè)化服務(wù)
數(shù)據(jù)不僅可以通過被收集,存儲,組織和分析等手段讓研究人員找到研究學科發(fā)展的規(guī)律,捕捉自己的研究方向;也可通過個人終端的研究項目和研究團隊的信息,了解各研究時間和項目的進度;甚至每個研究者的思維態(tài)度,能力和方法都因此而有跡可循??蒲袛?shù)據(jù)管理者可由此及時、準確地為研究者提供所需要的各種資源、指導和幫助,使高??蒲泄芾碚嬲龑崿F(xiàn)精準服務(wù)。
3科研數(shù)據(jù)管理面臨的挑戰(zhàn)
3.1 數(shù)據(jù)計算方法需優(yōu)化
從系統(tǒng)角度看待科研數(shù)據(jù)處理,未來計算的研究方向主要包括以下幾個方面:批量計算主要考慮的是針對典型應(yīng)用進行定制化的性能優(yōu)化,解決數(shù)據(jù)計算中的存儲瓶頸問題;流式計算后續(xù)的研究要設(shè)計并優(yōu)化流式計算中的資源調(diào)度策略,同時實現(xiàn)數(shù)據(jù)流速高時處理速度快和數(shù)據(jù)流速低時能耗低兩個目標。這些計算模式并不是相互獨立的,也可以相互配合,滿足同一應(yīng)用范式在不同階段對數(shù)據(jù)計算結(jié)果的要求。
3.2 專業(yè)人才缺乏
高??蒲泄芾聿块T利用好現(xiàn)在和未來的海量數(shù)據(jù)、海量技術(shù),需要專業(yè)性的數(shù)據(jù)人才,這些專業(yè)人才對科研數(shù)據(jù)資源的成功管理和利用起關(guān)鍵性作用。他們需要具備利用快速變化的網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)技術(shù)的能力,參加相關(guān)的教育和培訓活動,以便使用和管理這些科研數(shù)據(jù)。高校可通過開設(shè)數(shù)據(jù)科學相關(guān)的專業(yè)和課程對科研管理人員進行專業(yè)培養(yǎng),促進數(shù)據(jù)科學理論的發(fā)展,加快人才隊伍的建設(shè)。
3.3 數(shù)據(jù)的安全和隱私問題
信息技術(shù)中,數(shù)據(jù)的安全和隱私一直是重中之重。隨著數(shù)據(jù)量的增大,數(shù)據(jù)面臨更嚴峻的安全風險和威脅,科研管理部門需要制定相應(yīng)的安全訪問策略,確保數(shù)據(jù)訪問的授權(quán)和安全。數(shù)據(jù)的隱私問題包括兩個方面:一是個人隱私的保護,隨著數(shù)據(jù)采集技術(shù)的發(fā)展,在用戶無法察覺的情況下,個人隱私信息可以被更容易地獲取;另一方面,即使得到用戶的許可,個人隱私數(shù)據(jù)在存放、傳輸和使用的過程中,也有被泄露的風險。因此,大數(shù)據(jù)時代的隱私保護或?qū)⒊蔀樾碌拿}。
結(jié)論
大數(shù)據(jù)時代的到來,給高校科研數(shù)據(jù)管理工作帶來了挑戰(zhàn),為順應(yīng)時代發(fā)展,高??蒲袛?shù)據(jù)管理工作必須不斷進行完善。高校需要優(yōu)化數(shù)據(jù)計算方法、加強科研人員隊伍的建設(shè)、提升高校科研發(fā)展水平、對高??蒲袛?shù)據(jù)的安全和隱私問題加強重視并提高相應(yīng)的監(jiān)控手段,更好地促進高校科研數(shù)據(jù)管理工作的發(fā)展。
參考文獻
[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代:生活、工作與思維大變革[M].盛楊燕,周濤譯.杭州:浙江人民大學出版社,2013.
[2]CODATA中國全國委員會.大數(shù)據(jù)時代的科研活動[M].北京:科學出版社,2014.
[3]邢文明,吳方枝,司莉等.高校圖書館開展科研數(shù)據(jù)管理與共享服務(wù)調(diào)查分析[J].圖書館論壇,2013(6):19-25,61.
[4]孟祥保,李愛國.國外高校圖書館科學數(shù)據(jù)素養(yǎng)教育研究[J].大學圖書館學報,2014(3):11-16.
[5]楊鶴林.從數(shù)據(jù)監(jiān)護看美國高校圖書館的機構(gòu)庫建設(shè)新思路——來自 DataStaR 的啟示[J].大學圖書館學報,2012(2):23-28.
[6]李曉輝.圖書館科研數(shù)據(jù)管理與服務(wù)模式探討[J].中國圖書館學報,2011(5):46-52.
[7]唐燕花.高??蒲袛?shù)據(jù)管理服務(wù)實踐研究及建議[J].圖書情報工作,2016(24):130-138.
[8]胡紹君.面向科研數(shù)據(jù)管理的高校學科館員能力建設(shè)研究[J].圖書情報工作,2016(22):74-81.