張靜 劉危 楊兵 單文波
摘? 要:隨著我國“雙一流”建設(shè)的開展,學(xué)科建設(shè)的基礎(chǔ)地位愈發(fā)突顯,但傳統(tǒng)建設(shè)方法在新形勢下面臨嚴(yán)峻挑戰(zhàn),無法為“雙一流”建設(shè)提供長期有效指導(dǎo)。大數(shù)據(jù)分析具有善于處理大量、異構(gòu)、多變、關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢,利用數(shù)據(jù)挖掘、可視化分析等技術(shù)可以在精準(zhǔn)掌握教育數(shù)據(jù),合理配置教育資源,跟蹤監(jiān)測學(xué)科建設(shè)績效,預(yù)測學(xué)科發(fā)展趨勢,預(yù)警危機(jī)專業(yè)等方面發(fā)揮積極作用。
關(guān)鍵詞:大數(shù)據(jù)分析;學(xué)科建設(shè);預(yù)警;績效評估
中圖分類號:G640 文獻(xiàn)標(biāo)志碼:A 文章編號:2096-000X(2019)05-0001-05
Abstract: As China's "Double First-class" initiative operates, discipline construction is increasingly demonstrating its fundamental role. However, new circumstances have posed a severe challenge for traditional construction ways which fail to provide effective and long-term guidance to "Double First-class" construction. The big data analysis, if introduced in discipline construction, which enjoys its efficiency in handling numerous, heterogeneous, variable and associated data, can play a positive role in a view of the overall discipline construction, more scientific evaluation of performance in discipline construction, early warning of disciplines in crisis and provision of convenient service to collaborative innovation of "government, industry, study, research and practice". In the meantime, more efforts should be made to ensure big data security when they are extracted, applied, saved and released, and to improve the level and capacity of data used in decisions.
Keywords: big data analysis; discipline construction; early warning; evaluation of performance
2015年國務(wù)院印發(fā)的《統(tǒng)籌推進(jìn)世界一流大學(xué)和一流學(xué)科建設(shè)總體方案》(以下簡稱《方案》)中指出:建設(shè)世界一流大學(xué)和一流學(xué)科,是黨中央、國務(wù)院作出的重大戰(zhàn)略決策,對于提升我國教育發(fā)展水平、增強(qiáng)國家核心競爭力、奠定長遠(yuǎn)發(fā)展基礎(chǔ),具有十分重要的意義。[1]《方案》指明了學(xué)科建設(shè)與教育發(fā)展、國家進(jìn)步的關(guān)系。學(xué)科是“雙一流”建設(shè)的基礎(chǔ),辦大學(xué)就是辦學(xué)科。隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,使得用大數(shù)據(jù)分析描述學(xué)科建設(shè)動態(tài)、預(yù)測學(xué)科發(fā)展趨勢、為頂層決策機(jī)構(gòu)提供決策支持成為可能,因此,應(yīng)盡早搭建為學(xué)科建設(shè)服務(wù)的大數(shù)據(jù)分析平臺,為加快推進(jìn)我國雙一流建設(shè)及教育現(xiàn)代化提供決策支持。
一、當(dāng)前學(xué)科建設(shè)存在的問題
廣義學(xué)科建設(shè)的內(nèi)涵包括結(jié)構(gòu)性要素和功能性要素。結(jié)構(gòu)性要素包括凝練學(xué)科方向、匯聚學(xué)科隊伍、搭建學(xué)科平臺;功能性要素包括人才培養(yǎng)、科學(xué)研究和社會服務(wù)。[2]
當(dāng)前學(xué)科建設(shè)的主要問題包括:
第一,學(xué)科布局和結(jié)構(gòu)不合理,學(xué)位授予點(diǎn)并不能完全反映社會需求和科學(xué)技術(shù)的發(fā)展[3],學(xué)位點(diǎn)、科研基地的建設(shè)存在功利性、盲目性。據(jù)麥可思研究院近年來發(fā)布的《中國大學(xué)生就業(yè)報告》報道,生物工程、法學(xué)、歷史、英語、美術(shù)、體育等專業(yè)已連續(xù)幾年成為就業(yè)榜上的紅牌專業(yè)。曾幾何時,社會上流傳著“21世紀(jì)是生物學(xué)的世紀(jì)”的說法,可生物學(xué)近年來的就業(yè)率卻頻頻下降,甚至淪為十大較低就業(yè)率專業(yè)首位。培養(yǎng)目標(biāo)的趨同化致使高校校際間生物工程學(xué)科專業(yè)畢業(yè)生差異性不大、競爭力不明顯,導(dǎo)致學(xué)生“功能性、結(jié)構(gòu)性失業(yè)”現(xiàn)象加劇。不僅生物專業(yè),經(jīng)歷了十余年擴(kuò)張后表現(xiàn)出明顯的頹靡、萎縮之勢的專業(yè)不在少數(shù)。然而這些專業(yè)的招生人數(shù)、辦學(xué)規(guī)模、學(xué)位授予點(diǎn)卻在不斷增加,暴露出我國學(xué)科建設(shè)中存在盲目追求指標(biāo)和規(guī)模,卻忽視人才培養(yǎng)與市場需求相結(jié)合的規(guī)律的現(xiàn)象,而這直接關(guān)系到高等教育的質(zhì)量及教育資源的合理配置。鄰國日本的例子更是前車之鑒。據(jù)日本《朝日新聞》報道:截至2017年7月日本停辦或準(zhǔn)備停止招收法律碩士的高校多達(dá)36所,其中不乏新瀉大學(xué)、立教大學(xué)、京都產(chǎn)業(yè)大學(xué)這樣一些知名高校。而導(dǎo)致這些學(xué)校的法律碩士集體停辦的一個重要原因就是政府決策的失誤。2002年政府預(yù)計律師的需求量會加大,于是放寬了律師考試合格率的限制,并加大對法律碩士培養(yǎng)的投資力度,一些院校紛紛開辦法律碩士點(diǎn),但是事與愿違,律師的需求量并沒有增加反而減少了,再加之攻讀法律碩士的學(xué)費(fèi)比較高昂,一時之間法律碩士成了無人問津的專業(yè),一些院校因為招不到生源而無奈之下停辦[4]。給學(xué)校和政府造成巨大損失。
造成人才培養(yǎng)與市場需求不相適應(yīng)的一個主要原因在于:目前的學(xué)科建設(shè)方法尚不支持前瞻性決策。由于教育數(shù)據(jù)沒有與政治、經(jīng)濟(jì)、社會領(lǐng)域的數(shù)據(jù)對接,因此無法在同一平臺對這些數(shù)據(jù)流進(jìn)行整合分析,動態(tài)觀察教育與政治、經(jīng)濟(jì)、社會發(fā)展之間的聯(lián)動關(guān)系,使決策層不便于高屋建瓴,做出前瞻性決策。師資培養(yǎng)和引進(jìn),學(xué)生的教育與培養(yǎng)都具有周期性,一旦發(fā)現(xiàn)專業(yè)設(shè)置或?qū)W科建設(shè)中的不合理問題,可能已無法在短期內(nèi)消除,而這對于學(xué)校、教師和學(xué)生本人而言都得不償失。學(xué)科建設(shè)需要更具時效性、更有洞見性的分析工具,以實現(xiàn)前瞻性規(guī)劃。
第二,學(xué)科建設(shè)績效評估體制不完善,導(dǎo)致學(xué)科建設(shè)在培育人才、服務(wù)社會方面的價值難以量化。導(dǎo)致這些問題的原因主要有:第一,績效評價方法上存在局限性。目前學(xué)科建設(shè)績效評價的方法主要分為兩類:一是指標(biāo)權(quán)重賦權(quán)法,二是數(shù)據(jù)包絡(luò)分析法。指標(biāo)權(quán)重分析法的缺點(diǎn)在于:受主觀因素的影響較大,結(jié)論的科學(xué)性受到影響。而數(shù)據(jù)包絡(luò)分析法的問題在于:所選取的樣本量太少,使得求得的效益前沿面不夠科學(xué),必然會影響到對學(xué)科建設(shè)績效是否有效的評價。[5]第二,由于評估方法的局限,導(dǎo)致評估結(jié)果只能從靜態(tài)上反映出當(dāng)前學(xué)科建設(shè)的水平,不能預(yù)測學(xué)科建設(shè)的動態(tài)發(fā)展。第三,目前的學(xué)科績效評估只聚焦于學(xué)科,學(xué)科之外的信息被忽視,導(dǎo)致對學(xué)科的社會價值的漠視。因此學(xué)科外延審視的缺失影響了學(xué)科的社會價值計量。[6]
第三,“產(chǎn)學(xué)研”協(xié)同創(chuàng)新不夠,缺乏統(tǒng)籌協(xié)調(diào)機(jī)制,科研成果轉(zhuǎn)化率低等問題,也是當(dāng)前我國學(xué)科建設(shè)中存在的突出問題。首先,政府在產(chǎn)學(xué)研用結(jié)合中的組織協(xié)調(diào)功能發(fā)揮不夠,政府的服務(wù)機(jī)構(gòu)不健全、服務(wù)水平有待提高。[7]其次,科技人員視野受限,創(chuàng)新能力不高,無法適應(yīng)經(jīng)濟(jì)社會發(fā)展的重大需求,創(chuàng)新效率低下,高校人才隊伍建設(shè)與協(xié)同創(chuàng)新要求不相適應(yīng)。[8]
二、學(xué)科建設(shè)中應(yīng)用大數(shù)據(jù)分析的必要性及可行性
(一)大數(shù)據(jù)分析應(yīng)用于學(xué)科建設(shè)的必要性
針對以上學(xué)科建設(shè)中存在的問題,穩(wěn)步推進(jìn)一流大學(xué)和一流學(xué)科建設(shè),實現(xiàn)“中國特色,世界一流”,必須對學(xué)科建設(shè)進(jìn)行前瞻性研究。目前教育決策大多基于事后研判,事后研判固然必要,但對于學(xué)科建設(shè)總體而言,前瞻性的規(guī)劃,對于風(fēng)險管控和優(yōu)化人才培養(yǎng)質(zhì)量和科研產(chǎn)出效率,都有著積極意義。盡可能發(fā)揮科學(xué)研究的領(lǐng)頭羊作用,從而帶動社會政治經(jīng)濟(jì)的發(fā)展,并根據(jù)社會政治經(jīng)濟(jì)發(fā)展和人才需求,適時調(diào)整人才培養(yǎng)規(guī)格、目標(biāo)和課程體系,就要研究學(xué)科建設(shè)的規(guī)律,影響學(xué)科建設(shè)效率的重要因素,學(xué)科建設(shè)和經(jīng)濟(jì)社會發(fā)展之間的關(guān)系,人才培養(yǎng)和社會需求之間的關(guān)系等等,這些研究必然牽涉到政治、經(jīng)濟(jì)、教育、人口、環(huán)境等一系列海量、高速、類型多樣的數(shù)據(jù)流,僅用現(xiàn)有的數(shù)據(jù)庫難以實現(xiàn)前瞻性的設(shè)計,只有通過大數(shù)據(jù)分析才能獲取更多智能的、深入的、有價值的信息。大數(shù)據(jù)分析能用適當(dāng)?shù)慕y(tǒng)計方法對海量、高速、類型多樣的數(shù)據(jù)進(jìn)行整合與分析,從中提取有用信息并加以研究和概括之后形成知識,以指導(dǎo)決策?!斗桨浮芬螅阂灾蝿?chuàng)新驅(qū)動發(fā)展戰(zhàn)略、服務(wù)經(jīng)濟(jì)社會發(fā)展為導(dǎo)向,優(yōu)化學(xué)科結(jié)構(gòu),強(qiáng)化目標(biāo)管理,突出建設(shè)實效,加快高等教育治理體系和治理能力現(xiàn)代化[9]?!斗桨浮分该髁藢W(xué)科建設(shè)與經(jīng)濟(jì)社會發(fā)展的內(nèi)在聯(lián)系,要實現(xiàn)《方案》的總體目標(biāo),必須加快大數(shù)據(jù)分析在學(xué)科建設(shè)方面的應(yīng)用,以適應(yīng)“雙一流”建設(shè)以及國家中長期改革和發(fā)展的需要。
(二)大數(shù)據(jù)分析應(yīng)用于學(xué)科建設(shè)的可行性
隨著云存儲、云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動終端等信息技術(shù)的飛速發(fā)展,使得大數(shù)據(jù)分析成為可能。大數(shù)據(jù)分析能夠通過對歷史數(shù)據(jù)的分析和挖掘,科學(xué)總結(jié)與發(fā)現(xiàn)其中蘊(yùn)藏的規(guī)律和模式,并結(jié)合源源不斷的動態(tài)流式數(shù)據(jù)去預(yù)測事物未來的發(fā)展趨勢。[10]這讓越來越多的組織認(rèn)識到大數(shù)據(jù)的價值。美國普渡大學(xué)的Course Signals系統(tǒng)利用數(shù)據(jù)量化和監(jiān)測學(xué)生的學(xué)習(xí)狀態(tài),其數(shù)據(jù)來源包括課程考試分?jǐn)?shù)、排名、學(xué)術(shù)經(jīng)歷以及學(xué)生與學(xué)習(xí)管理系統(tǒng)LMS的互動情況,預(yù)測學(xué)生在一門課程學(xué)習(xí)中的表現(xiàn)。2012年美國國家教育部發(fā)布了《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報告,對美國國內(nèi)大數(shù)據(jù)教育應(yīng)用領(lǐng)域和案例,以及應(yīng)用實施所面臨的挑戰(zhàn)進(jìn)行了詳細(xì)介紹。2013年1月,德克薩斯大學(xué)(UT)推出SAS的可視化分析VA,VA為德克薩斯大學(xué)提供了對于學(xué)術(shù)界的更敏銳的洞見,現(xiàn)在員工們能夠很容易就看到不同學(xué)院、不同系及課程計劃等廣泛層面的學(xué)術(shù)測算指標(biāo)。這些信息幫助UT能夠做出更好的決策[11]。加州大學(xué)同樣致力于教育數(shù)據(jù)分析。他們積累有關(guān)本科生學(xué)習(xí)狀況、學(xué)習(xí)經(jīng)歷的調(diào)查數(shù)據(jù),已經(jīng)有15年之久,涉及加州大學(xué)10個分校中的9所;他們還能通過互聯(lián)網(wǎng),從覆蓋美國所有高校96%的數(shù)據(jù)庫中提取學(xué)生入學(xué)前及入學(xué)后的相關(guān)數(shù)據(jù),做相關(guān)性分析、趨勢展望和政策建議[12]。2015年是中國的教育大數(shù)據(jù)元年,國內(nèi)開始對大數(shù)據(jù)分析在教育領(lǐng)域的應(yīng)用展開了理論研究,而實證研究則剛剛起步。2017年3月20日——21日“教育大數(shù)據(jù)應(yīng)用技術(shù)”國際學(xué)術(shù)研討會在華東師范大學(xué)舉行。會議精神認(rèn)為:教育大數(shù)據(jù)將重構(gòu)教育生態(tài)系統(tǒng),宏觀層面為教育決策提供科學(xué)依據(jù),中觀層面推進(jìn)教學(xué)管理和評價的創(chuàng)新實踐,微觀層面為個性化教學(xué)提供精準(zhǔn)支持。[13]趙慧瓊,姜強(qiáng),趙蔚,李勇帆,趙艷的《基于大數(shù)據(jù)學(xué)習(xí)分析的在線學(xué)習(xí)績效預(yù)警因素及干預(yù)對策的實證研究》表明:學(xué)習(xí)分析技術(shù)可以將大量學(xué)生數(shù)據(jù)轉(zhuǎn)換成有價值的教學(xué)信息,通過對最終分析結(jié)果的可視化展示,能夠發(fā)現(xiàn)影響學(xué)生學(xué)習(xí)成績的關(guān)鍵因素,識別可能存在學(xué)習(xí)危機(jī)的學(xué)生,從而為進(jìn)行學(xué)業(yè)預(yù)警、教學(xué)干預(yù)、教學(xué)決策等服務(wù)提供有力支持。[14]盡管目前國內(nèi)外已有將大數(shù)據(jù)分析應(yīng)用于教育領(lǐng)域的理論研究,大數(shù)據(jù)分析支持下的預(yù)警系統(tǒng)設(shè)計的可行性也已被證實,但是國內(nèi)的教育大數(shù)據(jù)分析多集中在學(xué)習(xí)分析,對于大數(shù)據(jù)分析在科學(xué)建設(shè)領(lǐng)域的應(yīng)用研究還沒有。
本文將就大數(shù)據(jù)分析在學(xué)科建設(shè)中的應(yīng)用及其作用進(jìn)行分析和展望,旨在為高校學(xué)科建設(shè)提供有益的參考。
三、如何將大數(shù)據(jù)分析應(yīng)用于學(xué)科建設(shè)
大數(shù)據(jù)分析普遍應(yīng)用的方法有可視化分析、數(shù)據(jù)挖掘、預(yù)測分析等??梢暬钦故緮?shù)據(jù)的一種方式,可視化能夠直觀地呈現(xiàn)大數(shù)據(jù)特點(diǎn),同時能夠非常容易被讀者所接受,具有良好的交互性,就如同看圖說話一樣簡單明了。數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際數(shù)據(jù)中,提取隱含其內(nèi)的、人們事先所不知的、但又具有潛在價值的信息和知識的過程。如果說可視化是給人看的,那么數(shù)據(jù)挖掘就是給機(jī)器看的。數(shù)據(jù)的挖掘首先是搜集數(shù)據(jù),數(shù)據(jù)越豐富越好,數(shù)據(jù)量越大越好,只有獲得足夠的高質(zhì)量的數(shù)據(jù),才能獲得準(zhǔn)確的判斷,才能產(chǎn)生認(rèn)知模型[15]。數(shù)據(jù)挖掘是數(shù)據(jù)“模型”的發(fā)現(xiàn)過程,而機(jī)器學(xué)習(xí)是建模的重要方法之一。機(jī)器學(xué)習(xí)的過程是:將一些已知的并已被成功解決的問題作為范例輸入計算機(jī),機(jī)器通過學(xué)習(xí)范例,總結(jié)并歸納具有通用性的規(guī)則[16]。預(yù)測分析是根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出預(yù)測性的判斷。只要在大數(shù)據(jù)中挖掘出信息的特點(diǎn)與聯(lián)系,就可以建立科學(xué)的數(shù)據(jù)模型,通過模型輸入新的數(shù)據(jù),從而預(yù)測未來的數(shù)據(jù)[17]。
利用上述技術(shù),第一可以分析學(xué)科建設(shè)規(guī)律,找到制約學(xué)科建設(shè)和發(fā)展的因素,從而合理配置資源;第二可以預(yù)警危機(jī)專業(yè),控制人才培養(yǎng)的規(guī)模和數(shù)量,對于可能出現(xiàn)人才過剩的專業(yè),逐步放緩招生人數(shù)和師資的培養(yǎng);而對于可能出現(xiàn)人才緊缺的專業(yè),則適度增加人才培養(yǎng)的數(shù)量和師資的培養(yǎng)。將損失控制到最低。
基于上述的各類大數(shù)據(jù)分析技術(shù),結(jié)合學(xué)科建設(shè)特點(diǎn),構(gòu)建了如圖1所示的總體應(yīng)用框架。
首先,整合數(shù)據(jù)源,搭建“教育大數(shù)據(jù)平臺”。抽取教育部高教司、學(xué)位辦、科技司、社科司、教育部直屬單位、全國哲學(xué)社會科學(xué)規(guī)劃辦公室、國家自然科學(xué)基金委員會、各省市級教育主管部門、科研團(tuán)體、校級教學(xué)科研主管部門等的相關(guān)數(shù)據(jù)作為數(shù)據(jù)源。對數(shù)據(jù)源進(jìn)行處理面臨兩個問題,一是除了結(jié)構(gòu)化數(shù)據(jù)以外,還要將圖像、視頻、課件等非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)也整合進(jìn)來,這對數(shù)據(jù)關(guān)聯(lián)的發(fā)現(xiàn)提出了挑戰(zhàn)。二是現(xiàn)有教育數(shù)據(jù)分屬不同的部門管理,存在信息孤島現(xiàn)象。因此需要通過數(shù)據(jù)融合技術(shù),對這些結(jié)構(gòu)相異、定義多樣的數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,使其成為統(tǒng)一的語義學(xué)結(jié)構(gòu),在這種結(jié)構(gòu)下,將數(shù)據(jù)分解為少量但統(tǒng)一的基本元素。這些基本元素包括:組織、人、物(包括錢)、關(guān)系、場所、動作、條件、事件、時間等。經(jīng)過語義學(xué)分解之后,不同數(shù)據(jù)源的數(shù)據(jù)就具備了初步的一致性和相似性[18]。然后,通過人為設(shè)定的規(guī)則體系或人工智能和機(jī)器學(xué)習(xí)的方式,判斷不同數(shù)據(jù)源之間的聯(lián)系,如一個國家級項目的主持人同時也可以是一個省級項目的主持人、一篇權(quán)威期刊的作者、一門在線精品課的主講人、一所高校的教師,某院、系或者科研院所也可能是國家級重點(diǎn)實驗室或基地,某著作或論文可能是某個或幾個項目的科研成果等。經(jīng)過這些步驟,“教育大數(shù)據(jù)平臺”就基本形成了。
在此基礎(chǔ)上,就可以對整個學(xué)科建設(shè)的運(yùn)行情況進(jìn)行分析了。比如,可以分析高等教育司某項改革措施或建設(shè)工程所造成的影響,某一學(xué)科專業(yè)的人才流向,交叉學(xué)科的發(fā)展態(tài)勢等等,可以根據(jù)組織者的要求選擇不同“維度、顆粒度和路徑”的分析,數(shù)據(jù)越多、質(zhì)量越高,就越有利于建立模型,從錯綜復(fù)雜的數(shù)據(jù)中找到學(xué)科發(fā)展的規(guī)律。這就要用到前面提到的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)。通過研究算法,讓機(jī)器在數(shù)據(jù)中查找制約學(xué)科建設(shè)的關(guān)鍵因素,并利用可視化,幫助決策層創(chuàng)建一個描述狀況的共享視圖,對學(xué)科建設(shè)中存在的問題本質(zhì)獲取更多洞見,并對需要采取的措施達(dá)成共識。
機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘除了可以幫助決策層掌握學(xué)科建設(shè)的發(fā)展規(guī)律,還可以設(shè)計算法將學(xué)科建設(shè)績效與資源配置聯(lián)動起來。根據(jù)組織者關(guān)于學(xué)科建設(shè)績效評價的目的、范圍、周期等,確定績效考核方案,在此基礎(chǔ)上設(shè)計資源配置方案,聯(lián)動考核結(jié)果與資源配置。構(gòu)建以師資隊伍和科研團(tuán)隊、科研成果水平、人才培養(yǎng)質(zhì)量、社會服務(wù)與文化傳承等多維數(shù)據(jù)為核心的績效考核模型,為學(xué)科建設(shè)績效和資源配置提供技術(shù)支持。
另外,根據(jù)可視化分析和數(shù)據(jù)挖掘得到的學(xué)科建設(shè)規(guī)律,可以進(jìn)一步作出預(yù)測性分析,預(yù)警危機(jī)專業(yè)就是預(yù)測分析的一個重要運(yùn)用。傳統(tǒng)分析方法是對已經(jīng)發(fā)生的事件進(jìn)行分析,屬于事后研判,而在大數(shù)據(jù)中,可以通過建立的數(shù)據(jù)模型,建立一個“智能全景模擬器”,這個模擬器可以幫助我們模擬各種政策和項目工程對整個學(xué)科建設(shè)及其各個局部的影響,對可能發(fā)生的事件進(jìn)行預(yù)估,即預(yù)測分析。根據(jù)數(shù)據(jù)挖掘和可視化分析得到的學(xué)科建設(shè)規(guī)律,可以發(fā)現(xiàn)制約學(xué)科專業(yè)發(fā)展的關(guān)鍵因素,然后通過建模,預(yù)測某項政策措施或社會經(jīng)濟(jì)變化會對哪些學(xué)科或?qū)I(yè)造成影響以及造成怎樣的影響??梢园延绊懗潭扔玫梅值男问奖硎境鰜?,得分越高影響越大,危機(jī)程度越高,并根據(jù)危機(jī)程度給予不同等級的預(yù)警。危機(jī)學(xué)科或?qū)I(yè)設(shè)置為A、B兩類,A類表示需求增長過快,供不應(yīng)求;B類表示需求放緩或逐漸萎縮,供過于求。例如師生比持續(xù)上升,人才市場供不應(yīng)求、教學(xué)或科研績效高的專業(yè)可能預(yù)示著人才緊缺,可以歸為A類危機(jī)專業(yè),根據(jù)人才稀缺程度可下設(shè)三檔或四檔等級,等級越高,人才需求越旺,需要調(diào)整人才的增量和存量;而就業(yè)率持續(xù)下降、教學(xué)或科研績效低的專業(yè)可能預(yù)示著人才培養(yǎng)與市場需求不相適應(yīng),存在人才培養(yǎng)過剩的傾向,可以歸為B類,同樣下設(shè)幾個等級予以預(yù)警,等級越高代表危機(jī)程度越高,表明需要調(diào)整培養(yǎng)方案,減少招生規(guī)模。通過“智能全景模擬器”提供的危機(jī)預(yù)警,對危機(jī)學(xué)科專業(yè)進(jìn)行盡早干預(yù),可優(yōu)化資源配置,減少損失。
當(dāng)然,模型的準(zhǔn)確性不會一蹴而就,還需要對數(shù)據(jù)的持續(xù)觀察和對模型的反復(fù)驗證修改,形成“數(shù)據(jù)收集→整合平臺數(shù)據(jù)→數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)→智能全景模擬→危機(jī)預(yù)警(可視化)→數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)→智能全景模擬……”循環(huán)機(jī)制,從而不斷提高預(yù)測性能。
四、大數(shù)據(jù)分析應(yīng)用于學(xué)科建設(shè)面臨的挑戰(zhàn)
大數(shù)據(jù)分析固然能解決學(xué)科建設(shè)中面臨的諸多問題,使學(xué)科管理和建設(shè)走向更加精準(zhǔn)化和科學(xué)化的道路,但是也要看到應(yīng)用大數(shù)據(jù)分析尚存在諸多問題。
首先,數(shù)據(jù)的篩選問題。大數(shù)據(jù)時代,人們對數(shù)據(jù)的認(rèn)識始終處于不斷豐富和完善的過程,高質(zhì)量、高相關(guān)性的數(shù)據(jù)越多越能做出精準(zhǔn)的決策。UT對大數(shù)據(jù)分析的應(yīng)用就是一個典型的例子。該校為了減少學(xué)生貸款債務(wù)增加對辦學(xué)的影響,這些年來已經(jīng)采集了大量的學(xué)生數(shù)據(jù),包括入學(xué)和學(xué)位數(shù)據(jù)、學(xué)生財務(wù)資助數(shù)據(jù)、課程級別數(shù)據(jù)等,而數(shù)據(jù)可視化的新功能,使UT擁有與全州和全國學(xué)生債務(wù)相比較的有關(guān)UT學(xué)生貸款來源的信息,以便幫助UT的員工做出更好的決策[19]??蒲蟹矫?,UT也已經(jīng)開始采集教師生產(chǎn)力方面的數(shù)據(jù),包括不同學(xué)院、不同系的學(xué)術(shù)測算指標(biāo),研究經(jīng)費(fèi)和學(xué)術(shù)產(chǎn)出等,并常規(guī)性地利用這些數(shù)據(jù)輔助決策[20]。但這些都只是一個開始,隨著大數(shù)據(jù)的不斷涌現(xiàn),大數(shù)據(jù)分析技術(shù)的推廣,需要獲取的數(shù)據(jù)源會不斷增加,然而目前工業(yè)界處理龐大數(shù)據(jù)的能力有限,因此對數(shù)據(jù)進(jìn)行清洗,盡可能獲取高質(zhì)量、高相關(guān)性的數(shù)據(jù)顯得尤為重要,這需要機(jī)器學(xué)習(xí)和智能全景模擬等技術(shù)的支持。
第二,安全問題。大數(shù)據(jù)的挖掘與運(yùn)用時刻伴隨著安全問題,數(shù)據(jù)安全關(guān)乎個人安全和國家利益,必須在數(shù)據(jù)安全性與隱私性之間找到平衡。隨著文化、教育領(lǐng)域公共數(shù)據(jù)資源向社會開放,大量在線課程的開放,“互聯(lián)網(wǎng)+教育”模式的發(fā)展,教育數(shù)據(jù)的安全性也面臨挑戰(zhàn)。數(shù)據(jù)一旦開放,誰將擁有這些數(shù)據(jù)?誰又將使用這些數(shù)據(jù)?科研人員或教師在網(wǎng)站或社交平臺發(fā)布與教學(xué)科研有關(guān)的圖片、視頻或言論時,這些數(shù)據(jù)是否仍然屬于本人,網(wǎng)站和社交平臺是否能合法擁有其中的內(nèi)容,當(dāng)關(guān)閉網(wǎng)站和云服務(wù)時,用戶是否能將產(chǎn)生的數(shù)據(jù)帶走等,關(guān)系到能否在開放數(shù)據(jù)的同時保護(hù)好知識產(chǎn)權(quán)、數(shù)據(jù)的所有權(quán)和使用權(quán),個人隱私不受侵犯等問題。要治理學(xué)術(shù)環(huán)境,堅決杜絕盜用數(shù)據(jù)、利用數(shù)據(jù)造假、惡意轉(zhuǎn)載、剽竊他人研究成果等行為的發(fā)生。不斷提高數(shù)據(jù)安全意識和保密技術(shù),不給假冒期刊網(wǎng)站、非法營利團(tuán)體以可乘之機(jī)。要在從業(yè)人員和高校師生中普及安全使用數(shù)據(jù)的常識和政策法規(guī),讓大家建立起大數(shù)據(jù)時代的安全意識。
第三,數(shù)據(jù)融合問題。數(shù)據(jù)融合是一種處理大數(shù)據(jù)的手段,用于從大數(shù)據(jù)中發(fā)現(xiàn)知識,并按照知識的語義邏輯關(guān)聯(lián)融合形成更接近人類思維的知識,包括數(shù)據(jù)融合和知識融合2個步驟。數(shù)據(jù)融合負(fù)責(zé)將多源數(shù)據(jù)動態(tài)提取、整合并且轉(zhuǎn)化為知識資源,為知識融合奠定基礎(chǔ)。而知識融合負(fù)責(zé)對知識和知識間的關(guān)系進(jìn)行不同粒度的理解,使知識具有不同層次的可理解性和可領(lǐng)悟性,進(jìn)而方便解釋客觀現(xiàn)象[21]。就學(xué)科建設(shè)而言,不同領(lǐng)域、不同學(xué)科的科研數(shù)據(jù)來自不同的數(shù)據(jù)源;同一專家隸屬的機(jī)構(gòu)可能改變,同一專家也可能以不同語種發(fā)表成果,這意味著同一專家的信息可能涉及跨數(shù)據(jù)庫、跨語言的融合;不同信息源之間還可能存在隱含的關(guān)聯(lián)信息等。另外,各級、各地區(qū)院校在數(shù)據(jù)的統(tǒng)計、分類、管理上都存在不同程度差異,要將這些數(shù)據(jù)融合起來進(jìn)行數(shù)據(jù)分析和挖掘,還要面臨模式對齊、實體鏈接、沖突解決、關(guān)系推演等方面的技術(shù)難題。
五、結(jié)束語
隨著大數(shù)據(jù)的不斷涌現(xiàn),以及開源軟件、云計算等的出現(xiàn),用數(shù)據(jù)驅(qū)動的管理已初見端倪。麻省理工學(xué)院、德克薩斯大學(xué)、加州大學(xué)等一批知名高校都已聘用專門的數(shù)據(jù)可視專家和工程師,為決策和研究提供支持。由日本文部省科學(xué)大臣認(rèn)定的“跨學(xué)科大規(guī)模共享共用信息平臺研究基地(簡稱:JHPCN)”項目,于2010年正式啟動。該項目以東京大學(xué)信息平臺中心為核心,在北海道大學(xué)、東北大學(xué)、東京大學(xué)、東京工業(yè)大學(xué)、名古屋大學(xué)、京都大學(xué)、大阪大學(xué)、九州大學(xué)等八所院校的研究基地配備了超級計算機(jī),形成了“網(wǎng)絡(luò)式”共享研究基地。項目希望通過超大容量數(shù)據(jù)平臺,解決地球環(huán)境、能源、材料、基因組信息、網(wǎng)絡(luò)數(shù)據(jù)等大型挑戰(zhàn)性課題,為日本學(xué)術(shù)研究基礎(chǔ)的進(jìn)一步高度化和常態(tài)化做出貢獻(xiàn)。目前項目組已舉辦了10界論壇,取得了一些階段性成果,并于2016年新增了國際共同研究課題、企業(yè)共同研究課題、萌芽型共同研究課題,意在強(qiáng)化全球化、產(chǎn)學(xué)結(jié)合、孵化風(fēng)險企業(yè)的功能[22]。大數(shù)據(jù)分析已經(jīng)將觸角伸向了高等教育教學(xué)、科研、管理等各個層面。不久的將來,用數(shù)據(jù)驅(qū)動的學(xué)科建設(shè)也定將展現(xiàn)其前所未有的優(yōu)勢。但是技術(shù)的進(jìn)步也對使用技術(shù)的人提出了更高挑戰(zhàn),用好數(shù)據(jù),不等于一切依賴數(shù)據(jù),對學(xué)科建設(shè)做出科學(xué)決策,還要不斷提高對數(shù)據(jù)的甄別、思考和駕馭能力。
參考文獻(xiàn):
[1]http://www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.
[2]梁傳杰.論學(xué)科建設(shè)績效評價[J].北京科技大學(xué)學(xué)報(社會科學(xué)版),2010(1):160.
[3]謝桂華.關(guān)于學(xué)科建設(shè)的若干問題[J].高等教育研究,2002(5):49.
[4]http://www.asahi.com/articles/ASK7Z5F06K7ZUTIL01K.html.
[5]梁傳杰.論學(xué)科建設(shè)績效評價[J].北京科技大學(xué)學(xué)報(社會科學(xué)版),2010(1):159-160.
[6]薛玉香,黃文浩.以投入產(chǎn)出比重新審視高校重點(diǎn)學(xué)科建設(shè)績效評估[J].中國高教研究,2010(4):39.
[7]朱路甲,劉迪,王寶軍.新時期產(chǎn)學(xué)研用合作機(jī)制創(chuàng)新中存在的問題及相關(guān)對策[J].河北大學(xué)學(xué)報,2011(2).
[8]陳冬梅.基于“產(chǎn)學(xué)研用”協(xié)同創(chuàng)新的高校人才隊伍建設(shè)探析[J].高教探索,2013(2).
[9]http://www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.
[10]李金昌.從政治算數(shù)到大數(shù)據(jù)分析[J].統(tǒng)計研究,2014(11):10.
[11]Phil Simon.大數(shù)據(jù)可視化重構(gòu)智慧社會[M].人民郵電出版社,2018:110.
[12]龔放.把握學(xué)科特性 選準(zhǔn)研究方法——高等教育學(xué)科建設(shè)必須解決的兩個問題[J].中國高教研究,2016(9):5.
[13]吳忭,顧小清.教育大數(shù)據(jù)的深度認(rèn)知、實踐案例與趨勢展望——2017年“教育大數(shù)據(jù)應(yīng)用技術(shù)”國際學(xué)術(shù)研討會評述[J].現(xiàn)代遠(yuǎn)程教育研究,2017(3):11.
[14]趙慧瓊,姜強(qiáng),趙蔚,等.基于大數(shù)據(jù)學(xué)習(xí)分析的在線學(xué)習(xí)績效預(yù)警因素及干預(yù)對策的實證研究[J].電化教育研究,2017(1).
[15]陳明.大數(shù)據(jù)基礎(chǔ)與應(yīng)用[M].北京師范大學(xué)出版社,2016:228.
[16]陳明.大數(shù)據(jù)基礎(chǔ)與應(yīng)用[M].北京師范大學(xué)出版社,2016:286.
[17]陳明.大數(shù)據(jù)基礎(chǔ)與應(yīng)用[M].北京師范大學(xué)出版社,2016:209.
[18]王紋,毛彥.數(shù)據(jù)驅(qū)動的管理[M].清華大學(xué)出版社,2016:263.
[19]Phil Simon.大數(shù)據(jù)可視化重構(gòu)智慧社會[M].人民郵電出版社,2018:112-113.
[20]Phil Simon.大數(shù)據(jù)可視化重構(gòu)智慧社會[M].人民郵電出版社,2018:113.
[21]孟小峰,杜治娟.大數(shù)據(jù)融合研究:問題與挑戰(zhàn)[J].計算機(jī)研究與發(fā)展,2016(2):240.
[22]https://jhpcn-kyoten.itc.u-tokyo.ac.jp/ja/.