文/本刊記者 傅宇凡
大數(shù)據(jù)之美在“披沙瀝金”專訪西安交通大學(xué)副校長鄭慶華
文/本刊記者傅宇凡
大數(shù)據(jù)是美好的,但須大浪淘沙,才能見到金子。
2016年4月25日,西安交通大學(xué)正式啟動(dòng)了“陜西省高校大數(shù)據(jù)分析服務(wù)平臺”。在接受《中國教育網(wǎng)絡(luò)》雜志的專訪時(shí),西安交通大學(xué)副校長鄭慶華難掩自豪的神色:“這是解放生產(chǎn)力之舉。大數(shù)據(jù)是美好的,但須大浪淘沙,才能見到金子,西安交大在這方面先行一步?!?/p>
《中國教育網(wǎng)絡(luò)》:大數(shù)據(jù)已經(jīng)成為各個(gè)領(lǐng)域各個(gè)行業(yè)的一個(gè)重要話題,您如何看待這種情況?
鄭慶華:如何從海量的大數(shù)據(jù)當(dāng)中獲取有價(jià)值的知識,已經(jīng)成為一種普遍性的需求。在國家層面來說,在金融預(yù)測、網(wǎng)絡(luò)安全、信息保護(hù)、智能電網(wǎng)、氣候預(yù)測,包括社會治安、國家安全等等各個(gè)領(lǐng)域,都需要從大數(shù)據(jù)當(dāng)中獲取有價(jià)值的知識。對于我們普通的個(gè)人來說,這也是一個(gè)必須具備的層面。作為一個(gè)現(xiàn)代人,我們已經(jīng)不能超越,不能回避這樣一個(gè)事實(shí),就是我們必須依賴互聯(lián)網(wǎng)這個(gè)平臺,去獲取知識、溝通和交流。
圖1 高等教育大數(shù)據(jù)的頂層設(shè)計(jì)
當(dāng)前大數(shù)據(jù)分析平臺與大數(shù)據(jù)庫之所以蓬勃發(fā)展,來源于三個(gè)方面的需求。第一,目前普遍使用和廣泛存在的社交網(wǎng)絡(luò), 帶來內(nèi)容生產(chǎn)的變化Web技術(shù)從最早的1.0版本,到正在向3.0版本發(fā)展,人人都可以參與內(nèi)容的生產(chǎn),人人都可以作為一個(gè)信息源來發(fā)布和交流信息。這使得信息的發(fā)布渠道,從有限的網(wǎng)站變成了所有人,數(shù)據(jù)的增長是海量和龐大的。第二,從互聯(lián)網(wǎng)到物聯(lián)網(wǎng)的發(fā)展。物聯(lián)網(wǎng)的核心是把傳感器技術(shù),嵌入到各個(gè)物體當(dāng)中,使得原本沒有感知功能的物體,也能采集數(shù)據(jù)。再通過無線網(wǎng)絡(luò)把信息送到后臺的云平臺上,進(jìn)行存儲和計(jì)算,并且得出結(jié)論以后反饋到前端的物體。這也產(chǎn)生了海量的數(shù)據(jù)。第三,統(tǒng)計(jì)技術(shù)發(fā)展的需要。如何適應(yīng)互聯(lián)網(wǎng)時(shí)代信息特點(diǎn)進(jìn)行統(tǒng)計(jì),傳統(tǒng)統(tǒng)計(jì)學(xué)理論已經(jīng)不能適應(yīng),統(tǒng)計(jì)技術(shù)和模型需要順應(yīng)發(fā)展而變化。
《中國教育網(wǎng)絡(luò)》:大數(shù)據(jù)在高等教育中的價(jià)值與發(fā)展,您又是怎么看的?
鄭慶華:在大數(shù)據(jù)時(shí)代中,高校承擔(dān)著重要的責(zé)任,即人才培養(yǎng)和技術(shù)研究。當(dāng)前的大數(shù)據(jù)就是一個(gè)深海資源,如何圍繞某一個(gè)特定的應(yīng)用點(diǎn)開展研究工作,尚有差距。大數(shù)據(jù)是美好的,但須大浪淘沙,才能見到金子。
從教育教學(xué)的角度,“大數(shù)據(jù)+教育”有4個(gè)方面的重要價(jià)值。
首先,讓教育管理更有效。大數(shù)據(jù)對如何提高高校精細(xì)化、規(guī)范化管理,促進(jìn)高?,F(xiàn)代化具有非常重要的意義。它可以支持大學(xué)的管理更加有序和有效,可以真正實(shí)現(xiàn)教師、后勤、科學(xué)研究、人才培養(yǎng)方面的分類管理,而且可以實(shí)現(xiàn)在目標(biāo)導(dǎo)向、問題驅(qū)動(dòng)下的過程監(jiān)控,也可以對未來趨勢進(jìn)行預(yù)測,同時(shí),對可能出現(xiàn)的問題進(jìn)行早期的預(yù)防和預(yù)警。
其次,教育評價(jià)可以做到更精準(zhǔn)。因?yàn)榇髷?shù)據(jù)建立在海量、多類型,以及實(shí)時(shí)采集的各種數(shù)據(jù)基礎(chǔ)之上,它的樣本是海量化的,采集方式是實(shí)時(shí)多元化的、分析是多維度的,數(shù)據(jù)采集分析挖掘也是根據(jù)不同的類型,采取不同的多樣的分析手段。所以可以做到更加精準(zhǔn)。
第三,也是最重要的,是指導(dǎo)教師如何面向?qū)W生,在“教與學(xué)”上可以做到更加智慧。在學(xué)生層面上,學(xué)生可以對自己的實(shí)時(shí)學(xué)習(xí)行為進(jìn)行跟蹤分析,可以找到自己的學(xué)習(xí)興趣點(diǎn)、關(guān)注點(diǎn),可以進(jìn)行有效的學(xué)習(xí)路徑的設(shè)計(jì)和選擇,在海量資源中可以深度挖掘并且實(shí)現(xiàn)資源的精準(zhǔn)化訂閱,可以實(shí)現(xiàn)知識的學(xué)習(xí)。從教師層面,可以實(shí)現(xiàn)真正的互為師生關(guān)系,跨地域的資源整合和共享學(xué)習(xí)協(xié)作,實(shí)現(xiàn)多人的協(xié)同教學(xué);可以進(jìn)行班級或者針對專業(yè)學(xué)生的自身診斷;可以開展課程評估;可以對學(xué)習(xí)者進(jìn)行興趣的聚類或者進(jìn)行資源的有效聚合。
第四,為老師和學(xué)生提供個(gè)性化的資源推薦和服務(wù),包括文獻(xiàn)資源、績效評價(jià)、各課程教學(xué)管理、手機(jī)APP。從目前來看,大數(shù)據(jù)確實(shí)將對高校的管理、人才培養(yǎng)、科學(xué)研究、社會服務(wù)等等方面做出前所未有的支撐和服務(wù)。
《中國教育網(wǎng)絡(luò)》:西安交大與陜西省教育廳成立陜西省高等教育大數(shù)據(jù)服務(wù)平臺是基于什么考慮,有何意義?
鄭慶華:西安交通大學(xué)與陜西省教育廳共同建立了一個(gè)全省高等教育大數(shù)據(jù)中心, 這個(gè)數(shù)據(jù)中心于2014年12月正式成立,旨在為省教育廳管理部門、評估機(jī)構(gòu)、社會團(tuán)體、行業(yè)協(xié)會、企事業(yè)單位甚至個(gè)人,提供高等教育相關(guān)數(shù)據(jù)的查詢、統(tǒng)計(jì)、分析和咨詢等服務(wù),如圖1所示。
這個(gè)數(shù)據(jù)中心中,匯聚了全省各個(gè)高校的辦學(xué)狀態(tài)數(shù)據(jù),包括人事、財(cái)務(wù)、學(xué)生以及科研、后勤等等方方面面的數(shù)據(jù),同時(shí)也整合了陜西省教育廳各個(gè)業(yè)務(wù)處室的各個(gè)業(yè)務(wù)管理信息系統(tǒng),并且與互聯(lián)網(wǎng)上開放的各類教育行業(yè)大數(shù)據(jù)相互聯(lián)系、相互共享,可以在線獲取各個(gè)高校的辦學(xué)狀態(tài)數(shù)據(jù)。在大數(shù)據(jù)中心的基礎(chǔ)上,以大數(shù)據(jù)引擎來統(tǒng)籌實(shí)現(xiàn)數(shù)據(jù)的共享、關(guān)聯(lián)、挖掘、統(tǒng)計(jì)分析,以及各種各樣的智能服務(wù)。比如,整合了各類科技資源的服務(wù),本科教育評估專業(yè)認(rèn)證診斷方面的服務(wù)。另外,該中心與教育部的主要職能部門,如教育部評估中心、規(guī)劃司、財(cái)務(wù)司等部門,也形成了數(shù)據(jù)相互交換的功能。這樣,將全省的高校數(shù)據(jù)資源通過數(shù)據(jù)中心進(jìn)行匯聚、融通、共享。
陜西省高等教育數(shù)據(jù)中心已經(jīng)成立有一年多,通過全省高等教育大數(shù)據(jù)支撐平臺建設(shè)、全省高等教育數(shù)據(jù)資源融合以及線上線下服務(wù)支持等多種形式工作的實(shí)施,有效支撐了省教育廳各項(xiàng)工作的開展?;谶@個(gè)數(shù)據(jù)中心,我們又于最近正式向社會發(fā)布了“陜西省高等教育大數(shù)據(jù)服務(wù)平臺”,初衷就是解放生產(chǎn)力,并提供社會服務(wù)。以往我們統(tǒng)計(jì)查詢以及核實(shí)高校的業(yè)務(wù)數(shù)據(jù),需要大量的人工工作,現(xiàn)在,技術(shù)手段已經(jīng)不成問題,但是數(shù)據(jù)的唯一性,仍然問題重重,這也是大數(shù)據(jù)平臺成立的最大原因。破解數(shù)據(jù)唯一性這樣的難題,關(guān)鍵在于匯聚辦學(xué)的數(shù)據(jù),第一,面向某個(gè)數(shù)據(jù)業(yè)務(wù)的融通,將離散的碎片化的數(shù)據(jù)進(jìn)行整合,第二,針對不同部門的考核,進(jìn)行歸集化處理,第三,利用數(shù)據(jù)進(jìn)行教學(xué)的績效評價(jià),使得數(shù)據(jù)采集落地,真實(shí)實(shí)時(shí)準(zhǔn)確地了解一線教學(xué)的情況,為本科教育評估專業(yè)認(rèn)證提供數(shù)據(jù)支撐。未來,這個(gè)平臺將承擔(dān)陜西省高等教育大數(shù)據(jù)的統(tǒng)計(jì)查詢、分析評估、咨詢建議和決策支持等應(yīng)用服務(wù)工作。
《中國教育網(wǎng)絡(luò)》:陜西省高校大數(shù)據(jù)服務(wù)平臺上如何與當(dāng)前的教育教學(xué)過程相結(jié)合?如何提供服務(wù)?
鄭慶華:陜西省高校大數(shù)據(jù)服務(wù)平臺上首先是陜西省高校大數(shù)據(jù)的匯聚與分析評估(如圖2所示),這是整個(gè)陜西省高校大數(shù)據(jù)的匯聚。通過業(yè)務(wù)查詢、數(shù)據(jù)統(tǒng)計(jì)、電子報(bào)表、圖形展現(xiàn)、分析報(bào)告等功能,為省教育廳領(lǐng)導(dǎo)、管理單位、高校及社會公眾提供服務(wù)。
每年教育部公布的各種公開數(shù)據(jù)、招生數(shù)據(jù)、就業(yè)數(shù)據(jù)等等,全都融匯到這一平臺,形成了一個(gè)全省的數(shù)據(jù)中心和數(shù)據(jù)倉庫。在此基礎(chǔ)上,還開發(fā)了若干核心的引擎支撐模塊,預(yù)測預(yù)警、通用查詢、在線分析、信息發(fā)布,以及決策支持、評估分析應(yīng)用、數(shù)據(jù)挖掘等等,并面向陜西省教育廳各個(gè)職能部門、各高校、社會公眾等提供數(shù)據(jù)支撐服務(wù)。
首先,該平臺為陜西省教育廳職能業(yè)務(wù)部門及決策層提供了十一大類的功能,包括領(lǐng)導(dǎo)的儀表盤,可以進(jìn)行陜西省跟其他兄弟省市的數(shù)據(jù)橫向縱向比較,描述歷年來各個(gè)業(yè)務(wù)數(shù)據(jù)歷史變化的情況;為陜西省教育廳高教處、研究生處、科研處等11個(gè)部門提供專項(xiàng)數(shù)據(jù)服務(wù);提供教育質(zhì)量數(shù)據(jù)的在線查詢、監(jiān)測預(yù)警、對比分析,質(zhì)量報(bào)告;提供全省高基統(tǒng)計(jì)報(bào)表及統(tǒng)計(jì)年鑒報(bào)表81張的查詢查閱;提供全省教育經(jīng)費(fèi)統(tǒng)計(jì)報(bào)表191張和統(tǒng)計(jì)報(bào)告的查詢查閱以及高校就業(yè)數(shù)據(jù)的統(tǒng)計(jì)分析、重點(diǎn)指標(biāo)結(jié)構(gòu)分析等。
第二,為高校提供服務(wù)。為高校對內(nèi)自查、自評、自糾,對外橫向關(guān)聯(lián)比較提供支持,定位問題,尋找差距,促進(jìn)高校人才培養(yǎng)、學(xué)科建設(shè)決策的科學(xué)化。陜西省目前有100多所高校,未來還可以進(jìn)行省內(nèi)高校的橫向比較、陜西省同類高校和兄弟省市同類高校之間的對比分析,通過數(shù)據(jù)整合,在基礎(chǔ)數(shù)據(jù)層面解決應(yīng)用數(shù)據(jù)的碎片化問題,在管理體制層面建立健全學(xué)校數(shù)據(jù)的智能化管理體系,從而實(shí)現(xiàn)管理信息化向服務(wù)信息化、服務(wù)智能化的方向轉(zhuǎn)變,這是過去管理信息系統(tǒng)所難以做到的。
在高校大數(shù)據(jù)平臺的基礎(chǔ)上,支撐教育教學(xué)的評估和專業(yè)認(rèn)證。過去的評估都是專家進(jìn)校,通過長時(shí)間的現(xiàn)場考察、師生交流等等來發(fā)現(xiàn)問題。有了數(shù)據(jù)平臺之后,現(xiàn)在評估可以分兩個(gè)階段。第一階段,在高校大數(shù)據(jù)平臺基礎(chǔ)上,通過數(shù)據(jù)的分析找到問題;第二階段,專家進(jìn)校考證這些問題的實(shí)際情況。所以數(shù)據(jù)的前期分析將對專家的進(jìn)校評估提供有效的、有針對性的、面向問題和目標(biāo)的引導(dǎo)。該平臺上可以提供高校審核評估、專業(yè)綜合評估認(rèn)證、學(xué)生學(xué)習(xí)經(jīng)歷、與高等教育滿意度的測量與評價(jià),以及全省高等教育質(zhì)量監(jiān)控?cái)?shù)據(jù)分析平臺。
圖2 陜西省高校大數(shù)據(jù)匯聚與分析評估
《中國教育網(wǎng)絡(luò)》:高校大數(shù)據(jù)服務(wù)平臺還有哪些典型應(yīng)用案例?
鄭慶華:在高等教育大數(shù)據(jù)服務(wù)平臺上,我們還開展了陜西省高等教育MOOC平臺的建設(shè)和服務(wù)工作,該MOOC平臺已經(jīng)匯聚了包括西安交大在內(nèi)高校的253門課程,包含思想政治板塊、通識類課程板塊、基礎(chǔ)學(xué)科板塊、專業(yè)課程和特色課程板塊一共五大板塊的課程。MOOC平臺將全省的優(yōu)質(zhì)教育資源分層分類地向全省高校提供支持服務(wù),并實(shí)現(xiàn)了網(wǎng)上選課、課程互選、學(xué)分互認(rèn)等。陜西省高校的學(xué)生足不出戶即可以分享世界名校的課程,可以分享其它兄弟高校的優(yōu)質(zhì)課程資源。特別是,該平臺通過學(xué)習(xí)大數(shù)據(jù)分析,進(jìn)行學(xué)習(xí)過程的全過程跟蹤與分析。
另一個(gè)典型應(yīng)用是把互聯(lián)網(wǎng)技術(shù)以及云計(jì)算技術(shù)滲透到日常的教學(xué)過程管理、智慧教室的建設(shè)當(dāng)中。2015年學(xué)校一次性建立了80個(gè)智慧云教室,每一個(gè)教室的信息化設(shè)備全部通過互聯(lián)網(wǎng)實(shí)現(xiàn)了互聯(lián)互通,包括投影儀、還有中控系統(tǒng)、門禁系統(tǒng)、考勤系統(tǒng)等,全部實(shí)現(xiàn)了集約化、智能化、互聯(lián)網(wǎng)的一卡通,將傳統(tǒng)的安全監(jiān)控、考勤系統(tǒng)、IP電話,以及教師教學(xué)的實(shí)時(shí)隨堂錄制、師生互動(dòng)等功能整合到這一平臺上。
目前,西安交大80個(gè)教室的課堂情況,教師上課實(shí)時(shí)場景、講課內(nèi)容、學(xué)生課堂狀況等,可以通過一個(gè)集中監(jiān)控屏的界面實(shí)時(shí)掌握。并且很多新的內(nèi)容、新的教學(xué)管理手段可以部署和實(shí)現(xiàn),如督導(dǎo)組的可通過授課錄像實(shí)現(xiàn)精準(zhǔn)督導(dǎo);學(xué)生的到課率、考勤率、出勤率、排頭率等等,通過這個(gè)平臺也可以一覽無余。通過教師授課的隨堂錄制,老師自己可以查找、審閱自己上課的過程,為今后改進(jìn)教學(xué)提供很好的手段。
此外,對條件保障和資源的節(jié)約使用也有很大作用。過去學(xué)校中午有大量教室投影儀、燈光沒關(guān)的現(xiàn)象,現(xiàn)在通過云的集中控制,所有教室設(shè)備都可以實(shí)現(xiàn)集約化管控。一旦出現(xiàn)故障,遠(yuǎn)端也可以集中恢復(fù);設(shè)備系統(tǒng)的升級,也可以采用云的方式來完成,無須逐個(gè)教室手工進(jìn)行。所有這些都給我們教育教學(xué)的智慧化管理、集約化管理提供了很好的支撐手段。
《中國教育網(wǎng)絡(luò)》:大數(shù)據(jù)的應(yīng)用一直以來都是匯聚容易,分析難,價(jià)值體現(xiàn)更難,西安交大是如何實(shí)現(xiàn)的?做了哪些研究和嘗試?
鄭慶華:大數(shù)據(jù)如何挖掘價(jià)值,是當(dāng)前大數(shù)據(jù)發(fā)展中的一個(gè)重大技術(shù)挑戰(zhàn),也是高校進(jìn)行大數(shù)據(jù)研究的一個(gè)機(jī)遇。針對大數(shù)據(jù)的個(gè)性智能化的知識獲取與個(gè)性化的知識服務(wù),西安交大做了一些研究和嘗試,并取得了明顯的成效。
高校大數(shù)據(jù)平臺最終目標(biāo)是希望提高教育教學(xué)的質(zhì)量,這個(gè)工作知易行難??陀^上,大數(shù)據(jù)的確給人類自身造成嚴(yán)重的認(rèn)知障礙、包括認(rèn)知過程學(xué)習(xí)迷航等問題。原因是什么呢?首先是大數(shù)據(jù)造成了嚴(yán)重的認(rèn)知碎片化問題。什么叫知識碎片化呢?就是某個(gè)特定主題的知識資源分散在了不同的數(shù)據(jù)源當(dāng)中,分布在不同的網(wǎng)站或者數(shù)據(jù)庫當(dāng)中。比如,在百度中查“糖尿病”關(guān)鍵詞,它會反饋回來4440萬個(gè)數(shù)據(jù)源,有關(guān)于糖尿病的定義、有關(guān)于糖尿病的治療、有關(guān)于并發(fā)癥等等,林林總總,這些數(shù)據(jù)分散在各個(gè)網(wǎng)站、數(shù)據(jù)庫,用戶就像瞎子摸象一樣,我們得到的永遠(yuǎn)是一個(gè)片面的、局部的、散亂的狀態(tài)信息??梢韵胂?,這樣的情況給人們的認(rèn)知造成很大困難。再比如,一家三口預(yù)算十萬元到歐洲十日游,不管是百度還是谷歌,沒有哪個(gè)網(wǎng)站能給出滿意的答案,并不是說這個(gè)信息在網(wǎng)上沒有,而是因?yàn)檫@些信息散落在各個(gè)網(wǎng)站上,而且得到信息之后還需要經(jīng)過人工的處理才能得到需要的信息,這就是我們面臨的現(xiàn)實(shí)問題。
簡單地說教育大數(shù)據(jù)造成了四個(gè)方面的問題。第一,資源的分散特性,第二,快速動(dòng)態(tài)變化的特性,第三,人人都可以產(chǎn)生資源、人人都可以提供資源,導(dǎo)致的資源低質(zhì)化特征。這些特性我們?nèi)粘6紩畜w會,比如動(dòng)態(tài)性,每天的微信、微博、各個(gè)論壇帖子,都在發(fā)布各種各樣的信息,海量信息讓人們疲于跟蹤;同時(shí),這些信息源良莠不齊,內(nèi)容可靠性、真實(shí)性、完整性以及可信度,都值得商榷,這也是我們在大數(shù)據(jù)處理方面要處理的典型問題。第四,結(jié)構(gòu)無序性。數(shù)據(jù)源并非經(jīng)過精心組織,導(dǎo)致其結(jié)構(gòu)是無序的、散亂的,類型也是多樣化的。
如何去粗存精、去偽存真,我們提出了知識圖譜、知識地圖的理論,這是一種全新的資源組織方式,面向用戶提供精準(zhǔn)化的信息推薦,為用戶建立個(gè)性化的知識模型,將這兩者融合起來,建立用戶興趣和個(gè)性的精準(zhǔn)化資源模型,將無關(guān)的、冗余的信息去掉,從而實(shí)現(xiàn)了精準(zhǔn)化的推薦。
研究模型是面向智能學(xué)習(xí)的一個(gè)新模式,即基于知識地圖導(dǎo)航的知識學(xué)習(xí)系統(tǒng)。把知識的概念、定理、知識源通過語義關(guān)系,組合成一張知識地圖,它的邊是反應(yīng)知識單元之間的語義關(guān)系,在這個(gè)知識地圖的導(dǎo)航下,進(jìn)行面向用戶和學(xué)習(xí)的精準(zhǔn)化推薦。
在這個(gè)模型中,第一個(gè)核心技術(shù)是解決知識地圖海量資源的組織問題。我們在此模型下建立了一套研究平臺和大數(shù)據(jù)集,包括對數(shù)百門課程進(jìn)行了標(biāo)注、研究,獲取了它們之間的知識地圖關(guān)系,開發(fā)了一系列知識語言處理工具、信息抽取工具、復(fù)雜網(wǎng)絡(luò)分析工具、挖掘工具等等。
第二個(gè)核心技術(shù)是碎片化知識的聚合。碎片化知識聚合,就是要讓學(xué)生既見樹木又見森林,每一棵樹是面向某一個(gè)主題的知識結(jié)構(gòu),而森林則是把某個(gè)領(lǐng)域的知識,比如計(jì)算機(jī)領(lǐng)域、互聯(lián)網(wǎng)領(lǐng)域的知識主題組合起來,也就是“主題樹”和“知識森林”的概念。所謂碎片知識聚合就是把多元、片面、無序的碎片化知識聚合成符合人類認(rèn)知的多維關(guān)聯(lián)整合的知識森林,其目的就是緩解學(xué)習(xí)迷航、認(rèn)知過程的問題。整體來說它包括三個(gè)步驟,首先是構(gòu)建主題分面樹;第二,把語義和碎片化知識裝配到知識主題樹上,解決知識的散亂問題;第三,進(jìn)行知識關(guān)系的挖掘,解決知識無序問題,最后形成了一個(gè)“知識森林”。在“知識森林”當(dāng)中,既可以面向某個(gè)主題開展學(xué)習(xí),也可以在主題之間按照知識的依賴關(guān)系,按照路徑實(shí)現(xiàn)導(dǎo)航學(xué)習(xí),也就是“既見樹木又見森林”(如圖3所示)。
這中間重點(diǎn)是解決三個(gè)關(guān)鍵理論和技術(shù)問題,第一關(guān)鍵技術(shù)是知識森林及聚合過程的建模問題;第二關(guān)鍵技術(shù),如何建立主題分面、分層關(guān)系,即如何將碎片化知識裝配到分辨樹上,從而為學(xué)生、為用戶提供按照學(xué)習(xí)者興趣和個(gè)性的學(xué)習(xí)路徑的選擇;第三個(gè)關(guān)鍵技術(shù)是用戶模型的建立,即如何找到用戶的興趣、需求、喜好、偏好。目前的工具可以實(shí)現(xiàn)對學(xué)習(xí)者的行為進(jìn)行深度的分析和挖掘。在用戶模型建立基礎(chǔ)上,面向?qū)W習(xí)者定制、推薦個(gè)性化的學(xué)習(xí)路徑、學(xué)習(xí)內(nèi)容,反映學(xué)習(xí)者的學(xué)習(xí)進(jìn)度等等。
《中國教育網(wǎng)絡(luò)》:高校要實(shí)現(xiàn)大數(shù)據(jù)整合,難點(diǎn)何在?您認(rèn)為應(yīng)具備哪些要素?
鄭慶華:我前面提到的數(shù)據(jù)整合,最終的目標(biāo)是破解數(shù)據(jù)唯一性的難題,作為高等教育大數(shù)據(jù),當(dāng)前的難點(diǎn)在于如何建立一套技術(shù)、應(yīng)用、管理、服務(wù)相互協(xié)同的運(yùn)行機(jī)制,要建立一套數(shù)據(jù)的準(zhǔn)入與規(guī)范的標(biāo)準(zhǔn)、建立數(shù)據(jù)相互交換的機(jī)制,以及大數(shù)據(jù)融會貫通、相互共享的平臺,支撐服務(wù)平臺。而要實(shí)現(xiàn)數(shù)據(jù)匯聚融通、落實(shí)數(shù)據(jù)整合工作,需要具備三個(gè)要素,第一,堅(jiān)強(qiáng)的行政支持,第二,技術(shù)要過關(guān),第三,要做好支撐服務(wù)體系,需要有一支能戰(zhàn)斗的隊(duì)伍,一支專業(yè)的技術(shù)隊(duì)伍、管理服務(wù)隊(duì)伍,以及職業(yè)化培訓(xùn)隊(duì)伍,真正把技術(shù)、管理和服務(wù)滲透到我們教學(xué)環(huán)節(jié)當(dāng)中。這三個(gè)要素,缺一不可。
圖3 既見樹木又見森林
為了實(shí)現(xiàn)數(shù)據(jù)整合,西安交大還建立了計(jì)算能力為122萬億次的高性能計(jì)算平臺,能夠支撐各類學(xué)科高新技術(shù)研發(fā)的需求。在這一高性能計(jì)算平臺建立之前,西安交大一共有122個(gè)網(wǎng)站,每個(gè)網(wǎng)站都有自己的服務(wù)器,既占空間資源,也耗費(fèi)大量能源和經(jīng)費(fèi),建立高性能云計(jì)算機(jī)平臺以后,122個(gè)服務(wù)器全部收并統(tǒng)一,所有二級網(wǎng)站只需要一個(gè)虛擬機(jī)就可以支撐服務(wù),用物理機(jī)實(shí)際上不到一臺物理機(jī)就可以支撐。這樣,不僅集中了資源用以支持校內(nèi)各個(gè)學(xué)科的高性能科學(xué)計(jì)算的需求,也整合了大量網(wǎng)絡(luò)服務(wù)器資源,同時(shí)還可以面向高等教育大數(shù)據(jù)進(jìn)行支撐服務(wù)。
《中國教育網(wǎng)絡(luò)》:從教育教學(xué)上說,您既是大數(shù)據(jù)的應(yīng)用者,也是大數(shù)據(jù)的研究者,您對大數(shù)據(jù)時(shí)代的互聯(lián)網(wǎng)創(chuàng)新有什么體會?
鄭慶華:任何一個(gè)時(shí)代的技術(shù)創(chuàng)新與技術(shù)進(jìn)步,我們不僅要關(guān)注技術(shù)本身和技術(shù)在個(gè)體上的應(yīng)用,更重要的是要仰望星空,實(shí)現(xiàn)模式的創(chuàng)新。頂級的互聯(lián)網(wǎng)公司有不同的商業(yè)模式,有不同的盈利點(diǎn),有不同的技術(shù)支撐,但都是一種模式創(chuàng)新。微軟的模式是建立在人人都要買我的軟件,人人都要安裝我的操作系統(tǒng)之上的。而谷歌的云平臺則顛覆了這個(gè)模式。阿里巴巴也一樣,對于傳統(tǒng)零售模式在一定程度上的顛覆。因此,在互聯(lián)網(wǎng)時(shí)代首先是模式創(chuàng)新,在這個(gè)領(lǐng)域沒有遲到者,只有失敗者。我常常說,空間無限,創(chuàng)新也無限。俄羅斯科學(xué)家、以太網(wǎng)絡(luò)的發(fā)明人羅伯特·梅特卡夫提出了著名的“梅特卡夫定理”,即網(wǎng)絡(luò)的價(jià)值與聯(lián)網(wǎng)的用戶數(shù)的平方成正比。電話是一個(gè)人打給了另外一個(gè)人,所以信息的效率就是一;電視是一個(gè)頻道播出,有N個(gè)人收看,它的效率是N;而在互聯(lián)網(wǎng)上有7個(gè)用戶的話,它是用全互連的方式,每個(gè)人都是貢獻(xiàn)者,也是共享者,所以它的效率是N的平方。IBM內(nèi)部也有一句很好的名言,你有一美元,我有一美元,大家交換一下,大家還是一美元;如果是你有一個(gè)新的思想,我有一個(gè)新思想,兩者交換一下,人人都有兩個(gè)思想。這就是互聯(lián)網(wǎng)信息是帶給我們的好處,模式創(chuàng)新是最根本的創(chuàng)新。
第二,一定要樹立一種觀念就是打造平臺,沒有平臺就像人缺鈣一樣。IBM作為IT領(lǐng)域的百年老店,之所以能長盛不衰,原因就在于它有自己非常堅(jiān)強(qiáng)的軟硬件技術(shù)基礎(chǔ),做設(shè)備、做集成、做服務(wù)都可以。微軟、谷歌、蘋果都是這樣的發(fā)展,所以,真正能夠長遠(yuǎn)發(fā)展的,一個(gè)平臺是必不可少的。高等教育信息化也一樣,要真正獨(dú)立,應(yīng)該有這樣一個(gè)強(qiáng)大的技術(shù)平臺支撐,不能老是依靠第三方的供應(yīng)商解決問題,與公司的合作和交流是必要的,但是不應(yīng)完全依賴于企業(yè)的技術(shù)和平臺。
第三,也是非常重要的,內(nèi)容、活力和服務(wù)是信息化平臺賴以成功的三要素。MOOC之所以在短時(shí)間內(nèi)能夠快速成長,原因就在于受眾群體的活躍度,及優(yōu)秀的內(nèi)容。IT領(lǐng)域中,軟件比硬件重要,資源比軟件重要,內(nèi)容比形式重要,而服務(wù)比內(nèi)容更重要。MOOC平臺的優(yōu)秀之處,在于平臺上的每一門課好像就是在給你一個(gè)人上課,而不是傳統(tǒng)的視頻課程的模式,這一點(diǎn)吸引了很多年輕人。此外,MOOC網(wǎng)站不是一成不變,而是天天更新。它設(shè)法保持學(xué)習(xí)者的持續(xù)關(guān)注,內(nèi)容時(shí)刻更新,服務(wù)隨時(shí)到位。這是我認(rèn)為作為一個(gè)信息平臺來說,非常成功的三個(gè)基本要素。
沒有錯(cuò)誤的技術(shù),只有錯(cuò)誤的選擇。在互聯(lián)網(wǎng)上,在信息化時(shí)代,適者生存同樣是一個(gè)法則。在這個(gè)時(shí)代我們更要強(qiáng)調(diào),教育和學(xué)習(xí)要重視思維模式和方法。對今后的教育發(fā)展,個(gè)人認(rèn)為這既是一個(gè)重大的新課題,也是未來很有探索空間的理論方法和技術(shù)的問題。