許 天,文敏華,羅 萱
(上海交通大學(xué)網(wǎng)絡(luò)信息中心,上海 200240)
近年來,云計算、大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展推動了高校信息化建設(shè)與改革,越來越多的高校開展了信息化實(shí)驗(yàn)室建設(shè)工程,將理論教學(xué)與實(shí)驗(yàn)教學(xué)相結(jié)合,加強(qiáng)學(xué)生創(chuàng)新意識和創(chuàng)新能力培養(yǎng)。傳統(tǒng)方案基于物理設(shè)備,靈活性差、安全性難以保障,需要大量的人力及時間部署環(huán)境。云計算整合計算、存儲、網(wǎng)絡(luò)、軟件等資源,具備按需分配、獲取迅速、訪問便捷等特點(diǎn),簡化了實(shí)驗(yàn)教學(xué)資源管理工作,提高了實(shí)驗(yàn)教學(xué)效率[1-5]。
很多高校開展了云上教學(xué)探索,在校園云平臺上以云基礎(chǔ)設(shè)施服務(wù)(Infrastructure as a Service,IaaS)實(shí)現(xiàn)物理資源在云上的虛擬化分配。文獻(xiàn)[6]針對高校教學(xué)中工程學(xué)科和商學(xué)科的實(shí)驗(yàn)仿真環(huán)節(jié)設(shè)計云計算科研環(huán)境,滿足計算和存儲資源擴(kuò)展要求;文獻(xiàn)[7]結(jié)合硬件建設(shè)、云平臺建設(shè)、教學(xué)資源建設(shè)和信息化系統(tǒng)建設(shè)等4 個環(huán)節(jié),設(shè)計一種云平臺實(shí)驗(yàn)教學(xué)中心建設(shè)方案;文獻(xiàn)[8]以H3C CAS 云計算平臺搭建數(shù)據(jù)中心,在此基礎(chǔ)上探索虛擬實(shí)驗(yàn)室控制系統(tǒng)和虛擬實(shí)驗(yàn)室用戶平臺實(shí)現(xiàn);文獻(xiàn)[9]提出在高校網(wǎng)絡(luò)中心現(xiàn)有計算機(jī)、網(wǎng)絡(luò)等硬件設(shè)施基礎(chǔ)上,使用云服務(wù)提供商應(yīng)用軟件構(gòu)建云計算實(shí)驗(yàn)平臺,以滿足大學(xué)計算機(jī)基礎(chǔ)課程實(shí)驗(yàn)教學(xué)需要;文獻(xiàn)[10]基于OpenStack 框架搭建云計算實(shí)驗(yàn)平臺,從教師初始配置、投資效費(fèi)比、實(shí)驗(yàn)室開放、教師實(shí)驗(yàn)管理和學(xué)生準(zhǔn)備時間5 個維度對云計算實(shí)驗(yàn)平臺效果作綜合分析。
上述相關(guān)研究中,根據(jù)具體實(shí)驗(yàn)課程要求對實(shí)驗(yàn)環(huán)境定制化部署,并以資源實(shí)際利用情況為依據(jù)進(jìn)行資源配置的彈性調(diào)整很難達(dá)成。出于實(shí)驗(yàn)室信息安全考慮,一般對實(shí)驗(yàn)環(huán)境的外網(wǎng)訪問和數(shù)據(jù)存放加以限制,對用戶實(shí)驗(yàn)造成不便。2020 年上半年受新型冠狀病毒疫情影響,各大高校紛紛采用遠(yuǎn)程線上教學(xué)模式。為滿足遠(yuǎn)程實(shí)驗(yàn)課程教學(xué)需求,筆者基于校園云平臺設(shè)計并實(shí)施了計算機(jī)實(shí)驗(yàn)教學(xué)支持方案。該方案在實(shí)現(xiàn)云平臺基本計算、網(wǎng)絡(luò)和存儲功能基礎(chǔ)上,以自主式用戶門戶和課程對應(yīng)項目等設(shè)計向用戶提供更為自由和便捷的使用方式,部署監(jiān)控系統(tǒng)以便于資源池容量和資源配置的動態(tài)調(diào)整,并通過安全管控保障自由使用方式下的信息數(shù)據(jù)安全。
針對計算機(jī)實(shí)驗(yàn)教學(xué)需求,大多數(shù)高校建立了計算機(jī)實(shí)驗(yàn)室并安排管理人員為實(shí)驗(yàn)課程提供統(tǒng)一開放的實(shí)驗(yàn)環(huán)境。隨著個人電腦的普及和性價比提升,越來越多學(xué)生將個人電腦用于課程實(shí)驗(yàn)。但由于計算機(jī)實(shí)驗(yàn)室資源擴(kuò)展性、使用靈活性、個人電腦的軟件環(huán)境配置、網(wǎng)絡(luò)共享等問題,將個人電腦用于實(shí)驗(yàn)課程會造成諸多不便[11-16]。
(1)資源擴(kuò)展。計算機(jī)實(shí)驗(yàn)室一般要求在建設(shè)初期對實(shí)驗(yàn)類型和規(guī)模進(jìn)行規(guī)劃,根據(jù)規(guī)劃內(nèi)容實(shí)施室內(nèi)裝修布線、選擇計算機(jī)型號、硬件配置和網(wǎng)絡(luò)架構(gòu)。這樣的“統(tǒng)一式”規(guī)劃容易導(dǎo)致資源擴(kuò)展性較差,部分實(shí)驗(yàn)內(nèi)容如模型仿真對計算機(jī)硬件配置有較高要求,實(shí)驗(yàn)室難以滿足該類實(shí)驗(yàn)需求。
(2)使用限制。計算機(jī)實(shí)驗(yàn)室通常以課程為單位提前預(yù)定,當(dāng)學(xué)生數(shù)量較少時會造成資源閑置,學(xué)生數(shù)量較多時會超出單個實(shí)驗(yàn)室承載能力。因此,在課程較為集中的時間段容易產(chǎn)生資源緊張或資源利用率低的情況,且可用的實(shí)驗(yàn)時間段受到較為嚴(yán)格的限制。
(3)軟件環(huán)境。實(shí)驗(yàn)課程一般涉及到多種軟件,要求實(shí)驗(yàn)室管理員或?qū)嶒?yàn)教師在實(shí)驗(yàn)室多臺計算機(jī)上安裝,工作量大且耗時長,而后期的軟件版本更新同樣需要投入人力及時間維護(hù)[17-18]。
(4)管理維護(hù)。實(shí)驗(yàn)室計算機(jī)向多名用戶開放,為保護(hù)個人數(shù)據(jù)隱私,通常會在使用后還原計算機(jī)數(shù)據(jù)硬盤,對用戶作業(yè)連續(xù)性造成影響。因此,很多用戶會利用移動存儲設(shè)備或網(wǎng)盤導(dǎo)入導(dǎo)出作業(yè),由于計算機(jī)之間通常采用內(nèi)部局域網(wǎng)的網(wǎng)絡(luò)架構(gòu),這種方式容易造成病毒在實(shí)驗(yàn)室內(nèi)傳播。
(1)軟件環(huán)境。相對于計算機(jī)實(shí)驗(yàn)室需要為每臺物理計算機(jī)安裝軟件,由學(xué)生在自己的個人電腦上進(jìn)行軟件安裝可減少實(shí)驗(yàn)室管理員或課程助教工作。但由于個人電腦硬件型號配置、驅(qū)動程序、預(yù)裝插件等存在較大差異,經(jīng)常出現(xiàn)在某臺個人電腦上正常安裝運(yùn)行的軟件在其它個人電腦上無法安裝或運(yùn)行失敗的情況,這類問題增加了個人電腦用于計算機(jī)實(shí)驗(yàn)的難度。
(2)網(wǎng)絡(luò)連接。部分實(shí)驗(yàn)內(nèi)容如多媒體、網(wǎng)絡(luò)通信分析模擬等要求實(shí)驗(yàn)環(huán)境中的計算機(jī)處于同一局域網(wǎng)內(nèi)。個人電腦由于本地防火墻、校園網(wǎng)的安全設(shè)置等不支持這些功能。
校園云上計算機(jī)實(shí)驗(yàn)環(huán)境架構(gòu)如圖1 所示。云平臺基于虛擬化、軟件定義網(wǎng)絡(luò)等核心技術(shù),對底層計算、存儲和網(wǎng)絡(luò)資源聚合統(tǒng)一管理,根據(jù)需求從資源池中分配相應(yīng)資源,集成鏡像、數(shù)據(jù)庫等服務(wù)模塊提高平臺定制化能力及數(shù)據(jù)管理分析能力。
圖1 云平臺計算機(jī)實(shí)驗(yàn)環(huán)境結(jié)構(gòu)
云平臺后端調(diào)用API 為前端提供服務(wù),向授課教師和課程助教等對底層架構(gòu)不熟悉的用戶提供桌面化Web 界面服務(wù)窗口,實(shí)驗(yàn)環(huán)境配置及資源管理可在界面上執(zhí)行,降低普通用戶在云平臺操作的復(fù)雜性。在云平臺管理上,設(shè)置性能監(jiān)控和安全檢測模塊,加強(qiáng)對實(shí)驗(yàn)環(huán)節(jié)的管控調(diào)整,滿足用戶硬件配置、網(wǎng)絡(luò)訪問需求。
計算機(jī)實(shí)驗(yàn)環(huán)境所需要的硬件如計算、存儲、網(wǎng)絡(luò)資源,由云基礎(chǔ)設(shè)施服務(wù)提供。每門課程的學(xué)生數(shù)量和資源需求量不同,云計算的虛擬化特色可將資源池中的資源分割,提供多種硬件配置模板(flavor),根據(jù)不同課程進(jìn)行資源合理分配?,F(xiàn)有資源的彈性伸縮可應(yīng)對實(shí)驗(yàn)課程在不同階段產(chǎn)生資源配置變動的需求。對于閑置的計算資源可通過云主機(jī)“擱置”功能暫時釋放,提高資源利用率[19-21]。
計算機(jī)實(shí)驗(yàn)室和個人電腦由于采用物理設(shè)備,硬件故障會造成服務(wù)不可用甚至數(shù)據(jù)丟失。云平臺采用高可用性設(shè)計,云主機(jī)在所在宿主機(jī)故障時自動遷移至其它宿主機(jī)重新啟動,保障業(yè)務(wù)連續(xù)性。存儲池設(shè)定三副本冗余方案,保證單塊硬盤故障不會影響用戶數(shù)據(jù)。由于單臺云主機(jī)對應(yīng)到學(xué)生或?qū)嶒?yàn)小組,不設(shè)置每次使用后還原數(shù)據(jù)盤策略,避免了實(shí)驗(yàn)后遺忘數(shù)據(jù)轉(zhuǎn)移造成的不便。
在云平臺服務(wù)(Platform as a Service,PaaS)層面,實(shí)驗(yàn)環(huán)境所需要的標(biāo)準(zhǔn)組件如操作系統(tǒng)、程序庫、運(yùn)行環(huán)境等以鏡像服務(wù)的方式提供給用戶,用戶在此基礎(chǔ)上根據(jù)實(shí)驗(yàn)內(nèi)容增加定制化組件。實(shí)驗(yàn)課程產(chǎn)生的數(shù)據(jù)如課程項目、資源使用、資源利用、用戶操作日志等保存在數(shù)據(jù)庫中,利用這些數(shù)據(jù)對實(shí)驗(yàn)教學(xué)狀態(tài)、進(jìn)展和質(zhì)量進(jìn)行評價。
云平臺集成統(tǒng)一身份認(rèn)證,用戶以校內(nèi)統(tǒng)一身份認(rèn)證賬號或通過審批的注冊用戶賬號登陸云平臺控制臺門戶進(jìn)行自主式操作,如圖2 所示。每門實(shí)驗(yàn)課程對應(yīng)一個單獨(dú)的課程項目,實(shí)驗(yàn)教師可以加入到自己所在的課程項目下,對項目中的資源進(jìn)行配置調(diào)整和使用時間上的管理,各個課程項目間相互平行。為防止資源濫用,對每個課程項目可使用的資源總量采用配額限制,資源配額的擴(kuò)展需要發(fā)送工單并由云平臺管理員審批,并通過資源定價和計費(fèi)計量來控制資源的使用。
圖2 云平臺門戶界面
云平臺以云軟件服務(wù)(Software as a Service,SaaS)為部分已經(jīng)購入授權(quán)或開源的學(xué)科通用型軟件提供模板式部署,由模板創(chuàng)建的云主機(jī)預(yù)置對應(yīng)軟件的安裝,實(shí)驗(yàn)課程中需要使用到的其它軟件可在該基礎(chǔ)上增量安裝。首次完成了云主機(jī)部署后,可將云主機(jī)作為模板制作鏡像,對其它云主機(jī)統(tǒng)一、批量、自動化創(chuàng)建。針對工程學(xué)科實(shí)驗(yàn)環(huán)節(jié)中多種軟件的協(xié)同實(shí)驗(yàn)需求,云平臺的軟件模板和鏡像服務(wù)簡化了在軟件安裝和實(shí)驗(yàn)環(huán)境準(zhǔn)備中的復(fù)雜流程。
完成實(shí)驗(yàn)環(huán)境準(zhǔn)備后,實(shí)驗(yàn)教師將云主機(jī)的外網(wǎng)訪問方式、用戶名和密碼分配給學(xué)生,學(xué)生遠(yuǎn)程連接云主機(jī)登錄操作,并在本地客戶端或校內(nèi)超算平臺與云主機(jī)互傳數(shù)據(jù)或映射磁盤,無需接入移動存儲設(shè)備或使用網(wǎng)盤進(jìn)行數(shù)據(jù)搬遷工作。課程項目內(nèi)可將多臺云主機(jī)劃分至一個或多個內(nèi)網(wǎng),便于實(shí)驗(yàn)小組內(nèi)文件共享和小組間相互隔離。
為保障校園云上計算機(jī)實(shí)驗(yàn)環(huán)境的穩(wěn)定運(yùn)行,本文基于Zabbix 和Grafana 設(shè)計了監(jiān)控可視化模塊,云平臺運(yùn)維人員根據(jù)實(shí)驗(yàn)教學(xué)的資源負(fù)載情況做出資源池容量大小調(diào)整。課程項目下資源如CPU、內(nèi)存、磁盤IOPS、磁盤吞吐量、網(wǎng)絡(luò)流量的使用趨勢對教師可見,以便對實(shí)驗(yàn)進(jìn)展客觀分析,做出資源配置的動態(tài)調(diào)整。圖3 以云平臺CPU 分配量為例展示云平臺資源監(jiān)控,圖4 以云主機(jī)CPU 負(fù)載為例展示云主機(jī)參數(shù)監(jiān)控。
圖3 云平臺CPU 分配量監(jiān)控
圖4 云主機(jī)CPU 負(fù)載監(jiān)控
課程項目下設(shè)置安全組,默認(rèn)的安全組策略僅允許常用端口的訪問,降低受到網(wǎng)絡(luò)攻擊的可能性。此外,云平臺設(shè)置安全檢測模塊,以云主機(jī)為單位進(jìn)行自動化的周期性安全檢測,對存在的安全隱患如弱口令、軟件漏洞、非法進(jìn)程等信息通過郵件通知實(shí)驗(yàn)老師。
2020 年春季學(xué)期共有13 門實(shí)驗(yàn)課程在上海交通大學(xué)云平臺上開展。服務(wù)學(xué)生500 余名,累計使用到云主機(jī)551 臺,如圖5 所示。CPU 計算資源1750 核,存儲資源33.40 TB。經(jīng)統(tǒng)計,單個學(xué)生的實(shí)驗(yàn)環(huán)境部署平均時間少于5 分鐘。
圖5 春季學(xué)期教學(xué)云主機(jī)數(shù)量變化
針對高校傳統(tǒng)計算機(jī)實(shí)驗(yàn)教學(xué)方案中存在的問題,本文提出校園云上的計算機(jī)實(shí)驗(yàn)教學(xué)方案,并就當(dāng)前相關(guān)研究中出現(xiàn)的難點(diǎn)如云計算實(shí)驗(yàn)環(huán)境定制化部署、資源動態(tài)調(diào)整、平衡使用便捷和數(shù)據(jù)安全的關(guān)系等作出優(yōu)化設(shè)計,旨在提升實(shí)驗(yàn)教學(xué)的效率與質(zhì)量。同時,隨著高校信息化教學(xué)的發(fā)展,如何在校園云上提供更豐富的教學(xué)支持方案,如實(shí)驗(yàn)數(shù)據(jù)后處理、實(shí)驗(yàn)報告一鍵式提交等,并與現(xiàn)有的云上實(shí)驗(yàn)教學(xué)方案相整合,實(shí)現(xiàn)更為自動化和一體式的云上教學(xué)支持體系,將是下一步的研究方向。