趙宏 張亨國等
摘要:學(xué)習(xí)評價作為保障學(xué)習(xí)質(zhì)量和學(xué)習(xí)效果的重要措施,是MOOC學(xué)習(xí)中不可缺少的一環(huán)。該研究旨在對MOOCs的學(xué)習(xí)評價現(xiàn)狀進行分析,以期為我國MOOcs學(xué)習(xí)評價提供有意義的啟示和借鑒。筆者選取了國內(nèi)14個MOOCs平臺中能夠獲取課程學(xué)習(xí)評價方式說明的課程,對不同類別課程和不同平臺的學(xué)習(xí)評價進行分析,針對評價方式、評價類型數(shù)量、評價主體等方面進行了對比分析。研究發(fā)現(xiàn),課程評價沒有得到很好的重視,評價總體水平較低,期末考試、單元測驗和參與討論是最常采用的評價方式;課程整體的評價類型數(shù)量趨向于多元性的特征;評價主體仍顯得較為單一,主要為機器評價(90.8%)。各學(xué)科類別課程中文科課程偏重于同伴互評;各典型平臺的評價方式有所差異,“好大學(xué)在線”平臺考核方式最為豐富,更側(cè)重于線下考試。根據(jù)研究發(fā)現(xiàn),該文建議我國MOOCs建設(shè)和應(yīng)用過程中需要立足在線學(xué)習(xí)環(huán)境的特點,創(chuàng)新學(xué)習(xí)評價理念,重視同伴互評,設(shè)計有效的評價機制,推進學(xué)習(xí)分析的實踐應(yīng)用,開展個性化的學(xué)習(xí)評價。
關(guān)鍵詞:MOOCs;大規(guī)模在線開放;學(xué)習(xí)評價;評價方式
中圖分類號:G434 文獻標識碼:A
一、研究背景
在信息化社會中,互聯(lián)網(wǎng)對教育領(lǐng)域產(chǎn)生了巨大影響。隨著技術(shù)和理念的革新,各種新型教學(xué)方式層出不窮,影響著人們的學(xué)習(xí)方式。2012年,由MOOCs引發(fā)的“數(shù)字海嘯”席卷了全球,哈佛大學(xué)、MIT、斯坦福大學(xué)、耶魯大學(xué)等頂尖大學(xué)紛紛加入MOOCs行列。2013年,中國教育部和高校積極投身到MOOCs建設(shè)實踐中,各大高校的MOOCs如雨后春筍般接踵而至。清華大學(xué)牽頭建設(shè)的“學(xué)堂在線”,五所交大共建的大型開放式網(wǎng)絡(luò)課程平臺“Ewant”,愛課程攜手網(wǎng)易云課堂打造的“中國大學(xué)MOOC”等平臺都紛紛涌現(xiàn),形成了群雄逐鹿的局面。MooCs作為新型在線開放課程在世界范圍內(nèi)迅速興起,對在線教育及傳統(tǒng)教育產(chǎn)生了強烈的沖擊,但是一些挑戰(zhàn)也隨之而來,尤其是在MOOCs學(xué)習(xí)評價的實施上,傳統(tǒng)的以教師為主體的評價模式已經(jīng)不能適應(yīng)MOOCs的學(xué)習(xí)過程,如何對大規(guī)模學(xué)習(xí)者的學(xué)習(xí)進行科學(xué)評價成為新的挑戰(zhàn)。
2015年4月教育部頒布了《教育部關(guān)于加強高等學(xué)校在線開放課程建設(shè)應(yīng)用與管理的意見》,文件中明確指出要“建設(shè)適合網(wǎng)絡(luò)傳播和教學(xué)活動的內(nèi)容質(zhì)量高、教學(xué)效果好的在線開放課程”。為保證在線開放課程的質(zhì)量,必須有與之相應(yīng)的評價機制,沒有相應(yīng)的評價機制就難以評判真正意義上的網(wǎng)絡(luò)學(xué)習(xí),從某種程度上說,學(xué)習(xí)評價是在線學(xué)習(xí)的關(guān)鍵和核心,其在檢驗學(xué)習(xí)者的學(xué)習(xí)成效的同時,也幫助教師把握整體課程的學(xué)習(xí)狀態(tài),是MOOCs學(xué)習(xí)中必不可少的一環(huán)。
學(xué)習(xí)評價,顧名思義,主要指對學(xué)生學(xué)習(xí)狀況的測量與評估,即基于學(xué)生的學(xué)習(xí)過程和結(jié)果進行事實把握和價值判斷。已有研究和實踐從不同角度對MOOCs的學(xué)習(xí)評價進行了調(diào)查:一些研究者調(diào)查分析了MOOC學(xué)習(xí)評價方式,如Chauhan分析了新技術(shù)支持下的學(xué)習(xí)評價案例,包括學(xué)習(xí)分析技術(shù)、個人學(xué)習(xí)網(wǎng)絡(luò)(Personal Learning Network)、數(shù)字徽章等如何支持學(xué)習(xí)評價等;Papathoma通過觀察和訪談收集了12名學(xué)習(xí)者對于MOOC學(xué)習(xí)評價的看法,發(fā)現(xiàn)學(xué)習(xí)者認可同伴互評的方式,但是自動化評價仍舊是最受歡迎的評價方式;王宏艷等人結(jié)合自身在Coursera、Udacity等平臺的優(yōu)質(zhì)MOOCs的學(xué)習(xí)體驗對MOOCs教學(xué)評價加以探究,認為MOOCs具有多元、開放、人性化三大特征;鄭志高對Coursera、edX和Udacity三個平臺上349門課程的學(xué)習(xí)評價方式進行了調(diào)查分析。大部分學(xué)者尤其關(guān)注MOOCs環(huán)境下同伴互評的可行性與可靠性,探索不同的方法來提高同伴互評的精確性,其中一些學(xué)者嘗試通過構(gòu)建統(tǒng)計模型來評估和校正評價過程中的偏差;還有學(xué)者對評價量規(guī)進行了設(shè)計和應(yīng)用,發(fā)現(xiàn)在同伴互評的過程中提供指導(dǎo),能有效提升評價效果。
綜合國內(nèi)外近階段的研究發(fā)現(xiàn),目前關(guān)于MOOC學(xué)習(xí)評價的研究國外文獻居多,對學(xué)習(xí)評價的研究更為具體和深入,而國內(nèi)相關(guān)研究整體較少,且主要以國外的MOOCs平臺為調(diào)研對象,尚未有研究對我國MOOCs平臺的學(xué)習(xí)評價進行全面分析,如此便無法知曉教師對MOOCs學(xué)習(xí)評價的理解,那么相應(yīng)的改進建議就很難擺脫盲目性。因此,全面系統(tǒng)地研究我國MOOCs的學(xué)習(xí)評價現(xiàn)狀有著非常重大的意義。目前國內(nèi)MOOCs的學(xué)習(xí)評價在評價方式、評價類型數(shù)量、評價主體的整體狀況是怎樣的?不同平臺之間和不同課程之間到底有什么異同?這些都是值得我們探究的。因此,本研究通過借鑒已有研究,結(jié)合國內(nèi)的課程平臺及其教學(xué)課程,對不同類別課程和不同平臺的學(xué)習(xí)評價進行分析,針對評價方式、評價類型數(shù)量、評價主體等方面進行了對比分析,以期為我國MOOCs學(xué)習(xí)評價提供有意義的啟示和借鑒。
二、研究對象與數(shù)據(jù)來源
本研究以國內(nèi)主要的14個MOOCs平臺中明確給出評價方式的663門課程為研究對象,調(diào)查其采用的評價方式的類型、數(shù)量、評價主體及比例。
調(diào)查發(fā)現(xiàn),本研究樣本中學(xué)習(xí)評價方式主要包括單元測驗、單元作業(yè)、線下考試、期中考試、期末考試、期末大作業(yè)、隨堂小測試、參與討論頻次、課件瀏覽次數(shù)、調(diào)查共計10種評價方式。根據(jù)以往研究者的分類,以上評價方式可以分為兩類:總結(jié)性評價(期末考試、期末大作業(yè)及線下考試)、過程性評價(單元測驗、單元作業(yè)、期中考試、隨堂小測試、參與討論、課件瀏覽、課堂參與度調(diào)查)。同時,在663門課程中明確給出不同評價類型分值比例的有624門課程,占94%;只說明評價方式未給出比例說明的有39門,占6%。
三、MOOCs學(xué)習(xí)評價對比分析
(一)總體情況分析
1.MOOCs評價方式分析
本研究對樣本所采用的評價方式的類型進行了統(tǒng)計,發(fā)現(xiàn)可以分為三種類型:只采用總緒性評價、只采用過程性評價以及兩者結(jié)合評價方式。其中采用兩者結(jié)合評價方式的課程數(shù)量最多,共517門,占78%;其次是只采用“過程性評價”,包括119門課程,占17.9%;只采用“總緒性評價”課程數(shù)量最少,僅有27門課程,占4.1%。
本研究進一步對樣本采用的評價類型數(shù)量進行統(tǒng)計,結(jié)果發(fā)現(xiàn),絕大多數(shù)課程都采取了兩種以上的評價方式。樣本中僅有54門課程只采用了一種評價方式,占8.1%;采用三種評價方式的課程最多,有274門,占總體課程數(shù)量的41.3%;三種以上評價方式的課程共165門課程,占24.9%。
為了進一步分析當前M00Cs評價方式的差異,本研究對樣本中采用的具體評價方式類型進行了統(tǒng)計,如圖1所示。
數(shù)據(jù)結(jié)果表明,在所有評價方式中,單元測試是使用最多的評價類型(494門課程,占74.5%);其次是期末考試(451門課程,占68%);第三是參與討論頻次(407門課程,占61.4%)??偨Y(jié)性評價方式類型,期末大作業(yè)與線下考試這兩種普通高校傳統(tǒng)的評價方式在MOOCs中較少被采用。在過程性評價類型中,除了單元測試和參與討論頻次之外,單元作業(yè)也是經(jīng)常采用的一種評價方式(245門課程,占37%)。而采用期中考試、課件瀏覽次數(shù)、隨堂小測試和參與度調(diào)查的課程較少,均不超過整體課程數(shù)量的20%。
2.MOOCs評價主體分析
本研究對研究樣本的學(xué)習(xí)評價主體也進行了統(tǒng)計,發(fā)現(xiàn)樣本中有553門課程說明了評價主體,占83.4%。評價主體分為機器、同伴和教師三種類型。其中采用機器自評的課程數(shù)量最多,為501門,占了整體課程的90.6%;實施同伴互評的課程有156門,占28.2%;采用教師評價的課程最少,僅有40門,占7.2%。
本研究進一步統(tǒng)計了同一門課程采用不同評價主體的數(shù)量,如圖2所示。
數(shù)據(jù)表明,只采用一類評價主體的課程最多(426門),占總體的77%,兩類評價主體結(jié)合使用的課程數(shù)為110門(20%),三種評價主體均有的課程最少,僅有17門(3%)。由此可見,目前MOOCs主要以單主體評價為主。
(二)課程層次分析
一般來說根據(jù)學(xué)習(xí)對象,課程可以分為中學(xué)、本科、研究生、職業(yè)教育和通用課程五個層次。在本研究樣本中,本科課程最多,為373門,占總樣本的56%,通用課程為249門,占全部課程的38%,中學(xué)課程(6門,占0.9%)、研究生課程(6門,占0.9%)和職業(yè)教育(29門,占4.4%)數(shù)量較少。本部分對不同課程層次MOOCs的評價方式進行了分析。
1.不同課程層次MOOCs的評價類型及數(shù)量分析
本部分首先對不同課程層次MOOCs的評價類型數(shù)量進行了統(tǒng)計,如圖3所示。
結(jié)果發(fā)現(xiàn),無論哪種課程層次,同時采用兩種及以上評價方式的課程占絕大多數(shù),以三種為最多,而只采用一種評價方式的課程極少。
本部分進一步分析了不同課程層次MOOCs采用的評價類型(如圖4所示)。
由于研究樣本中本科生課程和通用課程占主體,因此這兩個層次課程的評價方式也最為全面。本科層次課程中,采用最多的前四種評價類型分別是期末考試(282門,占本科課程總數(shù)的75.6)、單元測驗(236門,63.3%)、參與討論頻次(206門,占55.2%)和單元作業(yè)(132門,占35.4%)。值得注意的是,本科生層次中,采用隨堂小測試的課程數(shù)量明顯高于其他三種層次。
通用課程中,使用最多的評價方式是單元測驗(197門,占通用課程數(shù)量的79.1%)和參與討論頻次(149門,占59.8%),其次才是期末考試(143門,57.4%)。
職業(yè)教育課程主要以過程性評價為主,其主要采用參與討論頻次(25門,占職業(yè)教育課程總數(shù)的86.2%)和單元測驗(22門,75.9%)兩種評價方式。
2.不同課程層次的MOOCs評價主體分析
本部分對不同課程層次MOOCs評價主體進行了統(tǒng)計,如圖5所示。
分析結(jié)果可知,不同層次課程在評價主體選擇上既有共同點也有差異。共同點是各層次課程的評價主體均以機器自評為主,尤其是研究生層次課程采用單一的機器自評。差異主要體現(xiàn)在教師評價和同伴互評方面。中學(xué)課程除機器自評外,主要以教師為主體進行學(xué)習(xí)評價,沒有同伴互評;而其他三種層次課程則正好相反,同伴評價的比例要顯著高于教師評價。
(三)學(xué)科類別分析
本研究樣本中,按照學(xué)科類別可分為哲學(xué)、經(jīng)濟學(xué)、法學(xué)、教育學(xué)、文學(xué)、歷史學(xué)、理學(xué)、工學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、軍事學(xué)、管理學(xué)、藝術(shù)13類。其中,理學(xué)(202門,30.4%)和工學(xué)(126門,19%)兩類課程占研究樣本的49.4%,醫(yī)學(xué)(67門,10%)、藝術(shù)(57門,8.5%)和文學(xué)(56門,8.5%)的課程數(shù)居中;農(nóng)學(xué)類課程僅有2門,均以期末大作業(yè)作為評價方式,軍事學(xué)的1門課程采用了參與討論頻次與期末大作業(yè)相結(jié)合的評價方式,由于這兩類學(xué)科的課程數(shù)量太少,在以下分析中不再加以說明。
1.不同學(xué)科類別MOOCs評價類型及數(shù)量分析
本部分對不同學(xué)科類別的課程評價方式進行了統(tǒng)計,結(jié)果如表1所示。
總體來說,各學(xué)科最常采用的四種評價方式是期末考試、單元測驗、參與討論、單元作業(yè)。其中,歷史學(xué)、工學(xué)兩個學(xué)科使用最多的評價方式是期末考試,其他9個學(xué)科采用最多的評價方式是單元測驗,比例均高于50%。
除此之外,不同學(xué)科其他6種評價類型的選擇上也有所差異。法學(xué)、醫(yī)學(xué)學(xué)科的MOOCs很注重學(xué)習(xí)者瀏覽課件的狀況,以此來評估學(xué)習(xí)者的學(xué)習(xí)參與度,采用此評價類型的比例明顯高于其他學(xué)科。相比較而言,經(jīng)濟學(xué)科中采用參與討論(33.3%)、單元作業(yè)(12.5%)、課件瀏覽(4.2%)三種評價方式的比重在研究樣本中均為最低。隨堂小測試、調(diào)查兩種評價方式僅在少數(shù)學(xué)科中有所應(yīng)用,且比例均低于5%。
對不同學(xué)科類別采用的評價類型數(shù)量進行進一步統(tǒng)計,如表2所示,各學(xué)科類別均同時至少采用了3種評價方式,尤其是哲學(xué)和醫(yī)學(xué)兩個學(xué)科,其采用三種以上評價類型的課程占比最高。
2.不同學(xué)科類別MOOCs評價主體分析
本部分對不同學(xué)科類別MOOCs的評價主體進行了統(tǒng)計,如圖6所示。
不同學(xué)科類別MOOCs采用機器自評的課程比例均高于75%,其中哲學(xué)和歷史學(xué)兩類學(xué)科中100%的課程都選擇了機器自評,其次是工學(xué)、理學(xué)學(xué)科,其采用機器自評的課程比例分別是96.0%(121門)和91.6%(185門)。
在所有學(xué)科類別中,采用教師主體進行學(xué)習(xí)評價的課程所占比例均低于同伴互評。其中歷史學(xué)采用同伴互評的比例最高,有7門課程,占80%,其次是法學(xué)(13門,占60%)、教育學(xué)(18門,占45%)。
(四)典型平臺分析
為了更深入分析目前MOOCs評價方式的現(xiàn)狀,本研究對具有代表性的前五個平臺(如表3所示),即中國大學(xué)MOOC、Ewant、智慧樹、學(xué)堂在線、好大學(xué)在線進行了進一步分析。
1.典型平臺評價方式比較
本部分對5個典型平臺課程所采用的評價方式進行了比較分析,如圖7所示。
結(jié)果表明,學(xué)堂在線和中國大學(xué)MOOC是采用評價方式類型最多的平臺,涵蓋了9種類型;其次是好大學(xué)在線和Ewant平臺,涵蓋8種類型;智慧樹平臺采用的評價類型最少,只有4種類型。
另外,各平臺選擇評價方式的類型有共同點也有差異。智慧樹、中國大學(xué)MOOC、學(xué)堂在線最常采用的評價方式是期末考試、單元測驗與參與討論,Ewant平臺主要采用單元測驗(81門,75.7%)和期末考試(63門,58.9%)兩種評價方式,參與討論沒有作為重要的評價方式(37門,34.6%)。值得注意的是,學(xué)堂在線采用隨堂小測試(15門,15.8%)的課程比例顯著高于其他四個平臺,Ewant期末大作業(yè)(22門,20.6%)的比重也明顯高于其他四個平臺。
相比較而言,好大學(xué)在線平臺在評價方式的設(shè)計上獨具一格,有三個區(qū)別于其他平臺的顯著特征:一是與其他4個平臺以期末考試為主的情況正好相反,好大學(xué)在線平臺期末考試的比例很低,僅占其平臺課程的3.2%;二是線下考試占據(jù)了很大的比重(37門,占該平臺課程的58.7%),這也與其他4個平臺截然相反,其他4個平臺中,除了智慧樹平臺僅有1.9%課程采用線下考試方式外,其余3個平臺都沒有采用此評價方式;三是相比較其他平臺,好大學(xué)在線平臺更為重視過程性評價,單元作業(yè)、單元測驗、課件瀏覽次數(shù)和參與討論頻次等比例均顯著高于其他4個平臺。
2.典型平臺評價類型數(shù)量比較
本部分進一步比較了五個平臺MOOCs評價類型數(shù)量,如圖8所示。
好大學(xué)在線采用的評價類型數(shù)量最為豐富,同時使用3種以上評價方式的課程比例為57.1%(36門),而其僅采用一種評價方式的課程比例最低(1.6%,1門)。其余四個平臺中同時使用3種評價方式的課程所占比較最高,均高于35%,其中以智慧樹(61.0%,64門)為最高。經(jīng)進一步分析發(fā)現(xiàn),智慧樹平臺中采用三種評價方式相結(jié)合的64門課程中,全部采用的是期末考試與單元測驗、參與討論相結(jié)合的評價。
3.典型平臺的MOOCs評價主體比較
本研究對五個平臺中課程的評價主體進行對比分析,如圖9所示。
整體來說,各平臺采用最多的仍然是機器自評,其次是同伴互評,最少的是教師評價。不同平臺在評價主體的選擇上各有偏好。較之其他四個平臺,好大學(xué)在線平臺采用機器自評的課程比例最低(76.9%,48門),采用同伴互評(75.4%,47門)和教師評價(21.5%,13門)兩種人工評價的課程比例卻顯著高于其他四個平臺。智慧樹平臺的課程均采用機器自評,沒有選擇任何一種人工評價的方式。
隨著技術(shù)和方法的進步,大多數(shù)MOOCs平臺都能實現(xiàn)對學(xué)生學(xué)習(xí)過程數(shù)據(jù)的記錄,實時地為學(xué)習(xí)評價提供重要依據(jù)。因此,本研究對典型平臺在學(xué)習(xí)過程數(shù)據(jù)上的評價狀況進行了分析。五個平臺都建立了練習(xí)和測試系統(tǒng),支持學(xué)生互評功能,支持課程成績設(shè)定及學(xué)習(xí)成績自動統(tǒng)計功能,除Ewant之外的四個平臺均可視化呈現(xiàn)了學(xué)習(xí)者的學(xué)習(xí)過程信息,如中國大學(xué)MOOC平臺提供了學(xué)習(xí)進度;學(xué)堂在線平臺記錄顯示了課程進度及學(xué)習(xí)者測試題得分情況;好大學(xué)在線提供了學(xué)習(xí)者每周學(xué)習(xí)時長與人均學(xué)習(xí)時長的對比、個人練習(xí)得分及班級平均得分的學(xué)習(xí)情況,便于學(xué)習(xí)者了解其他同伴的學(xué)習(xí)情況并知曉自己所處的學(xué)習(xí)狀態(tài);智慧樹通過統(tǒng)計圖呈現(xiàn)了學(xué)習(xí)者的進度及個人測試成績。但是總體來看,各平臺并沒有完整收集學(xué)習(xí)過程中的重要信息,相關(guān)信息的可視化呈現(xiàn)甚少。
四、MOOCs評價狀況討論
(一)評價設(shè)計的總體水平較低,期末考試、單元測驗和參與討論是最常采用的評價方式
通過對有評價說明的663門課程分析發(fā)現(xiàn),我國MOOCs學(xué)習(xí)評價的主流趨勢是總結(jié)性評價與過程性評價相結(jié)合,采用了更加偏重考試和測驗的評價方式,形式較為簡單,這與我國MOOCs偏重行為主義教學(xué)設(shè)計的現(xiàn)狀相符。值得注意的是,“參與討論”這一評價方式在MOOCs評價中應(yīng)用廣泛,這說明MOOC教師開始重視學(xué)習(xí)者之間的互動,評價學(xué)習(xí)者的交互將促進他們的主動參與,實現(xiàn)同伴間的知識共享、共同成長,同時討論內(nèi)容也是教師了解學(xué)習(xí)者學(xué)習(xí)狀態(tài)的一個重要依據(jù)。然而,課堂參與度調(diào)查、課程瀏覽和隨堂小測試三種方式只在不到15%的課程中得到應(yīng)用,這也側(cè)面體現(xiàn)了我國MOOCs對學(xué)習(xí)者的過程性學(xué)習(xí)行為關(guān)注不夠,隨堂小測試的缺失也會導(dǎo)致教學(xué)人員無法診斷學(xué)習(xí)者在視頻學(xué)習(xí)中遇到的問題。
學(xué)習(xí)評價應(yīng)考慮不同的情境,運用多種不同方式,從多個角度進行綜合分析和判斷。我國MOOCs整體的評價類型數(shù)量趨向于多元化的特征,67%的課程選擇3種及3種以上的評價方式相結(jié)合。但是整體課程的評價主體仍顯得較為單一,受限于MOOC的大規(guī)模、免費的特征,大多評價是基于客觀題,由機器評價(90.8%)展開,這可能會導(dǎo)致學(xué)習(xí)者與教師、同伴的交互處于較低的狀態(tài),在學(xué)習(xí)過程中感受到孤獨與焦慮。調(diào)查結(jié)果顯示,國內(nèi)MOOCs(156門,28.2%)開始運用同伴互評這一重要評價方式,但并不廣泛,仍在探索當中。相較于國內(nèi),雖然國外對同伴互評的效果有所爭議,但Coursera、edX等平臺廣泛采用了互評策略。另外,面對數(shù)量巨大的學(xué)習(xí)者,MOOCs教師無法也不再適合作為主要的評價主體,調(diào)查顯示只有極少數(shù)課程采用了教師評價(3%)。其實教師和學(xué)生的雙向交互是促進有效教學(xué)的重要環(huán)節(jié),教師可以通過作業(yè)的集中反饋、答疑等方式來與學(xué)習(xí)者進行良好的互動。
(二)各學(xué)科類別最常采用機器自評,社科領(lǐng)域更關(guān)注同伴互評
在不同學(xué)科類別的課程中,采用最多的評價方式仍舊是單元測驗、參與討論與期末考試。在調(diào)查中發(fā)現(xiàn),由于平臺提供的評價方式都是固定的類別,各學(xué)科類別可選擇的評價方式并無差異。如果要實現(xiàn)具有學(xué)科特色的學(xué)習(xí)評價,那么必須完善平臺功能,使教師能根據(jù)學(xué)科內(nèi)容靈活選擇適合的評價方式。
在評價主體的選擇上,法學(xué)、歷史學(xué)更注重于同伴互評和教師評價,而理學(xué)和工學(xué)在同伴互評和教師評價上相對較弱,這與edX平臺上MOOCs的學(xué)習(xí)評價情況一致。究其原因,自然科學(xué)領(lǐng)域側(cè)重于考察學(xué)習(xí)者對客觀知識的掌握,而人文社科領(lǐng)域則更關(guān)注于學(xué)習(xí)者的觀念、想法,注重培養(yǎng)學(xué)生的分析能力、問題解決能力及創(chuàng)新能力,主要選擇主觀題對學(xué)習(xí)者進行評價,因此在人文科學(xué)及社會科學(xué)領(lǐng)域更多利用“同伴互評”讓學(xué)習(xí)者可以對同伴的作業(yè)答案進行評價并提供反饋。
(三)本科層次和通用層次課程占據(jù)課程主體,評價形式表現(xiàn)不一
在中學(xué)、本科、研究生、職業(yè)教育和通用課程五種層次課程中,本科層次和通用層次課程有更為全面的評價方式。盡管兩種課程最常用的三種評價方式都是參與討論、單元測驗和期末考試,但是本科課程更注重期末考試,注重課程整體學(xué)習(xí)狀況的評估,而通用課程更關(guān)注參與討論、課件瀏覽等,注重學(xué)習(xí)者在線學(xué)習(xí)的參與度。這個現(xiàn)象和兩類層次課程的學(xué)習(xí)目標相一致。研究生課程和中學(xué)生課程稀少,類型單一,有待進一步發(fā)現(xiàn)學(xué)習(xí)者需求開設(shè)更多課程。
(四)不同平臺采用的評價方式差異較大
對五個典型平臺的評價方式分析后發(fā)現(xiàn),各平臺在評價方式與評價主體的選擇上都各具特色,無統(tǒng)一標準,這反映了各平臺建設(shè)的差異性。好大學(xué)在線的評價方式最為豐富,充分利用了線下考試,同時也重視課件瀏覽等行為數(shù)據(jù),體現(xiàn)出教學(xué)探索的意味,這主要是因為“好大學(xué)在線”深化了“翻轉(zhuǎn)課堂”的教學(xué)模式,而翻轉(zhuǎn)課堂師生見面的便利性在評價中得到充分應(yīng)用,應(yīng)用線下考試的比例非常高。智慧樹與其他MOOCs平臺相比的一個明顯不足在于評價方式相對單調(diào),平臺中僅采用了四種評價方式,更注重于結(jié)果性評價,評價主體均為機器自評。
五、MOOCs學(xué)習(xí)評價的改進建議
學(xué)習(xí)評價作為保障學(xué)習(xí)質(zhì)量和學(xué)習(xí)效果的重要措施,是MOOCs教學(xué)過程中不可或缺的要素,筆者通過調(diào)研國內(nèi)MOOCs學(xué)習(xí)評價實踐現(xiàn)狀,對MOOCs學(xué)習(xí)評價狀況進行了整體分析,以下從教學(xué)理念、實踐應(yīng)用等方面對MOOCs的學(xué)習(xí)評價改進提出幾點建議。
(一)以學(xué)習(xí)目標為燈塔,創(chuàng)新學(xué)習(xí)評價理念
作為一類新型的在線學(xué)習(xí),MOOCs以其大規(guī)模、開放、優(yōu)質(zhì)、創(chuàng)新等優(yōu)勢吸引了諸多學(xué)習(xí)者,同時也不可避免地出現(xiàn)了一系列的問題,如通過率低、學(xué)生參與度不足、師生互動缺乏等,MOOCs的學(xué)習(xí)評價對于了解MOOCs學(xué)習(xí)者的學(xué)習(xí)需求與狀態(tài),調(diào)整教學(xué)過程,提升教學(xué)質(zhì)量均有著重要意義。從實踐效果看,由于教學(xué)方式的不同,傳統(tǒng)學(xué)習(xí)評價的形式在MOOCs的應(yīng)用產(chǎn)生了相應(yīng)的變化,但是從本質(zhì)上看大量MOOCs對學(xué)習(xí)者的學(xué)習(xí)評價仍舊偏重于考試、測驗等評價方式,停留在通過試題分析發(fā)現(xiàn)學(xué)生的認知問題、通過作業(yè)反饋給學(xué)生提供學(xué)習(xí)指導(dǎo)的階段。學(xué)習(xí)者會把他們的努力集中在他們認為會被測試的內(nèi)容或技能上,學(xué)習(xí)評價不僅對學(xué)生的學(xué)習(xí)內(nèi)容、時長有所影響,對學(xué)習(xí)方式、結(jié)果也會產(chǎn)生影響?,F(xiàn)有MOOCs評價模式呈現(xiàn)出的單一化,會導(dǎo)致課程在維持學(xué)習(xí)者的學(xué)習(xí)動機、引發(fā)學(xué)習(xí)者的積極投入、提升高階思維能力等方面存在缺陷,反映了課程設(shè)計階段對課程學(xué)科特點、學(xué)習(xí)目標與學(xué)習(xí)過程監(jiān)控的忽視。
因此,現(xiàn)階段MOOCs評價理念應(yīng)當有所突破。在線課程設(shè)定學(xué)習(xí)目標不僅是學(xué)生對知識的簡單掌握,更希望學(xué)生在多個方面的發(fā)展,包括學(xué)生在學(xué)習(xí)過程中的收集處理信息能力、交流合作能力、投入程度、情感態(tài)度等,所以在設(shè)定評價內(nèi)容時,在以課程的學(xué)習(xí)目標為前提的條件下應(yīng)當全面地考慮學(xué)生各方面的成長變化。另外,雖然目前課程以行為主義理論指導(dǎo)下的xMOOCs為主,但一門在線課程中學(xué)習(xí)不可能獨立地依賴于某一種學(xué)習(xí)理論支撐,更多地是在多種學(xué)習(xí)理論的指導(dǎo)下的學(xué)習(xí),雖然某些課程中并不存在具有明顯社會建構(gòu)和知識創(chuàng)新特征的設(shè)計,但不乏在討論區(qū)形成強交互的潛在聯(lián)通。我們認為,課程設(shè)計者在遵循“學(xué)習(xí)目標一學(xué)習(xí)評價”的基礎(chǔ)上,應(yīng)當突破現(xiàn)有的基于行為主義和認知主義的MOOCs評價設(shè)計,關(guān)注學(xué)習(xí)者在異步交互中形成的知識建構(gòu),不僅停留在交互數(shù)量的評價上,更要嘗試對現(xiàn)有在線學(xué)習(xí)中的交互質(zhì)量進行評價,是使MOOCs評價真正實現(xiàn)有效改進和提升的關(guān)鍵所在。
(二)重視同伴互評,設(shè)計有效的評價機制
MOOCs的大規(guī)模和教師精力的有限性決定了MOOCs教師不再適合作為學(xué)習(xí)評價主體,MOOCs將學(xué)生這一主體元素引入學(xué)習(xí)評價,將評價作為學(xué)習(xí)任務(wù),把課程學(xué)習(xí)與評價有機統(tǒng)一起來,這對于發(fā)展學(xué)習(xí)者的評價能力、促進其成為主動的學(xué)習(xí)者尤為重要。雖然相較于人工反饋,MOOCs學(xué)習(xí)者更愿意接受機器評價,但以往研究調(diào)查也表明MOOCs學(xué)習(xí)者表現(xiàn)出與同伴交流的強烈意愿,并認同MOOCs中同伴互評的策略,認為其可以促進學(xué)習(xí)者的理解,減少孤獨感,通過同伴互評不僅能夠獲得改進其學(xué)習(xí)的具體建議和支持,而且能夠從中獲得更強烈的情感支持,激勵他們持續(xù)投入在學(xué)習(xí)中。因此,設(shè)計有效的同伴互評機制對于引導(dǎo)學(xué)習(xí)者參與學(xué)習(xí),增強學(xué)習(xí)動機有重要的作用。
由前文分析可知,雖然我國大部分平臺已經(jīng)在著力研究同伴互評,但是對同伴互評的應(yīng)用才剛剛開始,整體仍舊處于一個較低水平。一個主要原因是開設(shè)MOOCs的教師大多是傳統(tǒng)高校的教師,缺乏充足的在線設(shè)計經(jīng)驗,更容易關(guān)注教學(xué)內(nèi)容與測試的設(shè)計,忽視同伴互評這一重要創(chuàng)新性教學(xué)方法。因此,MOOCs教師應(yīng)當轉(zhuǎn)換觀念,借鑒傳統(tǒng)教育環(huán)境下的同伴互評,在MOOCs中應(yīng)用并不斷完善在線同伴互評,評價學(xué)習(xí)者在復(fù)雜環(huán)境下的問題解決能力、創(chuàng)新能力。目前國內(nèi)外的同伴互評方式大多是由3-5個學(xué)習(xí)者共同給一份作業(yè)打分,在此基礎(chǔ)上教學(xué)設(shè)計師可以通過多種方法來確保同伴互評的有效性,如為不同背景的學(xué)習(xí)者搭建“腳手架”,給出明確可實施的評價標準或者提供專家評分的樣例,通過樣例使學(xué)習(xí)者校正自己對于評分規(guī)則的理解。
(三1推進學(xué)習(xí)分析的實踐應(yīng)用,完善基于過程的學(xué)習(xí)評價
MOOCs不受時空限制、靈活的特點吸引了廣泛的受眾,根據(jù)學(xué)習(xí)動機的不同,主要包括以興趣為導(dǎo)向的學(xué)習(xí)者、以充實個人內(nèi)涵為目的的學(xué)習(xí)者、促進職業(yè)發(fā)展的學(xué)習(xí)者等。目前國內(nèi)MOOCs多將傳統(tǒng)學(xué)習(xí)評價遷移到在線環(huán)境下,單純地面向?qū)W習(xí)結(jié)果,無法實現(xiàn)“因材施教”的個性化評價,難以從根本上維持學(xué)習(xí)者的學(xué)習(xí)動機、激發(fā)其內(nèi)在驅(qū)動力。
學(xué)習(xí)分析技術(shù)的出現(xiàn)為個性化學(xué)習(xí)評價提供了可能,通過數(shù)據(jù)清洗、數(shù)據(jù)挖掘、數(shù)據(jù)建模等技術(shù)處理學(xué)習(xí)者在線學(xué)習(xí)過程數(shù)據(jù),從而對個體學(xué)習(xí)者的學(xué)習(xí)過程進行評價、追蹤預(yù)測和干預(yù),以了解學(xué)習(xí)者的個體差異。這種評價的主要功能是對學(xué)生的過程進行實時的監(jiān)控與引導(dǎo),有效激勵學(xué)習(xí)者參與學(xué)習(xí)過程,同時為教師進行及時有效的學(xué)習(xí)干預(yù)和支持提供依據(jù)。此外,將學(xué)習(xí)過程中的參與納入評價框架,可以有效改善以往僅將期末考試、作業(yè)、測試作為評價依據(jù)的局限,彌補總結(jié)性評價的片面性問題。目前國內(nèi)平臺雖然將學(xué)習(xí)分析融入到了學(xué)習(xí)評價中,但是這方面的實踐才剛剛開始,收集到的評價依據(jù)不完整,缺乏對相關(guān)過程與結(jié)果數(shù)據(jù)的深入分析,導(dǎo)致MOOCs學(xué)習(xí)無法實現(xiàn)真正的、全面的“過程性評價”。因此,對學(xué)習(xí)者學(xué)習(xí)過程的評價需要構(gòu)建全面衡量學(xué)習(xí)質(zhì)量的綜合評價模型,以教學(xué)目標作為“基準線”,從言語信息、認知策略、態(tài)度等更充分的維度綜合形成科學(xué)、可操作的評價目標體系,通過更加立體和多元化的評價數(shù)據(jù)為教師進行有效的教學(xué)干預(yù)提供支持。