桂安然,趙 晉
(1.同濟(jì)大學(xué) 經(jīng)濟(jì)與管理學(xué)院,上海201800;2.同濟(jì)大學(xué) 職業(yè)技術(shù)教育學(xué)院,上海200092)
隨著5G 時(shí)代的到來(lái),許多平臺(tái)網(wǎng)站都累積了大量的數(shù)據(jù),在線教育平臺(tái)也不例外。但同時(shí),在線教育平臺(tái)也面臨著一個(gè)問題,即只是“教育數(shù)據(jù)量大”,而不知道如何對(duì)收集到的這些數(shù)據(jù)進(jìn)行處理、利用,從而獲得“教育大數(shù)據(jù)”。在學(xué)術(shù)界的研究中也存在著同樣的問題,大數(shù)據(jù)浪潮之下學(xué)術(shù)界對(duì)于在線評(píng)價(jià)的信息挖掘主要集中在電商購(gòu)物領(lǐng)域,而非在線教育。比如在線課程的評(píng)論就是一個(gè)很好的例子,之前的學(xué)習(xí)者在學(xué)習(xí)過這些課程后,會(huì)產(chǎn)生大量和課程相關(guān)的評(píng)論信息,潛在的學(xué)習(xí)者通常會(huì)花大量的時(shí)間來(lái)閱讀在線評(píng)論,輔助自己制訂課程選擇決策。
然而,在線教育平臺(tái)的運(yùn)營(yíng)者卻未對(duì)在線課程評(píng)論的價(jià)值產(chǎn)生足夠的重視,未對(duì)可能隨意撰寫的評(píng)論進(jìn)行回應(yīng)或者刪除,這些都嚴(yán)重地干擾了后來(lái)學(xué)習(xí)者甄別信息,從而導(dǎo)致在線教育平臺(tái)在一定程度上會(huì)失去該學(xué)習(xí)者或者降低學(xué)習(xí)者的使用黏度。
對(duì)于評(píng)論信息在在線教育領(lǐng)域的利用主要可以從以下幾個(gè)方面實(shí)現(xiàn):在線學(xué)習(xí)者初步選定自己要進(jìn)行在線課程學(xué)習(xí)的平臺(tái),比如中國(guó)境內(nèi)的“網(wǎng)易云課堂”或海外學(xué)習(xí)網(wǎng)站“可汗學(xué)院”“Coursera”等;學(xué)習(xí)者在眾多在線課程中初步選擇五六門同質(zhì)化較高的課程;借助網(wǎng)絡(luò)爬蟲技術(shù)獲取這些在線課程的真實(shí)課后評(píng)論,所謂真實(shí)課后評(píng)論,就是人工去除一些與課程明顯無(wú)關(guān)的灌水評(píng)論、明顯能識(shí)別出是在線教育提供者以紅包或者減價(jià)等方式誘導(dǎo)在線學(xué)習(xí)者寫下的非真實(shí)評(píng)論,此后再使用強(qiáng)規(guī)則關(guān)聯(lián)算法、情感分析等自然語(yǔ)言處理方法對(duì)在線課程評(píng)論進(jìn)行分析;建立綜合評(píng)價(jià)模型對(duì)這五六門同質(zhì)化較高的課程進(jìn)行一個(gè)全面的評(píng)價(jià),最終選擇出適合學(xué)習(xí)者需求的課程。
值得注意的是,整個(gè)評(píng)論信息挖掘過程都是動(dòng)態(tài)的,并不僅僅只是適用于某一次在線教育課程的描述或評(píng)價(jià)。每進(jìn)行一次在線教育評(píng)論的信息挖掘,系統(tǒng)都可以記住本次信息挖掘的結(jié)果,并根據(jù)學(xué)習(xí)者接受課程選擇之后的真實(shí)學(xué)習(xí)體驗(yàn)之后的反饋進(jìn)行信息挖掘的修正,以使信息挖掘的準(zhǔn)確度更高、個(gè)性化程度更深。
偉大教育家孔子曾言“因材施教”,對(duì)在線教育評(píng)論的研究有助于實(shí)現(xiàn)大數(shù)據(jù)背景下的精準(zhǔn)個(gè)性化學(xué)習(xí)路徑挖掘研究。在線教育課程的評(píng)論中包含了十分豐富的課程相關(guān)信息,比如教授某門英語(yǔ)課程的教師發(fā)音是否標(biāo)準(zhǔn)、某門課程的難度設(shè)置是否適合目標(biāo)學(xué)習(xí)者等,借助自然語(yǔ)言處理技術(shù)都可以對(duì)課程進(jìn)行精準(zhǔn)的數(shù)學(xué)化描述,再結(jié)合學(xué)習(xí)者自身對(duì)于課程的期待、側(cè)重點(diǎn)為學(xué)習(xí)者制訂一個(gè)獨(dú)一無(wú)二的學(xué)習(xí)方案。
同時(shí),國(guó)務(wù)院所發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》中也明確提出要“探索發(fā)揮大數(shù)據(jù)對(duì)變革教育方式、促進(jìn)教育公平、提升教育質(zhì)量的支撐作用”,在學(xué)習(xí)者常用的在線學(xué)習(xí)平臺(tái)上都累積了大量的評(píng)論數(shù)據(jù),只有將這些評(píng)論利用起來(lái),才能真正地發(fā)揮大數(shù)據(jù)對(duì)教育方式變革的重要作用,發(fā)揮出大數(shù)據(jù)在教育管理和學(xué)習(xí)空間的重要作用[1]。
大量關(guān)于在線評(píng)論的文獻(xiàn)通過實(shí)證研究表明,在線商品的評(píng)論信息被消費(fèi)者作為制訂商品購(gòu)買決策的重要參考,而在線學(xué)習(xí)資源作為一種特殊的商品也無(wú)一例外。如何實(shí)現(xiàn)教育公平是教育改革領(lǐng)域長(zhǎng)期以來(lái)探討的重要話題,20 年以前,讓一個(gè)四川省涼山州大山里的學(xué)生接受北京小學(xué)生所學(xué)習(xí)的內(nèi)容一般是不可能實(shí)現(xiàn)的,而現(xiàn)在通過在網(wǎng)上觀看許多骨干教師分享在MOOC 平臺(tái)等上傳的課程,教育公平的實(shí)現(xiàn)也有了更多可能。而學(xué)習(xí)者如何才能從大量的在線課程中甄別出教學(xué)質(zhì)量高、課程完整、針對(duì)性較強(qiáng)的課程,往往需要借助閱讀其他學(xué)習(xí)者留下的評(píng)論進(jìn)行判斷。
目前對(duì)于在線評(píng)論的研究主要集中在手機(jī)購(gòu)買推薦、物流服務(wù)影響因素分析等領(lǐng)域[2-3]。針對(duì)電商網(wǎng)購(gòu)平臺(tái)的許多售貨者會(huì)以發(fā)放紅包,優(yōu)惠價(jià)格等方式誘導(dǎo)消費(fèi)者在購(gòu)買物品后寫下“非真實(shí)好評(píng)”的情況,演克武等人[4]以酒店在線預(yù)訂平臺(tái)作為研究對(duì)象,從網(wǎng)站的監(jiān)管是否得力、制定的酒店評(píng)價(jià)標(biāo)準(zhǔn)是否全面且合理、評(píng)論發(fā)表者的個(gè)人特性三個(gè)方面進(jìn)行研究,為打擊不良網(wǎng)絡(luò)匿名評(píng)論、虛假評(píng)論提出相應(yīng)的對(duì)策,從而提高線上銷售的可靠性。彭世豪[5]則將對(duì)于在線評(píng)論的挖掘拓展到了圖書編輯選材領(lǐng)域,主要是利用統(tǒng)計(jì)學(xué)上常用的K-means 聚類方法來(lái)對(duì)在線售賣圖書的評(píng)論進(jìn)行挖掘,構(gòu)建出了一個(gè)文學(xué)類圖書特征自定義詞庫(kù),供編輯參考。王少兵等人[6]在對(duì)旅游網(wǎng)站的景點(diǎn)評(píng)論進(jìn)行情感分析時(shí)創(chuàng)新性地結(jié)合了領(lǐng)域本體構(gòu)建技術(shù),為游客的出游制定個(gè)性化的推薦策略。
這些研究都對(duì)本文研究在線課程的評(píng)論有著重要啟示作用。以攜程網(wǎng)、螞蜂窩等旅游網(wǎng)站的相關(guān)評(píng)論為例,首先對(duì)于提供的旅游方案而言,它和在線學(xué)習(xí)課程都屬于非實(shí)體商品,所售出的東西不僅與商品本身特性有關(guān),和歷史評(píng)價(jià)者等因素也有關(guān)系;其次教育的本質(zhì)是集體的事情,即使是要為學(xué)生提供個(gè)性化的學(xué)習(xí)方案,也應(yīng)該在共性中找不同,集體學(xué)習(xí)有利于促進(jìn)個(gè)體的相互學(xué)習(xí)。而這些旅行出游方案也巧妙地將先前寫下評(píng)論的群體智慧融入到了個(gè)人的偏好之中。
在線課程的評(píng)論所包含的信息可以為后續(xù)學(xué)習(xí)者的學(xué)習(xí)提供決策參考,越來(lái)越多的科技企業(yè)、人工智能巨頭等也開始逐漸在智慧教育領(lǐng)域發(fā)力,但可以看到目前仍沒有商用的大型系統(tǒng)對(duì)在線學(xué)習(xí)課程的評(píng)論進(jìn)行分析,構(gòu)造出一個(gè)基于在線學(xué)習(xí)課程評(píng)論的描述模型,從而幫助在線學(xué)習(xí)者在有限的學(xué)習(xí)時(shí)間里提高自己的學(xué)習(xí)效率,倒逼在線教育平臺(tái)優(yōu)化服務(wù)、提高管理效率。
在線評(píng)論一直被視作“網(wǎng)絡(luò)口碑”,因?yàn)槠洹耙粋魇?、十傳百”的傳播效率受到了廣泛的關(guān)注。一方面,消費(fèi)者無(wú)論是在網(wǎng)絡(luò)上購(gòu)買服務(wù)時(shí)還是購(gòu)買產(chǎn)品時(shí),都希望尋找到已經(jīng)獲得此種服務(wù)或者產(chǎn)品的用戶的意見和真實(shí)購(gòu)物分享;另一方面,傳統(tǒng)口碑所具備的較大影響力,在網(wǎng)絡(luò)空間中也依舊有所體現(xiàn)[7]。周燕等人[8]發(fā)現(xiàn),在線評(píng)論的存在形式是決定其有用性的一個(gè)非常關(guān)鍵的因素。常見的評(píng)論形式有文字文本,字?jǐn)?shù)從幾個(gè)字到三十多個(gè)字不等;消費(fèi)者可以通過點(diǎn)亮不同維度的星星顆數(shù)來(lái)表明自己對(duì)當(dāng)前產(chǎn)品的態(tài)度,通常星星數(shù)越多代表滿意程度越高。
隨著國(guó)家對(duì)教育信息化工作的不斷推進(jìn),在線教育受到不同領(lǐng)域的關(guān)注也越來(lái)越多。2013 年是中國(guó)在線教育的元年,從業(yè)界逐漸形成共同認(rèn)知以來(lái),大量的資本注入、技術(shù)的涌入、在線教育從業(yè)者的加入、賽道的不斷細(xì)分共同推動(dòng)著在線教育取得巨大發(fā)展。比如2017 年中國(guó)融資金額榜首是專注于在線幼兒教育的VIPKID 英語(yǔ)。但是當(dāng)前的在線教育仍然是較為簡(jiǎn)單的模式,更多是將線下課堂所教授的線下課程原封不動(dòng)地搬運(yùn)到了網(wǎng)絡(luò)之上,這些課程沒有根據(jù)在線教育學(xué)習(xí)者的需求和在線教育的特點(diǎn)進(jìn)行精心的設(shè)計(jì)和內(nèi)容開發(fā),也沒有對(duì)學(xué)習(xí)者的意見給予足夠的重視,對(duì)在線課程評(píng)論這一重要反饋缺少必要的關(guān)注,也就因此缺少了一個(gè)根據(jù)學(xué)習(xí)者的個(gè)性化需求推薦課程、提高學(xué)習(xí)者的學(xué)習(xí)效率、從而倒逼在線教育不斷提高自己所提供課程的質(zhì)量、壯大企業(yè)的發(fā)展。而學(xué)術(shù)上,若能將評(píng)論信息挖掘的實(shí)證研究拓寬到在線教育領(lǐng)域,必定也能推動(dòng)著評(píng)論信息挖掘技術(shù)不斷完善,不管是社會(huì)價(jià)值還是教育意義層面,研究評(píng)論信息挖掘在在線教育領(lǐng)域的運(yùn)用都是勢(shì)在必行的。