徐秀珍,張媛媛,盧安文
(重慶郵電大學(xué)經(jīng)濟(jì)管理學(xué)院,重慶 400064)
由于留學(xué)生自身的文化背景和學(xué)習(xí)能力不同,導(dǎo)致留學(xué)生之間的學(xué)習(xí)成果也存在著巨大的差異,然而傳統(tǒng)的教學(xué)成果評價分析并沒有充分利用數(shù)據(jù)中隱含的更有價值的信息,因此想要真正地實現(xiàn)精準(zhǔn)教學(xué),必須從學(xué)生數(shù)據(jù)源著手進(jìn)行數(shù)據(jù)挖掘,進(jìn)而制定出更為完備的留學(xué)生分層教學(xué)策略。
數(shù)據(jù)挖掘領(lǐng)域的聚類分析已成為了學(xué)者廣泛關(guān)注的研究話題。高迎等以微博用戶為例,利用WeKa 工具構(gòu)建出了用戶活躍度聚類模型,為提高用戶活躍度提供了依據(jù);張建萍等通過闡述數(shù)據(jù)挖掘過程的實踐過程,論證了聚類分析在兒童生長發(fā)育時期的應(yīng)用價值;羅平娟等利用K-means算法設(shè)計了物流配送方案,以就近原則分配車輛和人員,實現(xiàn)了資源的有效利用。
基于此,本文通過構(gòu)建學(xué)生畫像和教學(xué)質(zhì)量評價指標(biāo)體系,實現(xiàn)對留學(xué)生學(xué)習(xí)需求和學(xué)習(xí)現(xiàn)狀的識別與分析。并運(yùn)用K-means 聚類算法構(gòu)建起合適的留學(xué)生群體聚類模型,針對不同的留學(xué)生類別提出相應(yīng)的教學(xué)策略建議。
留學(xué)生用戶畫像的繪制是基于留學(xué)生各類相關(guān)數(shù)據(jù)建立起來的,且大多來源于教務(wù)考勤、學(xué)生管理等應(yīng)用系統(tǒng)。將每項數(shù)據(jù)所代表的行為進(jìn)行分類即構(gòu)建起了用戶畫像標(biāo)簽,進(jìn)而可從不同維度對留學(xué)生進(jìn)行描述刻畫,建立起生動、清晰的學(xué)生畫像。
在學(xué)生用戶畫像繪制過程中,本文選取了“國別”“語言(漢語水平)”“成績(專業(yè)課平均分)”“學(xué)習(xí)習(xí)慣”等9個就探究內(nèi)容而言具有顯著甄選價值的標(biāo)簽指標(biāo),并對部分主觀性高的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化數(shù)字評估,最后輸出的某個可視化用戶畫像如表1,有助于更為直觀地探究該留學(xué)生的學(xué)習(xí)現(xiàn)狀和需求。
表1 某留學(xué)生學(xué)習(xí)畫像
續(xù)表1
通過對留學(xué)生教學(xué)的分析研究,本文梳理出了影響教學(xué)質(zhì)量的諸多因素,并計算出各因素影響教學(xué)質(zhì)量的權(quán)重,從而為優(yōu)化課堂教學(xué)效果和質(zhì)量提供可行性的決策依據(jù)。在教學(xué)質(zhì)量評價層次結(jié)構(gòu)中,確定了四個一級指標(biāo)和十八個二級指標(biāo),并結(jié)合專家排序法的結(jié)果就指標(biāo)重要程度進(jìn)行指標(biāo)權(quán)重的計算,結(jié)果如表2 所示。
表2 教學(xué)質(zhì)量指標(biāo)權(quán)重
從數(shù)據(jù)分析可見,計算的結(jié)果和實際認(rèn)知較為一致。其中,學(xué)生的“學(xué)習(xí)興趣及動力”和“學(xué)習(xí)自發(fā)性及主動性”在教學(xué)效果中分別占比為8.12%和7.01%,且由于留學(xué)生群體的特殊性,在諸多指標(biāo)中“課程難易程度”占比也較大,該指標(biāo)的重要性與針對留學(xué)生群體所展開的調(diào)查問卷結(jié)果相吻合。如圖1的調(diào)查問卷結(jié)果顯示,當(dāng)問到對于大學(xué)課堂若存在不滿意的原因相關(guān)問題時,52.38%的留學(xué)生表示“內(nèi)容太難,理解不了”,28.57%的留學(xué)生表示“內(nèi)容不感興趣”,說明這幾項指標(biāo)在教學(xué)質(zhì)量中起著非常重要的作用,學(xué)校管理者和教師都應(yīng)予以高度重視。
圖1 調(diào)查問卷結(jié)果統(tǒng)計
從表2的結(jié)果中還可以看出,在判斷教學(xué)效果各因素的影響力時教師的作用最大,其次是學(xué)生,再者是課程設(shè)置和教學(xué)管理辦法,因此必須意識到教師在教學(xué)質(zhì)量提高中扮演著不可或缺的角色,在分層教學(xué)過程中,還應(yīng)關(guān)注“教師教學(xué)態(tài)度”“教學(xué)語言”等幾項指標(biāo)以探究教學(xué)質(zhì)量提升的有效路徑。
在描繪出學(xué)生個體畫像的基礎(chǔ)上,將進(jìn)一步通過聚類建模劃分學(xué)生群體并分析特征,實現(xiàn)學(xué)生分層的群體畫像。本文在模型的分類上采用了K-means 聚類中的均值聚類算法,聚類分析的特點是計算簡單,呈現(xiàn)的結(jié)果比較直觀且易于理解。運(yùn)用在教學(xué)領(lǐng)域時,可有效分析學(xué)生學(xué)習(xí)情況。K-means聚類分析是選定初始中心并進(jìn)行多次迭代,計算每一個個體和聚類中心的距離大小,最終將樣本分成不同的類別的分析方法。其分析步驟如圖2所示。
圖2 K-means聚類分析步驟
數(shù)據(jù)準(zhǔn)備階段的主要工作包括對原始數(shù)據(jù)的采集、提取和轉(zhuǎn)換。由于留學(xué)生的學(xué)習(xí)差異在不同程度上受到文化背景、語言基礎(chǔ)、學(xué)習(xí)動機(jī)、個體學(xué)能等內(nèi)外部因素的影響,因此本文在學(xué)生用戶畫像中抽取了能體現(xiàn)該留學(xué)生漢語水平、學(xué)習(xí)意愿和學(xué)習(xí)能力的六個典型特征維度作為建模分層的標(biāo)簽指標(biāo)。
據(jù)此收集到的指標(biāo)分別為“漢語水平”“專業(yè)課平均成績”“考勤次數(shù)”“學(xué)習(xí)目標(biāo)是否明確”“學(xué)習(xí)習(xí)慣傾向”“一周課外學(xué)習(xí)時間”,從中可知該指標(biāo)集存在多維度分類型問題,如“學(xué)習(xí)目標(biāo)是否明確”可劃分為明確、較明確和不明確。為了實現(xiàn)分級度量,首先需要對字符串類型數(shù)據(jù)作相應(yīng)的數(shù)值變換處理。即可將標(biāo)簽指標(biāo)“漢語水平”中“完全聽不懂”賦值為1,“能聽和簡單的說”賦值為2。具體可參照表1中“評估準(zhǔn)則”欄,以此依次實現(xiàn)標(biāo)簽數(shù)據(jù)預(yù)處理。
本次建模隨機(jī)抽取了50 位留學(xué)生近一年的信息數(shù)據(jù)作為樣本并導(dǎo)出至Excel 中保存,為避免因缺考或未準(zhǔn)確收集從而導(dǎo)致的某些數(shù)據(jù)出現(xiàn)空值或重復(fù)的現(xiàn)象,及時剔除了存在缺失、重空值等情況的無效樣本數(shù)據(jù)。并且采用SPSS 軟件實現(xiàn)對數(shù)據(jù)的K-means 聚類分析,在完成數(shù)據(jù)導(dǎo)入后,為了解決量綱不一致等問題還需對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理以弱化數(shù)量級上的差異,得到的部分?jǐn)?shù)據(jù)描述性統(tǒng)計如圖3所示。
圖3 部分?jǐn)?shù)據(jù)描述性統(tǒng)計
在完成數(shù)據(jù)預(yù)處理和聚類變量特征的確定后,指定聚類個數(shù)是進(jìn)一步實現(xiàn)聚類分析的關(guān)鍵。在聚類個數(shù)的計算中,根據(jù)手肘法輸出的效果如圖4所示,橫坐標(biāo)為聚類個數(shù),縱坐標(biāo)為誤差平方和數(shù)值。其中,是所有樣本的聚類誤差,代表了聚類效果的好壞。隨著聚類個數(shù)的不斷增大,樣本劃分會更加精細(xì),每個簇的聚合程度會逐漸提高,從而導(dǎo)致誤差平方和SSE 逐漸變小。并且當(dāng)達(dá)到真實聚類個數(shù)時,聚合程度也已實現(xiàn)飽和,所以的下降幅度會趨于平緩。顯然,當(dāng)聚類個數(shù)為4 時折線出現(xiàn)了明顯的拐點,由此最終確定最佳聚類個數(shù)為4。
圖4 手肘法效果輸出
將值設(shè)置為4 并進(jìn)行了3 次迭代后,聚類中心不存在變動或者僅有小幅變動,由此實現(xiàn)了收斂。輸出結(jié)果如圖5所示。
圖5 最終聚類中心之間的距離
由圖5 和圖6 可知,在該聚類模型中各類別的最終聚類中心之間的距離分明且適中,各個指標(biāo)變量對應(yīng)的顯著性=0.000,顯然<0.05,從而可得各類別在指標(biāo)變量上的差異表現(xiàn)都十分顯著,也說明了該模型具有一定的合理性及有效性,可根據(jù)聚類結(jié)果進(jìn)行下一步分析。
圖6 ANOVA單因素方差分析
同時根據(jù)ANOVA 表中的F 近似值可得出該指標(biāo)變量在聚類分析中的作用影響程度,即在該模型中,各類指標(biāo)變量對聚類結(jié)果的重要程度排序為:專業(yè)課平均成績>一周課外學(xué)習(xí)時間>考勤>學(xué)習(xí)習(xí)慣傾向>學(xué)習(xí)目標(biāo)>漢語水平。該指標(biāo)變量重要程度的排序情況也為分層教學(xué)策略提供了有效的依據(jù),避免了因只考慮學(xué)習(xí)成績這一單項標(biāo)準(zhǔn)進(jìn)行分層教學(xué)所產(chǎn)生的弊端,進(jìn)而尊重學(xué)生的個體發(fā)展。
對聚類模型進(jìn)行有效性檢驗后,即可根據(jù)各類成員數(shù)和各位同學(xué)的聚類結(jié)果(如圖7 和圖8 所示)對留學(xué)生聚類群體特征進(jìn)行辨別分析。由此可以看出,50 個樣本數(shù)據(jù)經(jīng)過多次迭代后已被分配到距離它最近的聚類中心所在的簇中。
圖7 部分聚類結(jié)果
圖8 每個聚類中的個案數(shù)目
在分析聚類群體特征時,可將聚類結(jié)果進(jìn)行可視化處理。本文選擇以各類最終聚類中心數(shù)據(jù)為依據(jù),建立起了各類特征可視化雷達(dá)圖如圖9,即可在此基礎(chǔ)上直觀、準(zhǔn)確地觀察出聚類后各類留學(xué)生的群體特征,并為實施多維度分層教學(xué)提供了改進(jìn)依據(jù)。
圖9 各類特征可視化呈現(xiàn)
基于圖9 留學(xué)生群體特征可視化呈現(xiàn)結(jié)果,并結(jié)合由標(biāo)量特征所得到的留學(xué)生需求分析,本文提出了對應(yīng)的分層教學(xué)策略如下。
(1)迷茫型留學(xué)生群體——實行留學(xué)生學(xué)習(xí)導(dǎo)師制,引導(dǎo)學(xué)生制定出明確的學(xué)習(xí)目標(biāo)。第一類學(xué)生具備較好的學(xué)習(xí)自發(fā)性和主動性,常利用課余時間自主學(xué)習(xí)。但其可能存在缺乏明確的學(xué)習(xí)目標(biāo),在學(xué)習(xí)中遇到了問題未及時向老師請教和與同學(xué)討論的情況。針對該類學(xué)生群體,可安排專業(yè)導(dǎo)師引導(dǎo)學(xué)生樹立總體的奮斗目標(biāo)和完善的各學(xué)科學(xué)習(xí)計劃,定期對留學(xué)生進(jìn)行學(xué)習(xí)檢查和指導(dǎo)。在教學(xué)方法上重視教學(xué)的啟發(fā)性,引導(dǎo)學(xué)生獨立思考的同時注重課堂的合作討論學(xué)習(xí),幫助他們養(yǎng)成良好的學(xué)習(xí)習(xí)慣。
(2)逃避型留學(xué)生群體——以教學(xué)內(nèi)容和模式為依托,實行單獨授課和跟蹤指導(dǎo)制度。第二類學(xué)生在各類學(xué)習(xí)特征表現(xiàn)上均存在較大的問題,可能由于教學(xué)內(nèi)容難度較大或趣味性較低使得學(xué)生缺乏對學(xué)習(xí)的興趣和信心,從而影響著該學(xué)生群體的學(xué)習(xí)特征和學(xué)習(xí)成果。針對該學(xué)生群體,應(yīng)從教學(xué)內(nèi)容安排和教師的教學(xué)方法上著手改進(jìn)和提升。首先要適當(dāng)充實教學(xué)內(nèi)容,調(diào)整課程難度和提高課程的應(yīng)用價值。同時教學(xué)語言應(yīng)生動清晰,快慢適度,教學(xué)過程中注意重點突出和理論聯(lián)系實際。教學(xué)方法上可采用跟班學(xué)習(xí)和單獨授課相結(jié)合的方式,了解學(xué)生對教學(xué)效果的意見,幫助留學(xué)生解決思想上、心理上及生活上各方面的問題。
(3)內(nèi)向型留學(xué)生群體——采取鼓勵型教學(xué)方法,主張進(jìn)行合作探究式學(xué)習(xí)。第三類學(xué)生較第一類和第四類學(xué)生在特征表現(xiàn)上“學(xué)習(xí)習(xí)慣傾向”及“考勤”兩項指標(biāo)差異明顯。探究原因可能由于文化背景差異等使得該學(xué)生群體在社交特征中表現(xiàn)較為內(nèi)向,多傾向于采用自主式學(xué)習(xí)且獨立完成作業(yè)任務(wù),使得該類學(xué)生在有較為明確的學(xué)習(xí)目標(biāo)的基礎(chǔ)上同樣缺乏學(xué)習(xí)的主動性,未及時對所學(xué)內(nèi)容查漏補(bǔ)缺。針對該類留學(xué)生群體,可通過舉辦文化體驗活動、聯(lián)誼會、團(tuán)隊合作小組等,促進(jìn)教師和學(xué)生以及學(xué)生和學(xué)生之間的溝通交流,鼓勵學(xué)生提問或發(fā)表意見,提高學(xué)生對學(xué)習(xí)環(huán)境的適應(yīng)性,幫助學(xué)生建立學(xué)習(xí)信心。
(4)主動型留學(xué)生群體——注重培養(yǎng)學(xué)生獨立思考和創(chuàng)新的能力,制定優(yōu)秀留學(xué)生評選辦法。第四類學(xué)生在語言基礎(chǔ)和學(xué)習(xí)習(xí)慣的養(yǎng)成上均呈現(xiàn)出了良好的態(tài)勢,其憑借著較好的漢語水平,結(jié)合自身學(xué)習(xí)興趣樹立了明確的學(xué)習(xí)目標(biāo)并認(rèn)真執(zhí)行和實施,有較高的學(xué)習(xí)主動性和積極性,在學(xué)習(xí)習(xí)慣上多傾向于協(xié)同式學(xué)習(xí)和自主式學(xué)習(xí)相結(jié)合。因此,在對該類留學(xué)生實施分層教學(xué)時,可采取學(xué)生課前自學(xué),在課堂上教師針對其所存在的疑難點引導(dǎo)學(xué)生進(jìn)行小組合作式討論的教學(xué)策略。培養(yǎng)其獨立思考的能力和創(chuàng)新意識,發(fā)揮競爭和獎勵機(jī)制的正向作用力,確保該類留學(xué)生群體更為主動地加入到課堂中來,提高課堂出勤率。
基于不斷增長的留學(xué)生數(shù)量和高校教學(xué)資源有限的矛盾問題,本文首先對留學(xué)生用戶畫像進(jìn)行了刻畫,并結(jié)合留學(xué)生教學(xué)質(zhì)量評價指標(biāo)體系分析了留學(xué)生學(xué)習(xí)現(xiàn)狀和學(xué)習(xí)需求。在此基礎(chǔ)上,通過SPSS 軟件對留學(xué)生群體建立起了K-means 聚類分析模型,將留學(xué)生群體劃分為了迷茫型留學(xué)生、逃避型留學(xué)生、內(nèi)向型留學(xué)生、主動型留學(xué)生并對做出了相應(yīng)的分層教學(xué)策略。深層次挖掘了學(xué)校教務(wù)系統(tǒng)中諸多有效數(shù)據(jù)的潛在應(yīng)用價值,對教育教學(xué)活動有一定的指導(dǎo)意義,有利于更好地體現(xiàn)了以人為本的教育理念。