摘 要:隨著數(shù)字化學(xué)習(xí)的普及和發(fā)展,如何及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中學(xué)習(xí)者的個(gè)體學(xué)習(xí)需求,并實(shí)時(shí)地提供滿足他們需求的數(shù)字化學(xué)習(xí)資源和學(xué)習(xí)服務(wù)已日漸成為Elearning研究領(lǐng)域的關(guān)鍵問(wèn)題之一。利用人工智能技術(shù),通過(guò)提取數(shù)字化學(xué)習(xí)資源中的核心概念和對(duì)在線學(xué)習(xí)行為的自動(dòng)捕獲,建立基于概念圖的知識(shí)模型,在此基礎(chǔ)上智能地挖掘?qū)W習(xí)者個(gè)體認(rèn)知狀態(tài)和學(xué)習(xí)需求,為個(gè)性化學(xué)習(xí)服務(wù)提供支持。
關(guān)鍵詞:人工智能;個(gè)性化學(xué)習(xí);學(xué)習(xí)需求;數(shù)據(jù)挖掘
DOIDOI:10.11907/rjdk.1511133
中圖分類號(hào):TP302
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào)文章編號(hào):16727800(2015)012001203
0 引言
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和數(shù)字化教學(xué)資源的日益豐富,網(wǎng)絡(luò)學(xué)習(xí)逐漸成為一種廣泛采用的學(xué)習(xí)方式。近年來(lái)教育心理學(xué)研究對(duì)學(xué)習(xí)者在Elearning平臺(tái)上的學(xué)習(xí)認(rèn)知過(guò)程分析發(fā)現(xiàn):在網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中,學(xué)習(xí)者關(guān)于當(dāng)前所學(xué)主題的背景知識(shí)存在個(gè)體差異,這種差異將對(duì)網(wǎng)絡(luò)學(xué)習(xí)的過(guò)程和學(xué)習(xí)效果產(chǎn)生影響[1]。學(xué)習(xí)者在學(xué)習(xí)一個(gè)新的知識(shí)點(diǎn)時(shí),需要把新知識(shí)點(diǎn)和自己掌握的概念聯(lián)系起來(lái),以建立新的理解和認(rèn)知。這些與新知識(shí)點(diǎn)關(guān)聯(lián)且已被學(xué)習(xí)者掌握的概念稱為背景知識(shí)。由于每個(gè)網(wǎng)絡(luò)學(xué)習(xí)者的背景知識(shí)存在差異,在學(xué)習(xí)同一個(gè)新知識(shí)點(diǎn)時(shí),產(chǎn)生不同的學(xué)習(xí)需求。這導(dǎo)致他們?cè)诰W(wǎng)絡(luò)學(xué)習(xí)過(guò)程中的動(dòng)機(jī)、行為不同,學(xué)習(xí)效果也存在較大差異。因此,需要有新的技術(shù)和方法支持依據(jù)學(xué)習(xí)者的不同學(xué)習(xí)需求提供個(gè)性化的學(xué)習(xí)資源和學(xué)習(xí)服務(wù)。
1 研究問(wèn)題概述
依據(jù)學(xué)習(xí)者的個(gè)體學(xué)習(xí)需求來(lái)提供學(xué)習(xí)服務(wù)的系統(tǒng)稱為自適應(yīng)學(xué)習(xí)環(huán)境。自適應(yīng)學(xué)習(xí)環(huán)境通過(guò)建立該教學(xué)
領(lǐng)域的專家知識(shí)模型和學(xué)習(xí)者個(gè)人的認(rèn)知模型,并比較二者的差異來(lái)確定學(xué)習(xí)者的個(gè)體學(xué)習(xí)需求,再提取教學(xué)策略模型中的相應(yīng)教學(xué)內(nèi)容和教學(xué)活動(dòng)實(shí)現(xiàn)對(duì)該個(gè)體學(xué)習(xí)需求的支持[2]。目前的個(gè)性化學(xué)習(xí)服務(wù)通常需要通過(guò)人工方式構(gòu)建知識(shí)模型,再比對(duì)學(xué)習(xí)者的知識(shí)狀態(tài)和學(xué)習(xí)進(jìn)度來(lái)發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)需求。這樣的人工建模方式需要花費(fèi)大量時(shí)間和人力,并且建立的知識(shí)模型只能在該教學(xué)領(lǐng)域使用,很難推廣到其它知識(shí)領(lǐng)域和Elearning平臺(tái)上,局限性較大。另外,很多自適應(yīng)系統(tǒng)不能通過(guò)常見的在線學(xué)習(xí)行為及時(shí)發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)需求,使得在很多網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中,當(dāng)無(wú)法采集到足夠的學(xué)習(xí)者評(píng)測(cè)數(shù)據(jù)時(shí),不能識(shí)別學(xué)習(xí)者的學(xué)習(xí)需求,嚴(yán)重影響了個(gè)性化學(xué)習(xí)服務(wù)提供的及時(shí)性和準(zhǔn)確性。
為此,本文利用自然語(yǔ)言處理技術(shù),從數(shù)字化資源中自動(dòng)提取和構(gòu)建領(lǐng)域知識(shí)模型,從而擺脫對(duì)人工構(gòu)建領(lǐng)域知識(shí)模型的依賴,擴(kuò)大個(gè)性化學(xué)習(xí)服務(wù)的應(yīng)用領(lǐng)域和范圍。通過(guò)對(duì)在線學(xué)習(xí)行為數(shù)據(jù)的捕獲和挖掘,在學(xué)習(xí)者的網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中自動(dòng)和及時(shí)地發(fā)現(xiàn)學(xué)習(xí)者的個(gè)體學(xué)習(xí)需求。這樣不再需要學(xué)習(xí)者通過(guò)完成知識(shí)測(cè)驗(yàn)來(lái)評(píng)估認(rèn)知狀態(tài),從而能實(shí)時(shí)和準(zhǔn)確地向?qū)W習(xí)者提供適合他們個(gè)體需求的學(xué)習(xí)服務(wù)。通過(guò)在線學(xué)習(xí)行為自動(dòng)捕獲系統(tǒng),可以完整地跟蹤和收集學(xué)習(xí)者的在線學(xué)習(xí)行為數(shù)據(jù)。本文提出的知識(shí)模型構(gòu)建算法可以智能地從這些數(shù)據(jù)中提取學(xué)習(xí)者的學(xué)習(xí)目標(biāo)和對(duì)相關(guān)概念的理解,并用概念圖的方式系統(tǒng)地表征學(xué)習(xí)者當(dāng)前的認(rèn)知狀態(tài)。同時(shí)運(yùn)用自然語(yǔ)言處理技術(shù),對(duì)網(wǎng)絡(luò)數(shù)字化學(xué)習(xí)資源進(jìn)行提取和解析,通過(guò)概念短語(yǔ)提取和概念關(guān)系識(shí)別技術(shù),生成以概念圖表征的領(lǐng)域知識(shí)模型。該模型包含了該教學(xué)領(lǐng)域內(nèi)學(xué)習(xí)者應(yīng)當(dāng)掌握的知識(shí)概念。在此基礎(chǔ)上,本文實(shí)現(xiàn)了學(xué)習(xí)需求的智能挖掘技術(shù),利用概念聚類、核心權(quán)重計(jì)算和語(yǔ)義結(jié)構(gòu)差異分析等方法,通過(guò)比較學(xué)習(xí)者認(rèn)知狀態(tài)和領(lǐng)域知識(shí)模型,自動(dòng)和實(shí)時(shí)地挖掘?qū)W習(xí)者個(gè)體學(xué)習(xí)需求,包括核心概念缺失和概念錯(cuò)誤。從而提供與學(xué)習(xí)者個(gè)體需求相適應(yīng)的個(gè)性化學(xué)習(xí)服務(wù)。
2 基于概念圖的知識(shí)模型構(gòu)建
利用概念圖來(lái)表征教學(xué)領(lǐng)域的知識(shí)結(jié)構(gòu)和學(xué)習(xí)者當(dāng)前認(rèn)知狀態(tài)。概念圖用一種層級(jí)化的節(jié)點(diǎn)-連接結(jié)構(gòu)來(lái)呈現(xiàn)一個(gè)主題的知識(shí)內(nèi)容。概念圖中的每個(gè)節(jié)點(diǎn)用短語(yǔ)代表一個(gè)獨(dú)立的概念,節(jié)點(diǎn)間的連線和標(biāo)注表示這兩個(gè)概念間的語(yǔ)義關(guān)聯(lián)[3]。概念圖把文字的知識(shí)轉(zhuǎn)換成概念和概念間關(guān)系的網(wǎng)狀圖形。概念圖的這種網(wǎng)絡(luò)狀層級(jí)結(jié)構(gòu)化知識(shí)表達(dá),有利于開發(fā)一種算法來(lái)自動(dòng)把數(shù)字化教學(xué)資源轉(zhuǎn)化成以概念圖表達(dá)的領(lǐng)域知識(shí)模型。下面介紹如何從文本數(shù)據(jù)自動(dòng)構(gòu)建基于概念圖的知識(shí)模型。
2.1 概念短語(yǔ)提取
概念短語(yǔ)是表達(dá)領(lǐng)域知識(shí)和學(xué)習(xí)者認(rèn)知狀態(tài)的主體,也是構(gòu)成概念圖的要素。本文首先從數(shù)字化學(xué)習(xí)資源和在線學(xué)習(xí)行為數(shù)據(jù)的文本中提取大量原始術(shù)語(yǔ),再利用潛在語(yǔ)義分析的方法構(gòu)建多維術(shù)語(yǔ)矩陣,并對(duì)這些原始術(shù)語(yǔ)進(jìn)行權(quán)重計(jì)算,最后形成能夠概括領(lǐng)域知識(shí)的概念短語(yǔ)集[4]。
為了從原始文檔中鑒別和提取概念短語(yǔ),需要計(jì)算原始文檔中術(shù)語(yǔ)與教學(xué)資源文本的相關(guān)性,判斷這些術(shù)語(yǔ)在資源中的語(yǔ)義權(quán)重。每一個(gè)術(shù)語(yǔ)pi的語(yǔ)義權(quán)重w(pi)的計(jì)算方法如下:
w(pi)=TF·IDF(pi)+δ(pi,A)+IG(pi)(1)
其中,TF·IDF為術(shù)語(yǔ)頻乘以文檔頻率的倒數(shù),表征該術(shù)語(yǔ)在文檔中的重要程度;δ為該術(shù)語(yǔ)在文本中的開方檢驗(yàn)值,表征該術(shù)語(yǔ)與各文檔的相似程度;而IG可計(jì)算該術(shù)語(yǔ)給文檔帶來(lái)的信息增益值,表達(dá)了該術(shù)語(yǔ)對(duì)文檔的信息貢獻(xiàn)。
2.2 概念關(guān)系識(shí)別
從數(shù)字化教學(xué)資源中提取概念短語(yǔ)集后,要生成能代表領(lǐng)域知識(shí)的概念圖,還需要識(shí)別這些概念短語(yǔ)之間的語(yǔ)義關(guān)聯(lián)。本文首先通過(guò)解析文本,利用詞性標(biāo)注算法提取能夠表示概念短語(yǔ)之間語(yǔ)義關(guān)聯(lián)的動(dòng)詞集,并利用LSA(Latent Semantic Analysis)[5]計(jì)算各個(gè)動(dòng)詞在語(yǔ)義關(guān)聯(lián)表示中的權(quán)重值。對(duì)提取的所有概念短語(yǔ)進(jìn)行逐一配對(duì)檢驗(yàn),計(jì)算它們的語(yǔ)義關(guān)聯(lián)程度,確立它們存在語(yǔ)義關(guān)聯(lián)。
如上所述,通過(guò)從教學(xué)資源中提取概念短語(yǔ)集并為每對(duì)有語(yǔ)義關(guān)聯(lián)的概念短語(yǔ)匹配語(yǔ)義標(biāo)簽,生成代表該教學(xué)領(lǐng)域內(nèi)知識(shí)結(jié)構(gòu)的概念圖表征,即領(lǐng)域知識(shí)模型。將同樣的方法用在學(xué)習(xí)者行為數(shù)據(jù)上,可以生成代表學(xué)習(xí)者認(rèn)知狀態(tài)的學(xué)習(xí)者知識(shí)模型。
3 個(gè)體學(xué)習(xí)需求的智能挖掘
根據(jù)建構(gòu)主義的觀點(diǎn),學(xué)習(xí)者對(duì)新知識(shí)的理解和認(rèn)知是建立在已經(jīng)掌握的知識(shí)基礎(chǔ)之上。當(dāng)學(xué)習(xí)者在Elearning平臺(tái)上學(xué)習(xí)新知識(shí)時(shí),可能存在這樣的階段:他們雖然已經(jīng)掌握新知識(shí)的一部分相關(guān)概念,但是對(duì)與之相關(guān)聯(lián)的另一部分重要概念還存在認(rèn)知缺失或錯(cuò)誤,無(wú)法形成對(duì)新知識(shí)完整、準(zhǔn)確的認(rèn)知和理解。對(duì)于處在上述階段的學(xué)習(xí)者,本文的個(gè)體學(xué)習(xí)需求挖掘可以通過(guò)智能分析該學(xué)習(xí)者的網(wǎng)絡(luò)學(xué)習(xí)行為(資源瀏覽、信息檢索、信息發(fā)布等),確定學(xué)習(xí)者正在學(xué)習(xí)的知識(shí)專題,找出與該專題相關(guān)聯(lián)的核心概念,并鑒別出學(xué)習(xí)者缺失或誤解的概念,即學(xué)習(xí)者當(dāng)前的個(gè)性化學(xué)習(xí)需求,并向?qū)W習(xí)者提供個(gè)性化學(xué)習(xí)服務(wù)。
3.1 學(xué)習(xí)者核心概念缺失的識(shí)別
在學(xué)習(xí)者當(dāng)前所學(xué)專題中,部分概念短語(yǔ)與該專題聯(lián)系非常緊密,并與聚類中的很多概念短語(yǔ)存在語(yǔ)義關(guān)聯(lián),本文稱這樣的概念短語(yǔ)為核心概念。當(dāng)學(xué)習(xí)者在該專題的學(xué)習(xí)過(guò)程中,已經(jīng)完成了一定數(shù)量的相關(guān)概念學(xué)習(xí)后,卻沒(méi)有任何與該核心概念相關(guān)的學(xué)習(xí)行為(包括瀏覽相關(guān)資源;進(jìn)行與該核心概念有關(guān)的信息檢索和發(fā)布等)。這表明學(xué)習(xí)者在此階段對(duì)該核心概念還很陌生,但它又是對(duì)學(xué)習(xí)者理解當(dāng)前所學(xué)專題至關(guān)重要的,我們稱學(xué)習(xí)者在這個(gè)階段存在核心概念缺失。
本文利用概念圖的關(guān)聯(lián)結(jié)構(gòu)和相關(guān)度算法來(lái)識(shí)別和提取當(dāng)前學(xué)習(xí)專題中的核心概念。從關(guān)聯(lián)結(jié)構(gòu)上看,與核心概念有語(yǔ)義關(guān)聯(lián)的概念短語(yǔ)數(shù)量比一般概念多。另外,同一個(gè)專題內(nèi)的不同核心概念表達(dá)的是同一個(gè)主題,因此與不同核心概念相關(guān)聯(lián)的概念短語(yǔ)集存在一定的交集。即有一些概念短語(yǔ)同時(shí)和多個(gè)核心概念有語(yǔ)義關(guān)聯(lián)。與多個(gè)核心概念有語(yǔ)義關(guān)聯(lián)的概念短語(yǔ)為關(guān)聯(lián)概念。本文利用核心概念與關(guān)聯(lián)概念的結(jié)構(gòu)特征來(lái)辨別和自動(dòng)提取當(dāng)前所學(xué)專題中的核心概念。假設(shè)在同一個(gè)專題中的每個(gè)概念短語(yǔ)Pi都有一個(gè)核心權(quán)重W(Pi)和關(guān)聯(lián)權(quán)重U(Pi)。核心權(quán)重值高的概念短語(yǔ)就是該專題的核心概念。
利用下述算法計(jì)算每個(gè)概念的核心權(quán)重值。其基本思想是:如果一個(gè)概念短語(yǔ)與很多有較高核心權(quán)重的概念短語(yǔ)有語(yǔ)義關(guān)聯(lián),它應(yīng)當(dāng)有更高的關(guān)聯(lián)權(quán)重值;同樣,如果一個(gè)概念短語(yǔ)與很多有較高關(guān)聯(lián)權(quán)重的概念短語(yǔ)有語(yǔ)義關(guān)聯(lián),它應(yīng)當(dāng)有更高的核心權(quán)重值。這可以表達(dá)為:
W(Pi)=∑Pj:(Pj→Pi)U(Pj)(2)
U(Pi)=∑Pj:(Pi→Pj)W(Pj)(3)
該算法輪流執(zhí)行上述兩項(xiàng)操作,直到各個(gè)概念的權(quán)重值達(dá)到一個(gè)“平衡點(diǎn)”,即它們的權(quán)重值在操作后不再發(fā)生變化。
對(duì)提取出的核心概念,檢驗(yàn)其在學(xué)習(xí)者知識(shí)模型中是否有高相關(guān)度的對(duì)應(yīng)概念。如果找不到高相關(guān)度匹配,則稱之為學(xué)習(xí)者對(duì)該核心概念缺失。
3.2 學(xué)習(xí)者概念錯(cuò)誤的判定
學(xué)習(xí)者在線學(xué)習(xí)行為中的信息發(fā)布、檢索和記錄等行為能揭示他們對(duì)所學(xué)知識(shí)的認(rèn)知和理解狀態(tài)。該認(rèn)知狀態(tài)在學(xué)習(xí)者知識(shí)模型中被表征為核心概念及與之有語(yǔ)義關(guān)聯(lián)的概念短語(yǔ)形成的概念圖結(jié)構(gòu)。本文把該結(jié)構(gòu)以數(shù)學(xué)化的模型表達(dá)為概念圖G=(V,E,δ,λ),其中V為概念圖節(jié)點(diǎn)的集合,E為概念圖中聯(lián)接的集合,δ:Lv→T為每個(gè)節(jié)點(diǎn)與概念短語(yǔ)映射關(guān)系,λ:Le→S為每個(gè)聯(lián)接與語(yǔ)義關(guān)聯(lián)標(biāo)簽的映射關(guān)系。
對(duì)于某個(gè)核心概念,若學(xué)習(xí)者模型中對(duì)應(yīng)的語(yǔ)義結(jié)構(gòu)G1與領(lǐng)域知識(shí)模型中對(duì)應(yīng)的語(yǔ)義結(jié)構(gòu)G2存在較大差異,系統(tǒng)識(shí)別學(xué)習(xí)者在這個(gè)核心概念上存在認(rèn)知偏差,稱為概念誤解。G1和G2差異性的計(jì)算方法如下:
Matching(G1,G2)=MCS(G1,G2)MAX(G1,G2)(4)
其中,MCS(G1, G2)為概念圖G1=(V1,E1,δ1,λ1)和G2=(V2,E2,δ2,λ2)的最大共同子圖G,從而計(jì)算出學(xué)習(xí)者知識(shí)模型和領(lǐng)域知識(shí)模型在該核心概念上的語(yǔ)義結(jié)構(gòu)差異,以此為依據(jù)識(shí)別學(xué)習(xí)者的概念錯(cuò)誤。
4 結(jié)語(yǔ)
在網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中及時(shí)地發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)需求并基于此向他們提供個(gè)性化的學(xué)習(xí)服務(wù)是Elearning發(fā)展的趨勢(shì)和要求。本文利用自然語(yǔ)言處理與人工智能技術(shù)實(shí)現(xiàn)了一種從在線學(xué)習(xí)行為數(shù)據(jù)中自動(dòng)和實(shí)時(shí)地評(píng)估學(xué)習(xí)者的認(rèn)知狀態(tài),挖掘其個(gè)體學(xué)習(xí)需求的技術(shù)。這種智能挖掘技術(shù)突破了依賴學(xué)習(xí)者完成知識(shí)測(cè)驗(yàn)來(lái)評(píng)估認(rèn)知狀態(tài)和學(xué)習(xí)需求的局限,使網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)能更加及時(shí)和準(zhǔn)確地向?qū)W習(xí)者提供適應(yīng)他們個(gè)體學(xué)習(xí)需要的學(xué)習(xí)服務(wù)。
參考文獻(xiàn)參考文獻(xiàn):
[1] CLARK RC,MAYER RE. Elearning and the science of instruction:proven guidelines for consumers and designers of multimedia learning[M].San Francisco: Pfeiffer, 2011:3341.
[2] 張舸,周東岱,葛情情.自適應(yīng)學(xué)習(xí)系統(tǒng)中學(xué)習(xí)者特征模型及建模方法述評(píng)[J].現(xiàn)代教育技術(shù),2012,22(5):7782.
[3] 趙國(guó)慶,陸志堅(jiān).“概念圖”與“思維導(dǎo)圖”辨析[J].中國(guó)電化教育,2004(8):4244.
[4] 孫珠婷,顧倩頤. 領(lǐng)域概念術(shù)語(yǔ)提取中特征項(xiàng)自動(dòng)抽取方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(8):31893193.
[5] 蓋杰,王怡,武港山. 基于潛在語(yǔ)義分析的信息檢索[J]. 計(jì)算機(jī)工程, 2004,30(2): 5861.
(責(zé)任編輯:陳福時(shí))