□黃海
基于本體的CSCL學(xué)習(xí)行為模式研究
□黃海
本文將本體思想引入CSCL系統(tǒng),分析了基于本體的計算機支持的協(xié)同學(xué)習(xí)環(huán)境下各種角色的行為模式。通過對協(xié)同學(xué)習(xí)模式進(jìn)行分析,提出了基于本體的計算機支持的概念,建立了相應(yīng)的模型。該模型描述了基于本體的協(xié)作過程,對系統(tǒng)的實現(xiàn)具有指導(dǎo)意義。
本體;計算機支持的協(xié)同學(xué)習(xí)
計算機支持的協(xié)同學(xué)習(xí)(Computer Support for Collaborative Learning,CSCL) 是探討如何利用計算機實現(xiàn)對協(xié)作學(xué)習(xí)過程的支持,已成為當(dāng)前學(xué)習(xí)科學(xué)、教育技術(shù)學(xué)的一個熱點研究領(lǐng)域。Koschmann指出CSCL與其前身CAI、ITS和Logo—as—Latin相比,在學(xué)習(xí)、教育、研究方法和研究問題等方面有非常大的不同[1]。Lipponen提出“CSCL所關(guān)注的是如何通過技術(shù)促進(jìn)協(xié)作學(xué)習(xí)。以增強伙伴之間的交互和小組工作,促進(jìn)知識和專門技能在社區(qū)成員間的共享及分布”。[2]
目前對協(xié)同學(xué)習(xí)的相關(guān)技術(shù)研究,如:Web技術(shù)、協(xié)同技術(shù)、人工智能、知識庫和數(shù)據(jù)庫技術(shù)等,已經(jīng)取得了一定的成果。但也還存在著一些不足和缺陷,其中以下幾個問題比較突出:
(1)無法描述和處理跨學(xué)科知識問題。
(2)知識獲取與共享問題。在協(xié)同學(xué)習(xí)系統(tǒng)中,其知識庫中所包含的知識點數(shù)量巨大,知識源可以是Web、其他知識庫和數(shù)據(jù)庫。 Ashok Patel[3]、Yujian Zhou[4]等人設(shè)計的系統(tǒng)在知識庫的構(gòu)造中采用人工輸入知識的方法,耗費的工作量非常大。當(dāng)前,如何從上述知識源中自動或半自動地協(xié)同獲取知識以構(gòu)建CSCL系統(tǒng),并解決知識共享問題,已成為研究的熱點。
(3)協(xié)同對象互操作語義視圖。在協(xié)同學(xué)習(xí)環(huán)境里,用戶在合作期間經(jīng)常要訪問多個信息源(站點)獲得所需信息。由于這些信息源是異構(gòu)的,分布在不同地方甚至是不同國家,因此這些不同信息源之間就存在著語義差別,使得不同信息源之間的互操作更加困難。目前的研究大都是對多信息源采用統(tǒng)一的對象描述[5]及視圖來處理互操作的問題,但卻沒有解決協(xié)同互操作的語義問題。
上述問題存在的原因,主要是對知識、方法和信息源的描述缺乏有效的手段。本文引入本體(ontology)思想,為解決這些問題提供了一個思路:
(1)本體作為知識和概念描述[6]的重要工具,具有領(lǐng)域?qū)ο竺枋鍪侄魏兔枋龇椒?,因此可以解決跨學(xué)科的知識描述問題;
(2)語義網(wǎng)絡(luò)中本體構(gòu)造和描述機制,為用戶多信息源之間資源對象基于語義的知識獲取奠定了基礎(chǔ)。
本體描述為網(wǎng)絡(luò)學(xué)習(xí)相關(guān)部門提供了一個統(tǒng)一的語義框架或規(guī)范模型,使來自不同背景、不同觀點、不同目的組織部門之間的理解和信息交流成為可能,并保持語義上的一致性。本體表示的是由關(guān)系和概念組成的語義網(wǎng)絡(luò)。在網(wǎng)絡(luò)學(xué)習(xí)行為信息處理中引入本體的主要目的是從信息處理的角度,建立網(wǎng)絡(luò)學(xué)習(xí)行為術(shù)語集及其關(guān)系,建立多角度的本體體系,和用于表示網(wǎng)絡(luò)學(xué)習(xí)行為的基本理論體系。這樣我們可以將該體系用于網(wǎng)絡(luò)學(xué)習(xí)行為信息的共享交換、知識的映射以及分析不同國家的網(wǎng)絡(luò)學(xué)習(xí)行為經(jīng)驗與學(xué)術(shù)思想的異同。網(wǎng)絡(luò)學(xué)習(xí)行為本體是指應(yīng)用本體論的基本方法,通過基于網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)元來進(jìn)行領(lǐng)域概念提取、關(guān)系分析,以減少概念和術(shù)語上的歧義,把網(wǎng)絡(luò)學(xué)習(xí)行為知識體系中的名詞術(shù)語抽象為一組概念與概念之間關(guān)系的理論和方法。網(wǎng)絡(luò)學(xué)習(xí)行為本體已經(jīng)成為網(wǎng)絡(luò)學(xué)習(xí)行為信息處理的重要基礎(chǔ),在網(wǎng)絡(luò)學(xué)習(xí)行為智能系統(tǒng)以及網(wǎng)絡(luò)學(xué)習(xí)行為知識共享等多個方面得到廣泛的應(yīng)用。
目前,一般把本體劃分為通用本體、常識本體、領(lǐng)域本體、語言學(xué)本體、任務(wù)本體等不同類型。其中,領(lǐng)域本體(Domain Ontology)是對具體領(lǐng)域中概念和關(guān)系的抽象描述,其功用和關(guān)系模式相似,是相關(guān)領(lǐng)域信息資源的組織框架[7]。
領(lǐng)域本體給出了領(lǐng)域?qū)嶓w概念及相互關(guān)系、領(lǐng)域活動以及該領(lǐng)域所具有的特性和規(guī)律的一種形式化描述。CSCL行為的領(lǐng)域本體是專業(yè)性的本體,由屬性、對象、關(guān)系和子領(lǐng)域本體組成,這類本體中被表示的知識是針對CSCL行為領(lǐng)域的。它們提供了CSCL領(lǐng)域的重要理論和基本原理。
基于本體的協(xié)作交流模型:
定義1:(基本成員)假設(shè)在交流過程中有一個老師(teacher)和若干學(xué)生(student)
定義2:(基本角色)在基于本體的協(xié)作交流中,存在三種角色,知識點觸發(fā)者、知識解釋者和知識接受者。
知識點觸發(fā)者(interpellator) 是在協(xié)作學(xué)習(xí)中對當(dāng)前共同關(guān)注的某段文字中的某些詞匯或句子提出疑問的人,可能是學(xué)生不理解、也可能是教師故意提出。知識點觸發(fā)者必須對提出疑問的部分作標(biāo)記。
知識解釋者(interpretor)對知識觸發(fā)者標(biāo)記的部分進(jìn)行基于本體的解釋,建立標(biāo)記部分和對應(yīng)的本體之間的關(guān)聯(lián)。
知識接收者(embracer)通過知識解釋者提供的關(guān)聯(lián),在本體庫中執(zhí)行知識導(dǎo)航,掌握知識和能力。
知識的交流分為三個步驟:即知識點觸發(fā)者標(biāo)記問題、知識解釋者建立標(biāo)記部分和對應(yīng)的本體之間的關(guān)聯(lián)、知識接收者在本體庫中執(zhí)行知識導(dǎo)航。
在協(xié)作知識交流過程中,參加討論的成員的角色是動態(tài)變化的。例如:教師開始時可能是知識觸發(fā)者,然后又變?yōu)橹R解釋者。在現(xiàn)實世界中,教師可能認(rèn)為某一部分學(xué)生會產(chǎn)生疑惑,所以故意提問,然后自己再向?qū)W生提供解釋幫助。成員角色的變化具體有四種情況。如圖1所示。
定義3:本體O是三元組<C,R,S>,其中C表示概念的集合;R表示概念之間的關(guān)系;S表示約束其本身是二元組<ConS,RolS>,ConS是對C中概念的約束,RolS是對關(guān)系的約束。
本體是領(lǐng)域范圍內(nèi)的概念及相互之間關(guān)系的一種形式化表示,它使人們了對所描述的概念有統(tǒng)一的、一致的理解。
定義4:知識點κ
知識點κ是在當(dāng)前討論空間V中具有一定含義的一段文字,它具有原子性,不可分割。
定義5:知識點觸發(fā)ρ
知識點觸發(fā)操作是由當(dāng)前討論空間V中知識點觸發(fā)者執(zhí)行的,它對知識點作標(biāo)記。
例如,在某個詞匯或某段文字下加下劃線。
定義6:信息段Si
信息段可用三元組Si=<T,K,E>表示,其中T是當(dāng)前討論的主題,K是滿足所有知識點觸發(fā)者潛在標(biāo)識意圖的知識點κ的集合,E是K所處的上下文,也就是K的語境。
定義7:知識點解釋μ操作μ(κ):M(κ)→C
其中:
C是知識點對應(yīng)的本體O中的概念,O是受限于主題T的具體領(lǐng)域本體。
M是知識點κ和本體C之間的關(guān)系,也就是κ的概念化
定義8:知識導(dǎo)航操作β:c Х r→2c
其中c,r表示本體中的一概念和關(guān)系,c∈C,r∈R,此操作表示從一個概念沿著關(guān)聯(lián)的關(guān)系導(dǎo)航到另一個概念,一個概念可能有多個關(guān)系存在,因此導(dǎo)航的結(jié)果是多樣的。
基于本體的CSCL行為模式的研究核心是要確定為各CSCL參與者提供哪些具體的應(yīng)用功能和服務(wù)??蓜澐譃椤扒埃笈_”兩大類。前臺是基于后臺本體庫的應(yīng)用界面,它可以將本體庫中的各種本體實例化,并以能被用戶所理解的方式推送給用戶。后臺的核心是實現(xiàn)信息資源的共享,即通過對協(xié)同學(xué)習(xí)參與者的行為進(jìn)行跟蹤采集、統(tǒng)計分析,從中挖掘出該用戶網(wǎng)絡(luò)學(xué)習(xí)特征,并通過將其本體化后存入本體知識庫,同時,對由教師發(fā)布的知識點和學(xué)習(xí)資源進(jìn)行歸類,提取知識點特征屬性并本體化,保存入知識點屬性本體庫;根據(jù)用戶的學(xué)習(xí)行為特征,應(yīng)用兩個本體庫定制出適合不同學(xué)習(xí)者的學(xué)習(xí)資源清單。后臺部分包括以下幾種單元。
(1)數(shù)據(jù)源集合——具體包括原始數(shù)據(jù)、原始知識、數(shù)據(jù)采集傳遞的通道等?;诒倔w的CSCL行為建立的基礎(chǔ)是已經(jīng)出現(xiàn)的并能被采集的各種數(shù)據(jù),包括各種WEB日志、原始文檔、表單數(shù)據(jù)、分組記錄、下載記錄及能被計算機發(fā)現(xiàn)的各種隱性數(shù)據(jù)。這些數(shù)據(jù)能以數(shù)據(jù)庫的形式保持到計算機中并能被其他用戶和程序所訪問。原始數(shù)據(jù)在采集后需要進(jìn)行預(yù)處理,然后被基于本體之上的規(guī)則層的各種處理規(guī)則所訪問。
(2)本體庫集合——基于本體的CSCL行為中保持各種處理后數(shù)據(jù)的庫。基于本體的CSCL行為最大特點在于對于各種數(shù)據(jù)的處理都是基于本體來完成的。利用本體和OWL,基于本體的CSCL行為框架能保存各種不能被其他方法抽象化的各種行為數(shù)據(jù)、屬性數(shù)據(jù)及數(shù)據(jù)之間的關(guān)系。在基于本體的CSCL行為中,本體庫集合包括4種本體庫:對現(xiàn)有的實體語言通過抽象化后,產(chǎn)生Wordnet/Hownet知識庫;通過對CSCL用戶的學(xué)習(xí)行為實行本體化后產(chǎn)生學(xué)習(xí)行為本體庫;在Wordnet/Hownet知識庫的索引下,利用本體和OWL可以對知識點本體化;由其他隱性知識本體化后產(chǎn)生的本體庫。
(3)規(guī)則集合——各種本體庫的產(chǎn)生規(guī)則和使用規(guī)則。具體包括:數(shù)據(jù)源數(shù)據(jù)的預(yù)處理規(guī)則;本體庫的建模規(guī)則;由源數(shù)據(jù)生成本體的規(guī)則;各種實體與本體庫間的映射規(guī)則;各種訪問本體庫內(nèi)本體的應(yīng)用規(guī)則等。
(4)本體應(yīng)用集合——利用本體實行CSCL需求與個性化服務(wù)應(yīng)用。由上述幾項基于本體的CSCL行為組成單元及它們間的相互關(guān)系,共同構(gòu)成了如圖2所示的基于本體的CSCL行為的層次模型。
在基于本體的CSCL行為層次模型中,各層的主要功能及內(nèi)容如下:
(1)資源層:提供基于本體的CSCL行為的原始數(shù)據(jù)封裝,在這一層中,不僅包括各種數(shù)據(jù)資源,還包括提供數(shù)據(jù)流動支撐的物理平臺、網(wǎng)絡(luò)環(huán)境、數(shù)據(jù)格式等。
(2)本體庫層:基于本體的CSCL行為框架內(nèi)所訪問的所有本體的集合。在基于本體的CSCL行為框架中,主要的本體庫有4種:領(lǐng)域知識Word-Net/HowNet知識庫、CSCL行為本體庫、知識點屬性本體庫、其他知識本體庫。
(3)規(guī)則層:基于本體的CSCL行為本體抽取規(guī)則、映射規(guī)則和應(yīng)用規(guī)則的集合。在基于本體的CSCL行為框架中,由原始數(shù)據(jù)(知識點屬性、協(xié)作痕跡、網(wǎng)頁、日志等)基于抽取規(guī)則產(chǎn)生本體模型,而協(xié)作學(xué)習(xí)行為等物理活動和網(wǎng)頁、相關(guān)學(xué)習(xí)資源等通過本體映射規(guī)則構(gòu)成本體庫,本體庫在應(yīng)用規(guī)則的約束下最終產(chǎn)生以網(wǎng)絡(luò)推薦等能被用戶所接受的形式返還回用戶。由這些規(guī)則共同構(gòu)成基于本體的CSCL行為的規(guī)則層。
(4)應(yīng)用層:在應(yīng)用規(guī)則約束下,通過UI界面最終將本體庫中的本體通過某種特定算法返還用戶。
在基于本體的CSCL行為框架內(nèi),數(shù)據(jù)處理流程大致如下,如圖3所示。
(1)教師找出當(dāng)前信息段里學(xué)生可能不太理解的知識點,也就是知識點觸發(fā);
(2)教師通過工具軟件找出對應(yīng)該主題的本體庫,并在本體庫中找到目前知識點對應(yīng)的本體,也就是執(zhí)行μ操作;
(3)學(xué)生根據(jù)知識點對應(yīng)的本體庫中的概念,執(zhí)行操作。
基于本體的CSCL行為系統(tǒng)框架主要包括5個處理過程。
(1)CSCL痕跡抽取——利用知識挖掘方法,分析學(xué)習(xí)者的學(xué)習(xí)痕跡,為構(gòu)造CSCL本體庫提供數(shù)據(jù)基礎(chǔ);
(2)CSCL行為本體構(gòu)建——在挖掘CSCL數(shù)據(jù)的基礎(chǔ)上,構(gòu)筑基于本體的CSCL行為本體庫;
(3)CSCL知識屬性本體構(gòu)建——通過知識標(biāo)注,將各科知識點本體化;
(4)CSCL行為本體映射——通過知識挖掘擴(kuò)展到全體CSCL行為;
(5)CSCL行為本體應(yīng)用——利用已產(chǎn)生的各種CSCL本體,建立應(yīng)用機制,將知識庫內(nèi)容推介給用戶。
基于本體的CSCL行為層次模型和過程模型是本體理論在組織行為學(xué)領(lǐng)域應(yīng)用的初步研究成果,可以有效提高CSCL的效率和效益。
在我們開發(fā)的計算機支持的協(xié)同學(xué)習(xí)平臺中綜合了WebCT和Learning Space,BSCW等已有系統(tǒng)的優(yōu)勢,并注重了語義的清晰表示,這是前者所不具備的。系統(tǒng)使用涉及領(lǐng)域?qū)<液蛯W(xué)生兩個角色。系統(tǒng)包含兩個本體庫,行為本體庫和知識屬性本體庫。行為本體庫提供精確語義,知識屬性本體庫提供知識導(dǎo)航,其中行為本體庫由領(lǐng)域?qū)<矣蒛I界面通過本體編輯工具Protégé輸入,知識屬性本體庫由本文的概念分類算法對其中的術(shù)語分類形成術(shù)語網(wǎng)絡(luò)并由框架生成模塊形成。UI是用戶使用系統(tǒng)的接口,知識導(dǎo)航界面通過將本體概念以網(wǎng)頁上超鏈接形式呈現(xiàn)。在知識屬性本體庫支持下,學(xué)生可以通過知識導(dǎo)航界面的導(dǎo)航條查找在學(xué)習(xí)過程中有疑問知識點對應(yīng)的概念以及該概念和其它概念的關(guān)系;學(xué)習(xí)與該概念相關(guān)的材料,如該概念的解釋和以該概念為關(guān)鍵詞由網(wǎng)上信息抓取模塊從網(wǎng)站上抓來的經(jīng)過必要信息過濾的網(wǎng)頁快照等;學(xué)生還可以通過導(dǎo)航系統(tǒng)在概念之間瀏覽。通過這種方式,學(xué)生可以較好地掌握給出的概念及其相互關(guān)系,形成比較完整的領(lǐng)域概念體系。知識導(dǎo)航模塊工作的基礎(chǔ)是一個知識屬性本體庫,當(dāng)學(xué)習(xí)者對導(dǎo)航到的某個知識點及上下文關(guān)系模糊時,可通過系統(tǒng)中的本體解釋工具來將由描述邏輯表示的本體轉(zhuǎn)換為適合人類理解的表達(dá)方式,如自然語言和圖形方式。
本文通過對和協(xié)同學(xué)習(xí)相關(guān)的教學(xué)理論和模式進(jìn)行分析,得出了協(xié)同學(xué)習(xí)系統(tǒng)的需求模型。進(jìn)而討論了在計算機支持下,學(xué)生對新知識的獲取方式,認(rèn)為人與人的交流以及人與資源的交互是 CSCL中兩種主要的知識來源。通過對協(xié)同學(xué)習(xí)模式進(jìn)行分析,提出了基于本體的計算機支持的概念,建立了相應(yīng)的模型,該模型描述了基于本體的協(xié)作過程,對系統(tǒng)的實現(xiàn)具有指導(dǎo)意義。
[1]Koschmann,T.Paradigm shifts and instructional technology:An instruction [A],T.Koschmann.CSCL:Theory and practice of an emerging paradigm[C].Mahwah,NJ:Lawrence Erlbaum Associates,1996.1-23.
[2] Lipponen,L.Exploring foundations for computer-supposed collaborative learning [A]. Stahl,Computer Supported for Collaborative Learning:Foundations for a CSCL Community,the Proceedings of the Computer-supported Collaborative Learning 2002 Conference[C].Hillsdale,NJ:Eflbamn,2002.72-81.
[3]Ashok Patel,Kinshuk,A Conceptual Framework for Internet based Intelligent Tutoring Systems,Knowledge Transfer(Volume II)(Ed.A.Behrooz),1997,Pace,London,UK,pp117-124.
[4]Yujian Zhou,Martha W.Evens,A Practical Student Model in an Intelligent Tutoring System,Proceedings of the 11th IEEE International Conference on Tools with Artificial Intelligence,1999,pp.13-18.
[5]G.Aslan,D.Mcleod,SemanticHeterogeneity Resolution in Federated DatabasesbyMetadataImplantation and Step_wise Evolution,The VLDB Journal,Vol.8,Issue 2,1999,pp.120-132.
[6]T.R.Gruber,"Toward Principles for the Design of Ontologies Used for Knowledge Sharing".Formal Ontology in Conceptual Analysis and Knowledge Representation,edited by Nicola Guarino and Roberto Poli,Kluwer Academic Publishers,1993.
2010-05-30
黃海,碩士,鹽城衛(wèi)生職業(yè)技術(shù)學(xué)院信息中心計算機技術(shù)教研室主任(221009)。
責(zé)任編輯 柯 南
G40-057
B
1009—458x(2010)10—0070—04