国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于刻面的藏/漢教育資源的檢索設(shè)計(jì)與實(shí)現(xiàn)

2012-07-02 01:46:50姬升官
關(guān)鍵詞:術(shù)語教育資源檢索

姬升官

(西北民族大學(xué)中國(guó)民族語言文字信息技術(shù)國(guó)家民委—教育部重點(diǎn)實(shí)驗(yàn)室,蘭州730030)

在藏區(qū)互聯(lián)網(wǎng)絡(luò)逐步普及的今天,大力發(fā)展遠(yuǎn)程教育,對(duì)于促進(jìn)我國(guó)民族地區(qū)教育的普及和建立終身學(xué)習(xí)體系,實(shí)現(xiàn)民族地區(qū)教育的跨躍式發(fā)展,具有重大意義。現(xiàn)在漢語遠(yuǎn)程教育技術(shù)體系已基本成熟,但是由于我國(guó)民族地區(qū)的教育不平衡的狀況,特別是我國(guó)藏區(qū)的藏語教育資源與漢語教學(xué)資源相比較,擁有其獨(dú)立的特點(diǎn),使其在描述、檢索上有很大的阻力??堂婕夹g(shù)主要是針對(duì)軟件的復(fù)用而提出的一種提高軟件開發(fā)效率和軟件質(zhì)量的切實(shí)有效的途徑。該技術(shù)從資源的不同方面對(duì)其進(jìn)行描述,有利于提高檢索的準(zhǔn)確率;同時(shí),通過對(duì)查詢結(jié)果匹配度權(quán)值的控制增加查全率。本文用刻面技術(shù)對(duì)數(shù)據(jù)資源庫中的漢語、藏語教學(xué)資源進(jìn)行詳細(xì)地描述、分類,增加各類教學(xué)資源的檢索成功率。這種檢索技術(shù)的不足之處在于只能體現(xiàn)出刻面和刻面、刻面和術(shù)語以及術(shù)語與術(shù)語之間的組成關(guān)系,忽略了它們之間更為豐富的關(guān)系,而這些關(guān)系有助于系統(tǒng)對(duì)查詢條件的理解,從而進(jìn)一步提高查準(zhǔn)率和查全率。本文通過建立刻面、術(shù)語(關(guān)鍵詞)庫,可以極大豐富刻面和術(shù)語、術(shù)語和術(shù)語之間的關(guān)系,有利于發(fā)現(xiàn)它們之間的內(nèi)在關(guān)系;同時(shí)這術(shù)語可以作為檢索條件到檢索引擎之間的橋梁,通過它,更好地挖掘用戶的檢索意圖,使得檢索引擎檢索出更接近用戶意圖的結(jié)果。基于這種思想,我們把術(shù)語庫與刻面描述檢索方案相結(jié)合,構(gòu)造基于術(shù)語和刻面的資源描述與檢索方案。

1 刻面技術(shù)介紹

在本文中一個(gè)刻面類由一組描述教育資源本質(zhì)特征和屬性的刻面所組成,每個(gè)刻面從不同的側(cè)面對(duì)教學(xué)資源庫中的教學(xué)資源進(jìn)行分類[1]。在刻面分類策略中,每個(gè)刻面關(guān)聯(lián)了一個(gè)合法術(shù)語的結(jié)構(gòu)化集合—術(shù)語空間,在教學(xué)資源的分類和查找中用到的術(shù)語均來自于這些術(shù)語空間。術(shù)語空間的結(jié)構(gòu)反映了術(shù)語間的語義關(guān)系,因此術(shù)語空間可以看做是一種語義網(wǎng),而教學(xué)資源從外部來看,都是一組刻面術(shù)語的集合。一個(gè)教育資源可以被每個(gè)刻面中的一個(gè)或多個(gè)術(shù)語所刻劃(刻面術(shù)語是一個(gè)確定的集合)。而每個(gè)刻面則反映了對(duì)教育資源庫中教學(xué)資源的一種劃分,因?yàn)榭堂嬖诜诸惡兔枋龅男蝿?shì)下建立起來的,因此用戶可以直觀地從不同的角度指明待檢索的教學(xué)資源,也有利于用戶對(duì)教學(xué)資源的理解和應(yīng)用[2]。

刻面分類策略應(yīng)具有下列特性:(1)刻面必須充分并明確地描述教學(xué)資源庫中全體教學(xué)資源,即每一個(gè)教學(xué)資源都可以用刻面來分類和描述;(2)每一個(gè)刻面與一個(gè)術(shù)語空間相關(guān)聯(lián),任意2個(gè)刻面的術(shù)語空間是正交的,即一個(gè)刻面的術(shù)語發(fā)生變化不會(huì)影響到另一個(gè)刻面的術(shù)語空間;(3)一個(gè)刻面的術(shù)語空間為有限的不定空間,即可以隨時(shí)間的演進(jìn)而動(dòng)態(tài)地增加和刪除術(shù)語;(4)每一個(gè)教學(xué)資源的所有刻面必須予以定義,不允許在對(duì)教學(xué)資源進(jìn)行分類時(shí)有未定義的刻面,但查詢時(shí),用戶可以利用任意數(shù)目的刻面來查詢,因?yàn)楸疚牡募夹g(shù)支持模糊查詢;(5)教育資源庫管理者對(duì)教育資源進(jìn)行分類時(shí),應(yīng)該針對(duì)每一個(gè)刻面,從術(shù)語空間中選擇適當(dāng)?shù)模ǘ鄠€(gè))術(shù)語,以完成教學(xué)資源的封裝工作。

在用刻面技術(shù)對(duì)教育資源庫中的資源進(jìn)行分類的策略中,教學(xué)資源管理者通過將刻面與對(duì)應(yīng)的術(shù)語相聯(lián)結(jié),可以在教育資源間建立復(fù)雜的聯(lián)系。與一般的層次分類策略相比,刻面分類策略更易于修改,更富有彈性,因?yàn)閷?duì)一個(gè)教育資源刻面的修改不會(huì)影響到其他的刻面。同時(shí),每個(gè)刻面對(duì)應(yīng)一個(gè)結(jié)構(gòu)化的術(shù)語空間(教育資源的描述關(guān)鍵詞集合),避免了一般的關(guān)鍵詞分類策略的雜亂無章,使得對(duì)關(guān)鍵詞的管理更為方便和有序。而刻面分類模式必須遵循以下一般性原則[3]:(1)一致性原則;(2)精簡(jiǎn)的原則;(3)刻面正交的原則;(4)全面性原則;(5)易于理解的原則;(6)教育資源的復(fù)雜性和檢索效率平衡的原則;(7)充分考慮具體的特定的教學(xué)資源(藏族九年義務(wù)教育,藏區(qū)科普教育,藏族學(xué)習(xí)普通話)的特點(diǎn)的原則。

2 相關(guān)基本概念

2.1 教育資源的分類

在藏語/漢語遠(yuǎn)程教育信息平臺(tái)中,教學(xué)資源主要分為以下幾類:(1)媒體素材;文本類素材、圖形/圖像類素材、音頻類素材、視頻類素材、動(dòng)畫類素材。(2)試卷;(3)課件;(4)教學(xué)案例;(5)文獻(xiàn)資料;(6)網(wǎng)絡(luò)課程;(7)常見問題解答。而其中文本素材主要分為:txt、doc、caj、pdf、pdb、rtf、htm、html、ps等格式。圖形/圖像類素材主要分為:BMP、JPG、GIF、PNG、TIF、PCX、PSD等格式。音頻類素材主要分為:WAV、MP3、MIDI或流式音頻格式;視頻類素材主要分為:AVI、OuickTime、MPEG或流式媒體格式等;動(dòng)畫類素材主要分為:GIF、Flash動(dòng)畫格式、AVI動(dòng)畫格式、FLI/FLC動(dòng)畫格式或 Quick-Time動(dòng)畫格式。

2.2 刻面樹權(quán)值H

由于藏語/漢語遠(yuǎn)程教育信息平臺(tái)主要應(yīng)用在我國(guó)的少數(shù)民族地區(qū)(特別是藏族區(qū)域),用戶的學(xué)習(xí)、使用方式都具有獨(dú)立的特征。如:藏漢學(xué)習(xí)風(fēng)格、策略和方法的不同;藏漢學(xué)習(xí)者在多媒體方面交互方式的不同;指導(dǎo)者評(píng)審學(xué)習(xí)者的評(píng)估、偏好、歷史績(jī)效及未來學(xué)習(xí)目標(biāo)的不同等。所以不同用戶對(duì)初始查詢的滿足度評(píng)估在現(xiàn)實(shí)世界中具有不同的標(biāo)準(zhǔn)。對(duì)于上述教育資源數(shù)據(jù)庫來說,有人關(guān)注格式屬性,有人關(guān)注類型屬性,有人卻關(guān)注語種屬性。因此對(duì)初始查詢的滿足度進(jìn)行評(píng)估時(shí),需要考慮被查詢指定的屬性對(duì)于當(dāng)前用戶的重要程度(即權(quán)重)。為了解決這一問題,本文將以當(dāng)前用戶提交的初始查詢作為啟示來分配屬性權(quán)重。而本文定義的H值就是用來衡量被查詢指定的屬性的權(quán)重[4]。

令D是數(shù)據(jù)庫中的一個(gè)教學(xué)資源庫集合,S是在D上執(zhí)行松弛查詢后得到的近似查詢結(jié)果集。如果Ai是D中的一個(gè)文本型屬性且Ai的取值為{ai1,ai2,ai3....aik},則Ai在D 和S 上的分布用權(quán)重H可以表示為其中:P(Ai=aij|D)是D中屬性Ai=aij的概率;p(Ai=aij|S)是S中屬性Ai=aij的概率。H值的離散度越大,說明結(jié)果集中的數(shù)據(jù)分布與數(shù)據(jù)庫表中的數(shù)據(jù)分布差距越大,則這個(gè)屬性越重要。

從上面的公式可以看出,要想得到權(quán)重值H,就必須知道資源A在D和S上的不同的分布概率。假設(shè)D是從我們的藏語/漢語遠(yuǎn)程教育資源庫中隨機(jī)抽取的1 000個(gè)教育資源,主要的分布情況如圖1所示。我們把S定義為在D中所有相對(duì)屬性的集合,如媒體素材,則S是D上所有的媒體素材類的教育資源。而S分布情況如圖2所示,則根據(jù)上面所講的公式可以得到媒體素材相應(yīng)的權(quán)值H為0.148,則同理可以得到以下的H值結(jié)果。

圖1 整體數(shù)據(jù)分布圖

圖2 媒體素材類數(shù)據(jù)分布圖

3 刻面樹的建立方法

對(duì)藏/漢遠(yuǎn)程平臺(tái)教育資源的刻面描述方法的基本思想是抽取教學(xué)資源的某些本質(zhì)特征即刻面特征屬性來描述它。每一個(gè)刻面與一個(gè)術(shù)語空間相關(guān)聯(lián),術(shù)語空間由一組術(shù)語構(gòu)成,這些術(shù)語以及術(shù)語與刻面之間的關(guān)系可以用樹來表示。而對(duì)于不同種類的教學(xué)資源,本文應(yīng)用不同的刻面分類樹進(jìn)行描述。我們將其中的刻面、子刻面分別映射為樹中對(duì)應(yīng)的父節(jié)點(diǎn)、子節(jié)點(diǎn),對(duì)采用某個(gè)刻面分類方案描述的教學(xué)資源,可以將其對(duì)應(yīng)的描述術(shù)語映射為對(duì)應(yīng)的葉子節(jié)點(diǎn)。資源描述樹的構(gòu)建過程[5]:(1)用查詢教學(xué)資源的類型作為樹根節(jié)點(diǎn);(2)以教學(xué)資源的分類屬性并把根據(jù)關(guān)鍵詞和H權(quán)值作為描述的術(shù)語,插入作為每一棵樹枝的枝節(jié)點(diǎn);(3)術(shù)語的值即分類屬性的屬性值作為葉節(jié)點(diǎn)。其節(jié)點(diǎn)的構(gòu)建樹圖如圖3所示。

圖3 教學(xué)資源檢索樹

其中A~W所對(duì)應(yīng)的相關(guān)葉子節(jié)點(diǎn),即是各枝節(jié)點(diǎn)所對(duì)應(yīng)的屬性值,依次為:教學(xué)資源的名稱、媒體素材、試卷、課件、教學(xué)案例、文獻(xiàn)資料、網(wǎng)絡(luò)課程、常見問題解答、教學(xué)資源的大小值、文本、圖形/圖像、音頻、視頻、動(dòng)畫、藏語、漢語、英語、教學(xué)資源發(fā)表日期、文本格式(txt、doc、caj、pdf、pdb、rtf、htm、html、ps)、圖形類格式(BMP、JPG、GIF、PNG、TIF、PCX、PSD)、音頻類格式(WAV、MP3、MIDI)、視頻類格式 (AVI、OuickTime、MPEG)、動(dòng)畫類格式(GIF、Flash、FLI/FLC)。

圖4 教學(xué)資源描述樹實(shí)例

而其匹配樹的構(gòu)建過程與描述樹的構(gòu)建基本一致。如一個(gè)教學(xué)資源的類型、大小、名稱、語種、日期、格式等幾個(gè)子刻面來描述,刻面類型的子術(shù)語屬性值依次是視頻、400M、小學(xué)藏語文、藏語、2009-8-20、AVI。通過以上敘述方法可以構(gòu)造一棵如圖4所示的刻面描述樹。對(duì)于教學(xué)資源的查詢也可相應(yīng)地表示為一棵查詢樹,而其查詢樹的構(gòu)建過程與描述樹的構(gòu)建基本一致。將查詢中出現(xiàn)的刻面名、子刻面名轉(zhuǎn)化為相應(yīng)層次的父子節(jié)點(diǎn),并將待查詢的刻面術(shù)語值(關(guān)鍵詞)映射為葉節(jié)點(diǎn)。于是,教學(xué)資源的檢索可以轉(zhuǎn)化為查詢樹與庫中每個(gè)資源刻面描述樹之間的匹配,兩棵樹之間的匹配本質(zhì)上是兩棵樹的節(jié)點(diǎn)之間的一個(gè)映射。根據(jù)對(duì)該映射所施加的約束條件的不同,匹配是相應(yīng)的權(quán)值也不相同,然后根據(jù)返回的權(quán)值和的大小順序呈現(xiàn)給用戶。

4 匹配算法描述

輸入:查詢樹Q,構(gòu)件描述樹庫D。

輸出:符合查詢要求的構(gòu)件集合S。

(1)R=O;

(2)令標(biāo)志位值I=0.00;

(3)取出查詢樹的所有子節(jié)點(diǎn)及其對(duì)應(yīng)的屬性值;

(4)for教學(xué)資源庫D中的每一棵資源描述樹C;

(5)取出C的所有子節(jié)點(diǎn)及相應(yīng)的權(quán)值H;

(6)取得查詢樹Q的節(jié)點(diǎn)集和權(quán)值集和資源樹C的節(jié)點(diǎn)集和權(quán)值集并求交運(yùn)算;

(7)while Q與C具有匹配的子節(jié)點(diǎn)時(shí),取得子節(jié)點(diǎn)相對(duì)應(yīng)的權(quán)值Hi并將其與I求和;

(8)保存每一次循環(huán)的I的值,并把I置零;

(9)for比較I的大小,并按從大到小順序排列;

(10)根據(jù)I的順序,返回其相對(duì)應(yīng)樹的集合S。

5 結(jié)語

刻面檢索技術(shù)的描述樹(匹配樹)和檢索樹(查詢樹)的建立合理與否,將直接影響教學(xué)資源的檢索效果。本文歸納總結(jié)了每種資源類型,格式,語種等在建樹、檢索、匹配等過程中,刻面術(shù)語(關(guān)鍵詞)所應(yīng)有的權(quán)重。使用戶在檢索的過程中,面對(duì)的是具有排行順序的近似檢索結(jié)果集,這些思想和方法將為檢索其他教學(xué)資源庫中的教學(xué)資源提供方法指導(dǎo)。下一步工作的重點(diǎn)是要深刻精化權(quán)值的分配。

[1]Winograd T.From computing machinery to interaction design[A].Denning P,Metcalfe R.Beyound Calculation;The Next Fifty Years of Computing[C].New York:Springer-Verlag New York Inc,1997:149-162.

[2]王瑩,林雪峰,戴輝.基于葉節(jié)點(diǎn)包容匹配模型的構(gòu)件檢索算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28:5979-5977.

[3]馬衛(wèi)娟,方志剛.人機(jī)交互風(fēng)格及其發(fā)展趨勢(shì)[J].航空計(jì)算技術(shù),1999,29(3):16一20.

[4]孟祥福,馬宗民.Web數(shù)據(jù)庫近似查詢結(jié)果自動(dòng)排序方法[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2010,31,23-27.

[5]何飛,蔣冬初,向繼文.教學(xué)構(gòu)件的檢索與匹配[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2007,28:42-47.

猜你喜歡
術(shù)語教育資源檢索
整合校外教育資源 做好青少年道德教育
甘肅教育(2020年20期)2020-04-13 08:04:22
2019年第4-6期便捷檢索目錄
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
面向數(shù)字化教育資源的Flash到HTML5轉(zhuǎn)換研究
自主學(xué)習(xí)視角下的開放教育資源文獻(xiàn)綜述(上)
有感于幾個(gè)術(shù)語的定名與應(yīng)用
從術(shù)語學(xué)基本模型的演變看術(shù)語學(xué)的發(fā)展趨勢(shì)
“五老”是金錢買不到的優(yōu)質(zhì)教育資源
國(guó)際標(biāo)準(zhǔn)檢索
國(guó)際標(biāo)準(zhǔn)檢索
翼城县| 车致| 安图县| 宜都市| 淮安市| 库尔勒市| 芒康县| 东山县| 宽甸| 当涂县| 崇左市| 天祝| 丹阳市| 华容县| 德庆县| 正安县| 鹤庆县| 道孚县| 绥宁县| 佛山市| 枣庄市| 赤壁市| 定远县| 通辽市| 昌平区| 东乡族自治县| 太仆寺旗| 彭水| 柳州市| 西城区| 开平市| 延安市| 调兵山市| 禄丰县| 营口市| 贵阳市| 砀山县| 天长市| 海兴县| 余干县| 乐业县|