国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于增量AHP的學(xué)習(xí)資源多標(biāo)簽標(biāo)注研究

2016-03-27 09:44:44吳雷
數(shù)碼世界 2016年7期
關(guān)鍵詞:增量資源庫(kù)本體

吳雷

安徽教育網(wǎng)絡(luò)出版有限公司

?

基于增量AHP的學(xué)習(xí)資源多標(biāo)簽標(biāo)注研究

吳雷

安徽教育網(wǎng)絡(luò)出版有限公司

學(xué)習(xí)資源標(biāo)注是我們根據(jù)需要知識(shí)準(zhǔn)確獲取相關(guān)學(xué)習(xí)資源的基礎(chǔ)。然而目前大多數(shù)資源標(biāo)注方法僅局限于單標(biāo)簽以及缺乏關(guān)聯(lián)度信息,給用戶精確獲取學(xué)習(xí)資源帶來(lái)困難。為解決此問(wèn)題,本文提出一種基于增量AHP的學(xué)習(xí)資源多標(biāo)簽標(biāo)注方法,首先根據(jù)標(biāo)簽-資源信息構(gòu)建學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型,然后利用層次分析法定性與定量分析相結(jié)合的特點(diǎn)進(jìn)行關(guān)聯(lián)程度值處理,選取出與學(xué)習(xí)資源相關(guān)程度最大的若干個(gè)標(biāo)簽作為標(biāo)注標(biāo)簽,從而支持用戶方便獲得與學(xué)習(xí)資源相關(guān)的知識(shí)點(diǎn)以及關(guān)聯(lián)程度值。此外,針對(duì)初始成對(duì)比較矩陣隨時(shí)間變化導(dǎo)致更新的情況,本文對(duì)傳統(tǒng)AHP算法進(jìn)行改進(jìn),提出增量AHP算法實(shí)現(xiàn)學(xué)習(xí)資源關(guān)聯(lián)程度值更新。實(shí)驗(yàn)結(jié)果表明本文提出的方法具有良好的實(shí)用價(jià)值。

多標(biāo)簽標(biāo)注模型 關(guān)聯(lián)程度值 增量AHP

1 引言

隨著信息技術(shù)的飛速發(fā)展,我們可以方便的獲取海量文檔、圖像、視頻等跨媒體學(xué)習(xí)資源。然而 這些學(xué)習(xí)資源在給我們帶來(lái)豐富信息的同時(shí),也造成了資源信息雜亂以及檢索困難現(xiàn)象的出現(xiàn),即大量無(wú)用信息和有用信息摻合在一起,給我們迅速獲取所需信息資源帶來(lái)極大困難。這就需要我們采取有效的學(xué)習(xí)資源標(biāo)注方法,從而方便消費(fèi)者迅速獲 取其需要的各種知識(shí)資源。語(yǔ)義網(wǎng)[1]技術(shù)的出現(xiàn)為實(shí)現(xiàn)知識(shí)的高效管理提 供了新的方向,目前實(shí)現(xiàn)學(xué)習(xí)資源有效管理的方法主要有兩種,分別是構(gòu)建學(xué)習(xí)資源庫(kù)模型和資源標(biāo)注。構(gòu)建學(xué)習(xí)資源庫(kù)模型的方法源初始關(guān)聯(lián)知識(shí)點(diǎn):主要是通過(guò)分析學(xué)習(xí)資源的空間特征以及語(yǔ)義特征并生成資源的語(yǔ)義元數(shù)據(jù)對(duì)資源進(jìn)行規(guī)范化描述,進(jìn)而將學(xué)習(xí)資源組織起來(lái)構(gòu)建學(xué)習(xí)資源庫(kù)模型。張滬寅等將語(yǔ)義特征引入到電子學(xué)習(xí)資源模型庫(kù)的構(gòu)建之中,通過(guò)構(gòu)建電子學(xué)習(xí)資源庫(kù)本體并生成相應(yīng)的語(yǔ)義元數(shù)據(jù),規(guī)范地描述資源,將資源以機(jī)器可理解的方式組織起來(lái)實(shí)現(xiàn)資源的有效管理,進(jìn)而提出了一種基于本體描述的電子學(xué)習(xí)資源庫(kù)模型LMOD。資源標(biāo)注方法主要是通過(guò)分析學(xué)習(xí)資源的語(yǔ)義特征,并完成學(xué)習(xí)資源與標(biāo)注標(biāo)簽的映射,從而實(shí)驗(yàn)資源的有效檢索。陳葉旺等通過(guò)分析領(lǐng)域本體知識(shí)的語(yǔ)義環(huán)境和資源文檔結(jié)構(gòu)兩方面信息,利用領(lǐng)域本體所表達(dá)的豐富語(yǔ)義環(huán)境信息,實(shí)現(xiàn)對(duì)農(nóng)業(yè)領(lǐng)域中各類文檔資源的語(yǔ)義標(biāo)注提出了一種基于本體的文檔語(yǔ)義標(biāo)注改進(jìn)方法;李宏言等引入了針對(duì)語(yǔ)音數(shù)據(jù)標(biāo)注的六元組模型,將語(yǔ)音資源的自身特征考慮進(jìn)去,并將標(biāo)簽對(duì)象擴(kuò)展為更為廣義的標(biāo)記,提出基于 “興趣+收獲+報(bào)酬”的標(biāo)注模式實(shí)現(xiàn)了大數(shù)據(jù)語(yǔ)音語(yǔ)料庫(kù)的社會(huì)標(biāo)注。

盡管這些方法在一定程度上實(shí)現(xiàn)了基于語(yǔ)義的資源標(biāo)注,提高了用戶的資源檢索效率,然而這些方法依然存在下述不足:

(1)他們只是給某一資源進(jìn)行簡(jiǎn)單的貼上一個(gè)標(biāo) 簽,而沒(méi)有考慮與該資源有關(guān)標(biāo)簽可能不止一個(gè), 比如資源《名師解讀立體幾何問(wèn)題》不僅僅是講解 立體幾何問(wèn)題,該資源還關(guān)聯(lián)到坐標(biāo)與圖形運(yùn)動(dòng)的問(wèn)題。

(2)現(xiàn)存的標(biāo)注方法只是給予資源某個(gè)標(biāo)簽,僅僅完成定性分析,而沒(méi)有對(duì)資源與標(biāo)簽的關(guān)聯(lián)度進(jìn) 行定量研究。本文針對(duì)以上問(wèn)題,以教育領(lǐng)域?qū)W習(xí)資源標(biāo)注為研究對(duì)象,通過(guò)分析學(xué)習(xí)資源空間特征與語(yǔ)義特征完成學(xué)習(xí)資源信息與標(biāo)簽信息的映射構(gòu)造標(biāo)注信息,從而完成學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型構(gòu)建,利用層次分析法進(jìn)行相關(guān)程度值處理,提出了關(guān)聯(lián)程度值增量更新方法進(jìn)行標(biāo)注信息更新,并由此提出基于增量AHP的學(xué)習(xí)資源多標(biāo)簽標(biāo)注方法。 本文的其余章節(jié)安排如下:第2節(jié)介紹學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型構(gòu)建,第3節(jié)介紹基于增量AHP 的學(xué)習(xí)資源多標(biāo)簽標(biāo)注方法,第4節(jié)主要針對(duì)本文提出的方法進(jìn)行試驗(yàn)以及結(jié)果分析,最后一節(jié)是本文結(jié)束語(yǔ)以及未來(lái)工作展望。

2 學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型

本文針對(duì)通常的學(xué)習(xí)資源標(biāo)注出現(xiàn)的資源信息丟失以及不能定量分析標(biāo)簽的關(guān)聯(lián)度等問(wèn)題,通過(guò)構(gòu)建學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型來(lái)解決以上問(wèn)題。本文提出的學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型。R1、R2…Rn是不同學(xué)習(xí)資源,包括視 頻、圖片、文檔等類型的學(xué)習(xí)資源,首先在資源入庫(kù)時(shí)抽取資源信息(包括資源名稱、格式、主題等)構(gòu)建學(xué)習(xí)資源庫(kù)。然后根據(jù)學(xué)科標(biāo)準(zhǔn)(如學(xué)習(xí)大綱、主題分類詞表等)構(gòu)建標(biāo)簽庫(kù)。最后對(duì)于學(xué)習(xí)資源庫(kù)中的某一資源Rk,通過(guò)學(xué)習(xí)資源信息與關(guān)聯(lián)標(biāo)簽形成映射構(gòu)建標(biāo)注信息,并將標(biāo)注信息存儲(chǔ)于標(biāo)注信息庫(kù)中??闯?,本文提出的標(biāo)注方法主要包括三個(gè)方面的內(nèi)容,分別是標(biāo)簽庫(kù)構(gòu)建、標(biāo)注信息表示以及資源標(biāo)注。

2.1標(biāo)簽庫(kù)構(gòu)建

本文構(gòu)建的標(biāo)簽庫(kù)是利用本體構(gòu)建工具Protégé 根據(jù)《中國(guó)分類主題詞表》創(chuàng)建的學(xué)科領(lǐng)域本體OWL文件。

定義1 領(lǐng)域本體是描述某一領(lǐng)域知識(shí)的概念或術(shù)語(yǔ)以及它們之間關(guān)系的集合,因此領(lǐng)域本體可以用一個(gè)五元組表示,記作O=<C,R,F(xiàn),A,I>,其中 C、F、A、I和R分別是領(lǐng)域本體中的概念、關(guān)系、函數(shù)、公理和實(shí)例,其中概念(Concepts)是一類對(duì)象的集合的抽象描述,C={O1,O2,…},Oi是領(lǐng)域中的對(duì)象;關(guān)系(Relations)是在領(lǐng)域中概念之間的交互作用,形式上定義為n維笛卡兒積的子集;函數(shù)(Functions)則是元知識(shí)對(duì)規(guī)則與操作的一種映射關(guān)系;公理(Axioms)公理是一種無(wú)需證明的永真斷言;實(shí)例(Instances)是類中的知識(shí)具體化表示。本文構(gòu)建的標(biāo)簽庫(kù)有3個(gè)優(yōu)勢(shì),分別是:

權(quán)威性和規(guī)范性,《中國(guó)分類主題詞表》是在《中國(guó)圖書(shū)分類辦法》編委會(huì)的主持下,由全國(guó)40個(gè)圖書(shū)情報(bào)單位共同參加編制的一部大型文獻(xiàn)標(biāo)引工具書(shū),這使得本文構(gòu)建的標(biāo)簽庫(kù)具有權(quán)威性和規(guī)范性。

操作簡(jiǎn)單,考慮到《中國(guó)分類主題詞表》需要維護(hù)變動(dòng),我們對(duì)標(biāo)簽庫(kù)進(jìn)行單獨(dú)存儲(chǔ),從而便于對(duì)標(biāo)簽庫(kù)進(jìn)行修改。

實(shí)用性強(qiáng),本體構(gòu)建工具Protégé是基于Java語(yǔ)言開(kāi)發(fā)的開(kāi)源本體編輯和知識(shí)獲取軟件,可以免費(fèi)下載,并且具有良好的擴(kuò)展性,更為可貴的是它支持中文的輸入,具有很強(qiáng)的實(shí)用性。因此,本文選用 Protégé4.2[9]作為本體開(kāi)發(fā)工具用來(lái)構(gòu)建標(biāo)簽庫(kù)。

2.2標(biāo)注信息表示

定義2這里將標(biāo)注信息(Informat ion of Annotation,IA)定義為一個(gè)三元組,IA=(R,L,β)。其中,R代表學(xué)習(xí)資源,實(shí)際上是資源的抽取信息;L代表標(biāo)注標(biāo)簽,即是由領(lǐng)域本體抽取出的元知識(shí)點(diǎn);β代表標(biāo)簽L 與該資源R的關(guān)聯(lián)程度。標(biāo)注信息即資源標(biāo)注的結(jié)果,標(biāo)注信息表示是決定資源標(biāo)注成功與否的關(guān)鍵因素。標(biāo)注信息按保存形式分為內(nèi)嵌式和非內(nèi)嵌式兩種,其中內(nèi)嵌式是把標(biāo)注信息作為本體內(nèi)容一起存儲(chǔ),而非內(nèi)嵌式是把標(biāo)注信息獨(dú)立存儲(chǔ)于數(shù)據(jù)庫(kù)中。由于學(xué)科知識(shí)具有相對(duì)不變性,也就意味著知識(shí)本體不需經(jīng)常維護(hù),而教育資源需要根據(jù)實(shí)際情況進(jìn)行經(jīng)常性的增刪改查。因此,本文標(biāo)注信息選擇非內(nèi)嵌式的保存形式具有以下三個(gè)方面好處:

1)可以減少對(duì)標(biāo)簽庫(kù)的操作,保持標(biāo)簽庫(kù)的穩(wěn)定性,節(jié)省部分不必要的系統(tǒng)開(kāi)銷。

2)在教育資源改變時(shí),不需要對(duì)標(biāo)簽庫(kù)進(jìn)行操作與維護(hù),只需對(duì)標(biāo)注信息庫(kù)進(jìn)行相應(yīng)的增刪修改即可,可減少系統(tǒng)的維護(hù)開(kāi)銷。

3)在進(jìn)行資源標(biāo)注時(shí),由于不需要針對(duì)標(biāo)簽庫(kù)和資源本身進(jìn)行操作,可以很容易地實(shí)現(xiàn)跨媒體資源標(biāo)注。

2.3多標(biāo)簽資源標(biāo)注

之前學(xué)者研究的資源標(biāo)注方法都是單一標(biāo)簽標(biāo)注,然而很多資源并不是僅關(guān)于單一主題的,這就使得在使用單一標(biāo)簽標(biāo)注資源時(shí)不能充分描述資源信息而造成資源信息的丟失。為解決這個(gè)問(wèn)題,本文提出了學(xué)習(xí)資源多標(biāo)簽資源標(biāo)注模型。多標(biāo)簽標(biāo)注模型就是利用多個(gè)知識(shí)點(diǎn)作為標(biāo)簽去標(biāo)注同一個(gè)資源,從而盡可能準(zhǔn)確完整的描述資源信息。在對(duì)資源完成標(biāo)注之后,即在標(biāo)注信息庫(kù)中構(gòu)造了該資源的標(biāo)注信息組。

3 基于增量

AHP的多標(biāo)簽標(biāo)注方法學(xué)習(xí)資源多標(biāo)簽標(biāo)注模型建立后,一個(gè)重要的問(wèn)題是如何確定關(guān)聯(lián)程度值。對(duì)于某一學(xué)習(xí)資源,可能包含的多個(gè)標(biāo)簽與資源的關(guān)聯(lián)程度值可能不同,而且隨著資源信息的豐富,關(guān)聯(lián)程度值也需要進(jìn)行更新維護(hù)?;谝陨蠁?wèn)題,本文提出了基于增量 AHP的多標(biāo)簽標(biāo)注方法。

3.1層次分析法

層次分析法(AHP方法)是美國(guó)著名運(yùn)籌學(xué)家 T.L.Saaty[10]提出的一種定性分析與定量分析相結(jié)合的系統(tǒng)分析方法,它充分利用了人的分析、判斷和綜合能力,能夠有效分析目標(biāo)準(zhǔn)則體系層次間的非序列關(guān)系,有效地綜合測(cè)度決策者的判斷和比較。

層次分析法的基本思想是:首先根據(jù)多目標(biāo)評(píng)價(jià)問(wèn)題的性質(zhì)和總目標(biāo)將復(fù)雜的問(wèn)題按層次進(jìn)行分解,形成階梯層次結(jié)構(gòu),通過(guò)兩兩比較的方式確定層次中影響因素的相對(duì)重要性,然后綜合領(lǐng)域?qū)<业闹饔^判斷,對(duì)層次結(jié)構(gòu)中影響因素的相對(duì)重要性進(jìn)行排序。

3.2基于增量AHP的學(xué)習(xí)資源多標(biāo)簽標(biāo)注

本文資源標(biāo)注主要分為三個(gè)階段完成,分別是初始關(guān)聯(lián)確定、關(guān)聯(lián)程度值處理和關(guān)聯(lián)程度值更新。 初始關(guān)聯(lián)確定階段主要由學(xué)科老師根據(jù)以往的教學(xué)經(jīng)驗(yàn)分析教學(xué)資源并給出與教學(xué)資源相關(guān)的知識(shí)點(diǎn)以及相應(yīng)的相對(duì)關(guān)聯(lián)程度。關(guān)聯(lián)程度值處理階段主要是利用層次分析法對(duì)初始標(biāo)注結(jié)果進(jìn)行處理,獲得資源與相關(guān)知識(shí)點(diǎn)的關(guān)聯(lián)程度值。在完成資源標(biāo)注后,還需要對(duì)資源標(biāo)注信息進(jìn)行維護(hù)更新以保持標(biāo)注信息的準(zhǔn)確性以及穩(wěn)定性,關(guān)聯(lián)程度值增量更新階段是系統(tǒng)根據(jù)用戶評(píng)價(jià)增量完成關(guān)聯(lián)程度值的更新。

3.2.1初始關(guān)聯(lián)確定

由多位領(lǐng)域?qū)<覍?duì)學(xué)習(xí)資源進(jìn)行分析,判斷矩陣指標(biāo)評(píng)分標(biāo)準(zhǔn)標(biāo)示出與資源相對(duì)應(yīng)的知識(shí)點(diǎn),然后綜合領(lǐng)域?qū)<业某跏紭?biāo)注,獲得與資源相對(duì)關(guān)聯(lián)程度最大的若干個(gè)知識(shí)點(diǎn)作為資源的 標(biāo)注標(biāo)簽并依照相對(duì)關(guān)聯(lián)程度進(jìn)行排序,進(jìn)而可以獲得資源。

3.2.2關(guān)聯(lián)程度值處理

本文采用層次分析法來(lái)處理關(guān)聯(lián)程度值,重點(diǎn)是如何構(gòu)建階梯層次結(jié)構(gòu)。這一步需要認(rèn)真分析資源與標(biāo)簽的關(guān)聯(lián)確定問(wèn)題,充分考慮問(wèn)題的影響因素,根據(jù)層次分析法原理構(gòu)造如下:第一層:目標(biāo)層只有一個(gè)元素,就是問(wèn)題的實(shí)現(xiàn)目標(biāo),即確定資源與標(biāo)簽的關(guān)聯(lián)程度值。

第二層:準(zhǔn)則層包括所有實(shí)現(xiàn)目標(biāo)所涉及的資源與標(biāo)簽關(guān)聯(lián)程度的評(píng)價(jià)問(wèn)題,考慮到不同領(lǐng)域?qū)?家的知識(shí)深度及廣度的差異性,由此考慮以不同領(lǐng)域?qū)<易鳛闇?zhǔn)則層。

第三層:方案層包括實(shí)現(xiàn)目標(biāo)的方案,即與資源相關(guān)的標(biāo)簽的確定。

3.2.3關(guān)聯(lián)程度值增量更新

在資源使用過(guò)程中,需要對(duì)資源標(biāo)注信息時(shí)時(shí)維護(hù)以保證資源標(biāo)注信息的準(zhǔn)確性。這就要求系統(tǒng)能夠定期對(duì)用戶投訴較多的資源重新進(jìn)行標(biāo)注并對(duì)資源標(biāo)注信息進(jìn)行更新,由此本文提出了關(guān)聯(lián)程度值增量AHP更新方法。

首先,邀請(qǐng)新一批領(lǐng)域?qū)<裔槍?duì)該資源Rk進(jìn)行初始標(biāo)注,獲得資源Rk的C-P判斷矩陣E’。 然后,分析比較歷史標(biāo)注權(quán)向量與重新標(biāo)注權(quán) 向量的差異,可得出權(quán)向量增量值, 其中β’k為更新后的權(quán)向量。最后,在構(gòu)建更新規(guī)則的過(guò)程中,既要考慮到重新標(biāo)注的信息,也要考慮歷史標(biāo)注信息。

4 結(jié)束語(yǔ)

本文提出的基于增量AHP的學(xué)習(xí)資源多標(biāo)簽標(biāo)注方法同時(shí)考慮了資源的多關(guān)聯(lián)性以及標(biāo)簽貢獻(xiàn)度的問(wèn)題,很好地解決了資源標(biāo)注過(guò)程中信息丟失的問(wèn)題,同時(shí)完成了對(duì)學(xué)習(xí)資源的精確標(biāo)注,能夠使用戶快速準(zhǔn)確地檢索到所需的資源,從而可以極大地提高用戶的檢索效率。進(jìn)一步的研究中,我們將會(huì)深入研究并改進(jìn)增量更新算法并在資源標(biāo)注中盡可能的減少主觀因素對(duì)關(guān)聯(lián)程度值的影響。

[1]Tim Berners-Lee, Hendler James and Ora Lassila. The Semant ic Web [J]. Scientif ic Amer ican, 2001, 284(5):28-37

[2]張滬寅,張銘洋,李鑫.基于領(lǐng)域本體的電子學(xué)習(xí)資源庫(kù)模型[J].計(jì)算機(jī)應(yīng)用,2012,32(1):191-195

[3]張滬寅,李鑫,陸春濤,等.LMOD:一種基于本體描述的電子學(xué)習(xí)資源庫(kù)模型[J].計(jì)算機(jī)應(yīng)用研究, 2011,28(4):1001-3695

[4]伍春香,陳世鴻.多媒體教育資源庫(kù)層次索引模型[J].武漢大學(xué)學(xué)報(bào)(理學(xué)版),2007,53(5): 553-557

[5]陳葉旺,李文,彭鑫,等.基于本體的文檔語(yǔ)義標(biāo)注改進(jìn)方法[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版, 2009,39(6):1109-1113

猜你喜歡
增量資源庫(kù)本體
Abstracts and Key Words
提質(zhì)和增量之間的“辯證”
健身氣功開(kāi)放課程資源庫(kù)建設(shè)研究
對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
“價(jià)增量減”型應(yīng)用題點(diǎn)撥
貴州●石斛種質(zhì)資源庫(kù)
高中歷史信息化教育資源庫(kù)應(yīng)用探索
福建基礎(chǔ)教育教學(xué)資源庫(kù)建設(shè)研究——以福建基礎(chǔ)教育網(wǎng)資源庫(kù)為例
基于均衡增量近鄰查詢的位置隱私保護(hù)方法
《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
宁陵县| 碌曲县| 新昌县| 高密市| 锡林郭勒盟| 大丰市| 西盟| 郓城县| 延庆县| 衢州市| 云龙县| 信丰县| 峨眉山市| 阳谷县| 大方县| 白玉县| 台江县| 惠东县| 孟州市| 武冈市| 恩施市| 南江县| 寿光市| 黄浦区| 酒泉市| 合阳县| 正阳县| 怀安县| 洛浦县| 兰考县| 文水县| 通道| 顺昌县| 祥云县| 沁源县| 浠水县| 文安县| 洞头县| 和龙市| 德州市| 英山县|