国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于本體的航天領(lǐng)域知識組織方法

2018-05-16 12:43北京航天自動控制研究所
航天工業(yè)管理 2018年4期
關(guān)鍵詞:術(shù)語本體定義

/北京航天自動控制研究所

隨著科技的進(jìn)步,航天領(lǐng)域產(chǎn)生、存在著大量的信息,如文檔、代碼、案例、多媒體等。如何管理這些信息并使之為正常的工作服務(wù)就成為了現(xiàn)實中面臨的一個問題。為了解決該問題,知識組織應(yīng)運而生,它的目標(biāo)是管理相關(guān)領(lǐng)域的信息,并分析總結(jié)成為知識,以便滿足工作人員的需要。知識組織的主要任務(wù)是要對企業(yè)級的知識資源進(jìn)行全面和充分的開發(fā)以及有效的利用,充分獲取、生產(chǎn)、傳播和保存,利用集體智慧實現(xiàn)知識創(chuàng)新,獲取行業(yè)競爭優(yōu)勢。因為傳統(tǒng)的知識組織方法缺乏統(tǒng)一的知識模型,容易造成用戶的誤解,而存儲形式的不同也不利于知識的共享和交流,影響了查全率和查準(zhǔn)率。為了解決這些問題,將本體引入知識組織中,基于本體的知識組織是提高知識共享性、互操作性、可維護(hù)性和可復(fù)用性的一個有效途徑。

一、知識本體的概念與作用

從知識的角度來看,本體是一種概念組或詞匯表的理論,可用作構(gòu)建處理系統(tǒng)的構(gòu)建模塊,是一種具有代表性的詞匯表形式。本體是用來捕獲相關(guān)領(lǐng)域的知識,提供該領(lǐng)域知識的共同理解,確定領(lǐng)域內(nèi)共同認(rèn)可的詞匯(術(shù)語),并給出這些詞匯(術(shù)語)間相互關(guān)系的明確定義。本體被廣泛應(yīng)用于知識表示、知識共享、知識集成、知識復(fù)用和知識管理等領(lǐng)域。

1.本體的層次劃分

本體研究層次圖(見圖1),展示了關(guān)于本體研究與開發(fā)的不同層次的工作。其中,頂層本體(又稱為通用本體)主要研究通用的概念,如時間、空間、事物、事件、對象、行為等,其完全獨立于特定的問題或領(lǐng)域,可以在很大范圍內(nèi)共享;領(lǐng)域本體則研究與一個特定領(lǐng)域有關(guān)的術(shù)語或詞匯,如航天、導(dǎo)彈、軍事等;任務(wù)本體是定義通用任務(wù)或推理活動,如需求、設(shè)計等。領(lǐng)域本體和任務(wù)本體可以引用頂層本體中定義的詞匯來描述自身的詞匯。應(yīng)用本體描述特定的應(yīng)用,其既可以引用涉及特定的領(lǐng)域本體中的概念,又可以引用出現(xiàn)在任務(wù)本體中的概念。

2.本體的建模語言

1999年P(guān)erez等人提出了構(gòu)建本體的5個最基本的建?;?,即類或概念、關(guān)系、函數(shù)、公理、實例,它們能夠準(zhǔn)確地刻畫所描述的對象。

類或概念——從語義上講,表示的是對象的集合。一般采用框架結(jié)構(gòu)進(jìn)行定義,包括概念的名稱,以及與其它概念之間的關(guān)系集合,并用自然語言對概念進(jìn)行描述。

圖1 本體研究層次圖

關(guān)系——在領(lǐng)域中概念之間的交互作用。從語義上講,關(guān)系對應(yīng)于對象元組的集合。

函數(shù)——一類特殊的關(guān)系。函數(shù)的重要特性是關(guān)系的前n-1個元素可以唯一確定第n個元素。

公理——表示永遠(yuǎn)成立的聲明。

實例——代表元素。從語義上講,實例表示的就是對象。

3.本體的構(gòu)建準(zhǔn)則

目前,本體構(gòu)建技術(shù)還不能實現(xiàn)完全自動化構(gòu)建本體,主要還是依靠手工構(gòu)建或半自動生成一些本體。因此,依據(jù)一定準(zhǔn)則構(gòu)建本體十分必要,它可以使本體構(gòu)建過程更加規(guī)范,構(gòu)建效率更高、質(zhì)量更好。但由于本體構(gòu)建過程在各個領(lǐng)域和不同工程中各不相同,所以到目前為止,還沒有一套統(tǒng)一標(biāo)準(zhǔn)的本體構(gòu)建方法。而1995年Gruber提出的本體構(gòu)建5條準(zhǔn)則是最有影響的,即:

清晰性——本體應(yīng)該能有效地傳達(dá)其中所定義的術(shù)語的含義。

一致性——本體必須是一致的,即由本體得出的推論與原有的定義是相容的,不能產(chǎn)生矛盾和沖突。

可擴展性——本體在設(shè)計時不僅要使用領(lǐng)域內(nèi)公認(rèn)的詞匯,同時還要考慮可能的應(yīng)用任務(wù)范圍,使得本體的表達(dá)能被單調(diào)地擴展。

編碼偏好程度最小——概念應(yīng)該在知識層次上說明,而不應(yīng)依賴于特定的符號層次的編碼。

最小本體承諾——對待建模對象給出盡可能少的約束。

以上5條準(zhǔn)則在使用過程中需要進(jìn)行權(quán)衡,難以全部滿足。

二、基于本體的航天知識組織

1.本體的構(gòu)建與存儲

當(dāng)前,構(gòu)建知識本體的工作主要依靠手工編輯,沒有實現(xiàn)工程化,每個本體開發(fā)組都有自己的原則、設(shè)計標(biāo)準(zhǔn)和定義方法。然而,知識本體的構(gòu)建直接影響著知識組織的結(jié)果,以及用戶獲取知識的體驗。因此,選用合適的知識本體構(gòu)建方法非常重要。

目前,美國、歐洲等多個本體開發(fā)組織分別提出了自己的本體構(gòu)建方法,如英國愛丁堡大學(xué)開發(fā)的專門用來創(chuàng)建企業(yè)本體的“骨架法”,加拿大多倫多大學(xué)從TOVE項目中總結(jié)出來的TOVE企業(yè)建模法,西班牙馬德里理工大學(xué)提出的Methontology本體建模方法等。

(1)“骨架法”

建立在企業(yè)本體基礎(chǔ)之上,是相關(guān)商業(yè)企業(yè)間術(shù)語和定義的集合,該方法只提供開發(fā)本體的指導(dǎo)方針,“骨架法”流程如圖2所示。

確定本體應(yīng)用的目的和范圍。根據(jù)所研究的領(lǐng)域或任務(wù)建立相應(yīng)的領(lǐng)域本體或過程本體,領(lǐng)域越大,所建本體越大,因此需限制研究的范圍。

圖2 “骨架法”流程圖

本體分析。定義本體所有術(shù)語的意義及其之間的關(guān)系。此步驟需領(lǐng)域?qū)<业膮⑴c,對該領(lǐng)域越了解,所建本體就越完善。

本體的表示。一般用語義模型表示本體。

本體的評價。建立本體的評價標(biāo)準(zhǔn)是清晰性、一致性、完整性、可擴展性。清晰性就是本體中的術(shù)語應(yīng)被無歧義的定義;一致性指的是術(shù)語之間關(guān)系邏輯應(yīng)一致;完整性是指本體中的概念及關(guān)系應(yīng)是完整的,包括該領(lǐng)域內(nèi)所有概念,但很難達(dá)到,還需不斷完善;可擴展性是指本體應(yīng)用能夠擴展,在該領(lǐng)域不斷發(fā)展時能加入新的概念。

本體的建立。對本體按以上標(biāo)準(zhǔn)進(jìn)行檢驗,符合要求的以文件形式存放,否則轉(zhuǎn)本體分析階段。

(2)TOVE企業(yè)建模法

該方法由多倫多大學(xué)企業(yè)集成實驗室研制,用于構(gòu)造多倫多虛擬企業(yè)本體工程,使用一階邏輯進(jìn)行集成。TOVE本體包括企業(yè)設(shè)計本體、工程本體、計劃本體和服務(wù)本體,其流程如圖3所示。

設(shè)計動機。定義直接可能的應(yīng)用和所有解決方案,提供潛在的非形式化的對象和關(guān)系的語義表示。

非形式化的能力問題。能力問題作為約束條件,包括能解決什么問題及如何解決,這里的問題用術(shù)語表示,答案用公理和形式化定義回答。由于是在沒有形式化的本體之前進(jìn)行的,所以叫非形式化的能力問題。

術(shù)語的形式化。從非形式化能力問題中提取非形式化的術(shù)語,然后用本體形式化語言進(jìn)行定義。

形式化的能力問題。一旦能力問題脫離了非形式化,本體術(shù)語已定義,則能力問題便自然形式化。

形式化公理。術(shù)語定義所遵循的公理用一階謂詞邏輯表示,包括定義的語義或解釋。

完全理論。說明問題的解決方案必須是完全的。

圖3 TOVE方法流程圖

(3)Methontology本體建模法

該方法由馬德里理工大學(xué)人工智能實驗室提出,分為管理、開發(fā)和維護(hù)3個不同的階段。其中,管理階段的系統(tǒng)規(guī)劃包括任務(wù)的進(jìn)展情況、需要的資源、如何保證質(zhì)量等問題;維護(hù)階段包括知識獲取、系統(tǒng)集成、評價、文檔說明、配置管理。

通過這3種方法的分析對比可知,“骨架法”更適合作為航天知識本體的構(gòu)建方法。

2.航天知識本體的組織方式

知識本體的組織是構(gòu)建知識系統(tǒng)的重要手段,其目的是為了加強知識檢索和促進(jìn)知識的增長。對于本體知識系統(tǒng)而言,關(guān)鍵是建立知識本體的體系結(jié)構(gòu)。其中,概念體系和屬性體系是構(gòu)建本體體系結(jié)構(gòu)的2個重要組成部分。此外,描述領(lǐng)域概念的一些典型關(guān)系對于刻畫概念及屬性之間的關(guān)聯(lián)具有無法替代的作用。在構(gòu)建屬性分類體系時,往往需要參照這些存在于領(lǐng)域之中的固有關(guān)系。

三、知識本體的進(jìn)化及融合

1.知識本體的進(jìn)化

現(xiàn)實世界無時無刻不在改變,知識本體的含義、層次關(guān)系、存在方式也應(yīng)向前發(fā)展,而且用戶需求也在不斷改變。因此,要讓本體與時俱進(jìn),并根據(jù)外部知識源的變化作出及時的調(diào)整,實現(xiàn)本體的動態(tài)進(jìn)化。

本體進(jìn)化是指在現(xiàn)有本體基礎(chǔ)上,依照一定的理論、方法和規(guī)則,根據(jù)外部的應(yīng)用需求,對現(xiàn)有本體的數(shù)據(jù)結(jié)構(gòu)、概念及概念間關(guān)系進(jìn)行不斷豐富、完善、更新、改進(jìn)及評估的過程和方法。知識本體進(jìn)化的基本框架如圖4所示。

數(shù)據(jù)發(fā)現(xiàn)。在數(shù)據(jù)源中發(fā)現(xiàn)潛在的新信息,數(shù)據(jù)源的格式有多種,可以是非結(jié)構(gòu)化的數(shù)據(jù),如文檔、多媒體,也可以是結(jié)構(gòu)化的數(shù)據(jù),如文本、Excel等。對于不同格式的數(shù)據(jù),處理方式也不同:文檔使用信息抽取、本體學(xué)習(xí)技術(shù)處理;其它外部本體則將其轉(zhuǎn)換成與知識本體語言相兼容的本體。

數(shù)據(jù)確認(rèn)。經(jīng)過“信息發(fā)現(xiàn)”所發(fā)現(xiàn)的潛在信息,可以通過使用一系列的啟發(fā)式規(guī)則(如所抽取的術(shù)語的長度)來實現(xiàn)數(shù)據(jù)確認(rèn),尤其是從文檔中發(fā)現(xiàn)的新信息。對于結(jié)構(gòu)化的數(shù)據(jù)(文本、Excel)則無需確認(rèn),因為結(jié)構(gòu)化的數(shù)據(jù)已經(jīng)過明確良好的定義。

本體進(jìn)化。在所抽取的術(shù)語和進(jìn)化本體中的概念之間建立正確的關(guān)系,這些關(guān)系是通過搜索多個背景知識源鑒別出來的。進(jìn)化本體中相應(yīng)的變化將被直接執(zhí)行并記錄。

確認(rèn)進(jìn)化。對本體實施變化后會引起本體的不一致和不連貫,并且由于存在多個數(shù)據(jù)源,在本體進(jìn)化過程中也可能產(chǎn)生數(shù)據(jù)復(fù)制,這樣就會產(chǎn)生沖突知識,所以可以采用人工干預(yù)或者自動推理技術(shù)來解決。

進(jìn)化管理。在本體進(jìn)化以及進(jìn)化本體對依賴本體的變化傳播過程中,賦予本體管理者一定程度的控制權(quán),主要負(fù)責(zé)記錄、跟蹤本體變化,找出并解決本體進(jìn)化過程中未解決的問題。

2.知識本體的融合

根據(jù)成熟的研究結(jié)論,多領(lǐng)域知識融合方法主要可以分為基于規(guī)則的知識融合方法、基于分類的知識融合方法、基于估算的知識融合方法3類,它們共同構(gòu)成了知識融合的基礎(chǔ)方法,如圖5所示。

無論采取哪一種方法,以知識融合本身來說,都可以將知識融合作為對信息的一種處理過程。即采用綜合利用自然語言處理、語義分析、統(tǒng)計分析等技術(shù)方法對多領(lǐng)域知識信息進(jìn)行多層次和多維度檢測、關(guān)聯(lián)、估計、組合、分析的知識融合,目的是對知識對象的結(jié)構(gòu)和內(nèi)涵進(jìn)行優(yōu)化,為用戶的需求提供更有效的知識信息。

圖4 知識本體進(jìn)化基本框架

圖5 知識融合方法

航空航天領(lǐng)域擁有大量的顯性知識和隱性知識,需要進(jìn)行有針對性的發(fā)掘、收集和整理。通過對知識組織方式進(jìn)行控索,對知識本體的構(gòu)建與存儲、知識本體的組織方式、知識本體的進(jìn)化過程和多領(lǐng)域知識融合一般架構(gòu)進(jìn)行研究,在對比流行的知識本體構(gòu)建方法后,選取了“骨架法”的知識本體構(gòu)造方法,并提出知識本體進(jìn)化的一般流程,進(jìn)而提出知識融合的架構(gòu)設(shè)計?;诒倔w的知識組織研究是一個極其深入的課題,包括本體進(jìn)化過程中的學(xué)習(xí)、智能化,知識融合過程中的學(xué)習(xí)訓(xùn)練,需要不斷完善融合算法,因此仍有許多內(nèi)容需要進(jìn)一步深入研究?!?/p>

猜你喜歡
術(shù)語本體定義
繼齊韻往昔,以今聲開來——思考自五音戲主奏樂器的演變、本體及延伸
眼睛是“本體”
嚴(yán)昊:不定義終點 一直在路上
定義“風(fēng)格”
貿(mào)易術(shù)語修改適用問題探討
修辭學(xué)的重大定義
專題
Care about the virtue moral education
教你正確用(十七)