国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

《中圖法》在圖書(shū)館資源語(yǔ)義化中的應(yīng)用

2017-03-22 04:00:04,,,,,
關(guān)鍵詞:中圖法詞表皰疹

, , , ,,

所謂語(yǔ)義信息,就是將文獻(xiàn)變?yōu)橛?jì)算機(jī)能理解的信息,即語(yǔ)義標(biāo)簽,用語(yǔ)義標(biāo)簽表述文獻(xiàn)內(nèi)容,是圖書(shū)館資源組織發(fā)展趨勢(shì)。在語(yǔ)義環(huán)境下,知識(shí)服務(wù)轉(zhuǎn)變?yōu)閷?duì)文獻(xiàn)資源的深度挖掘,提供文獻(xiàn)的語(yǔ)義信息。由于傳統(tǒng)的資源組織方法在圖書(shū)館資源組織中的長(zhǎng)期應(yīng)用,形成了規(guī)范的分類體系和詞組,其高度結(jié)構(gòu)化、規(guī)范化的內(nèi)容是資源組織長(zhǎng)期積累的成果。如何揚(yáng)長(zhǎng)避短、利用這些成果是我們必須考慮的問(wèn)題。

1 中圖法在語(yǔ)義化中應(yīng)用的優(yōu)缺點(diǎn)

分類法是按照知識(shí)的門(mén)類、邏輯次序,層層劃分、逐級(jí)展開(kāi)的列舉式線性結(jié)構(gòu)組織信息[1],是傳統(tǒng)紙質(zhì)文獻(xiàn)的組織方式,其體系等級(jí)結(jié)構(gòu)可以看作邏輯結(jié)構(gòu),從而幫助計(jì)算機(jī)理解概念。在網(wǎng)絡(luò)時(shí)代仍被應(yīng)用于網(wǎng)站建設(shè)等方面,雅虎就是因其分類的特點(diǎn)而被視為分類網(wǎng)站發(fā)展的模板。

《中圖法》是一部既可以組織藏書(shū)排架,又可以分類檢索的列舉式等級(jí)式體系組配分類法?!吨袌D法》是使用最廣泛的中國(guó)圖書(shū)分類法,主要供大型綜合性圖書(shū)館及情報(bào)機(jī)構(gòu)類分文獻(xiàn)、編制分類檢索工具、組織文獻(xiàn)分類排架使用,同時(shí)也可供其他不同規(guī)模和類型的圖書(shū)情報(bào)機(jī)構(gòu)根據(jù)需要調(diào)整使用。其中的每個(gè)類不僅有類名,還有中圖法設(shè)定的類號(hào),按照一定的規(guī)則,每個(gè)類目有其特定的中圖法分類號(hào)。由于《中圖法》的類號(hào)被廣泛應(yīng)用,通用性較強(qiáng),同時(shí)從其排版形式和類號(hào)的結(jié)構(gòu)都可以看出,類與類之間的父子關(guān)系,很好地揭示了類目之間的關(guān)系。其不足之處是只反映了類與類之間的父子關(guān)系,關(guān)系揭示深度不夠。由于是專業(yè)人員編制,不容易被大眾接受,需要專業(yè)人員的轉(zhuǎn)換,增加了利用難度?!吨袌D法》的修訂是一項(xiàng)浩大的工程,涉及的學(xué)科范圍廣泛,版本之間的修訂年度一般時(shí)間很長(zhǎng),不能及時(shí)反映學(xué)科的發(fā)展。

2 資源語(yǔ)義化的理論基礎(chǔ)

資源語(yǔ)義化是文獻(xiàn)服務(wù)的終極目標(biāo),但是以現(xiàn)有的技術(shù)水平還不能實(shí)現(xiàn)。劉耀等根據(jù)共軛控制原理(即如果對(duì)事物甲的控制不能實(shí)現(xiàn),則可以通過(guò)控制與其相似的事物乙,進(jìn)而控制事物甲),提出“內(nèi)容與形式交互的圖書(shū)館資源組織語(yǔ)義化”理論,即把資源語(yǔ)義化分為內(nèi)容語(yǔ)義化和組織語(yǔ)義化兩個(gè)層次。內(nèi)容語(yǔ)義化即我們的終極目標(biāo),是對(duì)文獻(xiàn)內(nèi)容的語(yǔ)義化理解;組織語(yǔ)義化是利用自然語(yǔ)言處理技術(shù)對(duì)資源進(jìn)行處理,從而實(shí)現(xiàn)形式上的語(yǔ)義化。形式上的語(yǔ)義化和內(nèi)容上的語(yǔ)義化交互促進(jìn),進(jìn)而最終實(shí)現(xiàn)內(nèi)容語(yǔ)義化[2]?;谶@種理論,以皮膚病為例展開(kāi)研究,在本體自動(dòng)構(gòu)建平臺(tái)和語(yǔ)料加工平臺(tái)下,嘗試進(jìn)行皮膚病學(xué)本體的自動(dòng)構(gòu)建,語(yǔ)料的處理及相關(guān)文獻(xiàn)的語(yǔ)義標(biāo)注。

3 《中圖法》在語(yǔ)義化中的應(yīng)用

語(yǔ)義化涉及的兩個(gè)關(guān)鍵問(wèn)題是語(yǔ)義元數(shù)據(jù)的生成和語(yǔ)義標(biāo)注。本文主要論述了《中圖法》在語(yǔ)義化的這兩個(gè)環(huán)節(jié)中的應(yīng)用。

語(yǔ)義元數(shù)據(jù)是依賴于本體知識(shí)創(chuàng)建的,是利用本體中的實(shí)體概念,對(duì)領(lǐng)域知識(shí)文檔進(jìn)行標(biāo)注后形成的標(biāo)注資源的集合,其本質(zhì)是對(duì)語(yǔ)料經(jīng)過(guò)語(yǔ)義標(biāo)注后形成的領(lǐng)域?qū)嶓w數(shù)據(jù)。當(dāng)前語(yǔ)義元數(shù)據(jù)的構(gòu)建和語(yǔ)義標(biāo)注技術(shù)發(fā)展迅速,涌現(xiàn)了很多工具和方法。語(yǔ)義元數(shù)據(jù)提供數(shù)據(jù)的語(yǔ)義信息,其生成技術(shù)與本體的構(gòu)建方法基本一致。本體是描述概念的模型,其描述的范圍主要集中在語(yǔ)義和知識(shí)表現(xiàn)層面,是領(lǐng)域知識(shí)的通用表述方式,能夠在不同系統(tǒng)、不同層面進(jìn)行共享并且可以進(jìn)行推理和復(fù)用。

3.1 《中圖法》在語(yǔ)義元數(shù)據(jù)構(gòu)建中的應(yīng)用

領(lǐng)域本體構(gòu)建的關(guān)鍵是概念的獲取及概念之間關(guān)系的獲取。如何將領(lǐng)域知識(shí)及其之間的關(guān)系轉(zhuǎn)變?yōu)楸倔w能描述的關(guān)系是關(guān)鍵技術(shù)。關(guān)于對(duì)領(lǐng)域知識(shí)及其之間關(guān)系的描述,我們選取了該領(lǐng)域的結(jié)構(gòu)化詞表。該領(lǐng)域的結(jié)構(gòu)化詞表是專業(yè)人士對(duì)該領(lǐng)域知識(shí)的提煉總結(jié),并將其關(guān)系用詞表的形式表現(xiàn)出來(lái),如中國(guó)圖書(shū)分類法和Mesh詞表都是結(jié)構(gòu)化詞表的代表。

目前,分類法的體系等級(jí)結(jié)構(gòu)可以看作邏輯結(jié)構(gòu),從而幫助計(jì)算機(jī)對(duì)概念的理解。本體概念自動(dòng)獲取的方法主要是將敘詞表和專業(yè)詞典中的概念直接轉(zhuǎn)換填充到本體中,其中基于詞表的轉(zhuǎn)換是本體概念獲取的研究重點(diǎn),詞表中又以敘詞表、主題詞表的研究為重點(diǎn)中的熱點(diǎn)。他們通常能夠揭示文章的顯性、重要信息,但無(wú)法揭示隱形信息。為了解決全面揭示蘊(yùn)含在文獻(xiàn)中的知識(shí)信息的問(wèn)題,在利用傳統(tǒng)資源組織方法構(gòu)建語(yǔ)義元數(shù)據(jù)的同時(shí),引入了標(biāo)簽本體。

本文所應(yīng)用的本體輔助構(gòu)建平臺(tái)就是基于結(jié)構(gòu)化的詞表,并且支持3種類型的結(jié)構(gòu)化詞表:按代碼分層、由Tab鍵分層、按上下位關(guān)系分層的詞表[3]。本文就是基于這3種類型的詞表(圖1),將其關(guān)系轉(zhuǎn)變?yōu)楸倔w里類間的關(guān)系,并獲取概念間的邏輯關(guān)系,即父類與子類之間的關(guān)系[4]。

實(shí)例討論如下。如圖2所示,根目錄下面是大類,大類下面是子類,構(gòu)成樹(shù)狀結(jié)構(gòu)圖,從而構(gòu)成了本體的類。該過(guò)程基本實(shí)現(xiàn)類的獲取,類間關(guān)系的獲取的自動(dòng)化。評(píng)價(jià)方式采用了常用的3個(gè)評(píng)測(cè)指標(biāo):準(zhǔn)確率(P)、召回率(R)、綜合指標(biāo)F值(F)。

其中,準(zhǔn)確率(P)的計(jì)算方式如下:

召回率(R)的計(jì)算方式如下:

F值的計(jì)算方式如下:

通過(guò)對(duì)該實(shí)驗(yàn)進(jìn)行統(tǒng)計(jì),其中T為導(dǎo)入結(jié)果中正確的個(gè)數(shù),N為導(dǎo)入后的數(shù)據(jù)總和,M為要導(dǎo)入的數(shù)據(jù)總和。

通過(guò)計(jì)算得出:P=1,R=0.998,F(xiàn)=0.999

通過(guò)結(jié)果可以看出,該導(dǎo)入方法表現(xiàn)出很高的準(zhǔn)確率、召回率,綜合指標(biāo)表現(xiàn)優(yōu)秀。運(yùn)用該方法導(dǎo)入詞表,實(shí)現(xiàn)語(yǔ)義概念的生成完全可行。

圖1 詞表的導(dǎo)入

圖2 導(dǎo)入后生成的樹(shù)狀結(jié)構(gòu)圖

3.2 《中圖法》在專業(yè)語(yǔ)義詞典建設(shè)中的應(yīng)用

領(lǐng)域?qū)I(yè)詞典是區(qū)別于一般的關(guān)于該學(xué)科領(lǐng)域的詞典,主要用于領(lǐng)域文獻(xiàn)的切分標(biāo)注。由于用通用詞典進(jìn)行領(lǐng)域文獻(xiàn)的切分標(biāo)注,其效果不如專業(yè)詞典。如通用詞典不能反映詞條間的關(guān)系,只是按照一定規(guī)則將詞條列舉出來(lái);專業(yè)的語(yǔ)義詞典不僅是專業(yè)術(shù)語(yǔ)的羅列,更能反應(yīng)詞條間的邏輯關(guān)系?;赪eb的多領(lǐng)域語(yǔ)料標(biāo)注加工系統(tǒng)(MDCA)的一個(gè)重要功能是專業(yè)語(yǔ)義詞典的生成、編輯[5]。本文的皮膚病學(xué)語(yǔ)料加工部分的實(shí)驗(yàn)就是在此基礎(chǔ)上進(jìn)行的。

(MDCA)系統(tǒng)支持的詞典生成工具是專業(yè)語(yǔ)義詞典生成工具flat2tree.jar,用戶只需按照系統(tǒng)要求上傳所需的文件格式,系統(tǒng)就可自動(dòng)生成專業(yè)語(yǔ)義詞典。本實(shí)驗(yàn)采用的是輸入系統(tǒng)要求的專業(yè)詞典格式,上傳格式要求為:每行一對(duì)術(shù)語(yǔ)的上下位詞語(yǔ),前面是子類,后面是其所屬的父類,兩個(gè)詞語(yǔ)中間以空格分開(kāi)如下所示:

皮膚病 疾病

皮炎 皮膚病

接觸性皮炎 皮炎

特應(yīng)性皮炎 皮炎

自身敏感性皮炎 皮炎

郁積性皮炎 皮炎

濕疹 皮膚病

嬰兒濕疹 皮膚病

汗皰疹 皮膚病

手癬和腳癬 皮膚病

將該格式保存為UTF-8格式,然后上傳至系統(tǒng)界面(圖3),點(diǎn)擊“開(kāi)始生成”,系統(tǒng)即自動(dòng)生成專業(yè)語(yǔ)義詞典。

圖3 詞典的生成

生成的專業(yè)語(yǔ)義詞典將顯示在系統(tǒng)界面上,輸出的詞典格式為以Tab鍵分割的語(yǔ)義詞典上下位關(guān)系,同時(shí)在每個(gè)條目后面以漢語(yǔ)拼音的首字母縮寫(xiě)作為標(biāo)注。生成的專業(yè)語(yǔ)義詞典格式如下:

疾病,jb

皮膚病,pfb

皮炎,py

接觸性皮炎,jcxpy

特應(yīng)性皮炎,tyxpy

自身敏感性皮炎,zsmgxpy

郁積性皮炎,yjxpy

濕疹,sz

嬰兒濕疹,yesz

汗皰疹,hpz

手癬和腳癬,sxhjx

詞典生成的同時(shí)系統(tǒng)將激活與專業(yè)語(yǔ)義詞典相關(guān)的功能,而詞典的生成功能將不能使用。此時(shí)與專業(yè)語(yǔ)義詞典相關(guān)的功能為:查看語(yǔ)義關(guān)系樹(shù)、保存到數(shù)據(jù)庫(kù)、導(dǎo)出專業(yè)語(yǔ)義詞典。

語(yǔ)義詞典生成后可用來(lái)對(duì)語(yǔ)料進(jìn)行標(biāo)注。生語(yǔ)料如下:

急性濕疹表現(xiàn)為原發(fā)性和多形性皮疹。常在紅斑基礎(chǔ)上有針頭到粟粒大小的丘疹、丘皰疹,嚴(yán)重時(shí)有小水皰,常融合成片,境界不清楚。在損害周邊,丘皰疹逐漸稀疏。皮疹分布對(duì)稱,多見(jiàn)于面、耳、手、足、前臂、小腿外露部位,嚴(yán)重者可彌漫全身,自覺(jué)瘙癢較重。常因瘙癢形成點(diǎn)狀糜爛面,有明顯漿性滲出。如繼發(fā)感染,則形成膿皰、膿液、膿痂、淋巴結(jié)腫大,甚至有發(fā)熱等全身癥狀,如合并單純皰疹病毒感染,則可形成嚴(yán)重的皰疹性濕疹[6]。

標(biāo)注后的語(yǔ)料如下:

急性/n 濕疹/n 表現(xiàn)/v 為/p 原發(fā)性/n 和/c 多形性/n 皮疹/n 。/x 常/d 在/p 紅斑[疾病C,/n_jbc.皮膚和結(jié)締組織疾病,/n_pfhjdzzjb.皮膚疾病,/n_pfjb.紅斑./n_hb3] 基礎(chǔ)/n 上有/v 針頭/n 到/v 粟粒/nr 大小/b 的/uj 丘疹/n 、/x 丘/nr 皰疹/n ,/x 嚴(yán)重/a 時(shí)/ng 有/v 小/a 水皰/n ,/x 常/d 融合/vn 成片/n ,/x 境界/n 不/d 清楚/a 。/x 在/p 損害/v 周邊/f ,/x 丘/nr 皰疹/n 逐漸/d 稀疏/a 。/x 皮疹/n 分布/v 對(duì)稱/v ,/x 多見(jiàn)于/d 面/n 、/x 耳[耳./n_e2] 、/x 手[解剖A,/n_jpa.身體部位,/n_stbw.四肢,/n_sz.臂,/n_b1.手./n_s] 、/x 足[解剖A,/n_jpa.身體部位,/n_stbw.四肢,/n_sz.腿,/n_t1.足./n_z2] 、/x 前臂[解剖A,/n_jpa.身體部位,/n_stbw.四肢,/n_sz.臂,/n_b1.前臂./n_qb] 、/x 小腿/n 外露/v 部位/n ,/x 嚴(yán)重者/nr 可/v 彌漫/v 全身/n ,/x 自覺(jué)/d 瘙癢/a 較重/a 。/x 常因/n 瘙癢/a 形成/v 點(diǎn)狀/n 糜爛面/nr ,/x 有/v 明顯/a 漿性/n 滲出/v 。/x 如/v 繼發(fā)/v 感染[疾病C,/n_jbc.細(xì)菌感染和真菌病,/n_xjgrhzjb.感染./n_gr] ,/x 則/d 形成/v 膿皰/n 、/x 膿液/n 、/x 膿/n 痂/n 、/x 淋巴結(jié)[淋巴組織,/n_lbzz.淋巴結(jié)./n_lbj] 腫大/v ,/x 甚至/d 有/v發(fā)熱[疾病C,/n_jbc.體征和癥狀病理狀態(tài),/n_tzhzzblzt.體征和癥狀,/n_tzhzz.體溫變化,/n_twbh.發(fā)熱./n_fr]等/u 全身/n 癥狀/n ,/x 如/v 合并/v 單純/a 皰疹病毒/n 感染[疾病C,/n_jbc.細(xì)菌感染和真菌病,/n_xjgrhzjb.感染./n_gr] ,/x 可/v 形成/v 嚴(yán)重/a 的/uj 皰疹/n 性[生物科學(xué),/n_swkx.生殖和泌尿生理學(xué),/n_szhmnslx.生殖,/n_sz11.性./n_x10] 濕疹/n。/x

通過(guò)對(duì)比可以發(fā)現(xiàn),標(biāo)注后的語(yǔ)料不僅包含專業(yè)詞組,還揭示了該專業(yè)詞典的上下位邏輯關(guān)系等,更有助于理解語(yǔ)義。

4 結(jié)論

本文參照《中圖法》和《MeSH》詞表,對(duì)傳統(tǒng)詞表進(jìn)行重構(gòu),在語(yǔ)義元數(shù)據(jù)輔助平臺(tái)下導(dǎo)入專業(yè)語(yǔ)義詞典,設(shè)置本體類的屬性,成功構(gòu)建了皮膚病學(xué)領(lǐng)域本體并生成樹(shù)狀語(yǔ)義結(jié)構(gòu),并且構(gòu)建了專業(yè)的語(yǔ)義詞典用以對(duì)文獻(xiàn)進(jìn)行語(yǔ)義標(biāo)注。但是構(gòu)建過(guò)程中發(fā)現(xiàn),《中圖法》電子化、網(wǎng)絡(luò)化的程度不夠,在使用過(guò)程中存在困難。

隨著自動(dòng)分類標(biāo)引以及自動(dòng)主題標(biāo)引的研究與發(fā)展,分類主題一體化越發(fā)顯得重要,情報(bào)檢索語(yǔ)言將由單一的檢索語(yǔ)言轉(zhuǎn)變?yōu)榉诸?主題-自然語(yǔ)言一體化以及國(guó)內(nèi)外分類法兼容化[7]。

猜你喜歡
中圖法詞表皰疹
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
皰疹性咽峽炎來(lái)襲,幫寶寶渡過(guò)難關(guān)
啟蒙(3-7歲)(2019年5期)2019-06-27 07:25:04
汗皰疹的中醫(yī)治療
中醫(yī)治皰疹性咽峽炎
敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
改良Trizol-SiO2法在咽拭子及皰疹液EV71-RNA提取中的應(yīng)用
知識(shí)圖譜視角下《中國(guó)圖書(shū)館分類法》研究演進(jìn)與思考
國(guó)外敘詞表的應(yīng)用與發(fā)展趨勢(shì)探討*
《中圖法》與《中分表》修訂信息(連載3)
常用聯(lián)綿詞表
郯城县| 诏安县| 灵台县| 三江| 临沧市| 东兰县| 泰和县| 宜君县| 黑山县| 宜春市| 辉县市| 和平区| 星子县| 昌乐县| 射阳县| 大洼县| 芮城县| 乐平市| 定陶县| 黑河市| 望都县| 石泉县| 宝兴县| 卫辉市| 夏河县| 资阳市| 大石桥市| 沙田区| 共和县| 永吉县| 荆州市| 手机| 望江县| 达尔| 通榆县| 孝感市| 琼结县| 青铜峡市| 睢宁县| 岳西县| 上虞市|