保麗娟,劉虹
云南中醫(yī)學院,云南 昆明 650500
云南民族醫(yī)藥文獻元數(shù)據(jù)方案設計探討
保麗娟,劉虹*
云南中醫(yī)學院,云南 昆明 650500
概述云南民族醫(yī)藥文獻數(shù)字化建設的現(xiàn)狀,根據(jù)云南少數(shù)民族醫(yī)藥文獻的特點,提出云南民族醫(yī)藥文獻數(shù)字化元數(shù)據(jù)方案應遵循簡潔準確性原則、通用性及針對性原則、共享性與互操作性原則、可擴展性原則、用戶需求原則等設計原則。同時,結(jié)合調(diào)查研究,描述了云南民族醫(yī)藥文獻數(shù)字化元數(shù)據(jù)方案的設計思路。
云南??;民族醫(yī)藥文獻;元數(shù)據(jù)
云南民族醫(yī)藥文獻資源是云南各少數(shù)民族在漫長的歷史繁衍中總結(jié)并流傳下來的寶貴醫(yī)藥文化遺產(chǎn),具有珍貴的史料和實用價值。數(shù)字化建設是長期保存和有效利用這些資料的最佳手段。
近幾年來,通過政府資助、基金資助、聯(lián)盟資助、中央財政支持地方高校等項目,我省民族醫(yī)藥文獻數(shù)字化工作已經(jīng)起步,并取得了初步的成果,省內(nèi)多個民族醫(yī)藥科研單位先后開展了云南少數(shù)民族醫(yī)藥文獻目錄的研究整理、少數(shù)民族單驗方的研究整理,少數(shù)民族天然藥物的調(diào)查研究以及少數(shù)民族醫(yī)藥文化等多方位的少數(shù)民族醫(yī)藥文獻研究課題,如云南省藥物研究所主持開發(fā)了“云南特色天然藥物共享信息系統(tǒng)”,云南中醫(yī)學院主持開發(fā)了“云南民族藥物信息系統(tǒng)”、“云南少數(shù)民族醫(yī)藥單驗方數(shù)據(jù)庫”、“云南民族醫(yī)藥肝病單驗方數(shù)據(jù)庫”、“云南地產(chǎn)中草藥(民族藥)數(shù)據(jù)庫”,云南民族大學主持開發(fā)了“民族藥(傣藥)數(shù)據(jù)庫”等信息系統(tǒng)。這些數(shù)據(jù)庫都是在云南省各少數(shù)民族民間常用的民族藥、單方、驗方等民族醫(yī)藥信息資源進行收集整理的基礎上,利用現(xiàn)代信息技術(shù)進行數(shù)字化加工存儲。這些數(shù)據(jù)庫提供了方便快捷的檢索查詢功能,生動直觀地反映了云南各少數(shù)民族的醫(yī)藥資源狀況,為政府、企業(yè)、科研單位和醫(yī)藥工作者研究、開發(fā)、保護和利用云南省的民族醫(yī)藥提供比較全面、完整的信息資料。同時也為珍貴的民族醫(yī)藥資料提供了存儲平臺,對于深入研究少數(shù)民族醫(yī)藥理論和開發(fā)云南特色民族藥物都具有重要的意義。
盡管如此,云南民族醫(yī)藥文獻數(shù)字化工程還處于初期階段,有不少問題需要解決,例如數(shù)據(jù)庫功能結(jié)構(gòu)單一,各數(shù)據(jù)庫相互獨立,有的數(shù)據(jù)庫是基于C/S結(jié)構(gòu)模式開發(fā)的,嚴重限制了民族醫(yī)藥文獻資源的傳播和共享[1];有些數(shù)據(jù)庫如“云南地產(chǎn)中草藥(民族藥)數(shù)據(jù)庫”和“云南少數(shù)民族醫(yī)藥單驗方數(shù)據(jù)庫”,雖然使用的是同一數(shù)字化平臺,但由于缺乏統(tǒng)一規(guī)范的元數(shù)據(jù)方案指導,導致數(shù)據(jù)庫處于各自獨立的狀態(tài),數(shù)據(jù)庫結(jié)構(gòu)和元數(shù)據(jù)元素不盡相同,不能實現(xiàn)資源的整合挖掘,無法發(fā)揮數(shù)據(jù)庫的最大效用。如此參差不齊的元數(shù)據(jù)規(guī)范嚴重限制了民族醫(yī)藥文獻資源的傳播和共享利用,不利于知識發(fā)現(xiàn)和創(chuàng)新。因而制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻數(shù)字化元數(shù)據(jù)方案是云南民族醫(yī)藥文獻數(shù)字化建設的首要問題。
元數(shù)據(jù)(Metadata)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”[2],元數(shù)據(jù)為多種不同形態(tài)的信息資源提供了統(tǒng)一規(guī)范的描述方法,是文獻數(shù)字化建設中的重要組成部分,民族醫(yī)藥文獻元數(shù)據(jù)就是對民族醫(yī)藥文獻資源的內(nèi)容、屬性及特征進行描述,并對民族醫(yī)藥信息資源進行組織、定位和數(shù)據(jù)管理,以便于信息需求者進行檢索和利用的一種結(jié)構(gòu)化的數(shù)據(jù)。制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻數(shù)字化元數(shù)據(jù)方案,有助于實現(xiàn)云南各民族醫(yī)藥數(shù)據(jù)庫系統(tǒng)的互操作和民族醫(yī)藥信息資源的共享,達到民族醫(yī)藥知識發(fā)現(xiàn)和創(chuàng)新以及對民族醫(yī)藥信息資源整合的目的。
目前國內(nèi)還沒有相關(guān)的民族醫(yī)藥文獻元數(shù)據(jù)標準,但是關(guān)于中醫(yī)藥文獻的元數(shù)據(jù)標準建設已經(jīng)取得了很大的突破。由中國中醫(yī)科學院中醫(yī)藥信息研究所于2012年提出的“Traditional Chinese Medicine Literature Metadata(中醫(yī)文獻元數(shù)據(jù))”作為一項ISO技術(shù)規(guī)范(Technical Specification)得到成功立項,編號為 ISO/DTS 17948,經(jīng)過中國、韓國、英國、美國等多國專家的多次會議討論和反復修改,該標準的草案已于 2013年完成[3],目前該標準已進入編輯出版階段。該標準的頒布,將會對中醫(yī)藥及民族醫(yī)藥文獻資源數(shù)字化規(guī)范建設的發(fā)展起到極大的推動作用。
民族醫(yī)藥文獻資源不同于一般的中醫(yī)藥文獻資源,有大量不同類型的民族醫(yī)藥文獻素材,如古籍文獻、論著、民族天然藥物圖譜等傳統(tǒng)文字載體文獻以及各民族在從事醫(yī)療活動中的口碑經(jīng)驗、民間流傳的歌謠和視頻、錄音等非文字載體文獻,并且同時存在民族文字文獻和漢字文獻等情況[4],因此,民族醫(yī)藥文獻元數(shù)據(jù)方案應該在中醫(yī)藥文獻元數(shù)據(jù)標準的基礎上體現(xiàn)出民族醫(yī)藥文獻的特征,在設計中應遵循以下原則。
在元數(shù)據(jù)設計時應考慮各種層次的使用人員,設計的元數(shù)據(jù)方案應簡潔,易于理解和掌握,但要保證描述元數(shù)據(jù)的準確性,能清楚明了的解釋元數(shù)據(jù)所表示的含義,便于編目人員著錄實踐。例如Dublin Core(都柏林核心元數(shù)據(jù))是國際通用的主要應用于網(wǎng)絡信息資源組織的元數(shù)據(jù)標準,DC結(jié)構(gòu)簡單且易于掌握,許多專業(yè)領(lǐng)域的元數(shù)據(jù)框架都是基于DC建立的,但是民族醫(yī)藥文獻有其特殊性,這就需要元數(shù)據(jù)設計的時候綜合考量各種因素,參考DC元數(shù)據(jù)標準模式,在保證元數(shù)據(jù)簡潔易用的基礎上進行準確性的描述。
由于云南民族醫(yī)藥文獻資源類型多樣,載體形式不盡相同,所以在設計元數(shù)據(jù)時應保證元數(shù)據(jù)方案的整體通用性,同時也要對不同類型不同載體的文獻元數(shù)據(jù)有針對性的設計,滿足特殊性資源的特征描述要求。例如DC元數(shù)據(jù)標準是國際通用的元數(shù)據(jù)標準,但是它所規(guī)定的15個元素不能完全包含民族醫(yī)藥文獻的一些類型特征,因此有必要借鑒或復用其他類型的元數(shù)據(jù)標準,對某些元數(shù)據(jù)做針對性的設計,例如多媒體類的文獻資源可以參考多媒體資源描述元數(shù)據(jù)標準MPEG-7等。
元數(shù)據(jù)的共享性和互操作性主要體現(xiàn)在對異構(gòu)系統(tǒng)間互操作能力的支持[5],即不僅能支持本元數(shù)據(jù)標準上建立的各相關(guān)應用系統(tǒng)所操作,還應為其他民族醫(yī)藥資源應用系統(tǒng)所操作,便于實現(xiàn)民族醫(yī)藥資源的整合共享。因此,在設計云南民族醫(yī)藥文獻元數(shù)據(jù)方案的時候應保證該元數(shù)據(jù)能準確表示元素數(shù)據(jù)的前提下,對其進行其他系統(tǒng)常用元數(shù)據(jù)的共享和轉(zhuǎn)換,設計時要充分考慮元數(shù)據(jù)元素的語義定義及元數(shù)據(jù)結(jié)構(gòu)等方面的內(nèi)容。目前,基于語義網(wǎng)格技術(shù)的元數(shù)據(jù)本體模型可以很好的解決不同本體之間的互操作,跨語言、跨文化的互操作,實現(xiàn)數(shù)字資源的共享及知識發(fā)現(xiàn)等[6]。
云南民族醫(yī)藥文獻資源非常豐富,并且出版物類型和載體類型多樣,整體的元數(shù)據(jù)方案只能提供比較廣泛意義上的描述,對于一些具有民族特色的內(nèi)容不能做到全部描述,但是云南民族醫(yī)藥文獻元數(shù)據(jù)方案要體現(xiàn)出民族醫(yī)藥文獻資源的特征,所以需要在標準元數(shù)據(jù)框架的前提下,根據(jù)不同民族醫(yī)藥文獻資源的特點,擴展一些必備的元素或元素值,這就要求所設計的元數(shù)據(jù)方案具有較好的可擴展性。
民族醫(yī)藥文獻元數(shù)據(jù)方案設計的最終目的是能夠最大程度地滿足用戶對民族醫(yī)藥文獻資源的信息需求,因此在制定元數(shù)據(jù)時還需要重點考慮各種不同層次、不同類型的用戶需求。設計時應該從用戶的信息需求和應用角度出發(fā),對元數(shù)據(jù)的結(jié)構(gòu)設計、各字段的設計及元數(shù)據(jù)語義結(jié)構(gòu)等方面綜合考量制訂,以保證系統(tǒng)對用戶的友好性,提供用戶多層次、多途徑的信息檢索。
在設計元數(shù)據(jù)方案之前,需要對云南民族醫(yī)藥文獻資源以及與資源有關(guān)的對象進行詳細的調(diào)查分析,界定云南民族醫(yī)藥文獻資源的范圍,分析各類型文獻資源對象的特點,并調(diào)查各層次各類型使用者的需求。
調(diào)查國內(nèi)外相關(guān)領(lǐng)域已經(jīng)完成的元數(shù)據(jù)標準,分析元數(shù)據(jù)內(nèi)容,考慮可以參考借鑒或者復用的相關(guān)標準,避免資源浪費。
建立云南民族醫(yī)藥文獻元數(shù)據(jù)的整體框架,確定不同類型元數(shù)據(jù)方案各部分之間的相互關(guān)系和規(guī)則。
集合民族醫(yī)學、情報學、文獻學、計算機信息管理等方面的專家一起討論,結(jié)合調(diào)研實際和實證研究,從資源利用的角度提出屬性需求以及云南民族醫(yī)藥文獻資源的特征需求,明確核心元素,以及需要復用、借鑒、擴展的元素。
對不同的文獻資源類型制定相對應的著錄規(guī)則以及對元數(shù)據(jù)元素詳細的描述性著錄細則,充分體現(xiàn)民族醫(yī)藥文獻的特征,指導民族醫(yī)藥文獻數(shù)字化建設。
確定云南民族醫(yī)藥文獻元數(shù)據(jù)方案的置標方案。目前比較主流的置標方案是基于XML/RDF形式的,這種形式的置標方案有利于數(shù)據(jù)的長期保存,并且可以實現(xiàn)系統(tǒng)的語義互操作,有利于資源的整合和共享。
制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻數(shù)字化元數(shù)據(jù)方案是云南民族醫(yī)藥數(shù)字化信息資源的整合、共享的基礎性工作,為實現(xiàn)民族醫(yī)藥信息資源的深度挖掘、民族醫(yī)藥知識發(fā)現(xiàn)和知識創(chuàng)新提供技術(shù)支持,同時也為其他區(qū)域民族醫(yī)藥資源的數(shù)字化建設和信息資源整合提供參考和交流。
[1]保麗娟,李永強,劉虹.云南少數(shù)民族醫(yī)藥文獻數(shù)字化現(xiàn)狀及思考[J].云南中醫(yī)學院學報,2013,36(5):62-64.
[2]Weibel S. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bulletin of the American Society for Information Science and Technology,1997,24(1):9-11.
[3]于彤,崔蒙,李海燕,等.中醫(yī)藥文獻元數(shù)據(jù)標準化研究進展[J].中國數(shù)字醫(yī)學,2013,8(7):66-69.
[4]劉虹,陳柏君,羅艷秋.云南少數(shù)民族醫(yī)藥文字文獻述略[J].云南中醫(yī)學院學報,2013,36(3):43-46,48.
[5]陳海燕.CALIS特色數(shù)據(jù)庫信息資源描述與實踐[J].圖書情報論壇,2008(3):48-50.
[6]畢強,韓毅.語義網(wǎng)格環(huán)境下基于元數(shù)據(jù)本體的數(shù)字圖書館互操作研究[J].圖書情報工作,2009,53(15):17-20, 82.
Discussion on Metadata Schemes for Yunnan Minority Medical Literature
Bao Lijuan, Liu Hong*
(Yunnan University of Traditional Chinese Medicine, Kunming Yunnan 650500, China)
The article overviewed the current situation of digitization of minority medical literature in Yunnan, and proposed that the metadata schemes for Yunnan Minority medical literature should follow the principles of simplicity and accuracy, versatility and pertinence, sharing and interoperability, scalability and user needs according to the characteristics of Yunnan Minority medical literature. At the same time, it also described the design ideas of Yunnan Minority medical literature metadata schemes combining investigation and research.
Yunnan Province; minority medical literature; metadata
10.3969/j.issn.2095-5707.2014.03.008
云南省哲學社會科學規(guī)劃項目(QN2013057)
保麗娟,館員,研究方向:中醫(yī)藥信息管理。E-mail: daibaoauto@163.com
*通訊作者:劉虹,教授,研究方向:中醫(yī)藥文獻信息。E-mail: 13700694229@163.com.
2014-03-20,編輯:魏民)