中國中醫(yī)科學院中國醫(yī)史文獻研究所(北京,00700) 丁 侃 張麗君 胡曉峰
·學術探討·
中醫(yī)古籍圖像標引方案設計*
中國中醫(yī)科學院中國醫(yī)史文獻研究所(北京,100700) 丁 侃 張麗君 胡曉峰1
本文介紹了中醫(yī)古籍圖像標引的基本方案,通過定義、說明和示例的形式對古籍信息、版本信息、圖像本體三類元數(shù)據(jù)進行了逐條的解析;并對標引工作中的出處標引、規(guī)范制定、提高識圖能力、細化釋圖文字標引等重點、難點問題進行了討論。
中醫(yī) 古籍 插圖 標引 元數(shù)據(jù)
本研究中的“中醫(yī)古籍圖像”,主要是指各類中醫(yī)古籍中所刊載的承載中醫(yī)知識的各類插圖而言。2009年、2013年、2014年,中國中醫(yī)科學院持續(xù)立項資助了中醫(yī)古籍圖像相關研究工作,共查閱12類中醫(yī)古籍計2773種,登記圖像41,831幅,收集整理編輯圖像29,428幅[1]。
為了管理好這些資源,方便用戶查找,更為后續(xù)研究工作的深入開展奠定基礎,我們擬采用標引的手段達到上述目的。標是標記,引是指引。標引就是通過標記指引人們方便、快捷地找到所需要的信息。
在前期古籍圖像資源搜集工作基本完成的基礎上,隨著“中醫(yī)古籍圖像標引系統(tǒng)”開發(fā)完成,按照《中醫(yī)古籍圖像數(shù)據(jù)平臺構建方案》的具體要求[2],我們擬定了如下標引方案。
書目信息用以揭示圖像源自何種古籍,分“古籍信息”和“作者信息”兩組進行標引。
1.古籍信息
總目序號 古籍在《中國中醫(yī)古籍總目》[3](以下簡稱《總目》)中的順序號,為古籍在此系統(tǒng)中的唯一標識。如《外科心法要訣》一書,總目序號標引為“9387”。
書名 此項標引一般參照《總目》上所著錄的書名。①書名無需加書名號,如“外科心法要訣”;②書名中有卷數(shù)的,卷數(shù)與書名之間需要空一格,如“黃帝內(nèi)經(jīng)素問十二卷”。
又名 古籍的其他名稱。此項可重復標引。
成書年代 此項標引一般參照《總目》及《宋元明清醫(yī)籍年表》[4]。①年代可考者,一般標引為公元紀年;②具體年代不可考者,只能斷定朝代,按照方括號中加該朝代滅亡年代的格式標引,如明朝成書的古籍,標引為“[1644]”。
2.作者信息
一種古籍的作者及注釋整理者等可以有多位,此組可重復標引。
作者 作者的姓名。
別稱 作者的別稱,包括字、號、尊稱、謚號、官職等。此項可重復標引。如朱丹溪的別稱有“彥修”、“震亨”等。
朝代 作者生活的朝代。①此項標引參照《中國醫(yī)學史》[5]中附錄的“中國歷史年代簡表”;②若作者為外國人,則此項視為“國別”,如《瘍科秘錄》作者日人本間救,此項標引為“日”。
責任方式 作者對該書的責任方式。
版本信息用以揭示圖像所出之具體版本。分“版本信息”、“館藏信息”、“調(diào)研信息”、“備注信息”四組進行標引。
1.版本信息
版本 此項標引一般參照《總目》中著錄的版本名稱。格式一般為∶朝代+年號紀年+干支紀年(公元紀年)+刊刻地點+刊刻者+版本類別。如《(徐評)外科正宗》選用的版本為“清咸豐十年庚申(1860年)海寧許氏刻本”。
題名 收集古籍在牌記、卷首、卷末等處的不同題名。此項可重復標引。如《外科心法要訣》在卷首的題名為“編輯外科心法要訣”。
刊刻年代 此項標引與“成書年代”的格式要求基本相同。
所屬叢書 該版本所屬的叢書。
2.館藏信息
收藏館 此項標引參照《總目》中的“收藏館代號表”。如中國中醫(yī)科學院圖書館所藏,則標引為“139”。
索書號 該古籍在其所在圖書館的索書號。
3.調(diào)研信息
此組標引在圖書館實地查閱過程中,《中醫(yī)古籍圖像調(diào)查表》上所填寫的原始調(diào)研記錄。
4.備注信息
版本形態(tài) 版本形態(tài),或稱之為版本制度,包括行款、裝訂方式和板框形制等。
任務備注 關于此標引任務的備注說明。包括任務中,關于圖像種類、數(shù)據(jù)完整性、擬分配標引人員等備注信息。
此為圖像標引的重點。將圖像本體所蘊涵的信息,即其所承載的中醫(yī)藥知識,分如下9項逐條標引析出。
資源標識符 圖像在系統(tǒng)中的唯一編碼。由系統(tǒng)根據(jù)總目序號、版本以及圖像流水號等要素自動生成。
正名 此項標引是對無名圖進行命名,有名圖進行規(guī)范的過程。
圖名 ①此項客觀標引圖像原有的名稱,原則上對原圖名不作改動;②本無圖名的圖,此項不必標引;③對于本無圖名,但相關的篇名等顯然適合作為圖名的情況,可對篇名適當取舍,作為圖名標引。
分類 此項可重復標引。
主題 此項可重復標引。
圖中文字 圖像中起到標記、指示等作用的文字。圖中文字重復的(如圖中對稱的穴位名稱),只需標引一次即可。
釋圖文字 圖像外對其本體起到解釋、闡釋等作用的文字。允許參考其他相關資料標引本頁中沒有的釋圖文字。
相關圖像 與標引對象有關聯(lián)的其他圖像。如不同版本刊載的同一圖像、同名圖像、過程圖、組圖等,彼此之間建立關聯(lián)及順序。
備注 關于圖像本體需要備注說明的內(nèi)容。
由于目前對于古籍圖像的標引尚無成熟的方案可供借鑒,故本研究主要基于前期對“中醫(yī)古籍圖像數(shù)據(jù)平臺”所作的需求分析,方案設計參考了以都柏林核心(Dublin Core,DC)元數(shù)據(jù)為代表的國際上通用的元數(shù)據(jù)方案∶書目和版本信息的標引主要參考了DC元數(shù)據(jù)[6]、《國家圖書館古籍元數(shù)據(jù)規(guī)范及著錄規(guī)則》[7];圖像本體的標引主要參考了《基于知識元信息技術的中醫(yī)古籍元數(shù)據(jù)研究》[8]所提供的方案。
盡管目前關于圖像自動標引的研究方興未艾,并取得了一定的進展[9],但由于圖像低層特征和高層語義之間存在著難以逾越的鴻溝[10],中醫(yī)古籍圖像語義的特殊復雜性,以及圖像的數(shù)量相對有限,不具有“快速增長”的特性,因此我們選擇了更為穩(wěn)妥、可行的人工分布式標引方案,將標引與圖像研究過程融為一體。
1.對于圖像出處的標引十分必要
通過對書目信息的標引,可以將單幅的圖像定位于中醫(yī)學術傳承發(fā)展的大背景中進行考量;通過對版本信息的標引,可以藉此探究版本之間的差異以及圖像在刊刻過程中的衍化傳承關系。
2.正名、分類、主題是揭示圖像本體的核心元素
所謂“物之具名,本自有義,循名責實,義自明矣”[11]。然而古人對于圖像的命名并不統(tǒng)一,若要達到通過名稱以區(qū)分不同事物(圖像)的目的,就必須對每一幅圖像給予一個規(guī)范化的正名。為此,課題組擬定了《中醫(yī)古籍圖像命名規(guī)范》,其中對正名所含的各種要素分別進行了規(guī)范。
分類是對知識體系的次序化,為此課題組擬定了《中醫(yī)古籍圖像分類標準》,該標準設定了疾病圖、診斷圖、醫(yī)療圖、藥物圖、器具圖、養(yǎng)生圖、臟腑圖、經(jīng)穴圖、部位圖、理論圖、符咒圖、人物圖12個一級類目,其下設有相應的二級、三級類目。
主題標引是揭示圖像所承載知識點的有效方法。我們擬參考《中國中醫(yī)藥主題詞表》[12]對圖像主題進行標引,以此更規(guī)范地抽取圖像所承載的中醫(yī)知識,同時起到優(yōu)化檢索的目的。
3.圖中文字、釋圖文字、相關圖像標引是深入研究的基礎
圖中文字指圖像中起到標記、指示等作用的文字。標引過程中我們發(fā)現(xiàn),即使具有現(xiàn)代中醫(yī)學高等教育背景的一般標引人員,對于運氣、卦象、符咒等圖像的識讀,仍然相對困難。
釋圖文字指圖像外對其本體起到解釋、闡釋等作用的文字。釋圖文字往往不僅出現(xiàn)在圖像當前頁,前后頁中也常有大段的釋圖文字,將古籍圖像從整部書中割裂出來,可能造成圖像相關信息的缺失,為此特設此項加以彌補。此外,根據(jù)特定研究工作的需要,我們還可以針對不同類型圖像的釋圖文字,制定相應的擴展元數(shù)據(jù)。如針對疾病圖,我們設置了證候表現(xiàn)、辨證分析、治則治法、處方用藥等擴展元數(shù)據(jù)。
相關圖像指與標引對象有關聯(lián)的其他圖像。通過相關圖像的標引,在現(xiàn)有縱向分類基礎上,可以進一步建立橫向的關聯(lián),形成關系網(wǎng)絡。
4.中醫(yī)古籍圖像標引將是一項持續(xù)性的工作
標引不是最終目的,我們將其作為圖像研究的一種手段來看待,標引什么、如何標引要服務于圖像研究的最終目標或特定目標。隨著圖像研究的不斷深入,針對某些專題化、定制化的需求,我們將陸續(xù)制定并實施一系列標引方案。
依托現(xiàn)有工作基礎,我們希望探索一種數(shù)據(jù)共享、平臺開放、專題定制的研究機制,讓更多的有志同道參與到研究工作中來,共同開拓中醫(yī)古籍圖像更廣闊的研究領域。
[1]秦秋.我國首次開展中醫(yī)古籍圖像研究[N].中國中醫(yī)藥報,2011-12-16(001).
[2]丁侃,胡曉峰,張麗君.中醫(yī)古籍圖像數(shù)據(jù)平臺構建方案探討[J].中國醫(yī)藥導報,2012,9(14):123-124.
[3]薛清錄.中國中醫(yī)古籍總目[M].上海:上海辭書出版社,2007.
[4]劉時覺.宋元明清醫(yī)籍年表[M].北京:人民衛(wèi)生出版社,2005.
[5]甄志亞.中國醫(yī)學史[M].第2版.上海:上海科學技術出版社,1997:187.
[6]吳建中.DC元數(shù)據(jù)[M].上海:上??茖W技術文獻出版社,2001.
[7]肖瓏,蘇品紅,劉大軍.國家圖書館古籍元數(shù)據(jù)規(guī)范與著錄規(guī)則[M].北京:國家圖書館出版社,2014.
[8]丁侃.基于知識元信息技術的中醫(yī)古籍元數(shù)據(jù)研究[D].北京:中國中醫(yī)科學院,2009.
[9]汪丹.基于內(nèi)容的圖像標引與檢索創(chuàng)新[J].現(xiàn)代情報,2005,(4):59-62.
[10]謝書娟.SVM理論在圖書館館藏圖像標引方面的應用[J].甘肅科技,2010,26(1):118,119,128.
[11]金麗.考證名物與中醫(yī)古籍閱讀[J].江西中醫(yī)學院學報,2008,20(6):25-27.
[12]吳蘭成.中國中醫(yī)藥主題詞表[M].北京:中醫(yī)古籍出版社,1996.
Design on Image Index Project of Ancient Chinese Books
DING Kan,ZHANG Li-jun,HU Xiao-feng
(Chinese Medical History and Literature Research Institute,China Academy of Chinese Medical Sciences,Beijing 100700,China)
Traditional Chinese Medicine;ancient books;illustration;index;metadata
G254;R2
:A
:1006-4737(2015)03-0026-03
2015-04-01)
中央級公益性科研院所基本科研業(yè)務費專項資金資助項目“中醫(yī)古籍圖像數(shù)據(jù)庫示范性研究”(編號:ZZ030706);“中醫(yī)古籍圖像分類整理研究(第二期)”(編號:ZZ090503)
1通訊作者
Abstrac:This article is to introduce a basic indexing project of images in ancient Chinese books.Metadata is analyzed item by item on ancient books,visions,objects of pictures through definition,illustration and demonstration.Also,key notes and difficult points are discussed on index citation,indexing standards,capability of recognizing images,refinement of captions.