国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于引文分析的古籍文獻(xiàn)影響力評(píng)估

2016-04-11 07:53馬創(chuàng)新陳小荷
關(guān)鍵詞:本體評(píng)估

馬創(chuàng)新 陳小荷

摘要 介紹注疏文獻(xiàn)的引用特點(diǎn),并對(duì)注疏文獻(xiàn)的引用情況進(jìn)行分類。分析注疏文獻(xiàn)引文分析的流程,提出利用學(xué)科本體和XML表示的注疏文獻(xiàn),解決引文分析中的難點(diǎn)。通過(guò)對(duì)《十三經(jīng)注疏》中各部注疏文獻(xiàn)之間的耦合分析,以及被引文獻(xiàn)的同被引分析,嘗試對(duì)古籍文獻(xiàn)的影響力進(jìn)行評(píng)估。

關(guān)鍵詞 古籍文獻(xiàn) XML 本體 引文分析 評(píng)估

分類號(hào) G255.1

DOI 10.16603/j.issn1002—1027.2016.01.002

1引言

中華文化源遠(yuǎn)流長(zhǎng),在這漫長(zhǎng)的歷史時(shí)期,產(chǎn)生了大量古籍文獻(xiàn)。這些著作是中華民族精神文明的結(jié)晶,具有重要的文學(xué)價(jià)值、科學(xué)價(jià)值和歷史價(jià)值。在當(dāng)今時(shí)代,如何科學(xué)地評(píng)估古籍文獻(xiàn)在中華文化中所處的地位和影響力,成為亟需解決的重大問(wèn)題。

知識(shí)具有傳承性、累積性、擴(kuò)散性和創(chuàng)新性,任何新知識(shí)都不是憑空產(chǎn)生的,都是在前人研究的基礎(chǔ)上創(chuàng)造出來(lái)的。文獻(xiàn)作為知識(shí)的主要物質(zhì)載體,它們顯然都不是孤立存在的,而是具有密切聯(lián)系的,它們之間的聯(lián)系就表現(xiàn)在文獻(xiàn)的相互引用上。因此,文獻(xiàn)的相互引用是知識(shí)傳承規(guī)律的表現(xiàn),也是科學(xué)活動(dòng)中普遍存在的一種必然現(xiàn)象。

引文分析就是建立在文獻(xiàn)的引用與被引用關(guān)系基礎(chǔ)上,運(yùn)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和邏輯學(xué)等方法,對(duì)期刊、論文、專著等研究對(duì)象的引用和被引用現(xiàn)象進(jìn)行計(jì)量分析,揭示出研究對(duì)象所具有的規(guī)律和特征,以及對(duì)象之間的關(guān)系,從而探尋科學(xué)發(fā)展的動(dòng)態(tài)規(guī)律、評(píng)價(jià)科學(xué)現(xiàn)象和預(yù)測(cè)領(lǐng)域熱點(diǎn)。

國(guó)外很早就在科學(xué)史、科學(xué)結(jié)構(gòu)和科技管理等研究領(lǐng)域應(yīng)用引文分析的方法。從二十世紀(jì)八十年代起,國(guó)內(nèi)逐漸重視引文分析的研究,并且研制了多個(gè)用于科學(xué)管理的期刊引文索引數(shù)據(jù)庫(kù)。當(dāng)前國(guó)內(nèi)外的引文分析在研究范圍方面更加寬廣,并且逐步增加研究深度,探索出了一些新的引文分析方法。

2古籍文獻(xiàn)引文分析的相關(guān)研究

對(duì)于一般研究者來(lái)說(shuō),在閱讀和理解古籍文獻(xiàn)時(shí)會(huì)比較困難,所以對(duì)古籍文獻(xiàn)做引文分析的多是文獻(xiàn)學(xué)或者語(yǔ)言學(xué)的專家,他們的研究目的、關(guān)注的重點(diǎn)以及所采用的方法與當(dāng)代圖書情報(bào)學(xué)界的引文分析研究有較大區(qū)別。

1930年,洪業(yè)主持創(chuàng)辦了我國(guó)第一個(gè)大型索引編纂機(jī)構(gòu)——哈佛燕京學(xué)社引得編纂處,致力于編纂古籍索引,出版了《漢學(xué)引得叢刊》,共計(jì)64種81冊(cè)。洪業(yè)等人的引得編制因書而異,對(duì)于先秦諸子和儒家重要經(jīng)典,就編為逐字引得;對(duì)于考證名物的古籍,編作綜合引得;對(duì)于注疏類文獻(xiàn),則編為引書引得。洪業(yè)等人編制的“注疏引書引得”有《春秋經(jīng)傳注疏引得》、《禮記注疏引書引得》、《周禮引得附注疏引書引得》、《爾雅注疏引書引得》等共計(jì)14種。他們編制這些引得的主要目的在于為研究者提供檢索工具和輯佚線索。

何希淳在其1966年的碩士論文《禮記正義引佚書考》中,考證《禮記正義》引書中已經(jīng)亡佚文獻(xiàn)的作者生平、各書內(nèi)容和前人輯存情況。葉程義在其1969年的碩士論文《<禮記正義>引書考》中,列舉了《禮記正義》的引書種類,并且按照禮類、書類、易類、詩(shī)類等進(jìn)行歸類,把《禮記正義》引書的方式歸納為工5種,引書作用歸納為“申鄭注”、“申經(jīng)義”、“證鄭注”、“證經(jīng)義”、“存異說(shuō)”等5種。王忠林的碩士論文《周易正義引書考》介紹了《周易正義》引書的種類、作用和方式,考證每種書的作者和流傳情況,并且列出具體引書加以疏證。

班吉慶對(duì)劉寶楠的《論語(yǔ)正義》中引用《說(shuō)文解字》闡述經(jīng)義時(shí)的訓(xùn)詁特點(diǎn)進(jìn)行了歸納和總結(jié)。馬萃澤輯錄了《五經(jīng)正義》孔穎達(dá)疏中引用《說(shuō)文解字》的全部引文內(nèi)容,把引用體例歸納為全引、節(jié)引和敘引三類,并且把所輯錄的引文內(nèi)容與通行大徐本《說(shuō)文》進(jìn)行比對(duì),考證其中存有差異的條目。安敏統(tǒng)計(jì)了孔穎達(dá)的《左傳正義》的引書情況,將引書按經(jīng)、史、子、集分類,統(tǒng)計(jì)出引書的書名和引用次數(shù),分析了《左傳正義》的引書形式和注疏重點(diǎn)。

綜觀上述古籍文獻(xiàn)的引文分析研究,我們發(fā)現(xiàn)這些研究基本上都深入到引文內(nèi)容層面進(jìn)行統(tǒng)計(jì)、溯源、歸類和比較,具有一定的研究深度。但是,當(dāng)前古籍文獻(xiàn)的引文研究總體上聚焦在微觀層面的考證與辨析,沒有明確地從技術(shù)角度人手做引文耦合及共被引分析,很少有利用引文分析探索科學(xué)史以及揭示科學(xué)結(jié)構(gòu)等方面的宏觀研究。

筆者以某一類古籍——“注疏文獻(xiàn)”為研究對(duì)象,借助學(xué)科本體和結(jié)構(gòu)化表示的注疏文獻(xiàn),通過(guò)引文分析,探索注疏文獻(xiàn)中文獻(xiàn)引用的規(guī)律和特點(diǎn),從宏觀層面挖掘引文分析在探索科學(xué)史和評(píng)估古籍文獻(xiàn)影響力方面的價(jià)值。

3注疏文獻(xiàn)的文獻(xiàn)引用特點(diǎn)和分類

對(duì)比當(dāng)代的論文和圖書等文獻(xiàn)的引用情況,我們認(rèn)為,注疏文獻(xiàn)的文獻(xiàn)引用有三個(gè)特點(diǎn):

(1)古籍文獻(xiàn)是封閉性的信息資源。所謂封閉性資源,是指信息規(guī)模有限,不再隨時(shí)間而增加,處于靜止?fàn)顟B(tài)的信息資源。因?yàn)楣偶墨I(xiàn)的封閉性,它們的引文耦合、同被引等數(shù)據(jù)都已經(jīng)固定不變,不像當(dāng)代的期刊文獻(xiàn)具備開放性,引文分析的各項(xiàng)數(shù)據(jù)還在不斷變化之中。

(2)引用方式都是內(nèi)容引用,沒有列出參考文獻(xiàn)。古籍文獻(xiàn)并沒有在文獻(xiàn)末尾列出參考文獻(xiàn)的慣例,其所引用的文獻(xiàn)種類和引用次數(shù)只能到施引文獻(xiàn)的內(nèi)容中查找和統(tǒng)計(jì)。

(3)施引文獻(xiàn)和被引文獻(xiàn)都是圖書,而沒有論文。古代沒有定期出版的刊物,還沒有出現(xiàn)論文這種記錄學(xué)術(shù)成果、并且能夠快捷地提供給讀者閱讀的知識(shí)載體,所引用的文獻(xiàn)都是書籍。

我們考察了《十三經(jīng)注疏》的引用情況,對(duì)十三部注疏文獻(xiàn)中的引用情況進(jìn)行了綜合、比較、分析和歸納,按照兩個(gè)標(biāo)準(zhǔn)對(duì)注疏文獻(xiàn)的文獻(xiàn)引用情況進(jìn)行分類。

(1)根據(jù)所引用對(duì)象的類型,可以把引用情況分為“典籍引用”和“其他引用”兩大類。注疏文獻(xiàn)中的典籍引用是指引用《論語(yǔ)》、《莊子》、《史記》、《漢書》、《說(shuō)文》、《方言》等文獻(xiàn)。除了引用典籍外,注疏文獻(xiàn)中還大量引用訓(xùn)詁學(xué)家的看法和說(shuō)解,這些說(shuō)解沒有按照原創(chuàng)作者的不同分別輯錄成書,而是散錄在多部注疏文獻(xiàn)中。此外,還大量引用了散傳的詩(shī)歌曲詞等。

(2)根據(jù)引用方式,可以把引用情況分為“標(biāo)明出處的引用”和“未標(biāo)明出處的引用”。在注疏文獻(xiàn)中,大部分引用都是標(biāo)明了出處的,只有少部分沒有標(biāo)明。

4注疏文獻(xiàn)引文分析的流程、難點(diǎn)和解決方法

4.1注疏文獻(xiàn)引文分析的流程

注疏文獻(xiàn)的引文分析,實(shí)質(zhì)上就是對(duì)注疏文獻(xiàn)的引用內(nèi)容、以及相關(guān)上下文進(jìn)行分析。注疏文獻(xiàn)引文分析的具體流程如圖1所示,它主要包括四個(gè)步驟:

(1)構(gòu)建文獻(xiàn)集。構(gòu)建文獻(xiàn)集是進(jìn)行引文分析的前提,主要包括文獻(xiàn)下載、數(shù)據(jù)清洗和整理校對(duì)等工作。文獻(xiàn)在下載和清洗之后,要進(jìn)行相應(yīng)地整理,包括修改文件名和合并文件等。另外,還要利用紙質(zhì)古籍善本對(duì)文獻(xiàn)做人工校對(duì),以此來(lái)保證文獻(xiàn)集具有可靠的質(zhì)量。

(2)轉(zhuǎn)化文件結(jié)構(gòu)。轉(zhuǎn)化文件結(jié)構(gòu)是進(jìn)行引文分析的基礎(chǔ),主要是把文獻(xiàn)由非結(jié)構(gòu)化或半結(jié)構(gòu)化轉(zhuǎn)化為結(jié)構(gòu)化,以便于進(jìn)行文本分析和知識(shí)挖掘。當(dāng)前主流的結(jié)構(gòu)化文件存儲(chǔ)方式是使用數(shù)據(jù)庫(kù),或者以XML格式存儲(chǔ)。由于XML技術(shù)能夠把文獻(xiàn)內(nèi)容與表示結(jié)構(gòu)信息的標(biāo)簽分離開來(lái),不會(huì)影響文獻(xiàn)在閱讀方面的連續(xù)性,并且文獻(xiàn)內(nèi)容獨(dú)立于顯示方式,針對(duì)同一文獻(xiàn)內(nèi)容可以定義多種顯示方式,所以XML比數(shù)據(jù)庫(kù)更適合存儲(chǔ)結(jié)構(gòu)化的文獻(xiàn)資料。

(3)抽取引文內(nèi)容及相關(guān)上下文。這一步是進(jìn)行引文分析的關(guān)鍵環(huán)節(jié)。在把文獻(xiàn)由非結(jié)構(gòu)化或半結(jié)構(gòu)化轉(zhuǎn)化為結(jié)構(gòu)化表示后,如果文獻(xiàn)是存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中,能夠使用SQL查詢和抽取引文內(nèi)容及相關(guān)上下文。如果文獻(xiàn)存儲(chǔ)為XML格式,可以利用XQuery檢索和抽取,也可以自編程序?qū)嵤┏槿?,編寫程序前,首先要?duì)文獻(xiàn)中引文上下文的形式特征進(jìn)行分析和總結(jié),根據(jù)其區(qū)別特征編寫抽取規(guī)則。

(4)深入分析引文。這一環(huán)節(jié)是進(jìn)行引文分析的核心和重點(diǎn),主要包括①區(qū)分各個(gè)引文內(nèi)容是屬于哪部文獻(xiàn),由于所引文獻(xiàn)名稱的具體寫法存在多種方式,所以很難直接區(qū)分;②對(duì)所引文獻(xiàn)按照不同的分類標(biāo)準(zhǔn)進(jìn)行歸類,以此來(lái)探索施引文獻(xiàn)的知識(shí)結(jié)構(gòu);③對(duì)施引文獻(xiàn)和被引文獻(xiàn)進(jìn)行文獻(xiàn)耦合分析、同被引分析,探索它們之間的相互關(guān)系、共同特點(diǎn)和區(qū)別特征。

4.2注疏文獻(xiàn)引文分析的主要難點(diǎn)

主要難點(diǎn)有以下兩個(gè)方面:

(1)把注疏文獻(xiàn)由普通文本轉(zhuǎn)化為結(jié)構(gòu)化的XML文檔時(shí),需要分析各部注疏文獻(xiàn)的行文結(jié)構(gòu)和內(nèi)部知識(shí)單元,定義的XML架構(gòu)要能夠適應(yīng)于所有的注疏文獻(xiàn),并且充分地表示出重要的知識(shí),具有高度的結(jié)構(gòu)化和模塊性。另外,需要轉(zhuǎn)化的文獻(xiàn)規(guī)模很大,如果完全使用人工方式轉(zhuǎn)化,成本會(huì)很高。

在抽取引文內(nèi)容及其上下文時(shí),首先要分析表示注疏文獻(xiàn)知識(shí)結(jié)構(gòu)的XML架構(gòu),總結(jié)文獻(xiàn)中引文上下文的形式特征,然后根據(jù)區(qū)別特征定義規(guī)則進(jìn)行抽取測(cè)試,并且分析抽取結(jié)果,改進(jìn)抽取規(guī)則。要循環(huán)此流程,直至達(dá)到最佳的抽取效果。

(2)注疏文獻(xiàn)中所引文獻(xiàn)的名稱存在多種寫法,比如:《爾雅》、《釋言》、《漢書。天文志》、《大雅·抑篇》、《詩(shī).小雅.出車》等。還存在書名的異名同指現(xiàn)象,比如常稱《周易》為《易》或《易經(jīng)》、稱《尚書》為《書》等。只有解決這個(gè)問(wèn)題,才能正確區(qū)分出各個(gè)引文內(nèi)容究竟是屬于哪部文獻(xiàn)。

4.3解決方法

4.3.1把注疏文獻(xiàn)轉(zhuǎn)化為結(jié)構(gòu)化XML格式,以便于抽取引文內(nèi)容

注疏文獻(xiàn)的傳統(tǒng)知識(shí)表示方法是面向人的理解的,使用計(jì)算機(jī)難以對(duì)其做檢索和分析。而XML是表示結(jié)構(gòu)化數(shù)據(jù)的行業(yè)標(biāo)準(zhǔn),是萬(wàn)維網(wǎng)聯(lián)盟定義的一種元數(shù)據(jù),也是可以用來(lái)創(chuàng)建標(biāo)記語(yǔ)言的元語(yǔ)言。近些年來(lái),XML被廣泛應(yīng)用于古籍知識(shí)表示研究中。

XML沒有預(yù)先定義的標(biāo)記系統(tǒng),允許開發(fā)者根據(jù)需要定義自己的標(biāo)記系統(tǒng)。在使用XML標(biāo)注語(yǔ)料時(shí),標(biāo)注者可以根據(jù)需要設(shè)計(jì)標(biāo)記體系,詳盡地標(biāo)注出語(yǔ)料中的信息。當(dāng)語(yǔ)料規(guī)模不斷擴(kuò)充,或者應(yīng)用逐步深入時(shí),XML能夠適應(yīng)需求的變化,很方便地?cái)U(kuò)展標(biāo)記系統(tǒng)。為了能夠使所定義的XML架構(gòu)與表示對(duì)象的知識(shí)結(jié)構(gòu)基本一致,我們從注疏文獻(xiàn)的外部關(guān)聯(lián)事物、內(nèi)部體例結(jié)構(gòu)和知識(shí)結(jié)構(gòu)三個(gè)方面,對(duì)注疏文獻(xiàn)的典型代表——《十三經(jīng)注疏》做全面分析。在此基礎(chǔ)上,設(shè)計(jì)了表示注疏文獻(xiàn)的XML架構(gòu)。這個(gè)XML架構(gòu)簡(jiǎn)潔而又清晰,表現(xiàn)出了注疏文獻(xiàn)的核心知識(shí)結(jié)構(gòu),能夠根據(jù)需要進(jìn)行擴(kuò)展,具有較強(qiáng)的可擴(kuò)展性。

把注疏文獻(xiàn)由普通格式的文獻(xiàn)轉(zhuǎn)化為符合XML架構(gòu)規(guī)范的XML文檔的過(guò)程,也就是把它們的知識(shí)結(jié)構(gòu)由半結(jié)構(gòu)化轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化的過(guò)程。要實(shí)現(xiàn)這種知識(shí)結(jié)構(gòu)的轉(zhuǎn)化,有多種方法可供選擇,比如:手工方法、自動(dòng)化方法、半自動(dòng)方法等。我們?cè)趯?shí)施這項(xiàng)轉(zhuǎn)化工作時(shí),采用計(jì)算語(yǔ)言學(xué)方法,充分利用注疏文獻(xiàn)的半結(jié)構(gòu)化特征,依據(jù)人工制訂的規(guī)則,編寫程序?qū)崿F(xiàn)注疏文獻(xiàn)的半自動(dòng)轉(zhuǎn)化,提高了知識(shí)結(jié)構(gòu)轉(zhuǎn)化的工作效率。圖2是用XML表示《論語(yǔ)集注》的樣例。

注疏文獻(xiàn)原本是半結(jié)構(gòu)化的,現(xiàn)在由于轉(zhuǎn)化成了結(jié)構(gòu)化的XML格式,在原文中添加了有意義的標(biāo)簽信息,這就使得注疏文獻(xiàn)更加便利于利用計(jì)算機(jī)進(jìn)行分析和處理。在此基礎(chǔ)上,能夠開展多方面的研究。例如:設(shè)計(jì)更加智能、具有更高查準(zhǔn)率的檢索系統(tǒng),實(shí)現(xiàn)多種類型、復(fù)雜條件的檢索;在注疏引文與其經(jīng)典原文的知識(shí)點(diǎn)之間自動(dòng)設(shè)置錨點(diǎn)和鏈接,實(shí)現(xiàn)古籍文獻(xiàn)的超文本閱讀;等等。

4.3.2利用訓(xùn)詁學(xué)本體解決文獻(xiàn)名稱的異名同指問(wèn)題

對(duì)于標(biāo)明出處的文獻(xiàn)引用,在所引文獻(xiàn)名稱的具體寫法上,存在著多種方式。古代的劉炫做了總結(jié),他認(rèn)為“夫子敘經(jīng),申述先王之道?!对?shī)》、《書》之語(yǔ),事有當(dāng)其義者,則引而證之,示言不虛發(fā)也。七章不引者,或事義相違,或文勢(shì)自足,則不引也。五經(jīng)唯《傳》引《詩(shī)》,而《禮》則雜引,《詩(shī)》、《書》及《易》并意及則引。若泛指,則云‘《詩(shī)》曰、‘《詩(shī)》云;若指四始之名,即云《國(guó)風(fēng)》、《大雅》、《小雅》、《魯頌》、《商頌》;若指篇名,即言‘《勺》曰、‘《武》曰;皆隨所便而引之,無(wú)定例也。”我們分析了《十三經(jīng)注疏》的文獻(xiàn)引用情況,歸納出注疏文獻(xiàn)在標(biāo)明所引用文獻(xiàn)名稱時(shí)的六種常用寫法:

(1)給出文獻(xiàn)名稱,如《方言》、《爾雅》、《左傳》、《莊子》等,即劉炫所說(shuō)的泛指。

(2)給出章節(jié)名稱,如《釋言》、《釋詁》、《大雅》、《泰誓》、《大宗伯》等,即劉炫所說(shuō)的指四始之名。

(3)給出篇名,如《關(guān)雎》、《勺》、《武》、《多方》等。

(4)給出“文獻(xiàn)名稱+章節(jié)名稱”或者“文獻(xiàn)名稱十篇名”,如《爾雅·釋天》、《漢書·天文志》、《周禮·司服》、《周禮·司勛》、《史記·弟子傳》、《史記·世家》、《禮記·少儀》、《詩(shī)·大雅》、《詩(shī)·唐風(fēng)》等。

(5)給出“文獻(xiàn)名稱+章節(jié)名稱+篇名”,如《詩(shī)·邶風(fēng)·雄雉》、《詩(shī)·小雅·出車》、《詩(shī)·大雅。皇矣》、《周易·既濟(jì)·象辭》、《周易·遁卦·象辭》等。

(6)給出“章節(jié)名稱斗篇名”,如《大雅·抑篇》、《小雅·蓼莪》、《小雅·隰?!?、《乾卦·文言》、《夏官·司弓矢》、《地官·遂人職》、《衛(wèi)風(fēng)·碩人》等。

另外,注疏文獻(xiàn)中在標(biāo)明所引用文獻(xiàn)名稱時(shí),經(jīng)常出現(xiàn)異名同指現(xiàn)象,比如常稱《周易》為《易》或《易經(jīng)》、稱《尚書》為《書》、稱《詩(shī)經(jīng)》為《詩(shī)》、稱《春秋左氏傳》為《左傳》或<<左氏傳》、稱<<春秋公羊傳》為《公羊》等等。

注疏文獻(xiàn)在給出所引用文獻(xiàn)名稱時(shí)的六種常用寫法中,第一、四、五種名稱寫法都含有文獻(xiàn)名稱,而第二、三、六種寫法只有章節(jié)名稱或篇名,卻沒有文獻(xiàn)名稱。除此之外,還存在文獻(xiàn)名稱的異名同指問(wèn)題。

對(duì)于這些問(wèn)題,我們使用“古籍文獻(xiàn)名稱知識(shí)庫(kù)”來(lái)解決,該知識(shí)庫(kù)不需要重新構(gòu)建,它存在于“訓(xùn)詁學(xué)本體”中。為了用形式化方式表示訓(xùn)詁學(xué)領(lǐng)域的知識(shí)體系,利用本體思想重新檢查和審視傳統(tǒng)的訓(xùn)詁學(xué)知識(shí)體系,構(gòu)建了“訓(xùn)詁學(xué)本體知識(shí)庫(kù)”,它包含10個(gè)頂層概念、25個(gè)一級(jí)子概念、216個(gè)二級(jí)子概念以及眾多的下級(jí)概念。使用Protege4.2編輯器,對(duì)訓(xùn)詁學(xué)本體進(jìn)行編輯,生成OWL文件保存。圖3就是使用Protege的圖形插件OWLviz顯示的訓(xùn)詁學(xué)本體的主要概念層次。

在訓(xùn)詁學(xué)本體的“經(jīng)典古籍”和“訓(xùn)詁文獻(xiàn)”兩個(gè)頂層概念下,列出多部古籍文獻(xiàn)的名稱,以及各部古籍的章節(jié)名稱和篇名。圖4的是訓(xùn)詁學(xué)本體中的《爾雅》概念層次圖。

在做注疏文獻(xiàn)的文獻(xiàn)引用自動(dòng)分析時(shí),如果發(fā)現(xiàn)使用書名號(hào)括起來(lái)的字符串,當(dāng)不能確定它是指哪部文獻(xiàn)時(shí),甚至不能確定它是文獻(xiàn)名、章節(jié)名,還是篇名時(shí),就到“訓(xùn)詁學(xué)本體”的“經(jīng)典古籍”和“訓(xùn)詁文獻(xiàn)”兩個(gè)頂層概念下進(jìn)行檢索和分析,以確定它究竟指的是哪部文獻(xiàn)或者屬于哪部文獻(xiàn)。

5利用引文分析評(píng)估古籍文獻(xiàn)的知識(shí)結(jié)構(gòu)和影響力

《十三經(jīng)注疏》包含了十三部注疏文獻(xiàn),所引用的文獻(xiàn)種類極多,引用次數(shù)龐大,引用情況復(fù)雜。在注疏文獻(xiàn)的各種引用類型中,“其他引用”所引用的內(nèi)容主要是訓(xùn)詁學(xué)家說(shuō)解,以及散傳的詩(shī)歌曲詞等?!暗浼谩彼脙?nèi)容的來(lái)源復(fù)雜,包括多種類型的文獻(xiàn)?!拔礃?biāo)明出處的引用”所引用的內(nèi)容一般字?jǐn)?shù)較少,或者只是含義引用,而非原文引用,引用者在很大程度上對(duì)原文作了改寫?!皹?biāo)明出處的引用”所引用的內(nèi)容一般是原文引用,并且引用字?jǐn)?shù)較多。所以,“標(biāo)明出處的典籍引用”是注疏文獻(xiàn)中的主要引用類型。

我們編寫程序分析結(jié)構(gòu)化表示的《十三經(jīng)注疏》。為了能夠在有限條件下得到較為精確的結(jié)果,我們的實(shí)驗(yàn)沒有對(duì)《十三經(jīng)注疏》中所有的引用情況做窮盡式統(tǒng)計(jì),只統(tǒng)計(jì)和分析“標(biāo)明出處的典籍引用”,對(duì)于僅僅提及而沒引用其內(nèi)容的典籍也不做分析。

5.1文獻(xiàn)引用的總體情況和文獻(xiàn)特點(diǎn)分析

《十三經(jīng)注疏》中共有65045次提及文獻(xiàn)名稱、圖畫名稱、舞蹈名稱和樂曲名稱等可以用書名號(hào)標(biāo)注的名稱,其中《周易正義》提及1565次;《尚書正義》提及3839次;《毛詩(shī)正義》提及13574次;《周禮注疏》提及8809次;《儀禮注疏》提及6363次;《禮記正義》提及11460次;《春秋左傳正義》提及8528次;《春秋公羊傳注疏》提及1951次;《春秋穀梁傳注疏》提及1373次;《論語(yǔ)注疏》提及1255次;《孟子注疏》提及1467次;《孝經(jīng)注疏》提及836次;《爾雅注疏》提及4025次。

我們對(duì)《十三經(jīng)注疏》中“標(biāo)明出處的典籍引用”情況做了統(tǒng)計(jì),結(jié)果顯示:引用文獻(xiàn)總次數(shù)為27403次,被引文獻(xiàn)達(dá)400多種。其中,被引次數(shù)排在前10位的文獻(xiàn)是《禮記》、《周禮》、《詩(shī)經(jīng)》、《爾雅》、《儀禮》、《尚書》、《周易》、《左傳》、《說(shuō)文》、《史記》。在這10部被引次數(shù)較多的文獻(xiàn)中,除了十三經(jīng)中的八部經(jīng)書之外,還有一部訓(xùn)詁專書《說(shuō)文》和一部史書《史記》名列其中,這說(shuō)明了《說(shuō)文》和《史記》分別在訓(xùn)詁專書和史書中的重要地位。

通過(guò)分析表1中各部注疏文獻(xiàn)所引用的文獻(xiàn)類型,我們能夠?qū)Ω鞑孔⑹栉墨I(xiàn)所具有的知識(shí)結(jié)構(gòu)特點(diǎn)有一個(gè)基本的了解。

《十三經(jīng)注疏》各部注疏文獻(xiàn)引用文獻(xiàn)次數(shù)和種數(shù)如表2所示?!抖Y記正義>>引用的文獻(xiàn)次數(shù)最多,達(dá)到5070次,同時(shí)它也是引用的文獻(xiàn)種數(shù)最多的文獻(xiàn),引用了182種文獻(xiàn)?!洞呵锓Y梁傳注疏》引用文獻(xiàn)次數(shù)最少,只引用265次;而《周易正義》引用的文獻(xiàn)種類最少,只有24部。

各部注疏文獻(xiàn)引用文獻(xiàn)次數(shù)和種數(shù)的多少,除了與其自身的篇幅大小有關(guān)之外,還與其各自的訓(xùn)詁特點(diǎn)有關(guān)。各部注疏文獻(xiàn)在引用文獻(xiàn)的類型、次數(shù)和種數(shù)等方面差別很大,通過(guò)分析它們的文獻(xiàn)引用情況,可以基本判斷出它們?cè)谟?xùn)詁方式上的特點(diǎn)。接下來(lái),以《春秋經(jīng)》的三部注疏文獻(xiàn)為例加以說(shuō)明。

《春秋左傳正義》引用文獻(xiàn)次數(shù)和種數(shù)都比較多,并且大量引用《說(shuō)文》的釋義,《說(shuō)文》在其所引用的133種文獻(xiàn)中,按引用次數(shù)排在第八位,由此可以看出《春秋左傳正義》注重對(duì)詞語(yǔ)意義的解釋,它通過(guò)解釋詞義來(lái)疏通句義和文意。相對(duì)而言,《春秋穀梁傳注疏》引用史書的次數(shù)比較多,《史記》和《世本》在其所引用的50種文獻(xiàn)中,按引用次數(shù)分別排名第九位和第十位,由此可見《春秋穀梁傳注疏>>更偏重于介紹歷史事件背景?!洞呵锕騻髯⑹琛芬梦墨I(xiàn)61種,共引用文獻(xiàn)383次,在引用次數(shù)較多的前十種文獻(xiàn)中,既沒有史書也沒有字書,它的訓(xùn)詁特點(diǎn)是重視闡述句義。

5.2文獻(xiàn)的耦合情況和知識(shí)結(jié)構(gòu)相似度分析

我們分析了《十三經(jīng)注疏》中各部文獻(xiàn)之間的耦合情況,使用傳統(tǒng)的耦合強(qiáng)度計(jì)算方法計(jì)算注疏文獻(xiàn)之間的耦合強(qiáng)度,即:兩部文獻(xiàn)A與B之間的耦合強(qiáng)度就是它們引用相同文獻(xiàn)的數(shù)量,如果A與B同時(shí)引用了m種文獻(xiàn),那么A、B之間的耦合強(qiáng)度就定為m。由此可見,耦合強(qiáng)度的高低,取決于施引文獻(xiàn)之間引用相同文獻(xiàn)的數(shù)量。反之,文獻(xiàn)之間的耦合強(qiáng)度越高,說(shuō)明它們引用的相同文獻(xiàn)越多,在知識(shí)結(jié)構(gòu)上的相同之處也越多。

在表3中,列出了在《十三經(jīng)注疏》中各部文獻(xiàn)之間的引文耦合矩陣??梢钥闯?,在《十三經(jīng)注疏》中,耦合強(qiáng)度最高的兩部文獻(xiàn)是《周禮注疏》和《禮記正義》,它們之間的耦合強(qiáng)度是97;而耦合強(qiáng)度最低的兩部文獻(xiàn)是《周易正義》和《孝經(jīng)注疏》,它們之間的耦合強(qiáng)度是13?!妒?jīng)注疏》中各部文獻(xiàn)之間的平均耦合強(qiáng)度是44.5。

經(jīng)過(guò)分析,我們發(fā)現(xiàn)“耦合強(qiáng)度”與“知識(shí)結(jié)構(gòu)的相似度”之間確有著正相關(guān)。《十三經(jīng)注疏》中每部注疏文獻(xiàn)都有兩位或兩位以上的注疏人,比如:《周易正義》是王弼、韓康伯注、孔穎達(dá)等正義;《禮記正義》是鄭玄注、孔穎達(dá)等人疏。我們發(fā)現(xiàn)在這十三部注疏文獻(xiàn)中,當(dāng)兩部文獻(xiàn)有一個(gè)相同的注疏人時(shí),這兩部文獻(xiàn)的耦合強(qiáng)度就會(huì)相對(duì)較高。以《周禮注疏》為例,與《周禮注疏》之間耦合強(qiáng)度最高的文獻(xiàn)是《禮記正義》,我們發(fā)現(xiàn)這兩部文獻(xiàn)引用的文獻(xiàn)種數(shù)都比較多,并且都是由鄭玄作注;《孟子注疏》共引用文獻(xiàn)59種,它與《周禮注疏》的耦合強(qiáng)度是34,《儀禮注疏》共引用文獻(xiàn)57種,與《孟子注疏》引用文獻(xiàn)種數(shù)相差不大,但它與《周禮注疏》的耦合強(qiáng)度就達(dá)到52,原因就在于《儀禮注疏》與《周禮注疏》這兩部文獻(xiàn)有著兩個(gè)相同的注疏人,都是由鄭玄注、賈公彥疏。

5.3文獻(xiàn)的同被引情況和學(xué)術(shù)地位分析

對(duì)《十三經(jīng)注疏》中“標(biāo)明出處的典籍引用”情況做統(tǒng)計(jì),結(jié)果顯示:被引次數(shù)排在前25位被引文獻(xiàn)是:《禮記》、《周禮》、《詩(shī)經(jīng)》、《爾雅》、《儀禮》、《尚書》、《周易》、《左傳》、《說(shuō)文》、《史記》、《論語(yǔ)》、《釋例》、《公羊傳》、《漢書》、《春秋》、《穀梁傳》、《世本>>、《孝經(jīng)》、《方言》、《孟子》、《白虎通》、《廣雅》、《國(guó)語(yǔ)》、《韓詩(shī)》、《字林》。

在十三部注疏文獻(xiàn)中都被引用了的文獻(xiàn)有10部,它們是:《禮記》、《周禮》、《詩(shī)經(jīng)》、《爾雅》、《儀禮》、《尚書》、《周易》、《左傳》、《說(shuō)文》、《論語(yǔ)》。這十部文獻(xiàn)的被引用次數(shù)也很多,在《十三經(jīng)注疏》中共被引用了20261次,這十部文獻(xiàn)均排在按照被引次數(shù)排名的前11位被引文獻(xiàn)中。

把被引文獻(xiàn)按照經(jīng)、史、子、集等進(jìn)行分類,我們發(fā)現(xiàn)在史書類文獻(xiàn)中被引次數(shù)排在前四位的是:《史記》、《漢書》、《世本》和《國(guó)語(yǔ)》,可見這四部史書在訓(xùn)詁研究中有著重要價(jià)值。在小學(xué)類工具書中被引次數(shù)排在前四位的文獻(xiàn)是:《說(shuō)文》、《方言》、《廣雅》和《字林》,由此可以看出,這四部訓(xùn)詁專書在中國(guó)訓(xùn)詁學(xué)研究中具有重要作用和地位。

6總結(jié)

利用結(jié)構(gòu)化的注疏文獻(xiàn)和訓(xùn)詁學(xué)本體解決了引文分析研究中的兩個(gè)主要難點(diǎn),順利完成了引文分析,總結(jié)出《十三經(jīng)注疏》中文獻(xiàn)引用的總體情況,探討了注疏文獻(xiàn)之間的引文耦合情況,并且論述了文獻(xiàn)的同被引情況。

引文分析能夠揭示古籍文獻(xiàn)的知識(shí)結(jié)構(gòu)特點(diǎn),估測(cè)古籍文獻(xiàn)之間在知識(shí)結(jié)構(gòu)方面的相似程度,評(píng)估被引文獻(xiàn)在其所屬類別文獻(xiàn)中的地位。將傳統(tǒng)人文學(xué)科與當(dāng)代信息科學(xué)、文獻(xiàn)計(jì)量學(xué)結(jié)合起來(lái),不僅傳承了古籍文獻(xiàn)研究的歷史成果,而且產(chǎn)生了一些新的研究思路和方法,能夠?yàn)楣偶墨I(xiàn)的同類研究提供參考借鑒。

猜你喜歡
本體評(píng)估
Abstracts and Key Words
對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
評(píng)估依據(jù)
立法后評(píng)估:且行且盡善
Care about the virtue moral education
最終評(píng)估
EMA完成對(duì)尼美舒利的評(píng)估