国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

字書字料庫本借關(guān)系標(biāo)注相關(guān)問題芻議

2021-12-30 07:34馮寶成
關(guān)鍵詞:字書字頭界面

馮寶成

(渤海大學(xué)文學(xué)院,遼寧錦州 121013)

“字料庫”這一概念是由李國英、周曉文于2008年首次提出的[1]?!白至蠋臁笔侵浮耙晕淖值恼砗臀淖謱W(xué)的研究為目標(biāo),按照語言學(xué)和文字學(xué)的原則,收集實(shí)際使用中能夠代表特定文字或文字變體的真實(shí)出現(xiàn)過的文字書寫形態(tài),運(yùn)用計(jì)算機(jī)技術(shù)建成的具有一定規(guī)模的大型電子文字資源庫”[2]。近幾十年來計(jì)算機(jī)信息科學(xué)的飛速發(fā)展,為字料庫這一研究工具的出現(xiàn)提供了重要土壤,實(shí)現(xiàn)了漢字學(xué)與計(jì)算機(jī)信息科學(xué)的交叉融合,從而產(chǎn)生了字料庫這一重要的漢字學(xué)研究工具。作為一種仍處在初級發(fā)展階段的漢字學(xué)研究工具,一個(gè)系統(tǒng)完備、字料信息豐富的字書字料庫能夠?yàn)闈h字學(xué)及其它相關(guān)學(xué)科研究提供大量的字書漢字信息,可以借助于統(tǒng)計(jì)學(xué)手段和方法得到客觀可靠的漢字?jǐn)?shù)據(jù),從而探尋漢字學(xué)規(guī)律,并對先前的漢字學(xué)研究理論及成果進(jìn)行驗(yàn)證或修改,會(huì)在以后的漢字學(xué)研究中發(fā)揮巨大的作用。而建設(shè)一個(gè)系統(tǒng)完備、字料信息豐富、使用價(jià)值高的字書字料庫,其中最重要的工作環(huán)節(jié)是字書字料的標(biāo)注。因此,字書字料庫標(biāo)注研究與標(biāo)注后字書字料庫的應(yīng)用研究是同等重要的,是字書字料庫研究的兩個(gè)重要方面。

字際關(guān)系界面的標(biāo)注是字書字料庫標(biāo)注的重要內(nèi)容之一,而漢字本借關(guān)系研究是漢字字際關(guān)系研究的重要組成部分,對本借關(guān)系界面的標(biāo)注就尤為重要,是字際關(guān)系標(biāo)注中不可忽視的一部分。但因目前對本借關(guān)系頁面的標(biāo)注仍處于初級階段,標(biāo)注實(shí)踐初步開始,還未形成一套適用于本借關(guān)系的標(biāo)注理論。因此,本文以渤海大學(xué)字書字料庫(CCFD)字際關(guān)系界面中本借關(guān)系的標(biāo)注為研究對象,擬從理論、實(shí)踐、應(yīng)用三方面對字書字料庫本借關(guān)系標(biāo)注問題進(jìn)行初步探討,探索出一套適用于本借關(guān)系的標(biāo)注理論,為此界面的標(biāo)注與標(biāo)注后的應(yīng)用提供理論指導(dǎo)。

一、字書字料庫本借關(guān)系標(biāo)注理論

關(guān)于字書字料標(biāo)注的定義,柳建鈺提出:“所謂字書字料標(biāo)注,就是把字書字料所具有的漢字學(xué)、字典學(xué)及其他重要的信息按照既定原則一一標(biāo)注出來?!盵3]222依據(jù)以上定義,筆者對字書字料庫中本借關(guān)系標(biāo)注作出界定:作為字書字料標(biāo)注工作的重點(diǎn)之一,本借關(guān)系標(biāo)注是指將字書字料中所包含的字頭、聲紐和韻部、本借關(guān)系類型、文獻(xiàn)例證等本借關(guān)系信息按照本借關(guān)系標(biāo)注的既定原則進(jìn)行一一標(biāo)注。本借關(guān)系的標(biāo)注是字書字料庫標(biāo)注的重要內(nèi)容之一,二者間存在一定共通之處,但由于漢字本借關(guān)系內(nèi)涵的復(fù)雜性,其標(biāo)注原則、標(biāo)注內(nèi)容、標(biāo)注流程、標(biāo)注方式等皆存在特殊之處,下文將對之進(jìn)行探討。

(一)標(biāo)注的原則

字書字料庫本借關(guān)系界面標(biāo)注是為部分字書字料增加本借關(guān)系信息的過程,在這一過程中要遵循預(yù)先制定的標(biāo)注原則。關(guān)于字書字料庫標(biāo)注基本原則,柳建鈺總結(jié)為“生字料和標(biāo)注內(nèi)容的數(shù)據(jù)獨(dú)立性原則、字料標(biāo)注的公開性原則、字料標(biāo)注的通用性原則、字料標(biāo)注的標(biāo)準(zhǔn)化原則、字料標(biāo)注的多維度原則”[3]224-227。筆者在對字書字料庫本借關(guān)系界面進(jìn)行標(biāo)注時(shí),以其為標(biāo)注的基本原則,并結(jié)合前期標(biāo)注的具體情況,又概括出字書字料庫本借關(guān)系標(biāo)注的五條補(bǔ)充原則。

1.所依據(jù)資料的多元化原則。在對本借關(guān)系類型進(jìn)行標(biāo)注時(shí),豐富的研究材料可作為判定本借字頭間具體類型的可靠依據(jù)。所謂多元化的資料,指的是標(biāo)注者在對本借關(guān)系具體類型進(jìn)行判定時(shí),所依據(jù)的資料不能僅僅局限于某部字典辭書,還要廣泛搜集其它相關(guān)資料,包括但不限于相關(guān)的古代文獻(xiàn)用例、權(quán)威的漢字學(xué)著作、前代學(xué)者的訓(xùn)詁材料、當(dāng)代學(xué)者所作字典辭書及其它研究成果。之所以要考慮所依據(jù)資料的多元化,主要是因?yàn)閷ν唤M字本借關(guān)系具體類型的判定結(jié)果可能會(huì)受判定者自身因素的影響而難以統(tǒng)一,因此我們主張?jiān)趯Ρ窘桕P(guān)系具體類型進(jìn)行標(biāo)注時(shí),要擺脫單一的資料,所依據(jù)的資料要多元化。

2.主客觀相結(jié)合原則。字料信息標(biāo)注力求準(zhǔn)確是基本要求,標(biāo)注的準(zhǔn)確性越高,其利用價(jià)值越大。因此,在對字書字料庫本借關(guān)系界面進(jìn)行標(biāo)注時(shí)要遵循主客觀相結(jié)合的原則,既不可完全憑標(biāo)注者的主觀臆斷,亦不可完全以某相關(guān)材料為標(biāo)注依據(jù)。應(yīng)在廣泛搜集相關(guān)資料的基礎(chǔ)上,對前代學(xué)者的觀點(diǎn)作出甄別,并結(jié)合標(biāo)注者的思想,最后形成最終標(biāo)注結(jié)果。只有標(biāo)注者在遵循主客觀相結(jié)合原則對需標(biāo)注的內(nèi)容進(jìn)行標(biāo)注時(shí),才能保證被標(biāo)注內(nèi)容的準(zhǔn)確性,提高字書字料庫的利用價(jià)值。

3.規(guī)范性原則。字料信息標(biāo)注的規(guī)范與否對字料庫應(yīng)用價(jià)值的高低有著重要的影響。只有字料標(biāo)注符合規(guī)范化原則,才能將字書字料庫建設(shè)成一個(gè)規(guī)范化的漢字學(xué)研究工具,提高其應(yīng)用價(jià)值。字料信息標(biāo)注的規(guī)范化主要包括標(biāo)注信息的規(guī)范化以及標(biāo)注方式的規(guī)范化。所謂標(biāo)注信息的規(guī)范化,即在對字料信息進(jìn)行標(biāo)注前要建立字料信息統(tǒng)一的加工標(biāo)準(zhǔn),只有符合標(biāo)準(zhǔn)的字料信息才能夠進(jìn)行標(biāo)注;所謂標(biāo)注方式的規(guī)范化,即不同標(biāo)注者對同一字段進(jìn)行標(biāo)注時(shí)所采用的標(biāo)注方式要一致,標(biāo)注時(shí)要遵循同一規(guī)則。如果在標(biāo)注前不制定統(tǒng)一的規(guī)則,不同標(biāo)注者所標(biāo)注的方式差別很大,就會(huì)導(dǎo)致字書字料庫字料信息混亂,給字書字料庫使用者帶來不必要的麻煩,因此要在進(jìn)行字料信息標(biāo)注的過程中嚴(yán)格遵循規(guī)范化原則。

4.更新補(bǔ)充原則。系統(tǒng)完備、字料信息豐富、使用價(jià)值高這三個(gè)特點(diǎn)是字書字料庫建設(shè)的主要目標(biāo),對字料信息進(jìn)行及時(shí)更新補(bǔ)充是達(dá)成這一建設(shè)目標(biāo)的必經(jīng)之路。由于漢字本借關(guān)系本身具有復(fù)雜性的特點(diǎn),標(biāo)注者在對某一對本借關(guān)系信息進(jìn)行標(biāo)注時(shí)受自身知識(shí)儲(chǔ)備、學(xué)界研究成果等限制,難免標(biāo)注錯(cuò)誤,在發(fā)現(xiàn)后要立即進(jìn)行標(biāo)注更新,改為正確的標(biāo)注信息,此為漢字本借關(guān)系標(biāo)注的更新性原則。由于學(xué)術(shù)研究成果以及古籍文獻(xiàn)具有時(shí)代發(fā)展性,受于初次標(biāo)注時(shí)代存有文獻(xiàn)材料數(shù)量和學(xué)界關(guān)于本借關(guān)系研究成果數(shù)量的限制,本借關(guān)系字組的數(shù)量會(huì)隨著新材料的發(fā)現(xiàn)而增加,本借關(guān)系的標(biāo)注結(jié)果會(huì)隨著新研究成果的出現(xiàn)而滯后,因此要及時(shí)對字書字料庫本借關(guān)系頁面進(jìn)行補(bǔ)充標(biāo)注,這樣才會(huì)離建成具備系統(tǒng)完備、字料信息豐富、使用價(jià)值高等特點(diǎn)的字書字料庫的目標(biāo)越來越近。

5.獨(dú)立性原則。標(biāo)注結(jié)果的清晰明確是標(biāo)注的內(nèi)在要求。由于漢字本借關(guān)系是文獻(xiàn)角度的字際關(guān)系,關(guān)系的判定依據(jù)文獻(xiàn)中的例證來進(jìn)行,在不同的文獻(xiàn)中,構(gòu)成本借關(guān)系的字組所攜帶的本借關(guān)系具體類型、聲韻關(guān)系等信息可能是不同的,因此在對不同文獻(xiàn)例證中所攜帶本借關(guān)系信息有區(qū)別的一組字進(jìn)行標(biāo)注時(shí),要各自獨(dú)立,切忌混合標(biāo)注。混合標(biāo)注會(huì)造成標(biāo)注結(jié)果的模糊不清,給字書字料庫本借關(guān)系的應(yīng)用帶來諸多障礙。因此,在對字書字料庫本借關(guān)系界面進(jìn)行標(biāo)注時(shí)要遵從獨(dú)立性原則,對不同文獻(xiàn)例證中所攜帶不同信息的本借字頭分別進(jìn)行標(biāo)注,而不同文獻(xiàn)例證中所攜帶相同本借關(guān)系信息的本借字頭可進(jìn)行統(tǒng)一標(biāo)注。

(二)標(biāo)注的內(nèi)容

字書字料庫本借關(guān)系的標(biāo)注內(nèi)容是應(yīng)用此界面進(jìn)行漢字學(xué)研究的基礎(chǔ),標(biāo)注內(nèi)容的全面性、準(zhǔn)確性、系統(tǒng)性會(huì)對此界面的應(yīng)用產(chǎn)生直接影響。以目前渤海大學(xué)字書字料庫(CCFD)字際關(guān)系屬性本借關(guān)系界面的字段設(shè)置為例,標(biāo)注的內(nèi)容主要包括本借字頭、本借關(guān)系類型、主輔字頭聲紐和韻部、聲紐關(guān)系、韻部關(guān)系、相關(guān)參證文獻(xiàn)信息等。下面筆者將分別對以上標(biāo)注內(nèi)容進(jìn)行舉例介紹。

1.本借字頭。本借字頭標(biāo)注即對與主字頭構(gòu)成本字與通假字、假借字與后造本字、假借字與假借字、古本字與后造本字、通假字與通假字關(guān)系的輔字頭進(jìn)行標(biāo)注。本借字頭的標(biāo)注是本借關(guān)系界面標(biāo)注的首要內(nèi)容。

2.本借關(guān)系類型。本借關(guān)系類型標(biāo)注即對主輔字頭所構(gòu)成的本借關(guān)系具體類型進(jìn)行標(biāo)注,主要包括古本字與后造本字、本字與通假字、通假字與通假字、假借字與假借字、假借字與后造本字五種類型。五種類型大致涵蓋了本借關(guān)系中所包含的小的字際關(guān)系。古本字與后造本字指由于漢字孳乳分化而產(chǎn)生的源字與分化字通用、混用關(guān)系,例如“反”與“返”、“竟”與“境”等;本字與通假字指本有其字的同音借用,在共時(shí)文獻(xiàn)中被借字并不具有文獻(xiàn)所表達(dá)的意義,例如“早”與“蚤”;通假字與通假字指某字形所記錄的某一意義在古代文獻(xiàn)中分別借用了兩個(gè)或兩個(gè)以上與其音同或音近的字形,這兩個(gè)或多個(gè)字形之間構(gòu)成通假字與通假字的關(guān)系,例如“辜”與“故”在文獻(xiàn)中常被借表“固定”義,是“固”之借字;假借字與假借字指古人在記錄某本無其字的詞義時(shí)分別借用了兩個(gè)或兩個(gè)以上音同或音近的不同字形,被借用的字形間構(gòu)成假借字與假借字的關(guān)系,例如“乏”與“貶”,皆被借作指稱本無其字的古代行射禮時(shí)報(bào)靶人的護(hù)身器;假借字與后造本字指原未造本字的某一詞義借用了一個(gè)音同或音近的字形,后又為此詞義專門造了新字,被借用的字形與其后造字形就構(gòu)成了假借字與后造本字的關(guān)系,例如“采”與“睬”。

3.主輔字頭的聲紐。即構(gòu)成本借關(guān)系的主字頭和輔字頭在上古的聲紐地位,所采用的上古聲母系統(tǒng)為王力先生的上古33聲母系統(tǒng)。這兩個(gè)字段在字書字料庫中可點(diǎn)擊“自動(dòng)填充”按鈕,由計(jì)算機(jī)自動(dòng)匹配主輔字頭的上古聲母對其進(jìn)行標(biāo)注。

4.主輔字頭的韻部。即構(gòu)成本借關(guān)系的主字頭和輔字頭在上古的韻部地位,所采用的上古韻部系統(tǒng)為王力先生的上古30韻部系統(tǒng)。這兩個(gè)字段在字書字料庫中可點(diǎn)擊“自動(dòng)填充”按鈕,由計(jì)算機(jī)自動(dòng)匹配主輔字頭的上古韻部對其進(jìn)行標(biāo)注。

5.主輔字頭的聲紐關(guān)系和韻部關(guān)系。即構(gòu)成本借關(guān)系的主字頭及輔字頭的聲紐關(guān)系和韻部關(guān)系,聲紐關(guān)系包括唇音雙聲、舌上音雙聲、舌頭音雙聲、齒頭音雙聲、正齒音雙聲、牙音雙聲、喉音雙聲、舌音準(zhǔn)雙聲、齒音準(zhǔn)雙聲、舌齒準(zhǔn)雙聲、齒頭音旁紐、唇音旁紐、舌頭音旁紐、舌上音旁紐、正齒音旁紐、牙音旁紐、舌齒鄰紐、舌音準(zhǔn)旁紐、齒音準(zhǔn)旁紐、鼻邊臨紐、牙喉鄰紐等21 類。韻部關(guān)系包括陰聲疊韻、入聲疊韻、陽聲疊韻、陰入對轉(zhuǎn)、陽入對轉(zhuǎn)、陰陽對轉(zhuǎn)、陰聲旁轉(zhuǎn)、陽聲旁轉(zhuǎn)、入聲旁轉(zhuǎn)、陰入旁對轉(zhuǎn)、陽入旁對轉(zhuǎn)、陰陽旁對轉(zhuǎn)、陰入通轉(zhuǎn)、陽入通轉(zhuǎn)、陰陽通轉(zhuǎn)、陰聲通轉(zhuǎn)、入聲通轉(zhuǎn)、陽聲通轉(zhuǎn)18 類。這兩個(gè)字段在字書字料庫中可點(diǎn)擊“自動(dòng)填充”按鈕,由計(jì)算機(jī)自動(dòng)匹配主輔字頭的上古聲母對其進(jìn)行標(biāo)注。

6.相關(guān)參證文獻(xiàn)。即判定主字頭與輔字頭構(gòu)成本借關(guān)系所依據(jù)的文獻(xiàn),參證文獻(xiàn)是判定一組字是否構(gòu)成本借關(guān)系及其相關(guān)字段標(biāo)注的重要依據(jù)。

(三)標(biāo)注的方式

目前字書字料標(biāo)注的方式主要有三種,即人工標(biāo)注、機(jī)器標(biāo)注、人工標(biāo)注與機(jī)器標(biāo)注相結(jié)合。單純使用人工進(jìn)行標(biāo)注,會(huì)耗費(fèi)較多時(shí)間和人力,成本較高。單純使用機(jī)器進(jìn)行標(biāo)注雖然速度較快,但也不能保證字料標(biāo)注信息的百分之百正確,且機(jī)器標(biāo)注的好與壞也取決于前期的人工預(yù)設(shè)。

筆者在對字書字料庫本借關(guān)系界面進(jìn)行標(biāo)注時(shí)采取人工標(biāo)注與機(jī)器標(biāo)注相結(jié)合的標(biāo)注方式。本借字頭、相關(guān)參證文獻(xiàn)信息采用機(jī)器標(biāo)注的方式進(jìn)行標(biāo)注,而大部分主輔字頭聲紐和韻部、聲紐關(guān)系、韻部關(guān)系的標(biāo)注可由標(biāo)注者點(diǎn)擊“自動(dòng)填充”按鈕,由計(jì)算機(jī)根據(jù)字料的具體情況自動(dòng)填入。少部分字料無法匹配其古音關(guān)系則需要人工標(biāo)注,本借關(guān)系類型字段則完全需要人工標(biāo)注。

人工標(biāo)注與機(jī)器標(biāo)注相結(jié)合的標(biāo)注方式的優(yōu)勢主要體現(xiàn)在兩個(gè)方面:首先,在標(biāo)注效率方面,人工標(biāo)注與機(jī)器標(biāo)注相結(jié)合的方式有助于提高標(biāo)注速度;其次,在標(biāo)注的準(zhǔn)確率方面,這種方式可以降低標(biāo)注失誤率,提高標(biāo)注的準(zhǔn)確率,從而避免二次標(biāo)注。因此筆者在對字書字料庫本借關(guān)系界面進(jìn)行標(biāo)注時(shí)采用人工標(biāo)注與機(jī)器標(biāo)注相結(jié)合的標(biāo)注方式。

(四)標(biāo)注的過程

按照字書字料庫本借關(guān)系界面標(biāo)注的初步實(shí)踐,筆者將字書字料庫本借關(guān)系界面的標(biāo)注分為五個(gè)階段,詳見圖1。

圖1 本借關(guān)系界面標(biāo)注流程示意圖

1.選擇字書與設(shè)定采集方式階段。此階段首先要選擇包含本借關(guān)系信息的字書,其次根據(jù)字書對本借關(guān)系的表現(xiàn)形式制定自動(dòng)化采集字頭及參證文獻(xiàn)信息的方式。這是本借關(guān)系標(biāo)注的第一階段。

2.采集本借字頭與參證文獻(xiàn)階段。從事先選擇的字書中按照預(yù)先設(shè)定的采集方式采集構(gòu)成本借關(guān)系的主輔字頭與相關(guān)參證文獻(xiàn),標(biāo)注者應(yīng)對采集結(jié)果進(jìn)行仔細(xì)核查,務(wù)必要保證構(gòu)成本借關(guān)系的主輔字頭與相關(guān)參證文獻(xiàn)的準(zhǔn)確性以及主輔字頭與參證文獻(xiàn)的一一對應(yīng)。

3.本借關(guān)系初步判定階段。此階段首先需要依據(jù)相關(guān)參證文獻(xiàn)對已采集的主輔字頭是否構(gòu)成本借關(guān)系進(jìn)行初步判定,并反復(fù)確認(rèn)判定結(jié)果;其次,將依據(jù)參證文獻(xiàn)無法認(rèn)定為本借關(guān)系的主輔字頭及其參證文獻(xiàn)剔除。這一階段主要是對字料的初步篩選,將明顯不構(gòu)成本借關(guān)系的字料剔除,為標(biāo)注者后續(xù)的標(biāo)注工作減輕負(fù)擔(dān)。

4.本借關(guān)系標(biāo)注階段。此階段首先對經(jīng)初步確認(rèn)的構(gòu)成本借關(guān)系的主輔字頭與參證文獻(xiàn)進(jìn)行機(jī)器標(biāo)注,其次按照既定標(biāo)注原則對主字頭聲紐和韻部、輔字頭聲紐和韻部、聲紐關(guān)系、韻部關(guān)系、本借關(guān)系類型按順序進(jìn)行標(biāo)注,避免信息遺漏。此外,在標(biāo)注過程中發(fā)現(xiàn)不符合本借關(guān)系判定標(biāo)準(zhǔn)的字頭要及時(shí)刪除。

5.核驗(yàn)標(biāo)注結(jié)果與修改補(bǔ)充階段。字書字料庫標(biāo)注帶有主觀性,即使標(biāo)注者是具備漢字學(xué)知識(shí)的專業(yè)人員,也難免出現(xiàn)失誤,因此本借關(guān)系標(biāo)注結(jié)果必須經(jīng)過多次審核檢驗(yàn),對標(biāo)注錯(cuò)誤及時(shí)進(jìn)行修改和補(bǔ)充,增強(qiáng)其準(zhǔn)確性,使其更好地服務(wù)于本借關(guān)系研究與漢字學(xué)研究。

二、字書字料庫中本借關(guān)系標(biāo)注的實(shí)踐

字書字料庫本借關(guān)系標(biāo)注理論來源于本借關(guān)系界面標(biāo)注的初步實(shí)踐,本借關(guān)系標(biāo)注實(shí)踐中所產(chǎn)生的新問題、新發(fā)現(xiàn)也會(huì)對標(biāo)注理論起到豐富和修正的作用。因此,本借關(guān)系標(biāo)注理論與標(biāo)注實(shí)踐是相輔相成、相互促進(jìn)的。標(biāo)注實(shí)踐同時(shí)也是應(yīng)用字書字料庫本借關(guān)系界面進(jìn)行漢字學(xué)研究的必經(jīng)之路,其重要程度不言而喻?,F(xiàn)階段,渤海大學(xué)字書字料庫(CCFD)本借關(guān)系界面基礎(chǔ)建設(shè)已初步完成,此界面的標(biāo)注也已初步展開,下面對字書字料庫本借關(guān)系界面現(xiàn)有標(biāo)注框架的設(shè)計(jì)以及在標(biāo)注實(shí)踐中發(fā)現(xiàn)的現(xiàn)有框架的不足進(jìn)行探討。

(一)現(xiàn)有標(biāo)注框架的設(shè)計(jì)

渤海大學(xué)字書字料庫字料(CCFD)本借關(guān)系界面現(xiàn)包括字頭列表、本借字頭、本借關(guān)系類型、主字頭聲紐、主字頭韻部、輔字頭聲紐、輔字頭韻部、聲紐關(guān)系、韻部關(guān)系、相關(guān)參證文獻(xiàn)等十個(gè)字段,可分為三個(gè)層次:字頭、本借關(guān)系判定依據(jù)、本借關(guān)系類型。字頭包括主字頭、與主字頭構(gòu)成本借關(guān)系的輔字頭、字頭列表,字頭列表是輔字頭的集合;本借關(guān)系判定依據(jù)包括主字頭聲紐、主字頭韻部、輔字頭聲紐、輔字頭韻部、聲紐關(guān)系、韻部關(guān)系、相關(guān)參證文獻(xiàn),主輔字頭的聲韻關(guān)系是判定二字是否構(gòu)成本借關(guān)系的重要依據(jù);本借關(guān)系類型包括古本字與后造本字、本字與通假字、通假字與通假字、假借字與假借字、假借字與后造本字五種類型,詳見圖2。

圖2 字書字料庫本借關(guān)系標(biāo)注框架示意圖

(二)現(xiàn)有標(biāo)注框架的不足

雖然現(xiàn)有標(biāo)注框架中所設(shè)置的字段涵蓋了本借關(guān)系判定依據(jù)、本借關(guān)系類型等內(nèi)容,但筆者在借助本借關(guān)系界面對漢字本借關(guān)系進(jìn)行標(biāo)注研究時(shí)發(fā)現(xiàn),此界面標(biāo)注框架的設(shè)計(jì)還存在諸多問題,具體如下:

1.字段數(shù)量設(shè)置不足,實(shí)用性較低。上文提到,系統(tǒng)完備、字料信息豐富、使用價(jià)值高是字書字料庫建設(shè)的主要目標(biāo),但因本借關(guān)系界面的建設(shè)處于基礎(chǔ)階段,在字段設(shè)置方面還不完善,遠(yuǎn)不能達(dá)到上述要求。學(xué)界關(guān)于本借關(guān)系的部分研究成果還未在字書字料庫本借關(guān)系界面中體現(xiàn),例如部分學(xué)者將本借關(guān)系類型中本字與通假字關(guān)系按照二字是否能夠互相借用分為單向通假、雙向通假兩種,在本借關(guān)系界面增設(shè)這一標(biāo)注字段,將會(huì)豐富字書字料庫的字料信息,提高本借關(guān)系界面的使用價(jià)值。關(guān)于本借關(guān)系界面的字段增設(shè)問題,將在后文中具體展開探討。

2.本借關(guān)系具體類型的分類存在缺陷?,F(xiàn)有本借關(guān)系類型字段下設(shè)五個(gè)選項(xiàng),即本字與通假字、古本字與后造本字、假借字與假借字、通假字與通假字、假借字與后造本字五種關(guān)系,但因本借關(guān)系內(nèi)涵和外延具有復(fù)雜性,在具體標(biāo)注實(shí)踐中這五種類型的設(shè)置還存在一些問題。首先,在標(biāo)注實(shí)踐中,部分文獻(xiàn)例證中的本借關(guān)系會(huì)出現(xiàn)無法標(biāo)注的情況,也就是說以上五種關(guān)系類型并不能涵蓋所有文獻(xiàn)中構(gòu)成本借關(guān)系字組的具體小類;其次,在標(biāo)注實(shí)踐中,部分文獻(xiàn)例證中構(gòu)成本借關(guān)系的某一組字會(huì)出現(xiàn)標(biāo)注兩難抉擇的情況,也就是說在此文獻(xiàn)例證中兩字既可標(biāo)注為A關(guān)系,又可標(biāo)注為B關(guān)系。出現(xiàn)以上現(xiàn)象的主要原因是對本借關(guān)系的分類還不夠科學(xué)以及缺乏判定本借關(guān)系類型的固定標(biāo)準(zhǔn),因此亟待制定出一套符合漢字本借關(guān)系實(shí)際的本借關(guān)系類型字段標(biāo)注規(guī)則。

3.標(biāo)注環(huán)境與本借關(guān)系實(shí)際不相符。標(biāo)注環(huán)境與本借關(guān)系實(shí)際不相符主要表現(xiàn)在以下兩個(gè)方面:其一,因漢字本借關(guān)系是文獻(xiàn)角度的字際關(guān)系,文獻(xiàn)例證是本借關(guān)系判定的重要依據(jù),在不同文獻(xiàn)例證中,相同的字頭可能構(gòu)成不同類型的本借關(guān)系,但在目前的標(biāo)注環(huán)境下,對本借關(guān)系類型字段進(jìn)行標(biāo)注時(shí)只能標(biāo)注一種關(guān)系類型;其二,由于本借關(guān)系界面的字頭以字形作為區(qū)別性特征,但不同文獻(xiàn)例證中出現(xiàn)的同一組字存在構(gòu)成不同類型的本借關(guān)系且其中某一字在兩個(gè)文獻(xiàn)中古音可能存在差別的情況,在標(biāo)注時(shí)需要分別進(jìn)行標(biāo)注,但目前的標(biāo)注環(huán)境還無法做到將形體相同、古音不同的字形分別標(biāo)注,有待完善。

(三)本借關(guān)系界面標(biāo)注實(shí)例分析

1.反—返?!墩f文解字·又部》:“反,覆也。”[4]233后引申出“返回”義,后為此義新造“返”字形?!墩f文解字·辵部》:“返,還也?!盵4]137作“返回”之義時(shí)在古代文獻(xiàn)中 “反”與“返”多通用,例如《史記·魏公子列傳》:“公子往而臣不送,以是知公子恨之復(fù)返也。”[5]117再如《左傳》僖公二十三年:“楚子饗之曰:‘公子若反晉國,則何以報(bào)不谷?’”[6]64又如南朝宋劉義慶《世說新語·文學(xué)》:“丞相與殷共相往反,其馀諸賢,略無所闕?!盵7]39南朝梁丘遲《與陳伯之書》:“夫迷涂(途)知反,往哲是與,不遠(yuǎn)而復(fù),先典悠高?!盵8]44據(jù)以上例證可知,“返回”義在文獻(xiàn)中可作“反”,也可作“返”,屬于同源通用。二字都為“返回”義的本字,“反”為古本字,“返”為后造本字,構(gòu)成本借關(guān)系中古本字與后造本字的關(guān)系。在字書字料庫本借關(guān)系界面標(biāo)注如圖3所示:

圖3 “反”與“返”本借關(guān)系界面標(biāo)注示意圖

2.早—蚤?!墩f文解字·日部》:“早,晨也?!盵4]302本義為早晨?!对娊?jīng)·召南·小星》疏:“晨初為早?!盵9]22《說文解字·蟲部》:“蚤,□人跳蟲也?!盵4]1113本義為會(huì)咬人的跳蚤。二字意義毫不相關(guān),但古人在本該用“早”這一字形時(shí)多借用“蚤”。例如《詩經(jīng)·豳風(fēng)·七月》:“四之日其蚤,獻(xiàn)羔祭韭?!盵9]222又如《史記·秦始皇本紀(jì)》:“公何不蚤告我?”[5]206“早”與“蚤”在上古均屬精母幽部,二字構(gòu)成漢字本借關(guān)系中本字與通假字的關(guān)系。在字書字料庫本借關(guān)系界面標(biāo)注如圖4所示:

3.容—由?!墩f文解字·宀部》:“容,盛也。”[4]579本義為盛受,在部分文獻(xiàn)典籍中被借作表“使用”之義,為“用”之借字,二字構(gòu)成本借關(guān)系中本字與通假字的關(guān)系。例如《左傳》昭公元年:“中聲以降,五降之后,不容彈矣?!盵6]168又如《荀子·大略》:“有分義,則容天下而治?!盵10]293而“由”字在古代文獻(xiàn)中亦存在被借作表“使用”之義,是用之借字,二字構(gòu)成本字與通假字之關(guān)系,例如《左傳》襄公三十年:“以晉國之多虞,不能由吾子,使吾子辱在泥涂久矣?!盵6]300因此,“由”與“容”在“使用”義上同屬“用”之通假字,構(gòu)成通假字與通假字之關(guān)系。在字書字料庫本借關(guān)系界面標(biāo)注如圖5所示:

圖5 “容”與“由”在本借關(guān)系界面標(biāo)注示意圖

圖6 “直”與“值”在本借關(guān)系界面標(biāo)注示意圖

三、字書字料庫中本借關(guān)系標(biāo)注的應(yīng)用研究

字書字料庫本借關(guān)系界面標(biāo)注完成后的應(yīng)用是標(biāo)注的主要目的,因此對于此界面標(biāo)注完成后如何應(yīng)用的研究同樣十分重要。字書字料庫作為新興的漢字學(xué)研究工具,它不僅能夠通過自身的優(yōu)勢對已有的漢字學(xué)研究成果進(jìn)行驗(yàn)證,還能夠使傳統(tǒng)漢字學(xué)從新視角得到闡釋并產(chǎn)生新的發(fā)現(xiàn)。就本借關(guān)系而言,一旦此界面標(biāo)注完成的數(shù)據(jù)達(dá)到一定規(guī)模后,不僅漢字學(xué)理論方面的研究得以應(yīng)用,包括音韻學(xué)、訓(xùn)詁學(xué)、教育等領(lǐng)域皆可獲益。下面對本借關(guān)系標(biāo)注完成后可應(yīng)用的領(lǐng)域進(jìn)行介紹,說明本借關(guān)系標(biāo)注在研究應(yīng)用方面的作用。

(一)本借關(guān)系標(biāo)注與漢字學(xué)本體研究

字書字料庫可以為漢字學(xué)研究提供大量的漢字本借關(guān)系信息,待標(biāo)注完成后,利用字書字料庫的數(shù)據(jù)統(tǒng)計(jì)功能對漢字本借關(guān)系的各字段進(jìn)行數(shù)據(jù)統(tǒng)計(jì),可對漢字本借關(guān)系進(jìn)行全面而系統(tǒng)的了解與認(rèn)識(shí),同時(shí)還能夠驗(yàn)證已有的關(guān)于漢字本借關(guān)系的研究成果,意義重大。例如部分學(xué)者在對“通假”的界定中多有“通假只是甲字通乙字,而乙字絕不能代替甲字”的論斷,在對本借關(guān)系中本字與通假字的關(guān)系研究過程中,筆者發(fā)現(xiàn)上述論斷還很值得商榷。部分構(gòu)成本借關(guān)系中本字與通假字關(guān)系的字組都可互為通假字,稱之為“互通”。學(xué)界對于通假字的研究中也存在類似于“單通”“互通”的分類,很多學(xué)者都認(rèn)為通假字中“單通”的數(shù)量是遠(yuǎn)大于“互通”的,待字書字料庫漢字本借關(guān)系界面完善后,增設(shè)“單通”與“互通”的字段,待標(biāo)注完成后,使用者可以通過對本字與通假字關(guān)系中構(gòu)成單通、互通通假關(guān)系的數(shù)量進(jìn)行統(tǒng)計(jì),以對上述觀點(diǎn)進(jìn)行驗(yàn)證。

(二)本借關(guān)系標(biāo)注與字典辭書編纂

以往字典、辭書的編纂工作基本上依靠人工來完成,效率較低,失誤率較高。在字際關(guān)系溝通方面較多依賴人工進(jìn)行,因所依據(jù)資料數(shù)量與質(zhì)量的限制難免出現(xiàn)失誤,字書字料庫可為以上工作提供大量的資料,待字書字料庫本借關(guān)系界面標(biāo)注完成后,字典辭書的編纂者可借助字書字料庫對字典辭書中字頭的字際關(guān)系進(jìn)行溝通,即可通過查閱字書字料庫中相關(guān)字料信息并加以分析取舍,從而對相關(guān)字料進(jìn)行本借關(guān)系的溝通。

(三)本借關(guān)系標(biāo)注與大中小學(xué)語文教材中古詩文的注釋

語文教材是語文學(xué)習(xí)的重要組成部分,它既是教師教學(xué)的主要依據(jù),又是學(xué)生學(xué)習(xí)的重要憑借,因此語文教材編寫的優(yōu)與劣將直接影響到學(xué)生學(xué)習(xí)語文的好壞。古詩文是語文教材內(nèi)容中重要的組成部分,古詩文注釋是學(xué)生讀懂古詩文的重要工具,但大多古詩文注釋存在著字際關(guān)系溝通錯(cuò)誤、注釋術(shù)語混用等問題。漢字本借關(guān)系界面標(biāo)注完成后,可為教材編纂者提供大量漢字本借關(guān)系的資料,教材編纂者可利用字書字料庫對古詩文中的漢字字際關(guān)系進(jìn)行溝通,特別是古本字與后造本字、本字與通假字的溝通與注釋。

(四)本借關(guān)系標(biāo)注與音韻學(xué)研究

通假字判定的主要依據(jù)為古音相同或相近,因此在對中古音和上古音進(jìn)行研究時(shí),通假字是重要的研究材料。學(xué)界目前對于音韻學(xué)的研究多是基于各種語言材料的舉例性論證,這種方式更加注重語言材料的多樣化,能夠顯示出某種語言規(guī)律所具有的普遍性和必然性,但也往往會(huì)忽略語言材料的系統(tǒng)性和完整性。因此,待字書字料庫漢字本借關(guān)系界面標(biāo)注完成后,可借助字書字料庫本借關(guān)系界面的某一部或幾部字書對文獻(xiàn)中的通假字某韻部字與各聲紐的關(guān)系進(jìn)行考察,可對已有的古音研究成果進(jìn)行驗(yàn)證,亦可有所突破。下面筆者以《通用規(guī)范漢字字典》中構(gòu)成本借關(guān)系的明母字與其他聲母字通假頻次的數(shù)據(jù)統(tǒng)計(jì)為例,簡要說明本借關(guān)系標(biāo)注在音韻學(xué)方面的應(yīng)用。

李方桂先生提出了“唇塞音互諧,不常跟鼻音(明)互諧”[13]15這一諧聲原則,說明明母字不常與“幫滂並”三母相互通假。筆者試圖以本借關(guān)系界面已經(jīng)標(biāo)注完成的《通用規(guī)范漢字字典》中所涉及的明母字通假頻次數(shù)據(jù)統(tǒng)計(jì)為例證,為李方桂先生的論斷提供佐證。具體操作過程為:以字書字料庫公共界面的高級查詢功能為研究工具,首先統(tǒng)計(jì)出《通用規(guī)范漢字字典》中存在本借關(guān)系的明母字?jǐn)?shù)量,即主輔字頭中存在明母字本借關(guān)系的組數(shù)。其次,對與明母字字頭構(gòu)成本借關(guān)系字頭的上古聲紐地位分別進(jìn)行統(tǒng)計(jì),詳見表1。

表1 明母字通假頻次統(tǒng)計(jì)數(shù)據(jù)

從表1中可以看出明母與同部位塞音間有著非常明顯的界限,表中明母與幫母相通28次,與滂母相通僅5次,與並母相通僅10次,三母與明母相通僅占明母所有通假次數(shù)(425)的10.12%。這一數(shù)據(jù)與李方桂先生所言“唇塞音互諧,不常跟鼻音互諧”這一聲韻原則是相符合的。但明母與同部位塞音還有一小部分可以互諧,關(guān)系較為密切,因此二者亦不能截然分開。

四、結(jié)語

本文依托渤海大學(xué)字書字料庫(CCFD)對字書字料庫漢字本借關(guān)系標(biāo)注從理論、實(shí)踐、應(yīng)用三個(gè)方面進(jìn)行了研究探討。首先,在理論方面,探討了在字書字料庫本借關(guān)系界面標(biāo)注時(shí)應(yīng)遵循的原則,主要包括標(biāo)注所依據(jù)資料的多元化原則、主客觀相結(jié)合原則、規(guī)范性原則、更新補(bǔ)充原則、獨(dú)立性原則等,還介紹了標(biāo)注的內(nèi)容、標(biāo)注的方式、標(biāo)注的流程等理論問題,初步建立了字書字料庫本借關(guān)系界面標(biāo)注的理論基礎(chǔ);其次,在實(shí)踐方面,介紹了現(xiàn)階段本借關(guān)系界面的標(biāo)注框架,并對標(biāo)注實(shí)踐過程中所發(fā)現(xiàn)的現(xiàn)有標(biāo)注框架的不足進(jìn)行了總結(jié);最后,在應(yīng)用方面,設(shè)想了本借關(guān)系界面標(biāo)注完成后所能夠應(yīng)用的領(lǐng)域及解決的問題。

雖然字書字料庫本借關(guān)系界面標(biāo)注不論在理論建設(shè)方面還是在具體實(shí)踐方面都仍處于初級階段,還有很多問題亟待進(jìn)行深入地討論研究。但筆者相信,隨著本借關(guān)系標(biāo)注實(shí)踐的深入開展,以上問題就會(huì)陸續(xù)得到解決。標(biāo)注實(shí)踐中所形成的本借關(guān)系標(biāo)注理論會(huì)愈加符合本借關(guān)系實(shí)際,本借關(guān)系界面標(biāo)注框架和標(biāo)注環(huán)境也會(huì)朝著科學(xué)化、便捷化的方向邁進(jìn)。字書字料庫本借關(guān)系界面的發(fā)展也會(huì)為漢字學(xué)及相關(guān)學(xué)科的研究提供更多便利,帶來更多新的研究成果。

猜你喜歡
字書字頭界面
善讀無字之書
第六講 橫折彎、三點(diǎn)水、人字頭的寫法
不同截面類型鋼管RPC界面粘結(jié)性能對比研究
微重力下兩相控溫型儲(chǔ)液器內(nèi)氣液界面仿真分析
國企黨委前置研究的“四個(gè)界面”
康有為藏西夏字書《同音》殘葉版本考
“家”字的寫法
《羊字頭》教學(xué)設(shè)計(jì)
“家”字的寫法
雁字書