摘 要:
文章分析了四角號(hào)碼著者號(hào)產(chǎn)生重號(hào)的原因,通過(guò)借鑒漢語(yǔ)拼音輸入法中雙拼輸入模式的設(shè)計(jì)原理設(shè)計(jì)雙拼著者號(hào),并輔以實(shí)例證明雙拼著者號(hào)的設(shè)計(jì)可行性,一定程度上解決了傳統(tǒng)拼號(hào)法著者號(hào)無(wú)法較好兼顧重號(hào)的問(wèn)題,以期對(duì)圖書(shū)館書(shū)目管理及讀者閱讀體驗(yàn)有所助益。
關(guān)鍵詞:
書(shū)次號(hào);著者號(hào);漢語(yǔ)拼音;雙拼著者號(hào);四角號(hào)碼
中圖分類(lèi)號(hào):G254.13??? 文獻(xiàn)標(biāo)識(shí)碼:A?? 文章編號(hào):
1003-7136(2023)01-0035-04
The Compilation Method of the Binary-syllabification Author Number
LU Wei
Abstract:
This paper analyzes the reasons for the repetition of author number of the four-corner number,designs the binary-syllabification author number by referring to the design principle of the binary-syllabification input pattern in the Chinese Pinyin input method,and proves the design feasibility of the binary-syllabification author number with an example,which solves the problem that the traditional spelling author number cannot give consideration to the duplicate number to some extent,so as to improve the library bibliography management and the reader′s reading experience.
Keywords:
book number;author number;Chinese Pinyin;the binary-syllabification author number;the four-corner number
0 引言
著者號(hào)是書(shū)次號(hào)的一種,一直受到不少圖書(shū)館的青睞,主要原因是著者號(hào)能集中同一著者的同一類(lèi)書(shū)、同種書(shū)的不同版本、分次到館的多卷書(shū)、連續(xù)出版物等[1],對(duì)提升開(kāi)架借閱方式下讀者的圖書(shū)查找體驗(yàn)尤為有利。此外,相較于另一種書(shū)次號(hào)類(lèi)型種次號(hào),著者號(hào)取號(hào)時(shí)不依賴(lài)已有館藏,因此更有利于書(shū)次號(hào)的標(biāo)準(zhǔn)化。盡管著者號(hào)具有上述諸多優(yōu)點(diǎn),但至今仍沒(méi)有一種著者號(hào)能在全國(guó)得到廣泛認(rèn)可和應(yīng)用。但是,這并不妨礙各館從已有的眾多著者號(hào)編制方法中選用最符合本館需求的方法,以筆者所在的廣西壯族自治區(qū)為例,從省級(jí)到縣級(jí)公共圖書(shū)館多采用四角號(hào)碼著者號(hào)。四角號(hào)碼著者號(hào)是一種常見(jiàn)的拼號(hào)法著者號(hào),脫胎于四角號(hào)碼檢字法,依據(jù)漢字筆形取號(hào),對(duì)中文古籍文獻(xiàn)索引來(lái)說(shuō)十分便利,也不存在查號(hào)法著者號(hào)增字配號(hào)的問(wèn)題,但四角號(hào)碼著者號(hào)存在其他問(wèn)題,其中以重號(hào)問(wèn)題最為突出。下面筆者將從四角號(hào)碼著者號(hào)的重號(hào)問(wèn)題入手,分析其產(chǎn)生重號(hào)的原因并嘗試設(shè)計(jì)一種全新的著者號(hào)。
1 四角號(hào)碼著者號(hào)的重號(hào)問(wèn)題
在分析四角號(hào)碼著者號(hào)產(chǎn)生重號(hào)的具體原因前,一些與四角號(hào)碼著者號(hào)相關(guān)的實(shí)踐經(jīng)驗(yàn)是值得先行討論的。首先,四角號(hào)碼著者號(hào)的編制重心通常放在著者首字,其他字為輔;其次,四角號(hào)碼著者號(hào)一般只取著者首字的兩角號(hào)碼,而兩位數(shù)字的編碼容量?jī)H為100,所以重號(hào)是無(wú)法避免的;再次,著者首字的出現(xiàn)頻率有高低之分,優(yōu)先將高頻著者首字的號(hào)碼區(qū)分開(kāi),有利于從整體上控制著者首字的重號(hào)規(guī)模。綜上所述,若要評(píng)估四角號(hào)碼著者號(hào)的重號(hào)規(guī)模,可以將高頻著者首字集合作為待評(píng)估的漢字集合,漢字?jǐn)?shù)量則與兩位數(shù)字的編碼容量一致。
至于高頻著者首字集合該收錄哪些漢字,中文普通圖書(shū)的著者類(lèi)型有多種,除本名外還有筆名、少數(shù)民族名、外文名等,但本名仍是主流,所以本名中的傳統(tǒng)姓氏將是高頻著者首字集合的重要來(lái)源。公安部戶(hù)政管理研究中心2021年2月發(fā)布的《二〇二〇年全國(guó)姓名報(bào)告》顯示:按戶(hù)籍人口數(shù)量排名,2020年的“百家姓”與2019年相比變化不大;“王”“李”“張”“劉”“陳”依舊名列前五,五大姓氏人口總數(shù)占全國(guó)戶(hù)籍總?cè)丝诘?0.8%[2]。據(jù)此可以明確以下信息:“百家姓”總體上是穩(wěn)定的;“百家姓”的人口在全國(guó)總?cè)丝谥姓急容^高。因此筆者把“百家姓”整體確定為高頻著者首字集合,并對(duì)“百家姓”的姓氏取前兩角四角號(hào)碼后統(tǒng)計(jì)重號(hào)情況,結(jié)果顯示重號(hào)最多的是號(hào)碼10和44,數(shù)量分別達(dá)到10和11,號(hào)碼10對(duì)應(yīng)的姓氏有“王”“于”“丁”“石”“賈”“夏”“雷”“萬(wàn)”“覃”“嚴(yán)”,號(hào)碼44對(duì)應(yīng)的姓氏有“黃”“趙”“林”“董”“蔡”“蔣”“杜”“蘇”“范”“薛”“莫”,由此可見(jiàn)四角號(hào)碼著者號(hào)的重號(hào)規(guī)模并不小。經(jīng)統(tǒng)計(jì),“百家姓”范圍內(nèi)四角號(hào)碼著者號(hào)重號(hào)率高達(dá)78%,究其原因是一些漢字的偏旁部首常常占用兩個(gè)甚至更多角而使得這些漢字的四角號(hào)碼喪失了區(qū)分性,所以?xún)山撬慕翘?hào)碼是不足以區(qū)分“百家姓”的,只有通過(guò)增加取角的數(shù)量或其他漢字特征才能使“百家姓”進(jìn)一步區(qū)分開(kāi)來(lái),不過(guò)這會(huì)導(dǎo)致號(hào)碼變得更長(zhǎng),所以四角號(hào)碼著者號(hào)的重號(hào)問(wèn)題分析到這里似乎陷入了一個(gè)兩難的境地。
2 雙拼著者號(hào)的設(shè)計(jì)原理
四角號(hào)碼著者號(hào)的重號(hào)問(wèn)題或者說(shuō)如何兼顧重號(hào)與碼長(zhǎng)的問(wèn)題,不僅困擾著四角號(hào)碼著者號(hào),也困擾著其他拼號(hào)法著者號(hào),但解決途徑是有的。在計(jì)算機(jī)漢語(yǔ)拼音輸入法中就存在一種雙拼輸入模式,習(xí)慣上稱(chēng)之為雙拼輸入法,與傳統(tǒng)的全拼輸入模式需要輸入全部拼音(聲母和韻母,通常不包括聲調(diào))的方式不一樣,雙拼輸入法是將所有拼音的聲母和韻母分別映射到鍵盤(pán)上的某個(gè)字母鍵上,由于輸入時(shí)只需按兩下按鍵就能達(dá)到和全拼一樣的效果,所以在輸入效率上雙拼要高于全拼。在區(qū)分卷舌音和平舌音的情況下,漢語(yǔ)拼音中共23個(gè)聲母,在雙拼輸入法中,除卷舌音的聲母映射到一些無(wú)法用作聲母的字母鍵外,其他聲母都是映射到與之一致的字母鍵上,如圖1智能 ABC雙拼方案所示,聲母zh、ch、sh分別映射到了A、E、V三個(gè)鍵上。韻母方面,漢語(yǔ)拼音中共35個(gè)韻母,這顯然無(wú)法與鍵盤(pán)上的26個(gè)字母鍵一一映射,在各類(lèi)雙拼方案中這個(gè)問(wèn)題都是通過(guò)對(duì)若干韻母編組的方法來(lái)解決的,這些雙拼方案并沒(méi)有因?yàn)榫幗M了韻母而產(chǎn)生重號(hào),原因是雙拼輸入法的設(shè)計(jì)者在編組若干韻母前已通過(guò)統(tǒng)計(jì)手段保證了與這些韻母可相拼的聲母是沒(méi)有相同的。以韻母iang和uang為例,與韻母iang可相拼的聲母有n、l、j、q、x,與韻母uang可相拼的聲母有g(shù)、k、h、zh、ch、sh,兩組聲母并無(wú)交集,如圖1所示韻母iang和uang都映射到字母鍵T上。
因此,筆者也希望通過(guò)參考雙拼輸入法的編組原理來(lái)設(shè)計(jì)一種全新的拼號(hào)法雙拼著者號(hào),為對(duì)標(biāo)四角號(hào)碼著者號(hào),雙拼著者號(hào)使用兩位數(shù)字對(duì)漢語(yǔ)拼音編碼,即一位數(shù)字表示聲母,一位數(shù)字表示韻母,由于數(shù)字相較字母的編碼容量要小得多,不僅韻母與數(shù)字無(wú)法一一映射,聲母與數(shù)字也無(wú)法一一映射,因此要求聲母和韻母都必須編組。此外,雙拼著者號(hào)還兼顧著“百家姓”范圍內(nèi)少重號(hào)甚至無(wú)重號(hào)這一重要目標(biāo),要實(shí)現(xiàn)這個(gè)目標(biāo),把“百家姓”引入雙拼著者號(hào)設(shè)計(jì)環(huán)節(jié)作為設(shè)計(jì)條件直接干預(yù)聲母和韻母編組是唯一的辦法。循此思路,筆者專(zhuān)門(mén)為雙拼著者號(hào)設(shè)置了以下兩類(lèi)條件:一是聲母編組條件,“百家姓”范圍內(nèi)若與兩聲母相拼的韻母不存在相同的,且這些韻母?jìng)€(gè)數(shù)之和小于等于10,則兩聲母可編為一組,漢語(yǔ)拼音中的23個(gè)聲母須全部參與編組,共10組;二是韻母編組條件,以完成的聲母編組為參考,“百家姓”范圍內(nèi)若與兩韻母相拼的聲母所在的編組不存在相同的,則兩韻母可編為一組,漢語(yǔ)拼音中的35個(gè)韻母須全部參與編組,共10組。
3 雙拼著者號(hào)的設(shè)計(jì)過(guò)程
首先是對(duì)聲母進(jìn)行編組,以聲母c和x為例,“百家姓”范圍內(nèi)與聲母c相拼的韻母有:ao、ai、ui,與聲母x相拼的韻母有:ü、ie、iao、ia、iong、üe、iang,由于這些韻母不存在相同的且這些韻母的個(gè)數(shù)之和為10,所以聲母c和x可編為一組。如法炮制,在經(jīng)過(guò)大量嘗試后筆者得到了完整的聲母編組,
即{l}、{f,q,b}、{m,w,n}、{d,t}、{zh,j}、{z,g,r}、{ch,h}、{c,x}、{sh,p,k}、{s,y}。至于“百家姓”范圍內(nèi)未出現(xiàn)的聲母n,則可置入任一聲母編組中。值得一提的是,作為符合條件的聲母編組表并不是唯一的,任何符合條件的聲母編組表都可作為候選表進(jìn)入韻母編組階段。
其次是對(duì)韻母進(jìn)行編組,以韻母u和üe為例,“百家姓”范圍內(nèi)與韻母u相拼的聲母所在的編組有:{l}、{f,q,b}、{m,w,n}、{d,t}、{zh,j}、{z,g,r}、{ch,h}、{s,y},與韻母üe相拼的聲母所在的編組有{c,x},由于不存在相同的聲母編組,所以韻母u和üe可編為一組。與之前討論過(guò)的雙拼輸入法中韻母iang和uang編組的規(guī)律一樣,類(lèi)似的規(guī)律還存在于iong和ong、ia和ua、un和ün、uan和üan、uai和üe等韻母之間,可以?xún)?yōu)先將這類(lèi)韻母編為一組,但是過(guò)程中應(yīng)注意度的問(wèn)題,過(guò)度運(yùn)用這些規(guī)律會(huì)導(dǎo)致韻母編組進(jìn)程受阻以致無(wú)法完成最終的編組任務(wù)。同樣在經(jīng)過(guò)大量嘗試后筆者最終得到了完整的韻母編組,即{u,üe,uai}、{ong,iong,a}、{iang,uang,uan,üan}、{in,en,ing,ie}、{ü,ian,ou,o}、{iu,ao,er}、{iao,eng,un,ün}、{ai,e,ei}、{uo,ia,an,ua}、{i,ang,ui}
,其間還對(duì)“百家姓”范圍內(nèi)未出現(xiàn)的韻母er、ua、uai、ün也做了編配。與聲母編組表類(lèi)似,作為符合條件的韻母編組表也不是唯一的。
但是,有一種極端情況是依據(jù)所確定的高頻著者首字集合無(wú)法找到任何符合條件的聲母編組表,或存在符合條件的聲母編組表但不存在符合條件的韻母編組表,無(wú)論哪一種情況都只能在調(diào)整高頻著者首字集合后再次嘗試編組,直至同時(shí)找到符合條件的聲母編組表和韻母編組表。在結(jié)合聲母編組和韻母編組并為其統(tǒng)一分配數(shù)字編碼后,雙拼著者號(hào)編碼表如表1所示。
此時(shí)可對(duì)雙拼著者號(hào)的基本取號(hào)規(guī)則作如下規(guī)定:參照表1分別對(duì)著者首字聲母、首字韻母、次字聲母、第三字聲母取號(hào);漢字無(wú)聲母的取0;著者不足三字的,缺字部分也取0。應(yīng)用以上取號(hào)規(guī)則即可得到一個(gè)由四位數(shù)字構(gòu)成的著者號(hào),如張愛(ài)玲的著者號(hào)為4900,錢(qián)鐘書(shū)的著者號(hào)為1448,冰心的著者號(hào)為1370。當(dāng)然,上述取號(hào)規(guī)則只針對(duì)著者的常見(jiàn)形式,實(shí)際出版物的著者五花八門(mén),但對(duì)這類(lèi)特殊著者如何取號(hào)不屬于本文討論的范疇,這里不再展開(kāi)。
4 對(duì)雙拼著者號(hào)的評(píng)價(jià)
與評(píng)估四角號(hào)碼著者號(hào)重號(hào)規(guī)模的方式近似,筆者根據(jù)雙拼著者號(hào)碼表對(duì)“百家姓”中姓氏的聲母、韻母分別進(jìn)行了取號(hào),結(jié)果詳見(jiàn)表2。經(jīng)統(tǒng)計(jì),“百家姓”范圍內(nèi)雙拼著者號(hào)的重號(hào)率只有25%,遠(yuǎn)低于四角號(hào)碼著者號(hào)的重號(hào)率,由于雙拼著者號(hào)是以結(jié)果為導(dǎo)向進(jìn)行編制的,所以其最終的設(shè)計(jì)結(jié)果自然也符合預(yù)期目標(biāo)。優(yōu)勢(shì)方面:雙拼著者號(hào)依據(jù)漢語(yǔ)全拼來(lái)編制著者號(hào)碼表,保留了漢字相對(duì)完整的拼音特征,從著者的排序效果來(lái)看比較直觀,且取號(hào)簡(jiǎn)單,易于規(guī)范,新生代館員從義務(wù)教育階段就接受漢語(yǔ)拼音教育,無(wú)需再開(kāi)展專(zhuān)門(mén)的著者號(hào)使用培訓(xùn)。不足方面:“百家姓”范圍內(nèi)仍存在少量重號(hào),如“江”“姜”“蔣”等同音姓氏,但在實(shí)際使用過(guò)程中這類(lèi)重號(hào)通常不會(huì)對(duì)讀者造成大的困擾;其次,由于同音姓氏的存在,結(jié)果中有13個(gè)號(hào)碼未被使用,這意味著雙拼著者號(hào)還有改進(jìn)的空間,可在對(duì)包括“百家姓”在內(nèi)的高頻著者首字進(jìn)一步調(diào)查統(tǒng)計(jì)的基礎(chǔ)上,通過(guò)適當(dāng)擴(kuò)大高頻著者首字的范圍來(lái)使用這些剩余號(hào)碼;再次,結(jié)果中還出現(xiàn)了同一聲母編組內(nèi)不同聲母的姓氏混合排列的現(xiàn)象,如表2中從90到99的號(hào)碼中,聲母為s和y的姓氏是交替出現(xiàn)的,這是由編組操作伴生而來(lái)的,是無(wú)法消除的;最后,雙拼著者號(hào)的編制目前完全依靠人工完成,自動(dòng)化編制工具的設(shè)計(jì)將有利于提高雙拼著者號(hào)的編制效率,輔助館員在多種可行性方案之間做出更優(yōu)的選擇。
5 結(jié)語(yǔ)
筆者通過(guò)借鑒雙拼輸入法的編組原理提出了雙拼著者號(hào)的設(shè)想,并用實(shí)例證明了雙拼著者號(hào)的設(shè)計(jì)可行性,一定程度上解決了傳統(tǒng)拼號(hào)法著者號(hào)無(wú)法較好兼顧重號(hào)的問(wèn)題。此外,雙拼著者號(hào)的價(jià)值并不局限于編制出某個(gè)具體的雙拼著者號(hào)碼表,還在于它提供了一種普適的方法,使得各館可根據(jù)各自館藏文獻(xiàn)的著者情況來(lái)確定高頻著者首字集合的收錄內(nèi)容,并結(jié)合自定義的設(shè)計(jì)條件編制出更適合本館的雙拼著者號(hào)碼表,甚至可以拓展設(shè)計(jì)范圍,將雙拼著者號(hào)的編制方法應(yīng)用于用字同樣相對(duì)集中的報(bào)刊名號(hào)碼表的設(shè)計(jì)中。
參考文獻(xiàn):
[1]張秀芬.淺議著者號(hào)與種次號(hào)[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010,20(31):63-65.
[2]公安部戶(hù)政管理研究中心.《二○二○年全國(guó)姓名報(bào)告》發(fā)布[EB/OL].(2021-02-08)[2021-08-22].https://www.mps.gov.cn/n2253534/n2253535/c7725981/content.html.
作者簡(jiǎn)介:
陸偉(1980— ),男,大學(xué)本科,助理館員,任職于廣西壯族自治區(qū)柳州市鹿寨縣圖書(shū)館。研究方向:圖書(shū)流通服務(wù)、館藏發(fā)展、圖書(shū)館服務(wù)模式。