国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國(guó)際標(biāo)準(zhǔn)ISO 7098中文羅馬字母拼寫法的修訂:從WD到DIS

2016-08-06 02:30:09馮志偉
關(guān)鍵詞:譯音歧義音節(jié)

馮志偉

?

□ 語(yǔ)文現(xiàn)代化

國(guó)際標(biāo)準(zhǔn)ISO 7098中文羅馬字母拼寫法的修訂:從WD到DIS

馮志偉

[摘要]2011年5月,在ISO/TC 46第38屆全體會(huì)議(悉尼)上,中國(guó)代表提出修改ISO 7098:1991以適應(yīng)當(dāng)前中文羅馬字母拼寫法在中國(guó)乃至世界的實(shí)際需要。2012年5月11日,ISO/TC 46第39屆全體會(huì)議(柏林)通過(guò)決議,接受中國(guó)提案作為ISO 7098的工作草案(Working Draft,簡(jiǎn)稱WD)。2013年11月5日,委員會(huì)草案(Committee Draft,簡(jiǎn)稱CD)經(jīng)過(guò)ISO/TC 46各國(guó)投票獲得通過(guò)。2015年3月1日,國(guó)際標(biāo)準(zhǔn)草案(Draft of International Standard,簡(jiǎn)稱DIS)經(jīng)過(guò)ISO/TC 46各國(guó)投票獲得通過(guò)。2015年6月5日,ISO/TC 46第42體會(huì)議(北京)通過(guò)決議,決定進(jìn)行委員會(huì)內(nèi)部投票(Committee Internal Balloting,簡(jiǎn)稱CIB),由WG3(Working Group 3,ISO/TC 46第3工作組)根據(jù)DIS投票結(jié)果編輯之后出版ISO 7098的DIS修訂稿。2015年9月18日,CIB投票獲得通過(guò),2015年12月15日,ISO 7098:2015由ISO總部正式出版。本文介紹ISO 7098修訂工作從WD到DIS的整個(gè)過(guò)程。

[關(guān)鍵詞]ISO 7098;中文羅馬字母拼寫法;委員會(huì)草案;國(guó)際標(biāo)準(zhǔn)草案;漢語(yǔ)拼音音節(jié)的歧義指數(shù)

我在《關(guān)于修訂中文羅馬字母拼寫法國(guó)際標(biāo)準(zhǔn)ISO 7098(1991)的情況說(shuō)明》一文中,介紹了ISO 7098:1991前期的修訂情況[1]:1979年,在華沙召開的國(guó)際標(biāo)準(zhǔn)化組織第46技術(shù)委員會(huì)(ISO/TC 46)上,中國(guó)代表提出把《漢語(yǔ)拼音方案》作為國(guó)際標(biāo)準(zhǔn)的建議。[2-3]1982年,在南京召開的ISO/TC 46會(huì)議上,ISO 7098獲得通過(guò)并作為第1版出版。1991年,ISO 7098做了一些技術(shù)上的修改,出版了ISO 7098:1991。2011年5月,在悉尼召開的ISO/TC 46第38屆會(huì)議上,我國(guó)代表馮志偉提出了修改國(guó)際標(biāo)準(zhǔn)《ISO 7098信息與文獻(xiàn)——中文羅馬字母拼寫法》(1991)的建議,并于會(huì)后正式向國(guó)際標(biāo)準(zhǔn)化組織提出了修訂提案(提案號(hào):N2358)。2012年5月,于柏林召開的ISO/TC 46第39屆會(huì)議接受了我國(guó)的提案,將N2358號(hào)提案直接作為ISO 7098的工作草案(Working Draft,簡(jiǎn)稱WD),成立了由中國(guó)、俄羅斯、德國(guó)、美國(guó)、加拿大5國(guó)專家組成ISO 7098國(guó)際修訂工作組,并任命馮志偉擔(dān)任國(guó)際工作組組長(zhǎng),開始委員會(huì)草案(Committee Draft,簡(jiǎn)稱CD)的起草。

本文將進(jìn)一步介紹委員會(huì)草案(CD)、國(guó)際標(biāo)準(zhǔn)草案(Draft of International Standard,簡(jiǎn)稱DIS)的修訂情況以及修訂的技術(shù)內(nèi)容。

一、CD的起草和投票

柏林會(huì)議之后,我國(guó)就積極地開始了ISO 7098委員會(huì)草案(CD)的起草工作,CD草案英文本由馮志偉執(zhí)筆。這個(gè)CD稿的主要修改內(nèi)容如下:

(一)在“音節(jié)形式”這一節(jié),增加了有關(guān)漢語(yǔ)拼音的聲母、韻母的內(nèi)容

通常一個(gè)漢字代表一個(gè)音節(jié),一個(gè)詞可以由一個(gè)或幾個(gè)音節(jié)組成。漢語(yǔ)普通話中的音節(jié)可以分為聲母(initial)和韻母(final)兩部分。

聲母包括:

雙唇音(bilabial):b,p,m

唇齒音(labio-dental):f

舌面前音(dorso-prepalatal):d,t,n,l

舌根音(dorso-velar):g,k,h

舌尖前音(apico-alveolar):z,c,s

舌尖后音(apico-postalveolar):zh,ch,sh,r

舌面音(dorso-palatal):j,q,x

零聲母(zero initial)

韻母包括:

合口呼韻母(在ISO 7098的英語(yǔ)文本中,使用Articulation B來(lái)代表合口呼):以u(píng)開頭的韻母,如u,ua,uo,uai,uei,uan,uen,uang,ueng,ong。

齊齒呼韻母(在ISO 7098的英語(yǔ)文本中,使用Articulation C來(lái)代表齊齒呼):以i開頭的韻母,如i,ia,ie,iao,iou,ian,in,iang,ing。

撮口呼韻母(在ISO 7098的英語(yǔ)文本中,使用Articulation D來(lái)代表撮口呼):以ü開頭的韻母,如ü,üe,üan,ün,iong。

在這個(gè)CD稿的附錄A中,修改了漢語(yǔ)普通話的音節(jié)形式總表,調(diào)整了聲母的排列順序。這個(gè)總表中的音節(jié),覆蓋了漢語(yǔ)普通話中除了er和ê之外的所有音節(jié)。

(二)對(duì)于漢語(yǔ)拼音聲調(diào)進(jìn)一步作了說(shuō)明和圖示

漢語(yǔ)是一種有聲調(diào)的語(yǔ)言。這意味著,聲調(diào)會(huì)影響意義。具有不同聲調(diào)的同樣一個(gè)音節(jié),其意義可能有很大的不同。每個(gè)音節(jié)可以具有四個(gè)聲調(diào)中的一個(gè),也可以沒有聲調(diào)。在這個(gè)CD稿中,對(duì)于普通話的四個(gè)聲調(diào)符號(hào),加圓括號(hào)進(jìn)一步說(shuō)明了它們的性質(zhì):

一聲(高平調(diào)): —

二聲(升調(diào)): /

三聲(降/升調(diào)): ∨

四聲(降調(diào)):

并且增加了如下的圖示(見圖1、圖2):

又分別圖示如下:

這樣更便于國(guó)外用戶理解漢語(yǔ)普通話聲調(diào)的性質(zhì)。

(三)提出了命名實(shí)體的拼寫規(guī)則

目前在國(guó)際范圍內(nèi)全面實(shí)行漢語(yǔ)拼音的分詞連寫還有相當(dāng)?shù)睦щy,如果我們?cè)贑D修訂稿中提出全面實(shí)行漢語(yǔ)拼音的分詞連寫,估計(jì)難以得到其他國(guó)家的支持。不過(guò),如果我們?cè)赪D草案的基礎(chǔ)之上,提出不僅在人名、地名中實(shí)行分詞連寫,還增加對(duì)于語(yǔ)言名、民族名、宗教名實(shí)行分詞連寫,還是有可能得到支持的,因此,我們把人名、地名、語(yǔ)言名、民族名、宗教名統(tǒng)稱為“命名實(shí)體”(naming entity),提出了“命名實(shí)體的拼寫規(guī)則”,在WD中提出人名、地名的拼寫規(guī)則的基礎(chǔ)上,進(jìn)一步提出了語(yǔ)言名、民族名、宗教名的如下拼寫規(guī)則:

1.語(yǔ)言名連寫為一個(gè)單詞,首字母大寫。例如:Hanyu (漢語(yǔ),Chinese)、Yingyu (英語(yǔ),English)、Deyu (德語(yǔ),German)、Fayu (法語(yǔ),F(xiàn)rench)、Xibanyayu (西班牙語(yǔ),Spanish)。

2.民族名和部族名連寫為一個(gè)單詞,首字母大寫。例如:Hanzu (漢族,Chinese ethnic group)、Maolizu(毛利族,Maori tribe)、Maonanzu (毛難族,Maonan ethnic group)、Weiwu’erzu (維吾爾族,Uyghur ethnic group)。

3.宗教名連寫為一個(gè)單詞,首字母大寫。例如:Fojiao (佛教,Buddhism)、Jidujiao (基督教,Christianity)、Tianzhujiao (天主教,Catholicism)、Yisilanjiao (伊斯蘭教,Islamism)。

2013年6月3日至7日在巴黎召開ISO/TC 46第40屆全體會(huì)議,我國(guó)代表馮志偉出席了這次會(huì)議,并在會(huì)議上正式向ISO/TC 46秘書處提交了ISO 7098的CD稿。ISO TC 46接受了我國(guó)的CD稿,并在2013年7月5日至2013年11月5日在各成員國(guó)中進(jìn)行了投票。2013年11月,ISO/TC 46秘書處N2452號(hào)文件公布了投票結(jié)果。投贊成票的國(guó)家(21個(gè)):阿根廷、澳大利亞、加拿大、中國(guó)、捷克、埃及、愛沙尼亞、芬蘭、法國(guó)、伊朗、意大利、肯尼亞、韓國(guó)、摩洛哥、俄羅斯、西班牙、瑞士、泰國(guó)、烏克蘭、英國(guó)、美國(guó)。投反對(duì)票的國(guó)家(1個(gè)):德國(guó)。日本投了棄權(quán)票。由于這個(gè)CD稿得到大多數(shù)國(guó)家的支持,獲得通過(guò)。

德國(guó)、美國(guó)、澳大利亞、加拿大、法國(guó)、俄羅斯、西班牙都提出修改意見。

德國(guó)的意見是:

We reject the rules for the wording of personal and geographic names.This is a fundamental issue for us and leads to the rejection of the CD in total.After some years of individual practice within the German libraries the library community in Germany decided in 2010 to refrain from any wording when romanizing the Chinese characters.Since then we write syllable by syllable separated by blank in our transcriptions.This procedure has been published as best practice and is widely accepted within German libraries.Besides it is a perfect foundation for automated transcription processing that has been established in our cataloguing environments.

[我們反對(duì)人名和地名的分詞連寫規(guī)則。這是我們的一個(gè)基本觀點(diǎn),并且導(dǎo)致我們從總體上反對(duì)這個(gè)CD稿。經(jīng)過(guò)多年來(lái)在德國(guó)圖書館的實(shí)踐之后,德國(guó)圖書館界在2010年決定,在與漢字有關(guān)的漢語(yǔ)拼音工作中,譯音時(shí)不再進(jìn)行分詞連寫。從此之后,我們?cè)跐h字轉(zhuǎn)寫為拼音時(shí),音節(jié)與音節(jié)之間要使用空白分開。這樣的處理方式被認(rèn)為是最好的,并且在德國(guó)圖書館界得到廣泛的接受。此外,在德國(guó)的文獻(xiàn)編目環(huán)境下,這樣的處理方式也成為了中文自動(dòng)譯音信息處理工作的最完美的基礎(chǔ)。]

Concerning personal names we recently are considering wording rules for our authority files (GND);a decision has not been made so far.Within the bibliographic description of books we will continue to give the syllables individually.

[目前,在我們權(quán)威性的文件GND中,我們正在考慮對(duì)于人名實(shí)行按詞連寫,但至今尚未作出決定。因此,在圖書文獻(xiàn)描述中,我們還將繼續(xù)按照一個(gè)一個(gè)的音節(jié)進(jìn)行分寫。]

The suggestions for the wording of geographical names are extremely questionable.German experts mention that the Pinyin rules for wording are not clear and disambiguous enough to make sure that the same name is always transcribed and worded in the same way.Thus the exchange of bibliographical or authoritative data will be hindered.

[對(duì)于地名進(jìn)行分詞連寫的意見是非常成問(wèn)題的。德國(guó)專家已經(jīng)注意到,分詞連寫的拼音規(guī)則是不清楚的,是充滿歧義的,這樣的規(guī)則不能確保同樣一個(gè)地名始終按照同樣的方式譯音,并且始終按照同樣的方式分詞。因此,這將會(huì)阻礙圖書館數(shù)據(jù)或權(quán)威性數(shù)據(jù)的交流。]

Add the Unicode values for the tone marks.

[給每一個(gè)聲調(diào)符號(hào)添加Unicode代碼。]

Add for both the Chinese and the Latin marks the Unicode values.

[給中文標(biāo)點(diǎn)符號(hào)以及拉丁標(biāo)點(diǎn)符號(hào)都添加Unicode代碼。]

美國(guó)東亞圖書館協(xié)會(huì)(The Council on East Asian Libraries,簡(jiǎn)稱CEAL)非常關(guān)注ISO 7098的修訂,他們認(rèn)真地研究了我國(guó)提出的CD稿,并且通過(guò)美國(guó)標(biāo)準(zhǔn)化部門轉(zhuǎn)達(dá)了他們的意見。

美國(guó)的意見是:

The Council on East Asian Libraries (CEAL) supports ISO’s endeavor in this revision.The revised draft mandates most of the practices we currently follow,especially adding transliteration rules for personal and place names.It will enhance global information exchange in a data linking environment.

[美國(guó)東亞圖書館協(xié)會(huì)支持國(guó)際標(biāo)準(zhǔn)化組織在ISO 7098修訂中所作的努力。這個(gè)修訂草案涉及我們目前進(jìn)行的大多數(shù)實(shí)踐工作,特別是增加了人名和地名的轉(zhuǎn)寫規(guī)則。這將在數(shù)據(jù)鏈接的環(huán)境下大大推進(jìn)全球范圍內(nèi)的信息交流。]

The CEAL would also like to express some concerns and suggestions about ISO rules specified in specific comments below.We hope ISO considers CEAL members’ suggestions.CEAL members deal with Romanization issues on a daily basis.Their application of Romanization and syllable aggregation guidelines are made in dealing with real life situations.Decisions need not only adhere to principles and guidelines,but are generally made in consideration of the user and orderliness in large databases such as LC.

[美國(guó)東亞圖書館協(xié)會(huì)將在下面的意見中表述對(duì)于ISO的某些規(guī)則的建議。美國(guó)東亞圖書館協(xié)會(huì)的成員在日常工作中天天都會(huì)遇到中文羅馬字母拼寫的問(wèn)題。他們對(duì)于中文羅馬字母拼寫法以及按詞連寫規(guī)則應(yīng)用的導(dǎo)則都是根據(jù)現(xiàn)實(shí)生活的情況制定的。他們?cè)谧鳑Q定時(shí),不僅要遵守各種原則和導(dǎo)則,而且還要考慮到在諸如美國(guó)國(guó)會(huì)圖書館這樣的大規(guī)模數(shù)據(jù)庫(kù)中的用戶和各種規(guī)定的情況。]

The CEAL has concerns about hyphenated practice for double surnames.True double surnames should not be hyphenated.In addition,since not all such names following hyphenated practice,taking different approaches on hyphenated (or not) double surnames by different communities would have different results with indexing,searching,and retrieving of bibliographic data,and may subsequently become an issue for linking bibliographic data from different systems globally.

Since double surnames can be two-character or multi-character,we suggest removing “two-character” and adding an example of a double surnames with more than two-character,e.g.,項(xiàng)司徒文良.

Another option for better clarification is to add equivalent Chinese terms in qualifier after “traditional compound surnames”- (復(fù)姓) and “double surnames”- (雙姓).EXAMPLE,Zhang Wang Shufang (張王淑芳),Xiang Situ Wenliang (項(xiàng)司徒文良).

[美國(guó)東亞圖書館協(xié)會(huì)關(guān)注到在雙姓中連字符的使用問(wèn)題。真正的雙姓中沒有必要使用連字符。并不是所有的雙姓都使用連字符,不同的社團(tuán)采用不同的方式來(lái)處理雙姓的連字符問(wèn)題,有的社團(tuán)使用連字符,有的社團(tuán)不使用。這樣一來(lái),在圖書文獻(xiàn)的索引、搜索或檢索的時(shí)候,就會(huì)導(dǎo)致不同的結(jié)果。在把世界上不同的系統(tǒng)中的圖書數(shù)據(jù)連接起來(lái)的時(shí)候,就會(huì)產(chǎn)生問(wèn)題。由于雙姓可以是兩個(gè)字符組成的,也可以是多個(gè)字符組成的,我們建議去掉“兩個(gè)字符”的提法,在雙姓的例子中增加一個(gè)由兩個(gè)以上的字符組成的雙姓的例子:項(xiàng)司徒文良。為了表述得更清楚,建議在英文的術(shù)語(yǔ)后面加上一個(gè)等價(jià)的中文術(shù)語(yǔ)。雙姓的例子,Zhang Wang Shufang (張王淑芳)、Xiang Situ Wenliang (項(xiàng)司徒文良)。]

Example “Lao Zhang tour (老張頭兒,older Zhang)” introduces the syllable aggregation rule about 兒化音,i.e.,connecting other character(s) with “r” when “兒” serve as a suffix.This is a particular spoken feature and cannot be differentiated by machine transliteration.It could cause confusion and inconsistent practice among countries that don’t apply the Basic rules of the Chinese phonetic alphabet orthography as a whole.So we suggest to remove this example.

[“Lao Zhang tour (老張頭兒,older Zhang)”這個(gè)例子引入了一個(gè)關(guān)于兒化音的音節(jié)連寫規(guī)則,這牽涉到當(dāng)把“兒”作為一個(gè)后綴時(shí)其他帶“r”的漢字。這是一個(gè)特殊的口語(yǔ)特征,在機(jī)器自動(dòng)轉(zhuǎn)寫時(shí)很難加以區(qū)分。在那些還沒有使用《漢語(yǔ)拼音正詞法基本規(guī)則》的國(guó)家中,這樣的規(guī)則將會(huì)引起混亂并造成不一致。建議刪除這個(gè)例子。]

The characters “市,省” in example “Beijing Shi (北京市,Beijing Municipality),Hebei Sheng (河北省,Hebei Province)”technically are not geographical feature names but names of jurisdiction.It should be used to avoid confusion.Provide explicit instruction for clarification on jurisdiction and the syllable aggregation rules for place names.

[從技術(shù)上說(shuō),在“Beijing Shi (北京市,Beijing Municipality),Hebei Sheng (河北省,Hebei Province)”這兩個(gè)例子中的漢字“市、省”,并不是地理特征名,而是行政區(qū)劃名,應(yīng)當(dāng)加以區(qū)分以避免混淆。建議清楚地闡述地名中的行政區(qū)劃和它的音節(jié)連寫規(guī)則。]

Although implied in the examples,the rule 12.14 lacks instruction on syllable aggregation for geographical proper names and geographical feature names.We suggest to rewrite as follows:Chinese place names should separate the geographical proper name from the names of jurisdiction or the geographical feature name.The multi-character geographical proper names,names of jurisdiction,or geographical feature names are written together as one word.The first letter of each element should be capitalized.More examples:Xikou Zhen (溪口鎮(zhèn),Xikou town),Shenzhen Tequ (深圳特區(qū),Shenzhen Special Economic Zone),Qujiatun Cun (瞿家屯村,Qujiatun village).

[盡管在規(guī)則12.14的例子中隱含了規(guī)則的細(xì)節(jié),但是在這條規(guī)則中仍然缺少對(duì)于地理專名和地理特征名的音節(jié)連寫細(xì)節(jié)的具體說(shuō)明。我們建議改寫如下:“漢語(yǔ)地名中的專名與行政區(qū)劃名或地理特征名分寫。多音節(jié)的地理專名、行政區(qū)劃名或地理特征名分別連寫為一個(gè)單詞。每一分寫部分的第一個(gè)字母大寫”。建議增加更多的例子:Xikou Zhen (溪口鎮(zhèn),Xikou town)、Shenzhen Tequ (深圳特區(qū),Shenzhen Special Economic Zone)、Qujiatun Cun (瞿家屯村,Qujiatun village)。]

We suggest to rewrite the rule for Chinese transcription of non-Chinese personal names and place names.With bibliographic data for Chinese publications,one may not know the original form in Latin script.This instruction is not practical and will result in inconsistent practice.It’s better not making a conditional instruction on when to use pinyin and when to use original form.It may create confusion and/or barrier to users’ bibliographic search.By definition,transliterations should always match the characters they transliterate.If the original name or commonly known Roman (Latin) spelling is desirable for clarification,it can be provided in parentheses.Recording bibliographic data,transcribe/transliterate information as it appears;no research is needed to find the original name,therefore more user friendly;the original name can be provided for access points with non-original form as a variant.GB/T 16159-2012 漢語(yǔ)拼音正詞法基本規(guī)則 6.2.3的規(guī)定:非漢語(yǔ)人名地名的漢字名稱用漢語(yǔ)拼音拼寫.Wulanfu (烏蘭夫) Makesi (馬克思).Suggested rewording:Chinese transliterations of non-Chinese personal and place names are to be spelled according to their Chinese pronunciation.If the original name or commonly known spelling in Latin characters is known,it may be provided in parentheses.

[我們建議重寫關(guān)于非漢語(yǔ)人名、地名的譯音規(guī)則。根據(jù)中文出版物的文獻(xiàn)數(shù)據(jù),人們不可能知道非漢語(yǔ)人名和地名的拉丁字母的原文書寫形式。這樣的規(guī)則在實(shí)際上是無(wú)法使用的,而且會(huì)造成不一致性。因此,最好不要制定這種條件性的規(guī)則,說(shuō)明什么時(shí)候使用拼音,什么時(shí)候使用原文形式。這樣將會(huì)造成混亂,妨礙用戶進(jìn)行文獻(xiàn)搜索。根據(jù)轉(zhuǎn)寫的定義,轉(zhuǎn)寫時(shí)要始終保持轉(zhuǎn)寫字符之間的匹配。如果為了說(shuō)清楚情況而需要原文的書寫形式或者公認(rèn)的羅馬(拉丁)字母拼寫方式,可以使用括號(hào)提供出來(lái)。在記錄文獻(xiàn)數(shù)據(jù)時(shí),譯音或轉(zhuǎn)寫的信息怎樣出現(xiàn)就怎樣表示,沒有必要去搜索它們?cè)瓉?lái)的名字,這樣對(duì)于用戶也會(huì)顯得更加友好。當(dāng)然,為了查詢方便,也可以把原來(lái)的名字作為非原文形式的變體提供出來(lái)。根據(jù)GB/T 16159-2012 《漢語(yǔ)拼音正詞法基本規(guī)則》6.2.3的規(guī)定:非漢語(yǔ)人名、地名的漢字名稱用漢語(yǔ)拼音拼寫。例如,Wulanfu (烏蘭夫)、Makesi (馬克思)。因此,我們建議重寫如下:非漢語(yǔ)人名和地名的譯音,要根據(jù)它們?cè)跐h語(yǔ)中的讀音來(lái)拼寫。如果要知道原文的名字或者公認(rèn)的拉丁字母拼寫形式,可以在括號(hào)中提供。]

Example for達(dá)爾文’s transliteration has no need for apostrophe according to Pinyin rule.

[根據(jù)拼音規(guī)則,“達(dá)爾文”這個(gè)例子的譯音不必使用隔音符號(hào)。]

Abbreviation of Chinese names is not a good practice.Chinese characters cannot always be properly represented by Romanization.Abbreviation makes the situation worse.

[中文名字的縮寫不屬于文獻(xiàn)處理的內(nèi)容,在中文羅馬字母拼寫中,漢字也不能使用縮寫來(lái)表示,使用縮寫將使情況變得很糟糕。]

此外,澳大利亞、加拿大、法國(guó)、俄羅斯、西班牙還對(duì)CD稿提出了一些編輯上和技術(shù)上的修改意見。

2014年5月5日至9日,馮志偉受教育部派遣,到美國(guó)華盛頓參加了的ISO/TC 46第41屆全會(huì)。馮志偉在5月7日上午舉行的第3工作組(WG3)會(huì)議上,就ISO 7098 的修訂問(wèn)題說(shuō)明了中國(guó)的立場(chǎng)。他在發(fā)言中回顧了ISO 7098的研制過(guò)程,逐一回答了在CD階段投票中各國(guó)對(duì)于CD稿提出的意見,并說(shuō)明了在即將提交的DIS稿中,如何根據(jù)各國(guó)的這些意見進(jìn)行修改。

馮志偉的發(fā)言被與會(huì)專家們?cè)u(píng)價(jià)為“有深度”(in depth)的發(fā)言,引起了熱烈的討論,成為了當(dāng)天WG3會(huì)議的關(guān)注焦點(diǎn)。

ISO/TC 46 WG3工作會(huì)議關(guān)于ISO 7098的意見:

Professor Feng Zhiwei gave an indepth expose about the history of Pinyin and the proposals for the Romanization of Chinese.(Slides to be circulated to attendees).After a lively discussion the following resolution was proposed:

TC 46/WG 3 instructs the editor of the revision of ISO 7098 to add a paragraph clarifying the use of separation of syllables especially for automated transcription processing,and to add some material regarding UCS code points in Romanization,and then to forward the text to the TC 46 secretariat for balloting as DIS 7098.

[馮志偉教授在會(huì)議上作了有深度的報(bào)告,介紹了漢語(yǔ)拼音的歷史以及中文羅馬字母拼寫法提案的過(guò)程。他把報(bào)告的幻燈片分發(fā)給了與會(huì)者。經(jīng)過(guò)熱烈的討論之后,會(huì)議作出了如下決議:TC 46/WG3要求ISO 7098的編者在文本中增加一段來(lái)闡述音節(jié)分合的使用,特別是要說(shuō)明譯音的自動(dòng)處理技術(shù),并且還要增加在中文羅馬字母拼寫中有關(guān)UCS代碼的材料,然后向TC 46秘書處提交文本以便作為DIS 7098進(jìn)行投票。]

馮志偉自始至終參加了第41屆全會(huì)的全過(guò)程,認(rèn)真參與討論,與各國(guó)代表進(jìn)行了廣泛的接觸,爭(zhēng)取他們對(duì)于ISO 7098修訂工作的支持,會(huì)議已經(jīng)把ISO 7098的進(jìn)一步修訂寫入了ISO/TC 46第41屆全會(huì)的決議,作為決議的第7條。

ISO TC 46 第41屆全會(huì)有關(guān)ISO 7098的決議:

英文:

RESOLUTION 2014-07:Revision of ISO 7098:

ISO/TC 46 instructs the editor of the revision of ISO 7098 to add a paragraph clarifying the use of separation of syllables,particularly for the automated transcription processing,and to add some material utilizing extended Latin script,and then to forward the text to the TC 46 secretariat for balloting as DIS 7098.

Approved unanimously

法文:

RESOLUTION 2014-07 :Révision de l’ISO 7098

ISO/TC 46 demande à l’éditeur de la révision d’ISO 7098 d’ajouter un paragraphe pour clarifier l’utilisation de la séparation en syllabes,notamment pour le traitement automatisé des transcriptions,et d’ajouter des éléments d’information utilisant le jeu de caractères latins étendu,avant d’envoyer le texte au secrétariat du TC 46 pour le vote DIS du 7098.

Approuvée à l’unanimité

[決議2014-07,第7條:修訂ISO 7098

TC 46要求ISO 7098修訂版的編者在文本中增加一段來(lái)闡述音節(jié)分合的使用,特別是要說(shuō)明譯音的自動(dòng)處理技術(shù),并且還要增加擴(kuò)充拉丁字符使用的材料,然后向TC 46秘書處提交文本以便作為DIS 7098進(jìn)行投票。

表決結(jié)果:一致同意]

會(huì)議期間,馮志偉還分別與英國(guó)代表、德國(guó)代表交換了對(duì)于ISO 7098 的意見,進(jìn)一步了解了他們的立場(chǎng)。在CD稿的投票中,英國(guó)已經(jīng)投票支持ISO 7098,但是,英國(guó)代表在與馮志偉的個(gè)人談話中透露,由英國(guó)人威妥瑪(Thomas Wade)和詹理斯(H.A.Giles)制定的威妥瑪式拼音(Wade Giles)已經(jīng)在全世界范圍內(nèi)使用了將近200年,而漢語(yǔ)拼音方案只有50多年的歷史,因此,英國(guó)可能在今后的投票中棄權(quán)。德國(guó)代表說(shuō),他們?cè)敢庵С秩嗣匆舻姆衷~連寫,但對(duì)地名拼音的分詞連寫,尚持保留意見,德國(guó)圖書館界在圖書編目時(shí),已經(jīng)放棄了按詞連寫,而采用按照音節(jié)拼寫的方式,這樣便于編目工作自動(dòng)化。因此,德國(guó)可能在今后的投票中繼續(xù)投反對(duì)票。英國(guó)代表和德國(guó)代表的這些意見引起了馮志偉高度的重視。

二、DIS的起草和投票

根據(jù)各國(guó)對(duì)于CD稿提出的意見以及 ISO/TC 46第41屆全體會(huì)議的精神,我們提出了DIS稿,主要補(bǔ)充和修改的內(nèi)容如下:

(一)提出了“漢語(yǔ)拼音音節(jié)的歧義指數(shù)”的概念,為標(biāo)準(zhǔn)中分詞連寫的技術(shù)提供了理論支持

德國(guó)在CD投票中投反對(duì)票的原因是他們認(rèn)為拼音分詞連寫是有歧義的,不便于圖書館編目工作的自動(dòng)化。但是,我們認(rèn)為,分詞連寫比之于按照音節(jié)分寫更能避免歧義。為了說(shuō)明這個(gè)道理,我們?cè)贒IS稿中提出了拼音“歧義指數(shù)”(ambiguity index)的概念。

如果不計(jì)聲調(diào),基本的漢語(yǔ)音節(jié)只有405個(gè),這405個(gè)漢語(yǔ)音節(jié)可以表示全部漢字的讀音。而《通用規(guī)范漢字表》包含了8 105個(gè)通用漢字,在這種情況下,在一般使用中,一個(gè)漢語(yǔ)音節(jié)平均要表示20個(gè)以上的漢字(8 105/405=20.01),不可避免會(huì)出現(xiàn)歧義。

例1.在《通用規(guī)范漢字表》中,拼音音節(jié)/bei/可以表示如下31個(gè)漢字:北、杯、卑、背、椑、悲、碑、鵯、貝、孛、邶、狽、備、鋇、倍、悖、被、琲、棓、輩、憊、焙、蓓、碚、鞁、褙、糒、鞴、鐾、唄、臂。

例2.在《通用規(guī)范漢字表》中,拼音音節(jié)/jing/可以表示如下49個(gè)漢字:京、莖、涇、經(jīng)、猄、荊、菁、旌、驚、晶、腈、、睛、粳、兢、精、鯨、麖、鼱、井、阱、汫、剄、肼、頸、景、儆、憬、璥、璟、警、勁、徑、凈、逕、脛、倞、痙、競(jìng)、竟、竫、婧、靚、敬、靖、靜、境、獍、鏡。

從上面例子來(lái)看,在表示單音節(jié)語(yǔ)言單位(語(yǔ)言單位可以是漢字,也可以是語(yǔ)素或詞)的時(shí)候,漢語(yǔ)單音節(jié)拼音是存在歧義性的。這個(gè)歧義程度和一個(gè)單音節(jié)拼音所表示的語(yǔ)言單位的多少有關(guān)。如果一個(gè)單音節(jié)只表示一個(gè)語(yǔ)言單位,那么,這個(gè)音節(jié)就不存在歧義;如果一個(gè)單音節(jié)表示兩個(gè)語(yǔ)言單位,那么就存在一個(gè)對(duì)應(yīng)的歧義語(yǔ)言單位;如果一個(gè)單音節(jié)表示三個(gè)語(yǔ)言單位,那么就存在兩個(gè)對(duì)應(yīng)的歧義語(yǔ)言單位,以此類推。也就是說(shuō),單音節(jié)歧義單位的數(shù)量(也就是歧義程度)等于單音節(jié)拼音表示的語(yǔ)言單位數(shù)(漢字?jǐn)?shù)、語(yǔ)素?cái)?shù)或詞數(shù))減去1。由此,我們可以用“拼音音節(jié)的歧義指數(shù)”這個(gè)概念對(duì)漢語(yǔ)拼音音節(jié)的歧義程度進(jìn)行數(shù)學(xué)描述。漢語(yǔ)拼音單音節(jié)的歧義指數(shù)I等于該拼音音節(jié)可以表示的語(yǔ)言單位數(shù)N減1。計(jì)算公式為:I=N-1

拼音音節(jié)既可以是單音節(jié),也可以是多音節(jié),既可以表示一個(gè)語(yǔ)言單位,也可以表示多個(gè)語(yǔ)言單位,所以,這里所說(shuō)的“語(yǔ)言單位”可以是單音節(jié)的語(yǔ)素或詞,也可以是多音節(jié)的語(yǔ)素或詞。

也就是說(shuō),如果一個(gè)拼音音節(jié)可以表示一個(gè)語(yǔ)言單位,那么它的歧義指數(shù)為零;如果拼音音節(jié)可以表示兩個(gè)語(yǔ)言單位,那么,它的歧義指數(shù)為 2-1=1;如果拼音音節(jié)可以表示三個(gè)語(yǔ)言單位,那么,它的歧義指數(shù)為 3-1=2,……。

在例1中,拼音音節(jié)/bei/可以表示31個(gè)語(yǔ)素(或詞),也就是31個(gè)語(yǔ)言單位,它的歧義指數(shù)為 31-1=30;在例2中,拼音音節(jié)/jing/可以表示49個(gè)語(yǔ)素(或詞),也就是49個(gè)語(yǔ)言單位,它的歧義指數(shù)為 49-1=48。但是,如果把單音節(jié)/bei/和單音節(jié)/jing/組合成一個(gè)雙音節(jié)的詞/beijing/,其歧義指數(shù)將明顯地減少,因?yàn)?beijing/只能表示3個(gè)雙音節(jié)的語(yǔ)言單位,也就是3個(gè)詞:北京、背景、背靜。其歧義指數(shù)減少為 3-1=2。

如果把/beijing/的第一個(gè)字母進(jìn)一步大寫為/Beijing/,只對(duì)應(yīng)一個(gè)詞“北京”,其歧義指數(shù)為零。這說(shuō)明,/Beijing/是一個(gè)沒有歧義的語(yǔ)言單位,它的意思只有1個(gè),這就是中國(guó)首都的名稱——北京。

因此,如果把不同的單音節(jié)的拼音音節(jié)連接組合成多音節(jié)的漢語(yǔ)單詞,那么,拼音音節(jié)的歧義指數(shù)將明顯地減少。這是把不同的單音節(jié)連接組合成為多音節(jié)的漢語(yǔ)單詞的優(yōu)越之處。

我們提出“歧義指數(shù)”概念的目的,是為了證明:按照音節(jié)分寫的歧義指數(shù)很高,而分詞連寫有利于降低歧義指數(shù)。我們希望“歧義指數(shù)”這樣的概念能夠促使德國(guó)改變立場(chǎng)。

(二)給聲調(diào)和標(biāo)點(diǎn)符號(hào)補(bǔ)充了16進(jìn)制的unicode代碼

根據(jù)ISO/TC 46第41屆全會(huì)決議的精神,要增加擴(kuò)充拉丁字符使用的材料,因此,我們?cè)贒IS稿中,給漢語(yǔ)拼音的聲調(diào)符號(hào)和標(biāo)點(diǎn)符號(hào)補(bǔ)充了16進(jìn)制的unicode代碼(hexadecimal code,簡(jiǎn)稱hex)。

一聲(高平調(diào)): —(hex:0304)

二聲(升調(diào)): /(hex:0301)

三聲(降/升調(diào)): ∨(hex:030C)

四聲(降調(diào)): (hex:0300)

在實(shí)際的文本中,聲調(diào)符號(hào)是附著在音節(jié)的主要元音上的,例如,/péi/、/què/。在音節(jié)/péi/中,聲調(diào)符號(hào)附著在主要元音e上,標(biāo)注為/é/;在音節(jié)/què/中,聲調(diào)符號(hào)附著在主要元音e上,標(biāo)注為/è/。如果區(qū)分元音的大小寫,則漢語(yǔ)普通話帶聲調(diào)符號(hào)的元音如表1所示:

表1 漢語(yǔ)帶調(diào)元音小寫字母16進(jìn)制代碼

表2漢語(yǔ)帶調(diào)元音大寫字母16進(jìn)制代碼

漢語(yǔ)特有的標(biāo)點(diǎn)符號(hào)以及它們對(duì)應(yīng)的拉丁標(biāo)點(diǎn)符號(hào)的16進(jìn)制的unicode代碼如表3:

表3 標(biāo)點(diǎn)符號(hào)16進(jìn)制代碼對(duì)照表

(三)補(bǔ)充了命名實(shí)體自動(dòng)譯音的方法

根據(jù)ISO/TC 46第41屆全會(huì)決議的精神,要求在ISO 7098的文本中特別說(shuō)明譯音的自動(dòng)處理問(wèn)題。因此,我們?cè)贒IS稿中,增加了如下內(nèi)容:在計(jì)算機(jī)輔助文獻(xiàn)工作中,有兩種對(duì)命名實(shí)體進(jìn)行自動(dòng)譯音的方法。一種是按音節(jié)全自動(dòng)譯音,一種是基于規(guī)則的按單詞半自動(dòng)譯音。

1.按音節(jié)全自動(dòng)譯音

全自動(dòng)譯音程序能夠自動(dòng)地生成彼此之間由空白分開的單個(gè)音節(jié)。這樣的方法適用于任何的應(yīng)用系統(tǒng)和環(huán)境,其中音節(jié)切分的結(jié)果都會(huì)是令人滿意的,這種全自動(dòng)譯音程序特別適用于那些把拉丁字母的譯音與原來(lái)漢字存儲(chǔ)在一起的系統(tǒng)。使用這樣的方法,“北京市”這個(gè)地名可以全自動(dòng)地譯音為/bei/、/jing/、/shi/3個(gè)音節(jié)。譯音的過(guò)程為:

a.北京市

b.bei jing shi

這種全自動(dòng)的方法是很容易用計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)的,但是譯音出來(lái)的音節(jié)的歧義指數(shù)較高。

2.基于規(guī)則的按單詞半自動(dòng)譯音

在與語(yǔ)言有關(guān)的科學(xué)研究和工業(yè)生產(chǎn)中,“詞”是一個(gè)基本的和必要的概念,因此我們有必要對(duì)于“詞”這個(gè)概念加以統(tǒng)一界說(shuō)。然而,人們很難簡(jiǎn)單地使用基于空格和標(biāo)點(diǎn)符號(hào)之類的規(guī)則來(lái)決定單詞之間的界限。這樣的規(guī)則沒有考慮到復(fù)合詞、縮寫詞、慣用語(yǔ)之類的切分問(wèn)題。單詞的切分對(duì)于單詞與單詞之間沒有空格分開的語(yǔ)言(如漢語(yǔ)、日語(yǔ))更加麻煩。

在自然語(yǔ)言處理中,單詞切分就是把文本切分為負(fù)載意義的語(yǔ)言單位的過(guò)程。例如,在英語(yǔ)中,“the white house”可以切分為3個(gè)有意義的單位“the”,“white”,“house”,它表示一間白色的房子,而“the White House”則只與一個(gè)語(yǔ)言單位相對(duì)應(yīng),它表示美國(guó)總統(tǒng)的官邸。這樣的有意義的單位就叫作單詞的切分單位(Word Segmentation Units,簡(jiǎn)稱WSU)。對(duì)于單詞之間有空格的語(yǔ)言,如英語(yǔ),把文本切分WSU時(shí),只要使用空格作為基礎(chǔ),確定WSU切分的邊界就行了,是簡(jiǎn)單易行的。但是,對(duì)于單詞之間沒有空格的語(yǔ)言,如漢語(yǔ)和日語(yǔ),或者對(duì)于那些只在局部的單詞之間有空格的語(yǔ)言,如泰語(yǔ)和韓國(guó)語(yǔ),把書面文本切分為WSU要求使用不同的方法。

在很多應(yīng)用領(lǐng)域中,需要把文本切分為單詞。在翻譯中,數(shù)出單詞的個(gè)數(shù)是計(jì)算翻譯工作量大小的主要方法。在翻譯記憶系統(tǒng)和機(jī)器輔助翻譯(Computer-Assisted Translation,簡(jiǎn)稱CAT)的工具中,單詞切分是這些系統(tǒng)的一個(gè)主要的功能。在術(shù)語(yǔ)抽取工具中,單詞切分也起著重要的作用,在術(shù)語(yǔ)管理和CAT工具中,有時(shí)也要提供單詞切分的功能。大多數(shù)的內(nèi)容管理系統(tǒng)和數(shù)據(jù)庫(kù)都要根據(jù)單詞來(lái)進(jìn)行搜索。在內(nèi)容搜索時(shí),也要對(duì)文本進(jìn)行切分,以便使用搜索詞進(jìn)行匹配。此外,搜索功能要求關(guān)于單詞邊界的知識(shí),文本—語(yǔ)音轉(zhuǎn)換系統(tǒng)要在單詞的基礎(chǔ)上來(lái)生成語(yǔ)音,因此要求在單詞查詢時(shí)進(jìn)行單詞切分,等等。各種自然語(yǔ)言處理系統(tǒng)必須把文本切分為單詞才能實(shí)現(xiàn)其功能。詞典資源是根據(jù)它的規(guī)模來(lái)評(píng)測(cè)的,因而通常都要評(píng)估它的單詞個(gè)數(shù)。

ISO 24614-1:201“語(yǔ)言資源管理—書面文本的單詞切分—第1部分:基本概念和一般原則”給出了自然語(yǔ)言處理中單詞切分的基本概念和一般原則,提出了以可以信賴而且能夠復(fù)用的方式進(jìn)行書面文本自動(dòng)切分的導(dǎo)則,而且這種導(dǎo)則是獨(dú)立于語(yǔ)言的。

ISO 24614-1:201“語(yǔ)言資源管理—書面文本的單詞切分—第2部分:漢語(yǔ)、日語(yǔ)和韓國(guó)語(yǔ)的單詞切分”提出了漢語(yǔ)、日語(yǔ)和韓國(guó)語(yǔ)中切分WSU的具體規(guī)則。其中有些規(guī)則是這3種語(yǔ)言共同的,盡管每種語(yǔ)言都有自己判別WSU的特殊規(guī)則。

因此,在中文羅馬字母拼寫中,應(yīng)當(dāng)把由漢字表示的命名實(shí)體轉(zhuǎn)換為拼音表示單詞。在漢語(yǔ)中,一個(gè)單詞可以由一個(gè)或多個(gè)音節(jié)組成,單詞之間的界限不是那么清楚,在目前的技術(shù)條件下,全自動(dòng)的單詞切分難以達(dá)到很好的質(zhì)量,因此,可以采用基于規(guī)則的按單詞半自動(dòng)譯音的方法。

命名實(shí)體基于規(guī)則的按單詞半自動(dòng)譯音可以使用如下的資源:(1)一套譯音規(guī)則:在本標(biāo)準(zhǔn)的規(guī)則中提出了命名實(shí)體譯音的一般規(guī)則。這些規(guī)則可以用作命名實(shí)體半自動(dòng)譯音的資源;(2)一個(gè)相關(guān)的譯音詞典:《漢語(yǔ)拼音詞匯(專名部分)》包含了大多數(shù)的命名實(shí)體的拼音譯音,可以用作命名實(shí)體半自動(dòng)譯音的另一個(gè)資源。

使用這樣的方法,“北京市”這個(gè)地名的譯音過(guò)程如下:

a.北京市

b.bei jing shi

c.beijing shi

d.Beijing shi

e.Beijing Shi

根據(jù)規(guī)則,地名“北京市”首先被切分為/bei/、/jing/、/shi/3個(gè)音節(jié),然后把/bei/、/jing/結(jié)合成/beijing/,使它與行政區(qū)劃名/shi/分開,最后再把每一個(gè)部分的首字母大寫,譯音為/ Beijing Shi /。

如果在按詞譯音過(guò)程中出現(xiàn)歧義或其他問(wèn)題,編輯人員可以根據(jù)譯音詞典,使用人機(jī)交互(Human-Computer Interaction,簡(jiǎn)稱HCI)找出合適的命名實(shí)體的譯音。所以,這樣的方法是半自動(dòng)的。

這種半自動(dòng)方法的譯音質(zhì)量很高,音節(jié)的歧義指數(shù)較小甚至可以減少到零。

(四)進(jìn)一步解釋命名實(shí)體分詞連寫的必要性

根據(jù)ISO/TC 46第41屆全會(huì)決議的精神,要求在ISO 7098的文本中增加闡述音節(jié)分合的使用的內(nèi)容,我們?cè)贒IS稿中,增加了如下的內(nèi)容:

漢語(yǔ)中大多數(shù)的常用詞都是多音節(jié)詞。在國(guó)際文獻(xiàn)和信息工作中,把單音節(jié)的拼音連寫為多音節(jié)的漢語(yǔ)單詞是理所當(dāng)然的事情。

在中世紀(jì)之前,希臘人和羅馬人已經(jīng)知道什么是一個(gè)單詞,盡管文本中在相鄰的單詞之間沒有空格,他們?nèi)匀豢梢宰R(shí)別出單詞。

公元7世紀(jì),愛爾蘭的僧侶開始使用空格來(lái)分隔文本中的單詞,并且把這種方法介紹到法國(guó)。到了公元8世紀(jì)和9世紀(jì),這種使用空格分隔單詞的方法在整個(gè)歐洲流行開來(lái)。[7]

空格的使用意味著承認(rèn)單詞這個(gè)概念,在單詞與單詞之間插入空格成為了在書面上使用字母的語(yǔ)言的一個(gè)標(biāo)準(zhǔn),世界上的出版界和圖書館都遵循這個(gè)標(biāo)準(zhǔn)。

在漢語(yǔ)拼音中,也有必要使用空格來(lái)分割單詞而不是分割音節(jié)。單詞的分割是世界文明的一個(gè)優(yōu)良傳統(tǒng)。在中文羅馬字母拼寫中,遵循這樣的優(yōu)良傳統(tǒng)是有好處的。

然而,在漢語(yǔ)拼音中,單個(gè)的音節(jié)是有歧義的。一個(gè)拼音音節(jié)可以表示若干個(gè)漢字,因而在表示漢字方面,拼音音節(jié)是存在歧義的。在漢語(yǔ)拼音中,單音節(jié)的歧義指數(shù)是很大的。在日常使用中,一個(gè)單音節(jié)平均可以表示20多個(gè)漢字。但是如果我們把幾個(gè)單音節(jié)連接起來(lái)構(gòu)成多音節(jié)的單詞,拼音音節(jié)的歧義指數(shù)就會(huì)大幅度減少。為了給拼音音節(jié)排歧,必須把不同的單音節(jié)連接起來(lái)構(gòu)成多音節(jié)的漢語(yǔ)單詞。

《漢語(yǔ)拼音正詞法基本規(guī)則》(GB/T 16159-2012,中華人民共和國(guó)家標(biāo)準(zhǔn),2012)中包括了音節(jié)分割或連接成單詞的規(guī)則,常用詞(名詞、動(dòng)詞、形容詞、代詞等)的拼寫規(guī)則,固定短語(yǔ)的拼寫規(guī)則,人名和地名的拼寫規(guī)則,聲調(diào)的表示規(guī)則,在行末尾的連字符使用規(guī)則,等等。

目前,在漢語(yǔ)語(yǔ)言學(xué)中,對(duì)于漢語(yǔ)的詞還沒有公認(rèn)的明確定義,這樣有時(shí)就很難確定漢語(yǔ)普通單詞的邊界(切分線),當(dāng)把單個(gè)的音節(jié)連接起來(lái)構(gòu)成多音節(jié)的單詞時(shí),這當(dāng)然也就很困難了。不過(guò),漢語(yǔ)的專有名詞中,單詞的界限還是相對(duì)清楚的,由于漢語(yǔ)中多音節(jié)的命名實(shí)體的界限根據(jù)有關(guān)的規(guī)范和標(biāo)準(zhǔn)比較容易確定,因此,把不同的幾個(gè)單音節(jié)連接起來(lái)構(gòu)成多音節(jié)的專有名詞就不是很困難(如人名、地名、語(yǔ)言名、民族名、宗教名等命名實(shí)體)。在國(guó)際文獻(xiàn)和信息工作中,把不同的漢語(yǔ)拼音單音節(jié)連接起來(lái)構(gòu)成多音節(jié)的命名實(shí)體專有名詞,從而避免拼音的歧義,不僅是必要的,而且也是可能的。

(五)漢語(yǔ)的復(fù)姓(traditional compound surnames)和雙姓(double surnames)采用不同的拼寫形式,增加由兩個(gè)以上漢字構(gòu)成的雙姓的例子

漢語(yǔ)人名姓與名分寫。姓在前,名在后,名的部分連寫為一個(gè)詞。姓和名的首字母大寫。復(fù)姓連寫,中間不加連字符。由兩個(gè)或兩個(gè)以上的漢字構(gòu)成的雙姓使用連字符連接,每一個(gè)部分的首字母大寫。例如,Zhuge Kongming (諸葛孔明),Zhang-Wang Shufang (張王淑芳)。補(bǔ)充了由兩個(gè)以上的漢字構(gòu)成的雙姓的例子:Xiang-Situ Wenliang (項(xiàng)司徒文良),這個(gè)雙姓“項(xiàng)司徒”中包含了復(fù)姓“司徒”。

(六)刪除人名中兒化的例子

把“Lao Zhang tour (老張頭兒,older Zhang)”這個(gè)例子從有關(guān)人名的條目中刪除。

(七)把CD稿中地名部分的“通名”加以細(xì)化,并增加地名的例子,進(jìn)一步豐富地名譯音的內(nèi)容

把地名的“通名”進(jìn)一步細(xì)化為“行政區(qū)劃名”(name of jurisdiction)和“地理特征名”(geographical feature name)。相關(guān)段落重新表述如下:

漢語(yǔ)地名中的專名和行政區(qū)劃名或地理特征名分寫。包含多個(gè)漢字的地理專名、行政區(qū)劃名或地理特征名,譯音時(shí)分別連寫為一個(gè)單詞,單詞與單詞之間用空格分開,每一個(gè)部分的首字母大寫。

根據(jù)CEAL的建議,在地名部分增加了一些例子。

專名是多音節(jié)詞的例子:Xikou Zhen (溪口鎮(zhèn),Xikou town)、Qujiatun Cun (瞿家屯村,Qujiatun village)。

專名和行政區(qū)劃名都是多音節(jié)詞的例子:Shenzhen Tequ(深圳特區(qū),Shenzhen Special Economic Zone)。

(八)改寫關(guān)于非漢語(yǔ)人名、地名和非羅馬字母文字的外國(guó)人名、地名的譯音規(guī)則

在2011年教育部語(yǔ)言文字信息管理司召開的專家會(huì)議上,專家們考慮到修訂后的ISO 7098不僅要在中國(guó)使用,而且還要在國(guó)外使用,所以,對(duì)于非漢語(yǔ)人名、地名的拼寫方法,專家們建議在ISO 7098修訂稿中提出的規(guī)則與《漢語(yǔ)拼音正詞法基本規(guī)則》(GB/T 16159-2012)應(yīng)當(dāng)稍有不同。有的專家認(rèn)為,對(duì)于非漢語(yǔ)人名、地名的拼寫,有必要根據(jù)“名從主人”的原則,按照羅馬字母(拉丁字母)的原文書寫;非羅馬字母文字的人名、地名,按照該文字的羅馬字母譯音法拼寫,不強(qiáng)求外國(guó)人按照漢語(yǔ)譯名的讀法來(lái)讀他們自己的人名和地名,也就是不強(qiáng)求外國(guó)人改名。但是,為了便于外國(guó)人知道他們的名字和地名在漢語(yǔ)中究竟翻譯成什么樣的發(fā)音,也可以在原文后面注上漢字或漢字的拼音,在一定的場(chǎng)合也可以先用或僅用漢字譯名的拼音。

根據(jù)這次專家會(huì)議上專家們的建議,我們采取了“名從主人”的主張,在CD稿中提出了不同于《漢語(yǔ)拼音正詞法基本規(guī)則》(GB/T 16159-2012)個(gè)別規(guī)定的做法:非漢語(yǔ)人名、地名按照羅馬字母(拉丁字母)原文書寫;非羅馬字母文字的人名、地名,按照該文字的羅馬字母譯音法拼寫。為了便于閱讀,可以在原文后面注上漢字或漢字的拼音,在一定場(chǎng)合也可先用或僅用漢字的拼音。首字母大寫。

可是這樣的處理在國(guó)際上難以通過(guò)。美國(guó)東亞圖書館協(xié)會(huì)的專家認(rèn)為,這種有條件限制的譯音規(guī)則很難掌握,容易造成拼寫時(shí)的混亂,建議改寫。[4-5]漢語(yǔ)拼音是用來(lái)拼寫漢語(yǔ)的,非漢語(yǔ)人名、地名以及非羅馬字母文字的外國(guó)人名、地名,在漢語(yǔ)中是按照漢語(yǔ)的發(fā)音來(lái)讀的,應(yīng)當(dāng)按照漢語(yǔ)的讀法來(lái)拼寫,而不能“名從主人”。因此,我們對(duì)相關(guān)條目重寫如下:

(九)刪除了人名、地名的全部縮寫規(guī)則

ISO TC 46秘書處接受了我們提交的DIS稿,并于2014年12月1日至2015年3月1日進(jìn)行投票。根據(jù)ISO的規(guī)定,DIS投票在計(jì)算比例時(shí),不考慮棄權(quán)票。2015年3月1日由ISO/TC 46委員會(huì)秘書處N2519號(hào)文件公布了投票結(jié)果:18個(gè)沒有棄權(quán)的國(guó)家中,17票贊成,占94%,大于ISO規(guī)定的66.66%的比例,1票反對(duì),占6%,小于ISO規(guī)定的25%的比例,DIS獲得通過(guò)。

投贊成票的國(guó)家(17個(gè)):阿根廷、保加利亞、加拿大、中國(guó)、埃及、愛沙尼亞、伊朗、肯尼亞、韓國(guó),拉脫維亞、摩洛哥、挪威、葡萄牙、俄羅斯、泰國(guó)、烏克蘭、美國(guó)。投反對(duì)票的國(guó)家(1個(gè)):德國(guó)。日本、英國(guó)投了棄權(quán)票。

這樣的投票結(jié)果早在馮志偉的預(yù)料之中。

美國(guó)、德國(guó)、加拿大對(duì)DIS提出了修改意見。

美國(guó)提出的意見如下:

The CEAL CTP/CCM Working Group on ISO 7098 Romanization of Chinese submitted CEAL comments with suggested changes on the ISO/CD 7098 draft focusing on section 11,Transcription rules for personal names and geographic names,in October 2013.Most comments were accepted and changes are reflected in the new revised draft ISO/DIS 7098,section 12,Transcription rules for named entities.

From December 9,2014 to January 8,2015,the CEAL CTP/CCM Working Group conducted a survey among CEAL members.The survey requested input on the ISO/DIS 7098 new revised draft sections,especially on Rules 11 and 12.14- 17,in comparison to the ALA-LC Romanization table on Chinese.The survey included 13 questions that were grouped into four categories by importance.A total of 31 members participated in the survey.The majority voted to “support” or “support with modified suggestions” ISO/DIS 7098 instructions in Sections 11-12.Some voted not to support or voiced concerns.Most of the suggestions and concerns,whether members voted to support or not to support,include reasons.We have summarized members’ concerns in the table below.The entire survey results are available here.

CEAL also suggest the ISO website maintains lists of those “proper noun” names for non-Chinese places,languages,tribes,and religions and their variants and abbreviations which will be affected by new rules,if adopted.Users should be able to locate more inclusive lists in order to follow the standards correctly,and to avoid ambiguity and be consistent in practice.Besides the implications of Romanization rules,we sincerely hope that ISO considers rule change consequences that will affect scholarly communication,global information retrieval and discovery,data integrity,and the costs associated with consolidation and conversion of existing data.

[美國(guó)東亞圖書館協(xié)會(huì)CEAL CTP/CCM工作組在2013年10月就ISO 7098的CD稿,特別是對(duì)于第11節(jié)“人名、地名譯音規(guī)則”部分提出了意見,提交了美國(guó)東亞圖書館協(xié)會(huì)的意見。我們的絕大多數(shù)意見都被ISO 7098的DIS 稿接受了,并且做了相應(yīng)的修改,這些修改反映在DIS稿第12節(jié)“命名實(shí)體譯音規(guī)則”中。

從2014年12月9日至2015年1月8日,美國(guó)東亞圖書館協(xié)會(huì)CEAL CTP/CCM工作組在CEAL成員中進(jìn)行了調(diào)查。這項(xiàng)調(diào)查要求對(duì)ISO 7098的DIS新修改稿,特別是對(duì)于11節(jié)和12.14-17節(jié)中的規(guī)則,與ALA-LC的中文羅馬字母拼寫表ALA-LC Romanization table on Chinese 進(jìn)行對(duì)比,然后作出回答。調(diào)查包括13個(gè)問(wèn)題,按照重要程度分為4大類。共有31位成員參加了這項(xiàng)調(diào)查。對(duì)于ISO 7098 DIS稿中11~12節(jié)的規(guī)則,大多數(shù)人的回答是“支持”或“帶有修改建議的支持”,有的回答是“不支持”,或者沒有表態(tài)。我們把參加調(diào)查的成員的回答做成了一個(gè)表。全部的調(diào)查結(jié)果可以點(diǎn)擊here 得到。

美國(guó)東亞圖書館協(xié)會(huì)建議ISO網(wǎng)站建立一個(gè)非漢語(yǔ)地名、語(yǔ)言名、民族名、宗教名以及它們變異形式和縮寫的表,并進(jìn)行經(jīng)常的維護(hù),一旦出現(xiàn)新的規(guī)則,如果這些規(guī)則得到采用,將會(huì)影響到這個(gè)表的內(nèi)容。用戶可以下載這樣的表,以便正確地遵循國(guó)際標(biāo)準(zhǔn)的規(guī)定,避免歧義,在實(shí)際工作中保持一致。除了制定羅馬字母拼寫的規(guī)則之外,我們真誠(chéng)地希望,ISO要考慮到規(guī)則改變的后果,因?yàn)橐?guī)則的改變將會(huì)影響到學(xué)術(shù)交流、全球的信息檢索和發(fā)現(xiàn)、數(shù)據(jù)的完整性及為維護(hù)和轉(zhuǎn)換現(xiàn)存數(shù)據(jù)而付出的代價(jià)。]

Double surnames should not be hyphenated.When a wife adopts husband surname,she still keep her own surname intact.If hyphenated,it becomes a one new surname and no longer is true double surnames.Replace this statement:“The two-character or multi-character double surnames are to be written together with a hyphen and the initial letters of both capitalized.” with “The double surnames without philological permanence (e.g.,those linked by marriage or other conventions) are to be written separately with the initial letters of both capitalized”.Remove hyphen from examples.

[雙姓中不要使用連字符。當(dāng)妻子采用丈夫的姓時(shí),她仍然可以保持自己的姓。如果雙姓中使用連字符,這個(gè)雙姓就變成了一個(gè)新的姓,而不再是真正的雙姓了。將“由兩個(gè)或兩個(gè)以上的漢字構(gòu)成的雙姓使用連字符連接,每一個(gè)部分的首字母大寫”這樣的表述,改為“對(duì)于那些沒有語(yǔ)文恒久性(例如,由于婚姻或其他規(guī)定而連寫)的雙姓,分寫,每一個(gè)部分的首字母大寫”,刪除例子中的連字符。]

Adjuncts such as “xiao”,“l(fā)ao” and “da” should not be capitalized unless they appear at the beginning of a sentence.If the character is part of a given name,follow the same practice for given names.

[“老”“小”“大”等附加成分的首字母小寫,除非它們出現(xiàn)在句首才大寫。如果“老”“小”“大”等漢字是人名的一部分,則按照人名的拼寫規(guī)則來(lái)拼寫。]

Religion names and their followers are written as one word with the initial letter capitalized.In addition,provide and maintain an online list of religion names (and whether to include all variant forms) to make it easy to apply.

[宗教名以及宗教的信徒名連寫為一個(gè)單詞,首字母大寫。另外,建議提供一個(gè)聯(lián)機(jī)的宗教名表(包括其所有的變異形式),以便于使用。]

德國(guó)只提出一條反對(duì)的意見,內(nèi)容如下:

Germany disagrees for the following reasons:Giving value judgements (“…quality … is good,but …”) is not appropriate in an standard.Replace with:

Fully automated transcription procedures generating single syllables separated from each other can be used by any application or environment in which the results are regarded appropriate,especially in those that store the Latin transcription together with the original Chinese characters.

[德國(guó)不同意,原因如下:在國(guó)際標(biāo)準(zhǔn)中,采用“但書”(“……質(zhì)量很好,但是……”)這樣的方式進(jìn)行價(jià)值判斷是不恰當(dāng)?shù)?。建議改用以下的表達(dá)方式:“全自動(dòng)譯音程序能夠自動(dòng)地生成彼此之間由空格分開的單個(gè)音節(jié)。這樣的方法適用于任何的應(yīng)用系統(tǒng)和環(huán)境,其中音節(jié)切分的結(jié)果都會(huì)是令人滿意的,這種全自動(dòng)譯音程序特別適用于那些把拉丁字母的譯音與原來(lái)漢字存儲(chǔ)在一起的系統(tǒng)”。]

此外,加拿大也對(duì)于DIS中的某些細(xì)節(jié)提出了技術(shù)性的修改意見。

三、DIS的修改和CIB投票

根據(jù)各國(guó)的意見,我們對(duì)于DIS稿進(jìn)行了修改,我們決定接受德國(guó)的意見,促使德國(guó)改變立場(chǎng),為此,我們提出了第二個(gè)DIS的修訂稿。修改內(nèi)容如下:

(一)接受德國(guó)的建議,把全自動(dòng)的拼音轉(zhuǎn)換作為自動(dòng)拼音轉(zhuǎn)換的一種重要方法,刪除了DIS稿中“這種全自動(dòng)的方法是很容易用計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)的,但是譯音出來(lái)的音節(jié)的歧義指數(shù)較高”這樣“但書”式的表達(dá)。

(二)接受美國(guó)的意見,刪除雙姓之間的連字符。把例子改為:Zhang Wang Shufang (張王淑芳)、 Xiang Situ Wenliang(項(xiàng)司徒文良)。

(三)接受美國(guó)的意見,詞頭“小,老,大,阿”的首字母小寫,以免與“肖”“勞”“達(dá)”等姓相混淆。例如,xiao Liu(小劉,younger Liu)、lao Qian(老錢,older Qian)、da Li(大李,older Li)、a Gui(阿貴,Mr.Gui)。

(四)接受美國(guó)的意見,宗教名中增加教徒的拼寫規(guī)則。例如,Huijiaotu回教徒(Muslim)、Jidutu基督徒(Christian)。

(五)接受加拿大的意見,對(duì)于DIS文件中某些細(xì)節(jié)進(jìn)行了技術(shù)上的修改。

2015年6月1—5日的ISO/TC46第41屆全會(huì)在北京召開,馮志偉受教育部派遣參加了這次會(huì)議。馮志偉在6月2日下午的大會(huì)專題報(bào)告會(huì)上,作了《ISO7098國(guó)際標(biāo)準(zhǔn)及其在人機(jī)交互中的應(yīng)用》[6]的報(bào)告,用生動(dòng)的實(shí)例說(shuō)明了在數(shù)字化環(huán)境下,漢語(yǔ)拼音在人機(jī)交互中發(fā)揮了巨大的作用。馮志偉的報(bào)告受到了各國(guó)代表的熱烈歡迎。(請(qǐng)參看附錄)

在6月3日上午的WG3會(huì)議上,馮志偉又說(shuō)明了各國(guó)對(duì)于ISO 7098的DIS稿提出的意見以及我國(guó)對(duì)于這些意見的處理情況,并就ISO 7098的修訂問(wèn)題重申了中國(guó)的立場(chǎng)。

會(huì)議期間,馮志偉還分別與德國(guó)、日本、英國(guó)、美國(guó)的代表交換了對(duì)于ISO 7098 的意見,進(jìn)一步了解了他們的立場(chǎng),表示愿意接受代表們提出的絕大多數(shù)意見,并在最終的修訂稿中做相應(yīng)的修改。馮志偉特別與英國(guó)代表進(jìn)行了溝通,希望英國(guó)一如既往地支持我國(guó)的漢語(yǔ)拼音方案,不要投棄權(quán)票。

2015年6月5日的全體會(huì)議決定ISO 7098跳過(guò)“國(guó)際標(biāo)準(zhǔn)最終草案”(Final Draft of International Standard,簡(jiǎn)稱FDIS)階段,直接出版,并且把這樣的決定作為決議的第2條和第3條寫入全會(huì)的決議,表明了這次會(huì)議對(duì)于ISO 7098國(guó)際標(biāo)準(zhǔn)修改工作的高度重視。

ISO/TC 46第42屆全會(huì)關(guān)于ISO 7098的決議:

決議第2條:

英文:

NEW resolutions

ISO/TC 46 RESOLUTION 2015-02:Publication of revised ISO 7098

ISO/TC 46 acknowledges the positive results of voting on ISO DIS 7098 "Romanization of Chinese" (N 2519) and,in view of the technical changes required,resolves to circulate a CIB to publish the DIS edited by WG3 in response to the DIS ballot.TC 46 instructs its secretariat to include the latest revised draft with the CIB.

Approved unanimously

法文:

NOUVELLES résolutions

ISO/TC 46 RESOLUTION 2015-02 :Publication de la norme révisée ISO 7098

ISO/TC 46 prend acte des résultats positifs du vote sur ISO DIS 7098 “Romanisation du chinois" (N 2519) et décide,au regard des modifications techniques nécessaires,de distribuer un CIB pour publier le DIS édité par le GT3 en réponse au vote DIS.Le TC46 enjoint son secrétariat d’inclure la dernière proposition révisée avec le CIB.

Approuvée à l’unanimité.

[ISO/TC 46 決議2015-02,第2條:出版ISO 7098的修訂稿

ISO/TC 46認(rèn)識(shí)到ISO DIS 7098“中文羅馬字母拼寫法”的投票已經(jīng)得到了正面的結(jié)果(文件N2519),為了做技術(shù)上的修改,ISO/TC 46決定進(jìn)行委員會(huì)內(nèi)部投票(Committee Internel Balotting,CIB),由WG3根據(jù)DIS投票結(jié)果編輯之后出版ISO 7098的DIS修訂稿。TC 46將通知秘書處把CIB的意見納入最終修訂稿中。

表決結(jié)果:一致同意]

決議第3條:

英文:

ISO/TC 46 RESOLUTION 2015-03:Expression of thanks to Professor Feng

ISO/TC 46 wishes to express its gratitude to Professor Feng Zhiwei for bringing his experience to the successful completion of the revision of ISO 7098 "Romanization of Chinese".

Approved unanimously

法文:

ISO/TC 46 RESOLUTION 2015-03 :Remerciements au Professeur Feng

ISO/TC 46 souhaite exprimer sa gratitude au ProfesseurFeng Zhiwei pour avoir contribué par

son expérience à la bonne réussite de la révision de la norme ISO 7098 "Romanisation du Chinois".

Approuvée à l’unanimité

[ISO/TC 46決議2015-03,第3條:對(duì)馮志偉教授表示感謝

ISO/TC 46對(duì)馮志偉教授表示感謝,因?yàn)轳T志偉教授以他豐富的經(jīng)驗(yàn)推動(dòng)了ISO 7098國(guó)際標(biāo)準(zhǔn)“中文羅馬字母拼寫法”的修改工作,從而使得這一工作得以卓有成效地取得成功。

表決結(jié)果:一致同意]

會(huì)后,我們把經(jīng)過(guò)修改的DIS稿提交ISO TC 46秘書處,他們于2015年7月27日發(fā)給ISO/TC 46的各成員國(guó)進(jìn)行委員會(huì)內(nèi)部投票(Committee Internel Balotting,CIB),CIB投票于2015年9月18日結(jié)束。根據(jù)ISO國(guó)際標(biāo)準(zhǔn)化組織的規(guī)定,此次投票時(shí),不了解漢語(yǔ)拼音的國(guó)家可以棄權(quán),因此,計(jì)算票數(shù)時(shí)只考慮沒有棄權(quán)的國(guó)家。ISO/TC 46秘書處N2562號(hào)文件公布了投票結(jié)果:ISO/TC 46委員會(huì)中沒有棄權(quán)的19個(gè)國(guó)家都投了贊成票,獲得全票通過(guò)。

N2562號(hào)文件部分內(nèi)容如下:

“Please find attached the positive results following the distribution on the 27th July 2015 of the final text of SO 7098 Romanization of Chinese-document N2562 for electronic ballot closed on 2015-09-18.”

[請(qǐng)注意所附N2562號(hào)文件是在2015年7月27日發(fā)出的ISO 7098中文羅馬字母拼寫法的最終文本的正面投票結(jié)果,電子投票已于2015年9月18日結(jié)束。]

投贊成票的國(guó)家(19個(gè)):保加利亞、加拿大、中國(guó)、克羅地亞、丹麥、愛沙尼亞、法國(guó)、德國(guó)、伊朗、意大利、日本、韓國(guó)、拉脫維亞、挪威、俄羅斯、泰國(guó)、烏克蘭、英國(guó)、美國(guó)。沒有國(guó)家投反對(duì)票。

CIB投票在計(jì)算比例時(shí),不考慮棄權(quán)票。在19個(gè)沒有棄權(quán)的國(guó)家中,19票贊成,占100%,沒有反對(duì)票,獲得全票通過(guò)。

日本在CD和DIS投票中棄權(quán),英國(guó)在DIS投票中棄權(quán),經(jīng)過(guò)我們與日本、英國(guó)專家的深入交流和溝通,在這次關(guān)鍵性的CIB投票中,他們改變態(tài)度投了贊成票。德國(guó)在過(guò)去的投票中都是投反對(duì)票,經(jīng)過(guò)我們與德國(guó)專家以及德國(guó)標(biāo)準(zhǔn)化研究所(DIN)的深入交流和溝通,在這次CIB投票中,最后改變態(tài)度支持我們,投了贊成票。這說(shuō)明,由我國(guó)起草并修訂的ISO 7098已經(jīng)得到了世界各國(guó)的支持。我們獲得了全勝!

美國(guó)在CIB投票中,對(duì)于DIS稿中的第12.2節(jié)還提出了最后一條修改意見:

If there is a room for cataloger’s judgement,one may romanize it as “Agui” considering “阿” as part of a given name “阿貴”.

[如果還有編目專家作出判斷的空間,他們有可能把“阿貴”中的“阿”判斷為人名中的一部分,那么,這時(shí)他們就可以把“阿貴”拼寫為“Agui”。]

我們認(rèn)真研究了美國(guó)的意見,認(rèn)為他們的意見是有道理的。在漢語(yǔ)中,“小”“老”“大”“阿”確實(shí)有可能作為人名的開頭,這時(shí)它們的首字母應(yīng)當(dāng)大寫。因此,我們又對(duì)DIS做了最后的修改,有關(guān)內(nèi)容改寫如下:

Adjuncts such as “xiao”,“l(fā)ao”,“da” and “a” should not be capitalized unless they appear at the beginning of a sentence.E,g,xiao Liu (小劉,younger Liu),lao Qian (老錢,older Qian),da Li (大李,older Li),a Gui (阿貴,Mr.Gui).If the character “xiao”,“l(fā)ao”,“da” and “a” is part of a given name,follow the same practice for given names.E.g.Wang Xiaojuan (王小娟),Zhao Laoshan (趙老山),Li Daqin (李大勤),Lou Ashu (婁阿鼠).

[“老”“小”“大”等附加成分的首字母小寫,除非它們出現(xiàn)在句首才大寫。例如,xiao Liu (小劉,younger Liu)、lao Qian (老錢,older Qian)、da Li (大李,older Li)、a Gui (阿貴,Mr.Gui)。如果“老”“小”“大”等漢字是人名的一部分,則按照人名的拼寫規(guī)則來(lái)拼寫。例如,Wang Xiaojuan (王小娟) 、Zhao Laoshan (趙老山)、Li Daqin (李大勤)、Lou Ashu (婁阿鼠)。]

之后,我們向ISO秘書處提供了最后的版本,2015年12月15日,ISO 7098的第三版,即ISO 7098:2015由ISO總部正式出版。

參考文獻(xiàn):

[1] 馮志偉.關(guān)于修訂中文羅馬字母拼寫法國(guó)際標(biāo)準(zhǔn)ISO 7098 (1991)的情況說(shuō)明[J].北華大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013,14(3):4-13.

[2] Scheme of Chinese phonetic alphabet[C]//Selections of Norms and Standards for Language and Script of China.Beijing:Standards Press of China,1997:441.

[3] Directives for the promotion of Putonghua.Promulgated by the State Council of China[C]//Selections of Norms and Standards for Language and Script of China.Beijing:Standards Press of China,1997:439-440.

[4] ALA-LC Romanization.Chinese,Rules of Application[EB/OL].http://www.loc.gov/catdir/cpso/romanizati on/chinese.pdf.

[5] Library of Congress.Pinyin Conversion Project,New Chinese Romanization Guidelines [EB/OL].http://www.loc.gov/catdir/pinyin/romcover.html,1998.

[6] Zhiwei Feng.ISO 7098 and Its Application in Human Computer Interaction[C]// Proceedings of 42th plenary meeting of ISO/TC 46.Beijing:2015:1-16.

[7] Knight Stan.The Roman Alphabet[C]// In Daniels,Peter T,Bright William,The World’s Writing Systems.Oxford University Press,1996.

【責(zé)任編輯李開拓】

附錄:馮志偉在ISO/TC46第41屆全會(huì)上作的專題報(bào)告:《ISO7098國(guó)際標(biāo)準(zhǔn)及其在人機(jī)交互中的應(yīng)用》

ISO 7098 and Its Application in Human-Computer Interaction*Keynote Speech of Feng Zhiwei at 42th plenary meeting of ISO/TC 46 on 2015-06-02.

Feng Zhiwei

(HangzhouNormalUniversity,Hangzhou311121,China;InstituteofAppliedLinguistics,MOE,Beijing100010,China)

1.Challenge of Computer to Chinese Characters

We are in the information epoch.In this epoch,computer and network play more and more important rule in human life.The language is an effective carrier of information.In information epoch,the computer with only more than 60 years challenged to the Chinese characters with more than 6000 years.

The Chinese character is a kind of ideophonographic character.The ideophonographic character is a graphic character that represents an object or a concept and associated sound element.The Chinese characters are a big character set.The most of character set in the world only includes a limited number of characters.The character number included in the character set of different languages is as following:

The number of the Chinese characters is much more than above languages.Following is the Chinese character number in different Chinese dictionaries from ancient China to Modern China:

The Chinese character number in ZHONGHUA ZIHAI arrives to 85,000,but some Chinese characters in this dictionary only are meaningless or soundless signs,they can’t be considered as the authentic Chinese characters.Generally the number of the Chinese characters is more than 60,000.It is the biggest character set in the world.

In 20th century,some experts try to invent the Chinese typewriter to type Chinese characters.The Chinese character typewriter is different from the Remington typewriter which based on Latin alphabet.It is extremely complicated and cumbersome.For example,the Chinese typewriter invented by Wally Johnson,which now is kept in the office of Vickie Fu Doll,Chinese and Korean Studies Librarian in the East Asian Library of the University of Kansas,USA*Victor Mair,Chinese typewriter,Language Log,June 30,2009..

The main tray-which is like a typesetter’s font of lead type-has about two thousand of the most frequent Chinese characters.Two-thousand Chinese characters are not nearly enough for literary and scholarly purposes,so there are also a number of supplementary trays from which less frequent Chinese characters may be retrieved when necessary.

The pieces of character types are tiny and all of a single metallic shade in the tray,it becomes a maddening task for typist to find the right character.Another problem is the principle upon which the characters are ordered in the tray.By radical of Chinese characters? By total stroke count of Chinese characters? Both of these methods would result in numerous Chinese characters under the same heading.By rough frequency of Chinese characters? By telegraph code of Chinese characters ? Both of these methods need the good memory of typist.Unfortunately,nobody seems to have thought to use the easiest and most user-friendly method of arranging the Chinese characters according to their pronunciation.For all of the above reasons,using a Chinese typewriter was an excruciating experience.Following is a precious photograph of Wally Johnson working at his typewriter:necessary.

And another is the photograph of Wally Johnson taking a short break in place:

These photos vividly convey the suffering that is associated with using a Chinese typewriter.The computer also uses the Remington typewriter as the keyboard for human and computer interaction.Obviously,above Chinese typewriter can not be used as the keyboard of computer for human and computer interaction.The design of computer keyboard is based on Latin alphabet system.If we use Latin alphabet to represent the pronunciation of the Chinese characters,then we can get the easiest and most user-friendly method to input or output the Chinese characters according to their pronunciation.Therefore,the Romanization of Chinese is very helpful for Human Computer Interaction.

2.Romanization of Chinese

The words in a language,which are written according to a given script (the converted system),sometimes have to be rendered according to a different system (the conversion system).The conversion is indispensable in that it permits the univocal transmission of a written message between two countries using different writing systems or exchanging a message,the writing of which is different from their own.

There are two basic methods of conversion of a system of writing:transliteration and transcription.

Transliteration is the operation which consists of representing the characters of an entirely alphabetical character or alphanumeric character system of writing by the characters of the conversion alphabet.In principle,this conversion should be made character by character:each character of the converted alphabet is rendered by one character,and only one character of the conversion alphabet,to ensure the complete and unamb- iguous reversibility of the conversion alphabet into the converted alphabet (re-transliteration).

Transcription is the operation which consists of representing the characters of a language,whatever the original system of writing,by the phonetic system of letters or signs of the conversion language.A transcription system is of necessity based on the orthographical conventions of a conversion language and its alphabet.The users of a transcription system must have the knowledge of the conversion language to be able to pronounce the characters correctly.Transcription is not strictly reversible.The transcription may be used for the conversion of all writing systems.It is the only method that can be used for systems that are not entirely alphabetical and for all ideophonographic writing systems as Chinese.

Romanization is the conversion of non-Latin writing systems to the Latin alphabet by means of transliteration or transcription.To carry out Romanization,it is possible to use either transliteration or transcription or a combination of these two methods,according to the nature of the converted system.

Many years ago,in 1958-02-11,the National People’s Congress of China approved The Scheme for the Chinese Phonetic Alphabet (Hanyu Pinyin,or Pinyin)[1][2].This scheme is based on the principle of the transcription in Romanization.So we call this scheme as Chinese Romanization.

3. ISO 7098 Information and Documentation:Romanization of Chinese

In 1979,Chinese delegate proposed to take the Scheme of Chinese Phonetic Alphabet as the international standard in ISO TC46 meeting (Warsaw).In 1982,ISO 7098 Documentation and Information-Chinese Romanization was approved at ISO TC46 meeting (Nanjing) as the first edition.In 1991,ISO 7098 was technically revised.It became the second edition (ISO 7098:1991).

In China,Pinyin,the international standard for Romanization of Chinese,gives impetus to new information technique in the information epoch.In computer application and mobile communication,it is used to input and output the Chinese characters in computer,web and mobile phone.Now more than 80% Chinese used Pinyin to deal with Chinese information processing.Pinyin became an important tool for human-computer interaction.In China,Pinyin also is used in natural language processing and language technique (machine translation,information extraction,information retrieval,text data mining,etc.).

In the international level,Pinyin has been adapted by most libraries around the world.It provides access to bibliographic material of the Chinese language in documentation (including traditional documentation and computerized documentation).In the computerized documentation field,Pinyin plays active role in human-computer interaction.In the end of 20 century,Library of Congress (USA) used Pinyin to catalogue Chinese books (700,000 books) in the library.In the same tine,the Bibliothèque universitaire des langues et civilisations in Paris asked a team of sinological librarians from all over the country,including the Bibliothèque Nationale de France,to ask their opinion on Chinese word segmentation of ISO 7098,in order to establish a common guideline on Chinese word segmentation in Pinyin.The National Library of Australia also adapted Pinyin for Chinese Romanization in documentation.Now more and more people in the world learn Chinese as a foreign language by the means of Pinyin.Pinyin became an important tool for teaching and learning Chinese.In Computer-Assisted Chinese Language Learning,Pinyin is used for input and output of Chinese characters in the human-computer interaction.

These facts show,Pinyin is a useful tool in human-computer interaction not only in China,but also in the rest of world.

4.Index of ambiguity for Chinese syllables

The number of basic Chinese syllables is only 405.These 405 Chinese syllables can represent the pronunciation of all Chinese characters.List of Standard Chinese Characters for General use (2012) includes 8105 commonly-used the Chinese characters.In this case,one Chinese syllable has to represent in average more than 20 Chinese characters (8,105/405=20.01) for the general use.

In List of Standard Chinese Characters for General Use (2013),the Pinyin syllable /bei/ can represent the following 31 Chinese characters:

北 杯 卑 背 椑 悲 碑 鵯 貝 孛 邶 狽 備 鋇 倍 悖 被 琲 棓 輩 憊 焙 蓓 碚 鞁 褙 糒 鞴 鐾 唄 臂

In List of Standard Chinese Characters for General Use (2013),the Pinyin syllable /jing/ can represent the following 49 Chinese characters:

This means that the Pinyin syllable is ambiguous in representation of the Chinese characters.The ambiguity index is a mathematical description of the degree of ambiguity of Pinyin syllables.The ambiguity index of a Pinyin syllable (I) equals the number of Chinese linguistic units (Chinese characters,Chinese morphemes or Chinese words) represented by this Pinyin syllable (N) minus 1.The formula is as follows:I=N-1

This formula means that if the Pinyin syllable can represent N Chinese linguistic units,its ambiguity index (I) equals N-1.If the Pinyin syllable can only represent one Chinese linguistic unit,its ambiguity index is zero.If the Pinyin syllable can represent two Chinese linguistic units,its ambiguity index is 2-1=1.If the Pinyin syllable can represent three Chinese linguistic units,its ambiguity index is 3-1=2,...etc.

In example 1,the Pinyin syllable /bei/ can represent 31 Chinese characters,its ambiguity index is 31-1=30;in example 2,the Pinyin syllable /jing/ can represent 49 Chinese characters,its ambiguity index is 49-1=48.However,if we combine these two monosyllables /bei/ and /jing/ to form a bi-syllabic word /beijing/,the ambiguity index will be reduced,because /beijing/ can only represent three Chinese bi-syllabic words:北京,背景,背靜.The ambiguity index of /beijing/ is reduced to 3-1=2.

If we capitalize the first letter of /beijing/ as /Beijing/,the ambiguity index will be reduced to 1-1=0.It means that /Beijing/ is a Pinyin word without ambiguity,its sense number is only 1.The sense of /Beijing/ is exactly the name of the capital of China:北京

Therefore,if we link different Pinyin monosyllables to form a polysyllabic Chinese word,the ambiguity index of the Pinyin syllable will be reduced.It is an advantage to link different monosyllables to form one polysyllabic Chinese word.

However,at present days,in Chinese linguistics,there is not clear definition of Chinese word,it is difficult to decide the boundary (dividing line) of a Chinese word,and of course it will bring the difficulty to link the monosyllables to form a polysyllabic Chinese word.But the definition of Chinese proper noun is relatively clear.It is not so difficult to link different monosyllables to form a Chinese polysyllabic proper noun (personal names,geographic names,language names,ethnic names,tribe names,religion names,etc),because the boundary of Chinese polysyllabic proper noun is easy to decide according to the standards or regulations.

By this reason,at the 38th plenary meeting of ISO/TC 46 (6 May 2011,Sydney),the Chinese delegate proposes to further update ISO 7098:1991 to reflect current Chinese Romanization practice and new development not only in China,but also in the world.At the 39th plenary meeting of ISO/TC 46 (11 May 2012,Berlin),ISO TC 46 resolves to accept the China’s proposal at Working Draft (WD) stage.On 5 November 2013,the CD ballot is approved.At the 41th plenary meeting of ISO/TC 46 (4 May 2014,Washington D.C.),the Chinese delegate submitted the Draft of International Standard (DIS) revised on the comments at the CD ballot stage.On 1 March 2015,the DIS ballot was approved.

In ISO 7098 updating version,the Chinese delegate proposed the suggestions for the transcription rules of personal names,geographic names,language names,ethnic names,tribe names and religion names in Chinese language.We believe that this kind of transcription will be the first step for Chinese transcription based on the Chinese word (including monosyllabic word and polysyllabic word,etc).

The detailed spelling rules of personal names and geographical names should be alphabetized according to the regulations Spelling Rules for Chinese Personal Names and Spelling Rules for Chinese Geographical Place Names (the part of Chinese Geographical Names).

The detailed spelling rules of common words are more complex than the rules of these proper nouns (naming entities).The rules of pinyin orthography for Chinese common words are included in the National Standard of China Basic Rules for Hanyu Pinyin Orthography (GB/T 16159-2011).

In ISO 7098 updating version,Chinese delegate proposed and shall propose the following suggestions for the transcription rules of personal names,geographic names,language names,ethnic names,tribe names and religion names in Chinese language.We believe that this kind of transcription for the naming entity will be the first step for Chinese transcription based on the Chinese word (including polysyllabic common word and polysyllabic proper noun,etc).The Chinese Romanization will play more and more important roles in human-computer interaction.

References

[1]Scheme of Chinese Phonetic Alphabet.Selections of norms and standards for language and script of China[M].Beijing:Standards Press of China,1997:441.

[2]Directives for the Promotion of Putonghua.Promulgated by the State Council of China.Selections of norms and standards for language and script of China[M].Beijing:Standards Press of China,1997:439-440.

[中圖分類號(hào)]H125.2

[文獻(xiàn)標(biāo)識(shí)碼]A

[文章編號(hào)]1009-5101(2016)02-0001-17

[收稿日期]2016-02-09

[作者簡(jiǎn)介]馮志偉,杭州師范大學(xué)外國(guó)語(yǔ)學(xué)院教授,教育部語(yǔ)言文字應(yīng)用研究所研究員,博士生導(dǎo)師,主要從事計(jì)算語(yǔ)言學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)、數(shù)理語(yǔ)言學(xué)研究。(杭州311121)

Updating ISO 7098 Romanization of Chinese:from WD to DIS

Feng Zhiwei

(ForeignLanguagesSchoolofHangzhouNormalUniversity,Hangzhou311121,China)

Abstract:At the 38th plenary meeting of ISO/TC 46 (Sydney,May 2011),the Chinese delegate proposed to update ISO 7098:1991 to reflect the current Chinese Romanization practice and new development not only in China,but also in the world.At the 39thplenary meeting of ISO/TC 46 (Berlin,11 May 2012),ISO/TC 46 resolved to accept China’s proposal at Working Draft (WD) stage.On 5 November 2013,the Committee Draft (CD) ballot was approved.On 1 March 2015,the Draft of International Standard (DIS) ballot was approved.At the 42nd plenary meeting of ISO/TC 6 (Beijing,5 June 2015),ISO/TC 46 resolved that ISO 7098 will go to the publication phase after the revised latest text has been checked by the ISO/TC 46 leadership and sent for committee-internal balloting (CIB) together with the text.On 18 September 2015,the CIB ballot was approved.On 15 December 2015,ISO 7098:2015 was published by ISO.This paper introduces the procedure of updating ISO 7098 from WD to DIS.

Key words:ISO 7098;Romanization of Chinese;Committee Draft;Draft of International Standard;Ambiguity index of Chinese Pinyin syllable

猜你喜歡
譯音歧義音節(jié)
eUCP條款歧義剖析
拼拼 讀讀 寫寫
說(shuō)說(shuō)西夏韻圖《五音切韻》的韻等問(wèn)題
西夏學(xué)(2019年2期)2019-01-13 11:14:06
《象鼻高山譯語(yǔ)》藏漢對(duì)譯音義關(guān)系初步考查
西藏研究(2018年6期)2018-03-25 10:22:50
English Jokes: Homonyms
藏文音節(jié)字的頻次統(tǒng)計(jì)
乙種本《西番譯語(yǔ)》藏漢對(duì)譯音義關(guān)系辨析
西藏研究(2016年2期)2016-06-05 11:31:13
“那么大”的語(yǔ)義模糊與歧義分析
快樂拼音
木管樂器“音節(jié)練習(xí)法”初探
乌拉特后旗| 合江县| 龙山县| 东方市| 龙井市| 保亭| 兴业县| 读书| 潮州市| 尼勒克县| 杭州市| 公安县| 弥渡县| 梁河县| 达孜县| 嵩明县| 古交市| 抚松县| 开鲁县| 伊通| 墨竹工卡县| 民勤县| 安国市| 宁陕县| 元谋县| 胶州市| 丰原市| 兰溪市| 铜川市| 绥棱县| 龙门县| 江口县| 司法| 盱眙县| 广州市| 凤冈县| 洱源县| 台湾省| 迁安市| 大城县| 新源县|