国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢語(yǔ)拼音國(guó)際標(biāo)準(zhǔn)化的新進(jìn)展

2016-05-30 02:34:21馮志偉
語(yǔ)言戰(zhàn)略研究 2016年2期
關(guān)鍵詞:國(guó)際標(biāo)準(zhǔn)拼音

提 要 本文敘述了國(guó)際標(biāo)準(zhǔn)ISO 7098的修訂過(guò)程,指出這個(gè)國(guó)際標(biāo)準(zhǔn)修訂的兩大特點(diǎn)?:一是把漢語(yǔ)拼音按詞連寫的規(guī)則引入國(guó)際標(biāo)準(zhǔn),二是把漢字—拼音轉(zhuǎn)寫的自動(dòng)譯音方法引入國(guó)際標(biāo)準(zhǔn)。

關(guān)鍵詞 拼音;國(guó)際標(biāo)準(zhǔn);單一羅馬化;自動(dòng)譯音

Abstract This article describes the latest development of Chinese character internationalization. The first section, after a brief introduction about the promulgation of Pinyin (Romanization Scheme for Chinese character), discusses a series of academic efforts to integrate Pinyin into international standards since 1979, with a focus on recent proposals of Pinyin spelling standardization rules recommended to the annual meetings of ISO/TC (International Organization for Standardization/Technical Committee) from 2011 to 2015. The second and third sections review the two latest recommendation submitted to ISO. The second section focuses on the technical aspects of Chinese word-segmentation and disambiguation mechanism and the third section is devoted to the significance of the automatic transcription from Chinese characters to Pinyin in the international standard.

Key words Pinyin; international standard; single Romanization; automatic transcription

1979年,中國(guó)代表周有光在華沙的ISO/TC 46(國(guó)際標(biāo)準(zhǔn)化組織信息與文獻(xiàn)標(biāo)準(zhǔn)化技術(shù)委員會(huì))第18屆全體會(huì)議上,提出把《漢語(yǔ)拼音方案》作為國(guó)際標(biāo)準(zhǔn)的建議。

1982年在南京召開的ISO/TC 46第19屆全體會(huì)議上,正式通過(guò)了《ISO 7098 文獻(xiàn)工作——中文羅馬字母拼寫法》(ISO 7098 Information and Documentation-Chinese Romanization)。澳大利亞、加拿大、法國(guó)、日本、韓國(guó)、德意志聯(lián)邦共和國(guó)、蘇聯(lián)等國(guó)投了贊成票,英國(guó)棄權(quán),由于技術(shù)上的原因,美國(guó)投了反對(duì)票。從此,漢語(yǔ)拼音成為國(guó)際標(biāo)準(zhǔn)。

一、國(guó)際標(biāo)準(zhǔn)ISO 7098的修訂過(guò)程

1991年,在巴黎召開的ISO/TC 46第24屆全體會(huì)議上,對(duì)國(guó)際標(biāo)準(zhǔn)“ISO 7098”進(jìn)行了技術(shù)修改,成為《ISO 7098信息與文獻(xiàn)——中文羅馬字母拼寫法(1991)》,簡(jiǎn)稱“ISO 7098(1991)”。中國(guó)代表王均出席了這次會(huì)議。

20世紀(jì)90年代初制定ISO 7098(1991)的時(shí)候,正是世界進(jìn)入信息時(shí)代的關(guān)鍵時(shí)刻。為了適應(yīng)信息時(shí)代的要求,中國(guó)開始研制計(jì)算機(jī)漢字輸入輸出。使用漢語(yǔ)拼音,可以通過(guò)拼音—漢字轉(zhuǎn)換的方法輸入輸出漢字。由于漢語(yǔ)拼音是中國(guó)初等教育必不可少的內(nèi)容,每一個(gè)受過(guò)教育的中國(guó)人都會(huì)使用,這樣,ISO 7098(1991)就成了漢字輸入輸出的一種便捷的手段。

國(guó)際標(biāo)準(zhǔn)ISO 7098(1991)是在《漢語(yǔ)拼音方案》的基礎(chǔ)上制定的,為了在國(guó)際范圍內(nèi)進(jìn)一步擴(kuò)大《漢語(yǔ)拼音方案》的影響,有必要修改ISO 7098(1991)。

ISO 7098(1991)對(duì)于全世界的信息與文獻(xiàn)工作具有重要的意義,為了滿足國(guó)內(nèi)外對(duì)漢語(yǔ)拼音實(shí)際應(yīng)用的迫切需要,也有必要修改ISO 7098(1991)。

2011年3月,教育部成立了ISO 7098修訂工作組,由語(yǔ)言文字應(yīng)用研究所研究員馮志偉擔(dān)任組長(zhǎng),李志江、傅愛(ài)平、黃偉、顏偉四位語(yǔ)言文字專家為工作組成員,啟動(dòng)了ISO 7098(1991)的修訂工作。

2011年5月6日,ISO/TC 46第38屆會(huì)議在澳大利亞悉尼召開,受教育部的派遣,我國(guó)代表馮志偉出席并在會(huì)上提出了修改ISO 7098(1991)以便反映當(dāng)前中文羅馬化的新發(fā)展和實(shí)際應(yīng)用需要的建議。會(huì)后,我國(guó)國(guó)家標(biāo)準(zhǔn)化委員會(huì)(SAC)正式向ISO國(guó)際標(biāo)準(zhǔn)化組織提出了修訂ISO 7098(1991)的新工作項(xiàng)目(New Working Item Proposal,簡(jiǎn)稱NWIP)的提案,提案的國(guó)際編號(hào)是:N 2358。

2012年5月6日至11日,ISO/TC 46第39屆全體

會(huì)議在德國(guó)柏林舉行,教育部派遣馮志偉出席這次會(huì)議。會(huì)議接受了我國(guó)的N 2358號(hào)提案,并將這個(gè)提案直接作為ISO 7098的工作草案(Working Draft,簡(jiǎn)稱WD),成立了ISO 7098國(guó)際修訂工作組,并任命馮志偉擔(dān)任國(guó)際工作組組長(zhǎng),由美國(guó)、俄羅斯、德國(guó)和加拿大四國(guó)各派一位專家參加,這樣,ISO 7098(1991)的修訂便正式列入了國(guó)際標(biāo)準(zhǔn)化組織的工作日程。

2013年6月3日至7日在巴黎召開ISO/TC 46第40屆全體會(huì)議,教育部派遣馮志偉出席這次會(huì)議,馮志偉在會(huì)議上正式向ISO/TC 46秘書處提交了ISO 7098的委員會(huì)草案(Committee Draft,簡(jiǎn)稱CD)。

2014年5月5日至9日,ISO/TC 46第41屆全體

會(huì)議在美國(guó)華盛頓召開。教育部派遣馮志偉出席這次會(huì)議,在5月7日的第三工作組(Working Group 3,簡(jiǎn)稱WG3)會(huì)議上,就ISO 7098(1991)的修訂問(wèn)題重申中國(guó)的立場(chǎng)。會(huì)后向ISO/TC 46秘書處提交了ISO 7098的國(guó)際標(biāo)準(zhǔn)草案(Draft of International Standard,簡(jiǎn)稱DIS)。

2015年6月1日至5日的ISO/TC46第42屆全體會(huì)議在北京召開。教育部派遣馮志偉出席這次會(huì)議,在6月2日的大會(huì)專題報(bào)告會(huì)上做了《ISO 7098國(guó)際標(biāo)準(zhǔn)及其在人機(jī)交互中的應(yīng)用》的報(bào)告(Feng 2015)。6月3日的WG3會(huì)議上,馮志偉又介紹了各國(guó)對(duì)于ISO 7098的DIS稿提出的意見(jiàn)以及我國(guó)對(duì)于這些意見(jiàn)的處理情況,向與會(huì)人員出示了DIS的修改稿。

會(huì)后,馮志偉把經(jīng)過(guò)修改的DIS稿正式提交ISO/TC 46秘書處,根據(jù)ISO/TC 46第41屆全體會(huì)議的決議,ISO/TC 46秘書處于2015年7月27日把DIS的修改稿分發(fā)給ISO/TC 46的各成員國(guó),進(jìn)行委員會(huì)內(nèi)部投票(Committee Internal Balloting,簡(jiǎn)稱CIB),CIB投票于2015年9月18日結(jié)束。ISO/TC 46秘書處的N 2526號(hào)文件公布了投票結(jié)果:ISO/TC 46委員會(huì)中沒(méi)有棄權(quán)的19個(gè)國(guó)家全都投了贊成票,獲得全票通過(guò)。至此,ISO 7098形成了新的修訂稿,叫作ISO 7098:2015。2015年12月15日,ISO總部正式出版ISO 7098:2015,作為新的國(guó)際標(biāo)準(zhǔn)向全世界公布。

2015年12月15日由ISO總部正式出版的ISO 7098:2015有兩個(gè)最為引人注目的特點(diǎn),一是把漢語(yǔ)拼音按詞連寫的規(guī)則引入國(guó)際標(biāo)準(zhǔn),二是把漢字—拼音轉(zhuǎn)寫的自動(dòng)譯音方法引入國(guó)際標(biāo)準(zhǔn)。

二、漢語(yǔ)拼音按詞連寫的規(guī)則引入國(guó)際標(biāo)準(zhǔn)

漢語(yǔ)中大多數(shù)常用詞都是多音節(jié)詞,因此,在國(guó)際文獻(xiàn)和信息工作中,有必要把按詞連寫的規(guī)則引入國(guó)際標(biāo)準(zhǔn)。

在漢語(yǔ)拼音中,單個(gè)的音節(jié)是有歧義的。如果不計(jì)聲調(diào),基本的漢語(yǔ)音節(jié)只有405個(gè),這405個(gè)漢語(yǔ)音節(jié)可以表示全部漢字的讀音?!锻ㄓ靡?guī)范漢字表》包含8105個(gè)通用漢字,一般使用中一個(gè)漢語(yǔ)音節(jié)平均要表示20個(gè)以上的漢字(8105/405 =

20.01),不可避免會(huì)出現(xiàn)歧義。如果把幾個(gè)單音節(jié)連接起來(lái)構(gòu)成多音節(jié)詞,歧義指數(shù)就會(huì)大幅度減少。為了給拼音音節(jié)排歧,必須把不同的單音節(jié)連接起來(lái)構(gòu)成多音節(jié)的漢語(yǔ)單詞。

《漢語(yǔ)拼音正詞法基本規(guī)則》(GB/T 16159-2012)中包括了分詞連寫規(guī)則,人名和地名的拼寫規(guī)則,大寫規(guī)則,移行規(guī)則,等等。

漢語(yǔ)的專有名詞中,單詞的界限還是相對(duì)清楚的,由于漢語(yǔ)中多音節(jié)的命名實(shí)體的界限根據(jù)有關(guān)的規(guī)范和標(biāo)準(zhǔn)比較容易確定,因此,把不同的幾個(gè)單音節(jié)連接起來(lái)構(gòu)成多音節(jié)的專有名詞就不是很困難。

由于這樣的考慮,國(guó)際標(biāo)準(zhǔn)ISO 7098:2015增加了命名實(shí)體(naming entities)按詞進(jìn)行音節(jié)連寫的規(guī)定:在漢語(yǔ)拼音中,對(duì)于人名、地名、語(yǔ)言名、民族名、宗教名這五種命名實(shí)體,都要按詞進(jìn)行連寫。這樣就把“按詞連寫”這個(gè)重要的方法引進(jìn)了國(guó)際標(biāo)準(zhǔn)中。

在中文羅馬字母拼寫的發(fā)展過(guò)程中,曾經(jīng)使用過(guò)與《漢語(yǔ)拼音方案》不同的羅馬字母拼寫形式來(lái)拼寫中文地名。威妥瑪式(Wade Giles)、國(guó)語(yǔ)羅馬字(Guoyeu Romatzyh)、耶魯拼音(Mandarin Yale)等,根據(jù)“單一羅馬化”原則,在對(duì)中文地名進(jìn)行羅馬字母拼寫時(shí),選擇了《漢語(yǔ)拼音方案》。

三、漢字—拼音轉(zhuǎn)寫自動(dòng)譯音的方法引入國(guó)際標(biāo)準(zhǔn)

ISO 7098:2015還把漢字—拼音轉(zhuǎn)寫自動(dòng)譯音的方法引入國(guó)際標(biāo)準(zhǔn),提出了在計(jì)算機(jī)輔助文獻(xiàn)工作中,對(duì)命名實(shí)體進(jìn)行自動(dòng)譯音(automatic transcription)的兩種方法:一種是按音節(jié)全自動(dòng)譯音,一種是基于規(guī)則的按單詞半自動(dòng)譯音。

按音節(jié)全自動(dòng)譯音的方法能夠把漢字文本自動(dòng)地譯音為彼此之間由空白分開的單音節(jié)的拼音。使用這樣的方法,“北京市”這個(gè)地名可以全自動(dòng)地譯音為/bei/、/jing/ 和/shi/三個(gè)音節(jié)。這種方法很容易用計(jì)算機(jī)程序來(lái)實(shí)現(xiàn),但是譯音出來(lái)的音節(jié)的歧義指數(shù)較高。

另一種是基于規(guī)則的按單詞半自動(dòng)譯音的方法。在目前的技術(shù)條件下,全自動(dòng)的單詞切分難以達(dá)到很好的質(zhì)量,可以采用基于規(guī)則的按單詞半自動(dòng)譯音的方法。

命名實(shí)體基于規(guī)則的按單詞半自動(dòng)譯音可以使用如下的資源:1. 一套譯音規(guī)則:ISO 7098:2015提出了命名實(shí)體譯音的一般規(guī)則,這些規(guī)則可以用作命名實(shí)體半自動(dòng)譯音的資源。2. 一個(gè)相關(guān)的譯音詞典:最近出版的《漢語(yǔ)拼音詞匯:專名部分(草案)》(董琨 2015)包含了大多數(shù)的命名實(shí)體的拼音譯音,可以用作命名實(shí)體半自動(dòng)譯音的另一個(gè)資源。

ISO 7098:2015提出,如果在按詞譯音過(guò)程中出現(xiàn)歧義或問(wèn)題,后編輯人員可以根據(jù)譯音詞典,使用人機(jī)交互找出合適的命名實(shí)體的譯音。所以,這樣的方法是半自動(dòng)的。這種半自動(dòng)方法的譯音質(zhì)量很高,音節(jié)的歧義指數(shù)較小甚至可以減少到零。

24年前制定的ISO 7098(1991)把《漢語(yǔ)拼音方案》提高到國(guó)際標(biāo)準(zhǔn)的地位,是漢語(yǔ)拼音走向世界的第一步,現(xiàn)在我們修訂的ISO 7098:2015,進(jìn)一步提出了在羅馬字母拼寫時(shí)對(duì)命名實(shí)體按詞連寫的規(guī)則和自動(dòng)譯音的方法,邁開了漢語(yǔ)拼音走向世界的新步伐。

參考文獻(xiàn)

董 琨主編 2015 《漢語(yǔ)拼音詞匯:專名部分(草案)》,上海:上海辭書出版社。

Feng Zhiwei. 2015. Chinese Romanization and Its Application in HCI. Proceedings of 42th Plenary Meeting of ISO TC46, Beijing.

International Standadization Organization. 2015. ISO 7098: 2015 Information and Documentation: Romanization of Chinese. Geneve.

責(zé)任編輯:劉一玲

猜你喜歡
國(guó)際標(biāo)準(zhǔn)拼音
拼音梗
意林(2024年8期)2024-06-05 07:02:33
國(guó)際標(biāo)準(zhǔn)ISO 22992-2:2020正式發(fā)布
CTTC中紡標(biāo):國(guó)際標(biāo)準(zhǔn)誕生記
拼音
快樂(lè)拼音
快樂(lè)拼音
我國(guó)參與編制多項(xiàng)光伏逆變器國(guó)際標(biāo)準(zhǔn)
我國(guó)專家制定首項(xiàng)緩釋肥料國(guó)際標(biāo)準(zhǔn)
快樂(lè)拼音
哭泣的拼音
汕头市| 阿巴嘎旗| 崇左市| 临洮县| 襄樊市| 鄂托克旗| 遂宁市| 柳江县| 定远县| 黑龙江省| 罗城| 唐山市| 新干县| 宜州市| 揭西县| 武隆县| 甘孜县| 遵义市| 余江县| 勃利县| 海宁市| 青浦区| 博白县| 普定县| 新绛县| 高唐县| 边坝县| 阜宁县| 郴州市| 东乡| 定陶县| 天峨县| 岫岩| 东乌珠穆沁旗| 盘山县| 陆丰市| 凤翔县| 潞西市| 嘉禾县| 东辽县| 同德县|