国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢字數(shù)字化是建設(shè)數(shù)字中國的基礎(chǔ)設(shè)施之一

2018-10-11 17:26中共四川省廣元市委黨史研究室凌加杰
網(wǎng)信軍民融合 2018年6期
關(guān)鍵詞:輸入法字母統(tǒng)一

◎中共四川省廣元市委黨史研究室 凌加杰

把我國從網(wǎng)絡(luò)大國建成網(wǎng)絡(luò)強國,實施大數(shù)據(jù)戰(zhàn)略加快數(shù)字中國建設(shè),這是習(xí)近平總書記提出的偉大的戰(zhàn)略部署。網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)是網(wǎng)絡(luò)強國戰(zhàn)略的重要組成部分。網(wǎng)絡(luò)基礎(chǔ)設(shè)施,形象地說,就是要搭建一個信息“高速公路”從而實現(xiàn)海量數(shù)據(jù)的運行、儲存和流通。只有基礎(chǔ)設(shè)施搞上去了,在此基礎(chǔ)上發(fā)展通訊、互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算才有可能。所以網(wǎng)絡(luò)強國戰(zhàn)略的第一步是搞好網(wǎng)絡(luò)基礎(chǔ)設(shè)施。也就是說,只有建成信息“高速公路”,海量數(shù)據(jù)的運作、存儲、流通才有可能實現(xiàn)。數(shù)據(jù)的實質(zhì)是信息,漢字是信息的載體。在非電子時代,漢字是信息運作、存儲、流通的主要手段?,F(xiàn)在人類已進入互聯(lián)網(wǎng)時代,數(shù)字是現(xiàn)代計算機的語言,作為信息載體的漢字,必須實現(xiàn)數(shù)字化才能在信息“高速公路”上運作、存儲、流通。所以漢字的數(shù)字化既是數(shù)字基礎(chǔ)設(shè)施之一,也是網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)的組成部分?,F(xiàn)代計算機技術(shù)是以英文為基礎(chǔ)設(shè)計的。漢字被長期排斥在中央處理器之外,極大的限制了我國信息技術(shù)的發(fā)展,只有漢字實現(xiàn)數(shù)字化,才能改變這種局面,徹底取代英文統(tǒng)一天下的時代。漢字數(shù)字化可以解決漢字輸入、中文加密、電腦編程、人機界面、人工智能、語音控制等一系列關(guān)鍵信息領(lǐng)域里的難題。

為什么漢字被長期排斥在中央處理器之外呢?這既有歷史的原因,也有漢字自身的原因。現(xiàn)代計算機技術(shù)發(fā)源英美,自然是以英文為基礎(chǔ)而設(shè)計的?,F(xiàn)在漢字沒有進入中央處理器,其自身的原因是:1、漢字的歧義性太強;2、漢字的文字存儲占有太大,用點陣存儲,漢字的存儲占的字節(jié)數(shù)太多;3、漢字的結(jié)構(gòu)性不是很強;4、從編譯方式來說漢字同樣有很多不方便。由于漢字的缺陷在于它的造字原料,不具有單一性,不能構(gòu)成有序性,所以導(dǎo)致現(xiàn)代應(yīng)用的困難。因此,中國人不得不設(shè)計編碼,以此實現(xiàn)漢字數(shù)字化來解決這個問題。設(shè)計編碼的目的,是為了使?jié)h字帶上一套有序的符號,完善漢字系統(tǒng),以彌補漢字的不足之處。這是現(xiàn)代技術(shù)對中國人提出的挑戰(zhàn),同時也是時代給予中華民族的一次機遇。現(xiàn)代科技激活了漢字變革,漢字編碼實現(xiàn)漢字數(shù)字化,促成了漢字系統(tǒng)的完善,這是社會發(fā)展的必然。因此,“漢字編碼是漢字的一次變革,而不是單純?yōu)榱穗娔X輸入”。1995年的《電腦報》就曾經(jīng)發(fā)出這樣的呼吁:“最好的編碼究竟是什么?著名的科學(xué)家錢偉長教授早在1986年就曾經(jīng)指出:好的編碼方案還沒有出來,好的編碼方案應(yīng)該是一種文字,或者是準文字?!币簿褪钦f,好的漢字數(shù)字化方案,應(yīng)該是一種準文字,它不但能適合計算機的需要,而且還能繼承漢字的文化傳統(tǒng)幫助學(xué)習(xí)漢字,成為漢字的助手。

什么樣的漢字數(shù)字化方案才能適合現(xiàn)代計算機的需要呢?電腦的語言是數(shù)字。說白了就是“人機對話”的漢字必須數(shù)字化,并且實現(xiàn)數(shù)字化后,還很容易識別和還原,也就是說既有數(shù)字性也有可逆性。所謂規(guī)律性、規(guī)范性和標(biāo)準性,其意義就是數(shù)字性和可逆性。英文字母為組詞元件的英文系統(tǒng),正是由于它是具有數(shù)字性和可逆性的標(biāo)準性的文字。因此任何英文單詞才可以用鍵盤上所標(biāo)出的26個英文字母按鍵組成出來。漢字數(shù)字化后任何漢字單字也應(yīng)像任何英文單詞那樣,用鍵盤上所標(biāo)出的代碼字母(或數(shù)字)按鍵組成出來。這樣電腦上的所有程序,都可以把漢字“鍵盤代碼”作為橋梁,間接地用二進制數(shù)字編制出來。

怎樣的數(shù)字化編碼才能既適合現(xiàn)代計算機的需要又能繼承漢字文化傳統(tǒng)呢?漢字文化是整個民族逐漸積累起來的,漢字的演變,由象形而變?yōu)楸砹x、表音,形聲字的大量出現(xiàn)就表明了這種趨勢。形聲造字法不僅造字便捷,所造的字,既易學(xué)又易記。所以,如根據(jù)形聲造字法的原理編碼就便于學(xué)習(xí)和記憶,這樣的漢字編碼沒有重碼,能夠作到“見字識碼”“見碼識字”“字碼互換”“字碼通用”,能代表漢字像英文那樣適合于計算機的需求。見到每一個漢字數(shù)字化編碼就能知道它對應(yīng)是哪一個漢字,就像看到每一個繁體字就能知道它的簡體字一樣。這樣的編碼才能符合中國人的認知心理,這樣也就繼承了漢字的文化傳統(tǒng)。

美國哈佛大學(xué)教授德懷特·帕金斯表示,對中國真正的挑戰(zhàn)不是對互聯(lián)網(wǎng)具體的使用,而是中國能否成為信息技術(shù)的真正創(chuàng)造者?,F(xiàn)在能夠繼承漢字文化傳統(tǒng)并能適用于現(xiàn)代計算機的漢字數(shù)字化方案己經(jīng)問世。筆者經(jīng)十多年的潛心研究,發(fā)明了電腦漢字(及其相應(yīng)的數(shù)字漢字),使?jié)h字成為音形義數(shù)相結(jié)合的、排列有序的、適用于計算機應(yīng)用的文字系統(tǒng),使?jié)h字有了自己表示音形義數(shù)的字母,有人戲稱為這是中國現(xiàn)代的第五大發(fā)明。其特點是:

1、電腦漢字(及其相應(yīng)的數(shù)字漢字)是繼承漢字形聲造字法的傳統(tǒng),實現(xiàn)漢字數(shù)化以適應(yīng)現(xiàn)代計算機需求的編碼,它像英文一樣具有數(shù)字性和可逆性。它是由2-4個字母組成,第一和第二個字母表示字音,第三和第四個字母表示字義或字形。它的字母和漢語拼音字母完全一樣,只是增加了三個韻母符號以便將漢語拼音簡化為兩個字母的拼音。字母的序號是十六進制的兩位數(shù),稱為數(shù)字字母。數(shù)字字母可以按照電腦漢字的組字方式,鏈接成一個十六進制的數(shù)字,這個數(shù)很容易轉(zhuǎn)換為二進制數(shù),用于計算機運算,并且還具有可逆性。如單字“吧”的電腦漢字是bab,數(shù)字漢字是040104;“拔”是bac,040105;“芭”是bae,040107。位于第一第二個字母ba和兩個數(shù)字字母04,01,它們與漢語拼音的發(fā)音相同;“吧”字的第三個字母的b及04,是個單義字母表“口”,拔字的第三個字母c及05表“扌手”,芭字的第三個字母e及07表“草艸廾”等。01是a的數(shù)字字母,a的序號是十進制數(shù)01,轉(zhuǎn)換為十六進制數(shù)為數(shù)字字母01,同理b,c,e的數(shù)字字母分別為04,05,07。數(shù)字漢字很方便轉(zhuǎn)換為二進制數(shù)以用于計算機運算。如吧bab的數(shù)字漢字為040104,二進制數(shù)使是0000 0100 0000 0001 0000 0100。

2、電腦漢字(及其相應(yīng)的數(shù)字漢字)不但不否定漢字,反而使?jié)h字更加容易管理、使用、學(xué)習(xí)。它是漢字的“身份證”,它能作到“見字識碼”、“見碼識字”、“字碼互換”、“字碼通用”,成為漢字的有益補充。電腦漢字(及其相應(yīng)的數(shù)字漢字)是以漢字的存在而存在,它不可能脫離漢字而獨立存在(皮之不存毛將焉在),因此并不取代漢字而只是作為輔助漢字拼音表義表形的在電腦上使用的工具,正如作為英文輔助工具的國際音標(biāo)不可能取代英文一樣。同樣電腦漢字(及其相應(yīng)的數(shù)字漢字)作為漢語拼音的簡化也不可能取代漢語拼音為漢字普遍注音的作用。

3、電腦漢字使?jié)h字實現(xiàn)數(shù)字化后,漢字的字序就更科學(xué)更完善了。漢字是“音”“形”“義”結(jié)合的文字,漢字的字母和漢字數(shù)字化誕生后,漢字就變成了“音”“形”“義”“數(shù)”相結(jié)合的文字。漢字是音義文字并不是拼音文字,所以它的字形不是由字母組成而是由筆畫形成的字件組成。字件分為三種:部首,字件字和字件筆畫。電腦漢字(及其相應(yīng)的數(shù)字漢字)的字母不但代表字音也代表了漢字的筆畫及其字序。電腦漢字同筆畫字件既是漢字的輸入法,又是漢字的查字法。而且查字的速度和效率比漢語拼音更科學(xué)更快捷。因為,使用漢語拼音檢索的首要條件是要知道這個字的“音”,如果遇到了一個不認識的生字,不知道這個字的讀音,就無法查字。而使用漢字的筆畫字件字母,雖然不知道這個字的讀音,但仍然可以依據(jù)這個字的筆畫字件字母的順序,很快就能夠查出這是一個什么字,從而使?jié)h字的檢索更完善了。“漢字難查”是一個長期存在的問題。有了“音”“形”兩種快速檢索漢字法,檢索速度加快,準確性大大提高,“漢字難查”的問題迎刃而解,這將有助于學(xué)習(xí)漢字。使用電腦漢字(及其相應(yīng)的數(shù)字漢字)的輸入法,名叫“作為電腦漢字的現(xiàn)漢字碼三位一體輸入法”,它既可用音形義輸入漢字,也可只用字形輸入漢字,更可以用數(shù)字輸入漢字。

4、漢字實現(xiàn)數(shù)字化后,使?jié)h字成為全世界文字和數(shù)字可以相互有規(guī)律轉(zhuǎn)換的文字,由此帶來了中國的信息科學(xué)將有一個飛躍的發(fā)展。由于計算機是美國人發(fā)明的,故計算機是以英語為基礎(chǔ)設(shè)計的,世界上任何國家的文字要上計算機,都必須使用英語為載體才能夠做到,如中國的五筆字型輸入法以及漢語拼音輸入法都是以英語為載體才能夠在計算機上輸入中文。中國的信息技術(shù)也是建立在英文的基礎(chǔ)上的。電腦漢字誕生后情況就不一樣了,由于漢字實現(xiàn)了數(shù)字化,漢字是使用數(shù)字為載體的,不用英文也照樣可以輸入中文。于是中文就取得了全世界第一個能夠與英文平起平坐的計算機第二語言。同時中國的信息技術(shù)也能夠完全建立在中文的基礎(chǔ)上,大大促進中國信息技術(shù)的發(fā)展。

5、電腦漢字(及其相應(yīng)的數(shù)字漢字)有利于漢字文化的國際交流。隨著中國的和平崛起,國際交流頻繁,漢字走向世界的各個地區(qū)。世界上有很多人想掌握漢語漢字。外國人學(xué)中文,有一個普遍的體會:漢語容易漢字難。學(xué)習(xí)漢語通常幾個月便能開口說話,書面語言這一關(guān)便不容易通過,其原因何在呢?主要原因是文化差異造成的。世界上絕大多數(shù)國家的文字屬于拼音體系,它們的文化屬于拼音文字文化。也就是說要尊重國外的語言文字習(xí)慣,才能事半功倍。漢字要走向世界,要使世界上的人學(xué)會漢字,那就要尊重人家的語言文字習(xí)慣。所以漢字需要有一種既可拼音又能表示字義和字形的漢字別體(漢字的代碼)。它能與常用漢字一一對應(yīng)且語音規(guī)律性強,詞性、聲調(diào)明確,不僅可以更好的給漢字注音還可以提示詞性、字義,能夠起漢字身份證的作用。它和所代表的漢字是形影相隨的,是一個硬幣的兩面。它是連接拼音文化和漢字文化的橋梁,掌握了它也就是進入了漢字的大門,對于這一點,漢語拼音是無法做到的。漢字除了有隸書、楷書、宋體、草書、行書、繁體、簡體之外,還應(yīng)該有一種別體(輔助拼音的代碼)習(xí)慣于拼音體系文字的外國人,很容易在短時間內(nèi)學(xué)習(xí)輔助拼音體的別體,掌握漢語的口頭語言,同時又通過輔助拼音別體漢字,進入學(xué)習(xí)規(guī)范漢字的大門,從而進一步掌握規(guī)范漢字。這個輔助漢字拼音表義的別體就是電腦漢字(及其相應(yīng)的數(shù)字漢字)。

現(xiàn)在值得人們深思的是:進入數(shù)字立國的中國,為什么現(xiàn)在還沒出現(xiàn)中國統(tǒng)一的數(shù)字化漢字?其主要原因有四方面:

一是對中國統(tǒng)一的數(shù)字化漢字認識的片面性。有人認為,《中華人民共和國語言文字法》已明確規(guī)定了漢字的法律地位,當(dāng)前不搞文字改革,研發(fā)中國統(tǒng)一的數(shù)字化漢字不符合這個精神。這種理解是片面的,因為研發(fā)中國統(tǒng)一的數(shù)字化漢字并不等同于廢黜漢字,而是作為漢字的有益補充,從而使?jié)h字滿足信息時代的需求,成為輔助漢字拼音表義表形的工具。注音字母、漢語拼音以及各種輸入法的問世,這些和中國統(tǒng)一的數(shù)字化漢字一樣,都是輔助漢字的工具,是為漢字服務(wù)的,它們能取代漢字嗎?再說不搞文字改革并不是不搞漢字現(xiàn)代化、信息化、數(shù)字化,以便使?jié)h字適應(yīng)網(wǎng)絡(luò)時代的需求。

二是錯誤的認為沒有必要實現(xiàn)中國統(tǒng)一的數(shù)字化漢字。有同志認為“美國信息交換標(biāo)準代碼”(ASCII)在現(xiàn)代計算機中普遍應(yīng)用,早已成為完全公開的國際標(biāo)準。我國己經(jīng)掌握漢字的輸入輸出技術(shù),形成了漢字出版系統(tǒng)、漢字字庫等。目前國內(nèi)己創(chuàng)造出近1000種漢字輸入法方案,完全可以滿足應(yīng)用需求。也就是說,建立中國統(tǒng)一的數(shù)字化漢字沒有必要,至少不是急需。如果持有這種觀點,那就會使?jié)h字難以實現(xiàn)數(shù)字化,漢字將永遠序號不統(tǒng)一、代碼混亂、標(biāo)準不一致、輸入法五花八門、沒有切實可行的漢字信息交換標(biāo)準代碼。以數(shù)字化漢字來統(tǒng)一漢字編碼是非常必要的。因為漢字編碼不統(tǒng)一的問題,實際上就是中國人在信息高速公路上出現(xiàn)的問題。從實踐上講,也是家庭計算機與世界聯(lián)網(wǎng)出現(xiàn)的問題。在全國統(tǒng)一的網(wǎng)絡(luò)中,漢字輸入是基礎(chǔ),因此,它不應(yīng)該是多種輸入法并存,否則就會影響計算機的識別。從學(xué)習(xí)上講,需要全國統(tǒng)一的漢字輸入教學(xué),學(xué)習(xí)計算機應(yīng)用,首先是漢字輸入。漢字輸入的基礎(chǔ)是編碼,全國的基礎(chǔ)教育教材,不應(yīng)是多種并存,否則就會割裂統(tǒng)一使用的文字,增加識字教育的記憶負擔(dān)。因此,我們只能允許統(tǒng)一的編碼,統(tǒng)一的教材。一個使用統(tǒng)一文字的統(tǒng)一的民族,應(yīng)該有統(tǒng)一的文字副體(別體)。國家沒有統(tǒng)一的數(shù)字化漢字,絕非是一個網(wǎng)絡(luò)強國所作所為。這實際上也就是一種對中國統(tǒng)一的數(shù)字化漢字缺乏戰(zhàn)略性的考慮。我們常常會遇到這樣一道管理學(xué)考題:在重要而緊急、重要但不緊急、緊急但不重要、不緊急也不重要的四類事情中,應(yīng)該優(yōu)先處理哪一類?人們通常會毫不猶豫地選擇重要而緊急的事,但歷史經(jīng)驗告訴我們,恰恰是那些重要但不緊急的事,需要最為認真地對待,因為它的名字叫戰(zhàn)略布局。為了建設(shè)網(wǎng)絡(luò)強國實現(xiàn)漢字數(shù)字化信息化而研發(fā)中國統(tǒng)一的數(shù)字化漢字這是一個事關(guān)長期的戰(zhàn)略性計劃。我們要看準這個大方向,及時布局,伏設(shè)奇兵,敢于投入,敢于拼搏,敢于堅持,敢于勝利,這才是戰(zhàn)略家的氣魄和智慧。

三是現(xiàn)在的輸入法編碼追求急功近利缺乏對漢字數(shù)字化的長遠全面地考量。輸入法編碼追求簡便快速易學(xué),這樣的輸入法易于學(xué)習(xí)者掌握和使用,自然沒錯。但這樣的認識是不全面的而且也缺乏長遠的考量。所謂長遠全面的考量,就是要站在推進數(shù)字中國建設(shè)的高度來看待這個問題。小小輸入法,涉及大文章。互聯(lián)源于美國,控于美國,主權(quán)非我?,F(xiàn)代計算機以英文為基礎(chǔ)設(shè)計的,漢字被長期排斥在中央處理器之外,這給數(shù)字主權(quán)帶來極大的危機。實現(xiàn)漢字數(shù)字化就是為了自主可控,不要坐別人的車上,跑在別人的路上。因此,可以說“漢字現(xiàn)代化是中國從網(wǎng)絡(luò)大國到網(wǎng)絡(luò)強國的必由之路?!彼^漢字現(xiàn)代化就是漢字數(shù)字化。數(shù)字化漢字也是一種中國文化,因此,漢字數(shù)字化必須是中國特色的數(shù)字化,這樣的數(shù)字化才可能取得成功。中國人一生下來就先接觸本地方言,學(xué)的是拼形文字,既可以用本地方言讀寫也可以用普通話來讀寫,習(xí)慣用字形來區(qū)分意義來實現(xiàn)唯一性,而用字音區(qū)分意義,卻無法實現(xiàn)唯一性。漢字是單音節(jié)文字,同音字、同音詞特別多,只有通過字形才能區(qū)分清楚。正因為中國人習(xí)慣于運用字形來區(qū)別詞意,字音的區(qū)別能力就比較差。所以,認為只要普及了普通話就可以實現(xiàn)拼音化,想得未免太簡單了。漢字以字組詞,本身也是詞,字是有限的,詞是無限的。中國人利用識字組詞,省出了認詞的時間。漢字的繼承性也包含了造字法的繼承,新造出來的字,也要便于學(xué)習(xí)和記憶,才能符合中國人的認知心理。漢字發(fā)展到形聲造字法后,任何時候,任何新的信息出現(xiàn),人們就立即可以造出新的字來。這就說明漢字的造字系統(tǒng)已經(jīng)完善,不會再出現(xiàn)新的造字法了?,F(xiàn)代社會的應(yīng)用極其需要文字有直接的有序性,這樣的漢字系統(tǒng)才能說是完善的。錢偉長說:“我們并不是說,漢字不能改革,因為文字永遠在變,可是你得按系統(tǒng)來變,我們的文字是有系統(tǒng)的,不能改得把系統(tǒng)都改掉,不能按外國人的系統(tǒng)改我們的漢字系統(tǒng)。”王蒙說:“聰明的做法不是把全球化與民族地域化對立起來,而是結(jié)合起來。”所以,中國統(tǒng)一漢字數(shù)字化的編碼應(yīng)體現(xiàn)中國的文化。漢字編碼是五千年漢字用字史上的一件大事,我們決不應(yīng)掉以輕心。錢偉長先生指出好的編碼應(yīng)是一種準文字。這是漢字編碼的設(shè)計走向成熟的根本?,F(xiàn)在各種輸入法紛紛問世,比如,流行碼、鄭碼、沈碼、自然碼、手寫輸入法、微軟拼音等等,不勝枚舉,真是“萬碼奔騰”。據(jù)統(tǒng)計,各種不同類型的漢字輸入法已數(shù)以千計,而且現(xiàn)在還不斷出現(xiàn)。其輸入的速度越來越快,并且越來越好學(xué)。盡管這些早期出現(xiàn)的輸入法并不適合成為中國統(tǒng)一的數(shù)字化漢字,但它們已完全占領(lǐng)市場,人們習(xí)慣使用這些輸入法,現(xiàn)在開發(fā)作為中國統(tǒng)一數(shù)字化漢字的輸入法已無利可圖。如果國家對它的開發(fā)不加以扶持,它就不可能問世,中國統(tǒng)一的數(shù)字化漢字也就不可能出現(xiàn)。黨的十九大提出建設(shè)數(shù)字中國,發(fā)揮信息化的引領(lǐng)作用。實現(xiàn)數(shù)字中國必須完善數(shù)字基礎(chǔ)設(shè)施的建設(shè),才有助于突破核心技術(shù)。習(xí)近平總書記指出,“不掌握核心技術(shù),我們就會被卡脖子,牽鼻子,不得不看別人的臉色行事。”實現(xiàn)漢字數(shù)字化就是完善網(wǎng)絡(luò)基礎(chǔ)設(shè)施的一項重要內(nèi)容,所以對漢字數(shù)字化必須給予足夠的重視。

猜你喜歡
輸入法字母統(tǒng)一
要命的輸入法
堅持嚴管和厚愛相統(tǒng)一的著力點
碑和帖的統(tǒng)一,心和形的統(tǒng)一,人和藝的統(tǒng)一
緩存:從字母B到字母Z
統(tǒng)一數(shù)量再比較
輸入法順序聽我使喚
字母派對
百度被訴侵犯商標(biāo)權(quán)和不正當(dāng)競爭
你最想要的輸入法—QQ輸入法
堅持“四納入” 實施“四統(tǒng)一”