国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于統(tǒng)計的漢字特征多維度對比分析

2019-12-13 07:18布合力齊姑麗瓦斯力溫且姆薩迪克熱依漢古麗薩迪克木合塔爾沙地克
中文信息 2019年11期
關(guān)鍵詞:聲調(diào)韻母拼音

布合力齊姑麗?瓦斯力 溫且姆?薩迪克 熱依漢古麗?薩迪克 木合塔爾?沙地克

摘 要:文本對常用字的詞性、拼音和韻母進行基于統(tǒng)計的多維度對比分析,得出詞性、韻母與聲調(diào)的關(guān)系不太明顯,但近20%的拼音只發(fā)音同一個聲調(diào),其它80%拼音中占比最高的聲調(diào)分別為二聲和四聲。

關(guān)鍵詞:詞性 拼音 韻母 聲調(diào)

中圖分類號:H1文獻標(biāo)識碼:A文章編號:1003-9082(2019)11-0-01

《現(xiàn)代漢語常用字表》由國家語言文字工作委員會、國家教育委員會于1988年發(fā)布,共收字3500個。其中的常用字部分,共2500字,覆蓋率為97.97%。[1]學(xué)國家通用語言文字(以下簡稱國語)是每個中國人的神圣職責(zé),聲調(diào)是國語靈魂的所在。教育部、國務(wù)院扶貧辦、國家語委印發(fā)的《推普脫貧攻堅行動計劃(2018-2020年)》指出,到2020年,實現(xiàn)貧困家庭新增勞動力人口應(yīng)全部具有國家通用語言文字溝通交流和應(yīng)用能力,現(xiàn)有貧困地區(qū)青壯年勞動力具備基本的普通話交流能力,當(dāng)?shù)仄胀ㄔ捚占奥拭黠@提升,初步具備普通話交流的語言環(huán)境。國語的基本功能是表達和交流。國語的推廣普及程度不高是南疆脫貧攻堅的一大短板。國語普及率低且發(fā)音不準(zhǔn)嚴(yán)重影響了貧困地區(qū)與外部世界的交流。這一障礙,已成為制約扶貧開發(fā)、技術(shù)培訓(xùn)等活動的重要因素。堅決做好國語的推廣普及工作也就成為脫貧攻堅的一項重要而緊迫的任務(wù)。鑒于少數(shù)民族學(xué)國語的弱點和難點,本文對常用的2500漢字的詞性、拼音和韻母進行基于統(tǒng)計的多維度漢字特征對比分析,致力于發(fā)現(xiàn)與聲調(diào)的關(guān)系,助于正確發(fā)音。

一、詞性與聲調(diào)的關(guān)系

2500個常用字中共有22個詞性,其中前五個詞性占88.92%,分別為:名詞1007個(其中一聲248個、二聲302個、三聲149個、四聲303個、輕聲5個)、動詞794個(其中一聲202個、二聲145個、三聲138個、四聲309個、輕聲0個)、狀態(tài)詞178個(其中一聲47個、二聲34個、三聲43個、四聲53個、輕聲1個)、形容詞161個(其中一聲32個、二聲38個、三聲42個、四聲53個、輕聲0個)、副詞83個(其中一聲18個、二聲15個、三聲15個、四聲35個、輕聲0個),名詞中二聲四聲較多,動詞中四聲最多,狀態(tài)詞中一聲四聲較多,形容詞中三聲四聲較多,副詞中四聲最多。

分析發(fā)現(xiàn),只發(fā)音同一個聲調(diào)的詞性共有3個,牽涉到9個漢字:

1.只發(fā)音一聲的詞性有2個,分別為:擬聲詞、前接分詞,牽涉到3個漢字;

2.只發(fā)音輕聲的詞性有1個,是語氣詞,牽涉到6個漢字。

一聲發(fā)音率達到50%及以上的詞性共有3個,分別為:處所詞、擬聲詞、前接分詞,牽涉到5個漢字;二聲發(fā)音率達到50%及以上的詞性共有2個,分別為:非語素字、語素詞根,牽涉到5個漢字;三聲發(fā)音率達到50%及以上的詞性有1個,是區(qū)別詞,牽涉到4個漢字;四聲發(fā)音率達到50%及以上的詞性有1個,是連詞,牽涉到6個漢字;輕聲發(fā)音率達到50%及以上的詞性有1個,是語氣詞,牽涉到6個漢字。

二、拼音與聲調(diào)的關(guān)系

2500個常用字中共有387種拼音(忽略聲調(diào)),前5個拼音每個均含30個以上漢字,分別為:shi含40個漢字(其中一聲7個、二聲7個、三聲4個、四聲21個、輕聲1個), ji含36個漢字(其中一聲11個、二聲7個、三聲3個、四聲12個、輕聲0個), zhi含33個漢字(其中一聲10個、二聲7個、三聲6個、四聲10個、輕聲0個), yi含32個漢字(其中一聲4個、二聲6個、三聲6個、四聲10個、輕聲0個), jian含31個漢字(其中一聲10個、二聲0個、三聲8個、四聲13個、輕聲0個)。

分析發(fā)現(xiàn),只發(fā)音同一個聲調(diào)的拼音共有77個,牽涉到125個漢字。

1.只發(fā)音一聲的拼音共有19個,分別為:gen、bin、zun、diu、zhua、keng、shuan、ha、zhui、shuo、nie、en、zuan、weng、pou、sen、hei、pie、ca,牽涉到22個漢字;

2.只發(fā)音二聲的拼音共有23個,分別為:jue、rong、mang、ze、lin、nan、heng、ning、ceng、teng、qun、tuan、za、bie、qiong、ang、nuo、zei、hang、shei、neng、nin、nang,牽涉到48個漢字;

3.只發(fā)音三聲的拼音共有12個,分別為:ken、sao、nv、ka、fou、leng、ruan、zen、lia、gei、zhun、nuan,牽涉到15個漢字;

4.只發(fā)音四聲的拼音共有21個,分別為:ce、lie、kuo、mie、kuai、ruo、qia、zang、lve、rui、ri、nei、se、shun、te、run、cou、cuan、cuo、nen、beng,牽涉到38個漢字。

5.只發(fā)音輕聲的拼音共有2個,分別為me、ne,牽涉到2個漢字。

一聲發(fā)音率達到50%及以上的拼音共有75個,牽涉到188個漢字;二聲發(fā)音率達到50%及以上的拼音共有85個,牽涉到257個漢字;三聲發(fā)音率達到50%及以上的拼音共有40個,牽涉到65個漢字;四聲發(fā)音率達到50%及以上的拼音共有105個,牽涉到366個漢字;輕聲發(fā)音率達到50%及以上的拼音共有5個,牽涉到6個漢字。

三、韻母與聲調(diào)的關(guān)系

2500個常用字有37個韻母,前5個韻母每個均含100個以上漢字,分別為:i含302個漢字(其中一聲72個、二聲67個、三聲46個、四聲115個、輕聲2個)、u含206個漢字(其中一聲39個、二聲40個、三聲48個、四聲79個、輕聲0個)、ian含135個漢字(其中一聲31個、二聲33個、三聲21個、四聲50個、輕聲0個)、an含131個漢字(其中一聲30個、二聲28個、三聲27個、四聲46個、輕聲0個)、ao含116個漢字(其中一聲24個、二聲21個、三聲31個、四聲40個、輕聲0個)。

分析發(fā)現(xiàn),只發(fā)音同一個聲調(diào)的韻母有1個,一聲,是ueng,牽涉到1個漢字。

一聲發(fā)音率達到50%及以上的韻母有1個,牽涉到1個漢字;二聲發(fā)音率達到50%及以上的韻母共有2個,牽涉到10個漢字;三聲發(fā)音率達到50%及以上的韻母沒有;四聲發(fā)音率達到50%及以上的韻母有1個,牽涉到7個漢字;輕聲發(fā)音率達到50%及以上的韻母沒有。

結(jié)論

分析發(fā)現(xiàn),詞性、韻母與聲調(diào)間的關(guān)系不太明顯,但是拼音與聲調(diào)間的關(guān)系比較突出。2500個常用字共有387種拼音,只發(fā)音同一個聲調(diào)的拼音占比19.9%,牽涉的漢字占比5%。同一聲調(diào)發(fā)音率達到50%及以上的拼音有310,占比80.1%,牽涉到的漢字有882個,占比35.28%。另外,一聲字有613個、二聲字有587個、三聲字有444個、四聲字有839個、輕聲字有17個。387個拼音中,占比最高的聲調(diào)分別為二聲和四聲,2500個漢字中,占比最高的聲調(diào)分別四聲和二聲??傊涀『谜急冉?0%的只發(fā)音同一個聲調(diào)的拼音的同時,發(fā)音其它占比80%以上的拼音時,若不知怎么發(fā)音,不妨先按占比最高的聲調(diào)來發(fā)音,正確率可達近60%,[2]對理解和表達不會有太多的影響。

參考文獻

[1]木合塔爾·沙地克,布合力齊姑麗·瓦斯力,漢字的大數(shù)據(jù)分析與可視化[J].中文信息,2018(5):167-168.

[2]木合塔爾·沙地克,布合力齊姑麗·瓦斯力,用Python數(shù)據(jù)分析方法進行漢字聲調(diào)頻率統(tǒng)計分析[J].電腦知識與技術(shù),2017,17(35):13-14.

猜你喜歡
聲調(diào)韻母拼音
聲母韻母
聲調(diào)符號位置歌
坐著轎車學(xué)聲調(diào)
單韻母扛聲調(diào)
《湘水韻》及其編撰原理要點
單韻母讀讀讀