国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測

2016-01-27 03:06:32徐益華劉亞麗孟子厚

徐益華,劉亞麗,孟子厚

(中國傳媒大學 傳播聲學研究所,北京 100024)

?

自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測

徐益華,劉亞麗,孟子厚

(中國傳媒大學 傳播聲學研究所,北京 100024)

摘要:從基于言語知覺特性的聲母區(qū)別特征出發(fā),觀察MFCC和美爾能量取值在區(qū)別特征有無上的表現(xiàn)差異,修正了聲母區(qū)別特征的客觀參數(shù)特性,與修正前的結(jié)果相比更合理。定義含有區(qū)別特征參數(shù)特性的語音幀為有效幀,在自然音節(jié)中通過能量確定出聲母初判范圍位置的基礎(chǔ)上,利用該范圍內(nèi)有效幀的含量Para作為檢測探針,實現(xiàn)自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測。正檢率在80%左右。

關(guān)鍵詞:聲母區(qū)別特征;自然音節(jié);計算機輔助評測

1引言

目前漢語普通話的評測主要以人工評測和機器評測相結(jié)合的方法進行,人工方法測試成本較高,而且測試信度得不到保證?,F(xiàn)有的機器評測從統(tǒng)計模型角度設(shè)計計算機輔助的評測策略,雖然克服了人工評測的主觀性的缺點,但該方法較難鎖定發(fā)音缺陷,對數(shù)據(jù)過分依賴[1][2]。語音錯誤或缺陷往往發(fā)生在最小對立體之間,這與區(qū)別特征的定義很相似,區(qū)別特征是構(gòu)成語音的基本元素,是區(qū)分音位的最小差別[3-5]。從區(qū)別特征角度設(shè)計計算機輔助評測策略,有望從言語本質(zhì)角度為鎖定發(fā)音缺陷提供了新的思路。張家騄由知覺混淆結(jié)果,初步構(gòu)建了普通話聲韻調(diào)區(qū)別特征體系[5][6]。論文[7]在孤立聲母的條件下根據(jù)聲母的語音特征,結(jié)合二元對立的特點,構(gòu)建了由13個區(qū)別特征參數(shù)構(gòu)成的聲母參數(shù)體系,如圖1,該體系可以用于聲母檢測。論文[8]分析了不同聲學傳遞條件下聲母的清晰度特點和知覺混淆規(guī)律。建立由13個聲母區(qū)別特征組成的普通話聲母區(qū)別特征體系,如圖2。文中對各區(qū)別特征進行初步的參數(shù)化,不過都是從聲母參數(shù)體系中直接選取的,由于聲母參數(shù)體系與基于言語知覺特性的聲母區(qū)別特征體系的聚類邏輯是不一樣的,如此給區(qū)別特征匹配客觀參數(shù)是不太合理的。表1給出了初步參數(shù)化后的檢測結(jié)果,可以發(fā)現(xiàn)并不理想,而且聲母的區(qū)別特征的確定和客觀參數(shù)的選取都是在人工切分后的孤立聲母情形下進行的,如何在自然音節(jié)狀態(tài)下檢測到聲母區(qū)別特征也是非常重要的問題。

本文從基于言語知覺特性的聲母區(qū)別特征體系出發(fā),在孤立聲母情形下,觀察區(qū)別特征的有無在聲學線索上的表現(xiàn)差異,確定各區(qū)別特征對應(yīng)的客觀參數(shù)特性。與此同時,在自然音節(jié)狀態(tài)下,設(shè)定檢測探針,觀察檢測探針在區(qū)別特征的有無上的表現(xiàn)差異,確定在自然音節(jié)狀態(tài)下聲母區(qū)別特征的檢測探針條件。最后對檢測探針有效性進行分析。

表1 聲母區(qū)別特征初步參數(shù)化失效性結(jié)果

圖1 用于聲母檢測的聲母參數(shù)體系 

圖2 基于言語知覺特性的聲母區(qū)別特征體系 

2聲母區(qū)別特征參數(shù)的修正

本文中使用的語料庫包括212位女生和126位男生,他們的年齡范圍是18-22歲。文中使用的孤立聲母語料是從發(fā)音較為清晰的單音節(jié)中,通過人工切分的方式得到,共計21類聲母,零聲母暫不考慮。其中40%的語料用于尋找與特征對應(yīng)的參數(shù),剩余60%用于測試這些參數(shù)的有效性。

在對區(qū)別特征進行檢測之前,得先對其進行合理的參數(shù)化,聲母的持續(xù)時間較短,分幀后各幀的差異不大,故使用各幀的聲學參數(shù)平均值并歸一化代表聲母的總體特征。主要使用MFCC和美爾濾波器能量這兩類聲學參數(shù),MFCC舍去一維對數(shù)能量,只保留其余12維,Mi代表第i維的MFCC值,美爾濾波器共有40維,包含有13 個線性濾波器和27 個對數(shù)濾波器。濾波器組由混迭的三角窗構(gòu)成,將每個濾波器頻帶內(nèi)的能量進行疊加作為濾波器的輸出,f(i)代表第i維的美爾濾波器輸出值。

求出21類聲母的12維MFCC值和40維美爾濾波器輸出值。由圖2可知,基于言語知覺特性的聲母區(qū)別特征共有13個,對于某個區(qū)別特征,聲母含有該特征,標志為“+”,不含有該特征標志為“-”。觀察這兩類聲母在兩類聲學參數(shù)上的表現(xiàn)差異,確定區(qū)分這兩類聲母的客觀參數(shù),該參數(shù)就是該區(qū)別特征對應(yīng)的客觀參數(shù),圖3給出了“濁音的”區(qū)別特征“+”標志聲母l、m、n、r和“-”標志的其它聲母在美爾濾波器能量上的取值情況,可發(fā)現(xiàn)在第一維到第三維的取值上出現(xiàn)差異,故設(shè)定N1=(f(1)+f(2)+f(3))/3為該特征對應(yīng)的客觀參數(shù)。

圖3 區(qū)別特征“濁音的”涉及的聲母的美爾能量曲線 

在確定好聲母區(qū)別特征對應(yīng)的客觀參數(shù)的基礎(chǔ)上,進一步確定各區(qū)別特征所對應(yīng)的參數(shù)特性。以“濁音的”區(qū)別特征為例,計算含有“濁音的”“+”類聲母和“-”類聲母的N1值,圖4給出了這兩類聲母的N1值的概率分布。

圖4 “濁音的”“+”類、“-”類聲母的N1值概率分布圖 

設(shè)判決閾限為兩曲線的交點0.52,“濁音的”區(qū)別特征參數(shù)特性為N1=(f(1)+f(2)+f(3))/3>0.52。故通過N1的取值實現(xiàn)有無“濁音的”區(qū)別特征判定。

同樣的方法確定出其余11個聲母區(qū)別特征所對應(yīng)的客觀參數(shù)以及參數(shù)特性,如表2所示。f(2:12)=f(2)+f(3)+...+f(12)。

對于“雙唇的”區(qū)別特征并沒有找到一個聲學參數(shù)同時區(qū)分m和n、b p和d t g k。進一步思考,基于圖2的區(qū)別特征體系,需要檢測“雙唇的”特征的聲母主要是塞音(b p d t g k)和鼻音(m n)兩種,對于這兩種情形通過不同的聲學參數(shù)進行“雙唇的”特征的檢測。

表2右側(cè)給出的正檢率是指理論上含有某區(qū)別特征的聲母樣本中,客觀參數(shù)滿足對應(yīng)參數(shù)特性的聲母樣本所占比例。誤判率是指理論上沒有該區(qū)別特征的聲母樣本中,客觀參數(shù)滿足對應(yīng)參數(shù)特性的聲母樣本所占比例。各區(qū)別特征的正檢率在80%左右,誤判率在20%左右。“舌尖前的”和“雙唇的”正檢率略低,說明匹配的聲學參數(shù)不太適合,有待進一步修正。

對修正前后的參數(shù)化結(jié)果進行對比,表3給出了修正前后總體正檢率和誤判率的差異,可以發(fā)現(xiàn),修正后總體的特征正檢率有了大幅提升,總體誤判率也有明顯地下降,故修正后的區(qū)別特征參數(shù)化結(jié)果更加合理。

3音節(jié)中聲母區(qū)別特征的檢測探針

上節(jié)中為聲母的各區(qū)別特征匹配了聲學參數(shù),確定了各特征的參數(shù)特性,利用這些參數(shù)和參數(shù)特性可以實現(xiàn)在孤立聲母的情形下聲母區(qū)別特征的檢測。本節(jié)觀察區(qū)別特征的有無在自然音節(jié)語音幀角度上的表現(xiàn)差異,以此設(shè)計探針實現(xiàn)自然音節(jié)中聲母區(qū)別特征檢測。

表2 聲母區(qū)別特征的參數(shù)化修正后結(jié)果

表3 聲母區(qū)別特征的參數(shù)化修正后結(jié)果

定義:具有某聲母區(qū)別特征參數(shù)特性的語音幀為該區(qū)別特征的有效幀。

對于自然音節(jié),聲母部分語音幀的能量值要低于整個音節(jié)語音幀的能量平均值。利用此特征可以實現(xiàn)音節(jié)中聲母位置的初判。

聲母的持續(xù)時間短,分幀后各幀差異不大[10],故在自然音節(jié)中,某聲母區(qū)別特征的有無將會在聲母初判范圍內(nèi)有效幀的含量上出現(xiàn)差異。將音節(jié)中聲母初判范圍內(nèi)有效幀的含量設(shè)定為該區(qū)別特征的檢測探針,記為Para。圖5給出Para的定義示意圖。

圖5 聲母區(qū)別特征檢測探針Para的定義示意圖 

自然音節(jié)中某聲母區(qū)別特征的有無,將會在檢測探針上出現(xiàn)差異。下面將通過樣本對這種差異進行分析,確定音節(jié)中檢測聲母區(qū)別特征的探針條件。本節(jié)所使用的樣本與前1節(jié)的樣本來自同一語料庫,不同的是不含有靜音區(qū)的自然音節(jié)。

以“濁音的”聲母區(qū)別特征為例,該特征對應(yīng)的檢測探針Para為聲母初判范圍內(nèi)N1>0.52的語音幀比例,記作Para1。觀察理論上含有該特征的音節(jié)(A類)與理論上不含有該特征的音節(jié)(B類)在Para1概率分布,A類音節(jié)的Para1值為Para1A,B類音節(jié)的為Para1B,如圖6所示。設(shè)判決閾限為兩曲線的交點0.66。該特征的有無與Para1值的關(guān)系如表4所示。A類音節(jié)的Para1值一般大于等于66%。即可以通過Para1的取值來進行音節(jié)中“濁音的”聲母區(qū)別特征檢測。

圖6 A類和B類音節(jié)的Para1概率分布圖 

音節(jié)中“濁音的”特征閾值Para1范圍有無66%≥66%<66%

同樣的方法,確定出自然音節(jié)中其他聲母區(qū)別特征的探針條件,如表5所示。

表5 自然音節(jié)中檢測聲母區(qū)別特征的探針條件

4自然音節(jié)中聲母區(qū)別特征檢測

利用第3節(jié)中表5給定的檢測探針條件,在自然音節(jié)狀態(tài)下對各音節(jié)樣本進行聲母區(qū)別特征檢測。檢測結(jié)果如表6所示。正檢率是指理論上含有某區(qū)別特征的音節(jié)樣本中,滿足對應(yīng)區(qū)別特征檢測條件的音節(jié)樣本所占比例。誤判率是指理論上沒有該區(qū)別特征的音節(jié)樣本中,滿足對應(yīng)區(qū)別特征檢測條件的音節(jié)樣本所占比例。

由表6可知,正檢率普遍在80%左右,誤判率在20%左右,“舌尖前的”和“雙唇的”正檢率略低,與孤立聲母情形下的檢測結(jié)果類似。

表6 自然音節(jié)中聲母區(qū)別特征的檢測結(jié)果

5檢測探針的有效性檢驗

第4節(jié)中設(shè)計了在自然音節(jié)中實現(xiàn)聲母區(qū)別特征檢測的探針,該探針的有效性主要通過自然音節(jié)狀態(tài)下聲母區(qū)別特征的檢測效果與孤立聲母下區(qū)別特征檢測效果的差異來表征。從兩個角度考慮:第一,總體上對比兩種狀態(tài)下的檢測效果;第二,考察各區(qū)別特征下兩種狀態(tài)下的檢測效果。

由表7可知,孤立聲母狀態(tài)下檢測聲母區(qū)別特征的總體結(jié)果與自然音節(jié)狀態(tài)下的檢測效果差異不大。具體表現(xiàn)在自然音節(jié)狀態(tài)下特征總體正檢率要略優(yōu)于孤立聲母狀態(tài),但同時帶來的是誤判率的提高。

表7 總體測試結(jié)果

在兩種狀態(tài)下總體檢測效果相當?shù)幕A(chǔ)上,下面從各區(qū)別特征的角度分析,設(shè)定檢測探針失效條件為:自然音節(jié)狀態(tài)與孤立聲母狀態(tài)相比,在檢測某一特征時,正檢率絕對下降10%,或者誤判率絕對增加10%。觀察圖7到9,其中,聲母-正檢和聲母-誤判表示孤立聲母狀態(tài)下聲母區(qū)別特征的正檢率和誤判率;同理,音節(jié)-正檢率和音節(jié)-誤判表示自然音節(jié)狀態(tài)下聲母區(qū)別特征的正檢率和誤判率。可見,并沒有特征滿足失效條件,故可以認為用文中提出的探針在自然音節(jié)中檢測聲母區(qū)別特征的方法是有效的。

圖7 兩種狀態(tài)下特征檢測效果對比圖(一) 

圖8 兩種狀態(tài)下特征檢測效果對比圖(二) 

圖9 兩種狀態(tài)下特征檢測效果對比圖(三) 

6結(jié)論

本文修正了各聲母區(qū)別特征對應(yīng)的聲學參數(shù),確定了各區(qū)別特征的參數(shù)特性,并提出利用探針Para實現(xiàn)自然音節(jié)狀態(tài)下聲母區(qū)別特征的檢測的方法。具體工作如下:

孤立聲母的狀態(tài)下,對聲母各幀聲學參數(shù)值進行幀間平均,修正了12對聲母區(qū)別特征的客觀參數(shù),參數(shù)為12維MFCC值和40維美爾濾波器輸出值。利用客觀參數(shù)對聲母區(qū)別特征進行檢測,檢測效果與修正前的結(jié)果相比更加合理。

定義了具有某區(qū)別特征參數(shù)特性的語音幀為該區(qū)別特征的有效幀。在自然音節(jié)狀態(tài)下,定義探針,樣本訓(xùn)練確定出各區(qū)別特征的檢測探針條件。在音節(jié)中對聲母區(qū)別特征進行集內(nèi)外檢測,檢測效果良好。

自然音節(jié)狀態(tài)下的特征檢測效果與孤立聲母狀態(tài)下的檢測效果相當,且良好。這說明聲母區(qū)別特征匹配的區(qū)別特征參數(shù)是合理的,并且文中提出的自然音節(jié)狀態(tài)下檢測聲母區(qū)別特征的探針是有效的。

自然音節(jié)中聲母區(qū)別特征檢測的實現(xiàn)有助于推動基于區(qū)別特征的普通話評測技術(shù)的發(fā)展,但僅僅實現(xiàn)音節(jié)中聲母區(qū)別特征檢測問題是不夠的,還得進一步考慮韻母區(qū)別特征檢測問題,以及如何在將本文的結(jié)果應(yīng)用在連續(xù)語流問題中,與此同時,“舌尖前的”、“塞擦的”這兩個特征的檢測效果不佳,可能是參數(shù)化中匹配的參數(shù)并不是很合適,下一步將為其尋找更合適的參數(shù)。

參考文獻

[1]張家騄.言語知覺反映論[J].中國科學,1978,(5):519-530.

[2]張家騄.論語音技術(shù)的發(fā)展[J].聲學學報,2004:29(3):193-199.

[3]吳宗濟. 試論普通話語音的“區(qū)別特征”及其相互關(guān)系[J].中國語文,1980,(5):321-327.

[4]吳宗濟,林茂燦. 實驗語音學概要[M]. 北京:高等教育出版社,1989.

[5]陸致極. 試論普通話音位的區(qū)別特征[J].語文研究,1987,(4):10-21.

[6]張家騄. 漢語普通話區(qū)別特征體系[J].聲學學報,2005:30(6):506-514.

[7]張家騄. 漢語普通話區(qū)別特征體系樹狀圖[J].聲學學報,2006:31(3):193-198.

[8]馮曉亮,孟子厚. 面向普通話輔音檢測的區(qū)別特征參數(shù)測量[J].聲學技術(shù),2013,(1):297-305.

[9]章斯宇,孟子厚. 混響環(huán)境下漢語語音知覺特征的實驗分析[J].聲學學報,2013,(1):85-91.

[10]馮曉亮,孟子厚.舌尖輔音和舌面輔音的區(qū)別特征參數(shù)[J].北京:第八屆中國語音學學術(shù)會議,2008.

(責任編輯:王謙)

Detection of The Mandarin Initials Distinctive Feature in Natural Syllables

XU Yi-hua,Liu Ya-li,MENG Zi-hou

(Communication Acoustics Laboratory,Communication University of China,Beijing 100024,China)

Abstract:According to Mandarin initials distinctive feature systems based on speech perception characteristics,objective signal parameters was corrected which correspond to the distinctive features.Initial distinctive feature was detected tin Natural syllables by parameter Para,which is based on the percentage of effective frames in the initial preliminary position.The effective frame is that speech frame containing the parameter characteristics of a distinctive feature. Initial preliminary position is determined due to energy in Natural syllables. The average detection accuracy of initial distinctive feature was about 80%.

Keywords:Mandarin initials distinctive feature;natural syllables;computer aided speech evaluation

作者簡介:徐益華(1990-),男(漢),江蘇鹽城人,碩士研究生.E-mail:xuyihua0708@163.com

基金項目:國家自然科學基金項目(11174275)

收稿日期:2015-04-27

中圖分類號:0428

文獻標識碼:A

文章編號:1673-4793(2015)05-0029-06

呼玛县| 织金县| 运城市| 柏乡县| 芮城县| 北流市| 东丽区| 大埔县| 喀什市| 徐州市| 鱼台县| 永靖县| 武邑县| 勃利县| 孟津县| 嘉祥县| 吉水县| 新巴尔虎右旗| 兰坪| 任丘市| 禄劝| 台东市| 离岛区| 宜良县| 江都市| 麦盖提县| 什邡市| 嘉兴市| 共和县| 邛崃市| 洞头县| 布拖县| 安新县| 淄博市| 镇巴县| 延寿县| 巨野县| 荆门市| 乾安县| 阿拉善左旗| 漳州市|