彭夢婭,劉亞麗
(中國傳媒大學(xué) 傳播聲學(xué)研究所,北京 100024)
區(qū)別特征單音節(jié)評測中過渡音征的影響
彭夢婭,劉亞麗
(中國傳媒大學(xué) 傳播聲學(xué)研究所,北京 100024)
為將區(qū)別特征應(yīng)用于語音評測,需分析區(qū)別特征應(yīng)用的可行性及過渡音征對區(qū)別特征單音節(jié)評測的影響。利用區(qū)別特征探針參數(shù)并在區(qū)別特征決策樹中逐層判斷的方法進行單音節(jié)中聲母和韻母的唯一確定,對含過渡音征的語音樣本信號與無過渡音征的語音樣本信號分別計算聲母正檢率,兩組正檢率顯著性檢驗結(jié)果顯示無顯著性差異,因此建議在區(qū)別特征單音節(jié)檢測中不考慮過渡音征。該結(jié)果可以為進一步將區(qū)別特征應(yīng)用于普通話語音客觀評測提供參考。
區(qū)別特征;過渡音征;計算機輔助評測
目前的普通話水平測試工作中,雖有部分地區(qū)采用人工打分為主,計算機輔助評測的方式,大部分地區(qū)采用的仍是人工打分的主觀評測方法。雖然主觀評分能夠真實地反映被試者的語言能力,但存在評分員勞動強度大、測試成本高以及測試信度受主觀影響大等問題。隨著實驗語音學(xué)和語音識別等相關(guān)技術(shù)的進步,計算機輔助發(fā)音質(zhì)量評測技術(shù)也在不斷發(fā)展。當(dāng)下主流的客觀評測方法是基于統(tǒng)計模型的方法,該方法可操作性強適用范圍廣泛且可信度高,但統(tǒng)計模型缺少對語音的聲學(xué)模型和語音的知覺模型內(nèi)部細節(jié)問題的研究,而且系統(tǒng)性能的提高過于依賴數(shù)據(jù)驅(qū)動。20世紀(jì)80年代國內(nèi)開始進行普通話區(qū)別特征的研究,區(qū)別特征方法可以很好地解決基于統(tǒng)計模型方法存在的弊端。區(qū)別特征是針對語言的本質(zhì)特征的理論,可以鎖定普通話評測中的發(fā)音錯誤和發(fā)音缺陷,將區(qū)別特征概念引入到計算機輔助發(fā)音評測,為漢語普通話語音評測提供了新的思路和方法。
關(guān)于區(qū)別特征的研究已經(jīng)達到一定的深度。張家祿[1]首次建立了聲韻調(diào)體系的區(qū)別特征系統(tǒng)。章斯宇[3]建立了基于言語知覺特性的普通話區(qū)別特征聲韻調(diào)體系。遺憾的是,他們并未進行區(qū)別特征的參數(shù)化,因此無法將區(qū)別特征實際應(yīng)用于語音評測。為解決這一問題,徐益華[4]和李戈[5]嘗試?yán)锰结樃拍罨就瓿闪藵h語普通話聲母和韻母的區(qū)別特征參數(shù)化。他們完成了每個聲母或韻母對應(yīng)的區(qū)別特征組中的單個區(qū)別特征的檢測,目的是檢測區(qū)別特征探針參數(shù)的有效性,但并未利用這些參數(shù)進行判別決策樹中的聲韻母檢測。
無論是識別還是評測中,過渡音征問題一直是難點。過渡音征現(xiàn)象主要由聲韻過渡段表現(xiàn),它使得聲母的一部分特征或全部特征由韻母攜帶,特別是某些聲母,如不送氣塞音,其區(qū)別特征幾乎全部由過渡段攜帶。在基于統(tǒng)計模型的方法中,普遍認為過渡音征是必須考慮的,如論文[5-8]為解決過渡音征對聲母識別的影響,根據(jù)后接韻母第一音位的不同建立各種聲母模型,再使用基于聲韻母時長和短時能量的算法進行聲韻自動切分,之后進行模式識別。該方法需要建立91種聲母模型,數(shù)據(jù)量大,并且依賴聲韻自動切分,切分算法改變可能會造成聲母模型失效,降低了應(yīng)用的普適性。區(qū)別特征理論是針對語言的本質(zhì)特征的理論,在進行區(qū)別特征的研究時一般認為過渡音征問題是不需要單獨考慮的,那么在將區(qū)別特征應(yīng)用于普通話語音評測時過渡音征問題的影響是否需要考慮,是我們將要進行討論的。
本文在區(qū)別特征相關(guān)研究的基礎(chǔ)之上,針對過渡音征問題,通過提取區(qū)別特征探針參數(shù)并在區(qū)別特征決策樹中逐層判斷的方法進行單音節(jié)中聲母和韻母的唯一確定,并對含過渡音征的語音樣本信號與無過渡音征的語音樣本信號分別進行聲母正檢率計算,對兩者正檢率結(jié)果之間的差異進行顯著性檢驗,分析在區(qū)別特征單音節(jié)檢測中過渡音征問題的影響。除此之外,對單音節(jié)中韻母進行正檢率計算,結(jié)合單音節(jié)中含過渡音征的聲母正檢率,分析區(qū)別特征應(yīng)用的可行性。
2.1 樣本的選取和處理
語音樣本信號選自中國傳媒大學(xué)傳播聲學(xué)研究所錄制的語音語料數(shù)據(jù)庫中的單音節(jié)數(shù)據(jù)庫部分[11]。在該數(shù)據(jù)庫中選取50個人的語音樣本數(shù)據(jù)(男女比例1:1),年齡分布在19~21歲之間。該單音節(jié)數(shù)據(jù)庫涵蓋所有聲韻組合,選取362種聲韻組合的單音節(jié),聲調(diào)全部為一聲,共18100個(50×362)。語音樣本采樣率為16kHz。按過渡音征有無將語音信號分別進行處理,處理方法如下:
含過渡音征樣本:通過人工聽辨去除不可用的單音節(jié)信號(誤讀或噪聲過大等),最終選定單音節(jié)樣本總數(shù)為14736個,包含所有可能的聲韻組合情況。并通過人工觀察語譜圖、時域圖的方法,將單音節(jié)前后的靜音區(qū)去除,只保留純凈的單音節(jié)信號。
無過渡音征樣本:通過人工聽辨去除不可用的單音節(jié)信號(誤讀或噪聲過大等),最終選定單音節(jié)樣本總數(shù)為3247個,從聲母呼讀音樣本中獲取,如表1所示。為了得到純凈的聲母信號,處理上不受后面的元音信號和過渡音征的影響,將呼讀音后部的非聲母部分切除。采取人工切音的方法,保留起始點和排除過渡音、韻母的干擾。切割主要根據(jù)輔音的語圖特點、時域信號特點,并通過聽辨進行切分。
表1 聲母呼讀音對照表
續(xù)表
2.2 參數(shù)選取
選用文獻[4-5]的聲母和韻母區(qū)別特征探針參數(shù),用于聲韻母區(qū)別特征決策樹[3]中各區(qū)別特征有無的判別。
表2 聲母區(qū)別特征探針參數(shù)
表3 韻母區(qū)別特征探針參數(shù)
2.3 實驗流程
針對每個單音節(jié),通過計算得出的12個聲母探針參數(shù)(見表2)和24個韻母探針參數(shù)(見表3)對聲韻母進行判別的流程如圖1所示。
圖1 單音節(jié)中聲韻母正檢流程圖
第一步,對單音節(jié)語音樣本信號進行預(yù)處理,包括預(yù)加重、分幀、加窗、聲母邊界初判(聲母邊界初判指的是,聲母部分語音幀的能量值要低于整個音節(jié)語音幀的能量平均值,利用此特征實現(xiàn)音節(jié)中聲母位置的初判);
第二步,對預(yù)處理后的語音信號進行區(qū)別特征探針參數(shù)的計算,得到1×12的聲母區(qū)別特征探針參數(shù)矩陣和1×24的韻母區(qū)別特征探針參數(shù)矩陣;
第三步,將每個聲母和韻母判別時用不到的區(qū)別特征探針參數(shù)矩陣值設(shè)定為0,即把不參與判別的區(qū)別特征(后稱無效區(qū)別特征)去除,只考慮理論上含有的區(qū)別特征;
最后,根據(jù)區(qū)別特征探針矩陣在聲母/韻母區(qū)別特征決策樹[3]進行路徑搜索,通過對節(jié)點處區(qū)別特征有無的判定實現(xiàn)對單音節(jié)中聲母和韻母的唯一確定,以q為例,如圖2所示,依次判別“濁音的”、“舌面的”、“送氣的”和“塞擦的”四個區(qū)別特征的有無,最終確定聲母q。
圖2 聲母“q”判決路徑
將樣本中所有單音節(jié)進行上述聲韻母判別,判別結(jié)果用于正檢率的計算,計算方法如下:
對于某一聲母或某一韻母,測試集中含有該聲母或韻母的單音節(jié)樣本為a個,在這些樣本中,通過區(qū)別特征檢測出含有該聲母或韻母的單音節(jié)樣本為b個,則:正檢率=b/a×100%。
使用上述流程及計算方法進行正檢率計算,含過渡音征語音樣本聲母正檢率與無過渡音征語音樣本聲母正檢率如表4所示,韻母的正檢率如表6所示。
表4顯示含過渡音征語音樣本聲母正檢率大多在60%以上,平均正檢率為63%。無過渡音征語音樣本聲母正檢率大多在60%以上,平均正檢率為62%。正檢結(jié)果偏低,進一步分析表4,可以得出:
(1)參與判別的區(qū)別特征個數(shù)增多正檢率會相應(yīng)降低,如j/q/x,其中j的判別需要3個區(qū)別特征,q和x的判別需要4個區(qū)別特征,j的正檢率明顯高于q和x。同樣的情況還存在于z/c/s、zh/ch/sh、b/g/d等聲母判別中。說明區(qū)別特征逐層判斷存在誤判不斷累積的情況,參與判別的區(qū)別特征越多,正檢率就相應(yīng)越低,但由于各區(qū)別特征之間非相互獨立,最終正檢率并不是各參與判別的區(qū)別特征正檢率的乘積。
(2)每個區(qū)別特征對于判別的貢獻程度是不同的,如m有三個參與判別的區(qū)別特征:“濁音的”、“鼻音的”和“雙唇的”,l也有3個參與判別區(qū)別特征:“濁音的”、“鼻音的”和“邊音的”,在兩者的判別中雖然只有一個參與的區(qū)別特征不同,但是正檢率差距較大,說明區(qū)別特征“雙唇的”和“邊音的”在聲母的判別中,貢獻程度是不同的。同樣的情況還存在于b/h等聲母的判別中。
表4 含、無過渡音征語音樣本聲母正檢率
此外,為觀察過渡音征對聲母判別的影響,將表4中的含過渡音征語音樣本聲母正檢率和無過渡音征語音樣本聲母正檢率進行如下對比分析。
含過渡音征語音樣本聲母正檢率和無過渡音征語音樣本聲母正檢率之間的相對變化率如表5所示,此變化率指的是無過渡音征聲母正檢率相對于含過渡音征聲母正檢率的變化率。
由表5可以看出,兩組正檢率之間的平均變化率為3%,變化幅度很小。將兩組正檢率進行顯著性檢驗,結(jié)果為p=0.319>0.05,即含過渡音征語音樣本聲母正檢率和無過渡音征語音樣本聲母正檢率之間不具有顯著性差異,說明從區(qū)別特征角度進行聲母正檢時過渡音征影響很小。
表5 聲母正檢率相對變化率
韻母正檢率結(jié)果如表6所示,語音樣本為含過渡音征的語音樣本信號,正檢流程如圖1中韻母部分所示,計算方法與聲母相同。
表6 韻母正檢率
表6顯示韻母正檢率大多在50%以上,平均正檢率為54%。相比表4中含過渡音征聲母正檢率,正檢結(jié)果偏低,進一步分析表6,可以得出:
(1)韻母正檢率同樣存在參與判別的區(qū)別特征個數(shù)增多正檢率降低的現(xiàn)象,如無介音韻母o/ou/ong,其中o的判別需要4個區(qū)別特征,o和ong的判別需要5個區(qū)別特征,o的正檢率明顯高于ou和ong。同樣的情況還存在于a/ai/ao、o/ou/ong等韻母的判別中。韻母正檢率同樣存在不同區(qū)別特征對于判別的貢獻程度不同的現(xiàn)象,如ia有4個參與判別的區(qū)別特征:“合口的”、“齊齒的”、“低的”和“后的”,iong也有4個參與判別的區(qū)別特征:“合口的”、“齊齒的”、“低的”和“開尾的”,在兩者的判別中雖然只有一個區(qū)別特征不同,但是正檢率差距較大,說明區(qū)別特征“低的”和“開尾的”在韻母的判別中,貢獻程度是不同的。同樣的情況還存在與ai/ao/an/ang等韻母的判別中。
(2)韻母中含有的音位越多,其正檢率越低,如a/ai/ang、o/ou/ong、i/in/ing、u/ua/uai/uang等,音位增多的同時韻母正檢率呈現(xiàn)由大到小的變化趨勢。韻母中含有的音位增多,發(fā)音時口型和舌位都會發(fā)生不同程度的變化,區(qū)分難度隨之增加,造成了正檢率的降低。
(3)韻母按內(nèi)部結(jié)構(gòu)的不同,可以分為單韻母、復(fù)韻母和鼻韻母三類,鼻韻母所占比例最大,有16個。由表6可以看出鼻韻母正檢率普遍較低,平均正檢率為46%,相比于單韻母和復(fù)韻母低得多。韻母按韻尾情況分為無尾韻母、元音尾韻母和鼻音尾韻母三類,將這三類韻母正檢率分別求平均值的結(jié)果如表7所示。
表7 按韻尾情況分類韻母平均正檢率
由表7可以看出,無尾韻母正檢率較好,鼻韻尾韻母正檢率較差。鼻音相關(guān)韻母一直是韻母識別與評測中的難點,在論文[5]進行韻母區(qū)別特征“鼻韻尾的”的正檢時就存在結(jié)果不理想的情況,鼻音相關(guān)的區(qū)別特征參數(shù)應(yīng)進一步研究,必要時可嘗試其它聲學(xué)參數(shù)。
(4)含過渡音征聲母正檢率和韻母正檢率,兩者所用語音信號樣本相同,但對比表4和表6可以發(fā)現(xiàn)聲母的正檢率明顯好于韻母正檢率。對比聲韻母區(qū)別特征理論體系,韻母的區(qū)別特征體系相對復(fù)雜,許多韻母在判別中涉及的區(qū)別特征多,誤判累積也會相應(yīng)增多,在目前的韻母參數(shù)研究中仍有個別特征參數(shù)選取不夠理想,需改進。
綜上所述,從區(qū)別特征角度進行單音節(jié)中聲母的檢測時過渡音征問題影響很小,建議忽略。韻母中音位增多正檢率隨之降低,部分區(qū)別特征參數(shù)應(yīng)進一步研究,必要時可嘗試其它聲學(xué)參數(shù)。參與判別的區(qū)別特征個數(shù)增加會造成誤判累積,而且各個區(qū)別特征對最終的判別貢獻程度是不同的,因此有必要對各區(qū)別特征進行權(quán)值設(shè)定,以降低誤判的累積程度。
區(qū)別特征單音節(jié)檢測中聲母和韻母的平均正檢率可以達到60%左右,表明區(qū)別特征應(yīng)用于單音節(jié)測評是可行的。但總體來說正檢率偏低,這說明已有的區(qū)別特征參數(shù)仍需改進后才能應(yīng)用到普通話語音評測當(dāng)中。
對比含過渡音征語音樣本聲母正檢率與無過渡音征語音樣本聲母正檢率,兩者之間的顯著性檢驗結(jié)果說明兩者之間不具有顯著差異,因此從區(qū)別特征角度進行單音節(jié)檢測時建議不考慮過渡音征。
韻母區(qū)別特征體系相對復(fù)雜,口型和鼻音相關(guān)區(qū)別特征對最終判別結(jié)果影響較大,應(yīng)進一步研究,或嘗試其它聲學(xué)參數(shù)。
各區(qū)別特征之間的相互影響及誤判率的累計都可能造成評判結(jié)果不理想,應(yīng)當(dāng)確定每個區(qū)別特征對于聲母或韻母判別的貢獻程度,根據(jù)每一個區(qū)別特征的在評判時的重要性進行權(quán)值的設(shè)定,權(quán)值的設(shè)定可以將區(qū)別特征之間的相互影響和誤判累積程度降低。不僅如此,區(qū)別特征參數(shù)是根據(jù)已有的數(shù)據(jù)結(jié)果,按照統(tǒng)計判別的最佳標(biāo)準(zhǔn)而設(shè)定的,而沒有結(jié)合評測人員的主觀經(jīng)驗,完全依賴標(biāo)準(zhǔn)數(shù)據(jù)得到的參數(shù)是片面的,最終的評分機制應(yīng)與主觀測評相結(jié)合的合理評分機制。這也是下一步需要進行的工作。
[1]張家騄.漢語普通話區(qū)別特征系統(tǒng)[J].聲學(xué)學(xué)報,2005,30(6):506-514.
[2]陸致極.試論普通話音位的區(qū)別特征[J].語文研究,1987,(4):10-21.
[3]章斯宇.基于言語知覺特性的普通話區(qū)別特征系統(tǒng)研究[D].北京:中國傳媒大學(xué)博士學(xué)位論文,2011.
[4]徐益華.自然音節(jié)狀態(tài)下聲母區(qū)別特征檢測[D].北京:中國傳媒大學(xué)碩士學(xué)位論文,2015.
[5]李戈.自然音節(jié)狀態(tài)下韻母區(qū)別特征檢測[D].北京:中國傳媒大學(xué)碩士學(xué)位論文,2016.
[6]戚建宇.普通話單字發(fā)音客觀評價方法研究[D].蘇州:蘇州大學(xué)碩士學(xué)位論文,2006.
[7]陳麗霞.基于聲韻母基元的漢語語音識別系統(tǒng)[D].南京:南京理工大學(xué)碩士學(xué)位論文,2005.
[8]湯霖.普通話聲母的客觀評測[J].計算機應(yīng)用.2010,(6):30-4.
[9]劉振安.基于特征比較的語音評分方法研究.計算機應(yīng)用[J].2005,(12):25-12.
[10]鄭世杰.基于語音自動評測的普通話學(xué)習(xí)系統(tǒng)的研究[D].哈爾濱:哈爾濱師范大學(xué)碩士學(xué)位論文,2015.
[11]呂軍,基于語音識別的漢語發(fā)音自動評分系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2007,(3):28-5.
[12]馮曉亮.普通話輔音的參數(shù)化區(qū)別特征體系構(gòu)建[D].北京:中國傳媒大學(xué)博士學(xué)位論文,2009.
(責(zé)任編輯:王謙)
Effect of Initial-to-Final Transition in Detecting Syllables by Distinctive Features
PENG Meng-ya,LIU Ya-li
(Communication Acoustics Laboratory,Communication University of China,Beijing 100024,China)
In order to apply distinctive feature theory in Mandarin evaluation technology,it is necessary to analyze the feasibility of application of distinctive features and effect of initial-to-final transition in detecting syllables.By extracting acoustic parameters and distinguishing layer by layer,the initial and the final in a syllable can be determined uniquely.The detective accuracy of initials in speech samples with initial-to-final transition and speech samples without initial-to-final transition shows no significant difference,so initial-to-final transition is suggested to be ignored in in detecting syllables by distinctive features.The results obtained in this paper can provide a reference for further applying the distinctive features to the objective evaluation of Mandarin.
distinctive features;initial-to-final transition;computer-assisted assessment system
2017-04-14
彭夢婭(1992-),女(漢族),安徽阜陽人,中國傳媒大學(xué)碩士研究生.E-mail:yl_liu@cuc.edu.cn
O
A
1673-4793(2017)04-0064-06