陳小瑩,艾金勇,于洪志
(1. 西藏民族學院 信息工程學院,陜西 咸陽 712082;2.西藏民族學院 圖書館,陜西 咸陽 712082;3.西北民族大學 中國民族信息技術研究院,甘肅 蘭州730030)
?
藏語拉薩話單音節(jié)嗓音聲學參數(shù)分析
陳小瑩1,艾金勇2,于洪志3
(1. 西藏民族學院 信息工程學院,陜西 咸陽 712082;2.西藏民族學院 圖書館,陜西 咸陽 712082;3.西北民族大學 中國民族信息技術研究院,甘肅 蘭州730030)
該文對藏語拉薩話單音節(jié)的嗓音特征進行了實驗研究,實驗首先對藏語拉薩話單音節(jié)進行語音標注,然后根據(jù)語音標注的位置信息,利用對應的程序提取音節(jié)結(jié)構(gòu)中的元音和輔音的嗓音聲學參數(shù),對基頻、開商和速度商分別統(tǒng)計分析,并做了顯著性分析。實驗結(jié)果表明不同元音和輔音的嗓音參數(shù)與發(fā)聲方式以及其在音節(jié)中位置有關,元音和音節(jié)結(jié)構(gòu)的不同會顯著影響開商和速度商的值,但對于基頻數(shù)據(jù)的影響并不顯著。同時嗓音參數(shù)之間也存在一定的關聯(lián)性,即基頻和開商、速度商之間是反比關系,開商和速度商之間是正比的關系。
拉薩話;嗓音特征;基頻;開商;速度商
隨著語音信號處理技術的發(fā)展,嗓音發(fā)聲的研究在許多不同的學科得到了迅速的發(fā)展。對不同語言嗓音的研究,一直都是語音學、信號處理和生理學等學科研究的熱點。在面向語言學的嗓音研究領域,中國的民族語言和漢語的發(fā)聲類型得到了比較深入的研究[1-2]。藏語歷史悠久,使用人口眾多,是我國一種主要的民族語言。利用現(xiàn)代語音學的研究方法對藏語的嗓音進行研究,建立嗓音聲學參數(shù)數(shù)據(jù)庫,對語音學、言語工程和信號處理方面都有著重要價值[3-4],筆者曾對安多方言和衛(wèi)藏方言的元音嗓音參數(shù)進行了一些前期的實驗研究,并得到了一些有意義的結(jié)論[5-6],但是由于研究對象不夠系統(tǒng),因此難以形成較為完善的結(jié)論,鑒于此,本文分別從元音和輔音兩方面研究分析嗓音聲學參數(shù)的特征,以期獲得更多有意義的結(jié)果。
2.1 實驗材料
本項目以《藏語簡志》中的音系為基礎[7],參照《新編藏文字典》和《藏漢對照拉薩口語詞典》,并按照文獻[8]中拉薩話音系的歸納結(jié)果,整理得出滿足不同音節(jié)結(jié)構(gòu)的單音節(jié)共計3 547個,對同一音節(jié)結(jié)構(gòu)的單音節(jié)盡量選擇其中的常用詞作為實驗文本,最終編制形成實驗所需的錄音材料。
2.2 信號采集和預處理
實驗中錄音人為拉薩本地人,發(fā)音清晰,無嗓音方面的病史,藏語言文字基礎扎實。信號錄制在中國民族信息技術研究院的專業(yè)錄音室進行,采集語音和嗓音的雙通道信號,設定語音采樣頻率為40kHz,其中語音信號通過麥克風采集得到,嗓音信號通過喉頭儀采集得到[9]。
由于在信號錄制的過程中,采集的嗓音常伴隨有噪音,所以信號錄制后首先需要對嗓音信號進行降噪處理。本文對嗓音信號先采用小波分析方法進行降噪預處理,經(jīng)過預處理后的嗓音信號提取出的參數(shù)能更準確真實地反映藏語拉薩話單音節(jié)嗓音信號頻域和時域的信息。
2.3 語音標注
語音文件錄制結(jié)束后,我們首先要對藏語拉薩話單音節(jié)進行語音學和聲學上的標注[10-11]。本文標注采用的是北京大學語音樂律分析平臺下的wavefinal軟件[12]。
圖1 藏語拉薩話單音節(jié)[e]的標注圖
2.4 參數(shù)提取
語音文件標注后,利用美國KEY公司Real-Time EGG Analysis 5138軟件進行嗓音參數(shù)的提取。提取的嗓音參數(shù)包括基頻(F0)、開商(OQ)和速度商(SQ)。提取的參數(shù)以.txt默認文本格式保存[4]。
根據(jù)研究對象,單元音的嗓音聲學參數(shù)可以直接提取。對于整個音節(jié)而言,根據(jù)語音標注的位置信息,利用MATLAB編寫對應的程序,提取嗓音聲學參數(shù)。
2.5 參數(shù)時間歸一化處理
藏語拉薩話的單音節(jié)的時長是不一致的,為了對比不同時長音節(jié)的嗓音參數(shù)數(shù)據(jù),提高數(shù)據(jù)分析的科學性,提取出的嗓音聲學參數(shù)需要進行時間歸一化處理?;诖宋闹欣肕ATLAB程序?qū)⒒l、開商和速度商數(shù)據(jù)集合調(diào)整為等距離的15個點提取,使得所獲取的數(shù)據(jù)在時間上具有可比性。
實驗中對藏語拉薩話單音節(jié)嗓音聲學參數(shù)主要是基于音素層面的,通過對單元音構(gòu)成的音節(jié)(V)、元音帶輔音聲母構(gòu)成的音節(jié)(CV)、元音帶輔音韻尾的音節(jié)(VC)和元音前后均有輔音存在的單音節(jié)(CVC)四種音節(jié)結(jié)構(gòu)中濁音的參數(shù)統(tǒng)計分析的。鑒于清輔音發(fā)音的時候?qū)τ诼晭д駝拥挠绊憳O小,而嗓音的特征表現(xiàn)主要由聲帶振動引起[1],所以文中重點研究的是濁輔音和元音的嗓音特征。其中音節(jié)結(jié)構(gòu)中的輔音(C)指的是濁輔音。實驗中所涉及的元音是指拉薩話中常用的[a]、 [i]、 [u]、 [e]、 [o]五個元音。在輔音參數(shù)分析部分,主要考慮濁輔音的參數(shù)變化情況,將濁輔音按照發(fā)音方式分成鼻音、邊音、顫音和半元音四類進行分析,為了消除其他因素影響,所有濁輔音均與元音[a]搭配。
3.1 基頻數(shù)據(jù)分析
3.1.1 元音基頻數(shù)據(jù)分析
圖2描述的是特定調(diào)值下,不同的元音在四種音節(jié)結(jié)構(gòu)中的基頻分布圖。其中音節(jié)結(jié)構(gòu)中的輔音為相同發(fā)音部位和發(fā)音方法的濁輔音。通過圖例數(shù)據(jù)可以看出在四種不同音節(jié)結(jié)構(gòu)中,元音的基頻數(shù)據(jù)變化趨勢基本一致。音節(jié)結(jié)構(gòu)CVC的元音同時受到前后濁輔音的影響,其基頻變化明顯不同于其他三種音節(jié)結(jié)構(gòu)。而音節(jié)結(jié)構(gòu)VC和CVC中所有元音的基頻比單一元音發(fā)生時元音的基頻值有所提升,CV結(jié)構(gòu)基本符合這一規(guī)律,只是元音為[i]時略有降低。但總體而言,這些都說明元音相鄰的輔音的生理特性使得元音基頻值也受到影響,從而使得發(fā)音人在發(fā)聲時共鳴腔受到的影響增大。
圖2 元音基頻數(shù)據(jù)圖
3.1.2 輔音基頻數(shù)據(jù)分析
四種不同發(fā)音方式的濁輔音基頻數(shù)據(jù)平均值、最大值和最小值統(tǒng)計結(jié)果見表1。
表1 輔音基頻數(shù)據(jù)表
表中數(shù)據(jù)顯示輔音基頻范圍在110Hz~160Hz之間,其中顫音與元音相連接時其基頻最小,最大的為鼻音,這也表明了鼻音發(fā)聲時響度更大。數(shù)據(jù)表明,基頻與輔音自身的發(fā)聲方式有一定的聯(lián)系。
3.2 開商數(shù)據(jù)分析
3.2.1 元音開商數(shù)據(jù)分析
通過圖3可以看出: 開商均值集中在57%~65%之間,變化幅度不大,開商值比較穩(wěn)定。在四種不同音節(jié)模式中,不同元音開商數(shù)據(jù)的曲線走向基本上是一致的。這說明不同音節(jié)結(jié)構(gòu)中元音開商受影響較小。和單元音開商值相比較,CV結(jié)構(gòu)中輔音聲母會相應的提升元音的開商值,VC結(jié)構(gòu)中輔音韻尾會相應的降低元音的開商值, CVC結(jié)構(gòu)中元音的開商數(shù)據(jù)和其他音節(jié)相比較可以看出輔音韻尾對元音的影響要大于輔音聲母。
圖3 元音開商數(shù)據(jù)圖
3.2.2 輔音開商數(shù)據(jù)分析
四種不同發(fā)音方式的濁輔音開商數(shù)據(jù)平均值、最大值和最小值統(tǒng)計結(jié)果見表2。
表2 輔音開商數(shù)據(jù)表
開商表明的是聲門開啟時間所占的比例。表中數(shù)據(jù)顯示輔音開商范圍在56%~61%之間,其中顫音與元音相連接時其開商最小,最大的為鼻音,這與基頻數(shù)據(jù)的表現(xiàn)形式基本一致,數(shù)據(jù)也表明了濁輔音發(fā)聲時聲門的開啟時間在整個發(fā)聲周期中所占比例最大。
3.3 速度商數(shù)據(jù)分析
3.3.1 元音速度商數(shù)據(jù)分析
通過圖4我們可以看出,速度商均值集中在190%~332%之間,變化幅度較大。在不同音節(jié)結(jié)構(gòu)中,元音速度商的變化趨勢基本是一致的。從圖中還可以看出輔音聲母會降低元音的速度商的值,而韻尾則會提升元音的速度商,綜合CVC的數(shù)據(jù),還可以推測輔音韻尾對元音速度商的影響更大一些。和基頻以及開商值一樣,元音速度商值也受自身生理特性舌位和唇形影響。
圖4 元音速度商數(shù)據(jù)圖
3.3.2 輔音速度商數(shù)據(jù)分析
不同發(fā)音方式的濁輔音速度商數(shù)據(jù)統(tǒng)計情況如表3所示。
表3 輔音速度商數(shù)據(jù)表
速度商描述的是聲門打開的動作與聲門關閉動作兩者所占用時間的比例關系。表中數(shù)據(jù)顯示輔音速度商范圍在210%~265%之間,其中半元音與元音相連接時其速度商最小,最大的為鼻音,這與基頻數(shù)據(jù)的表現(xiàn)形式基本類似,數(shù)據(jù)也表明了濁輔音發(fā)聲時嗓音的開啟時間遠遠大于其關閉所占用的時間。
3.4 嗓音參數(shù)之間的顯著性分析
前面關于元音和輔音嗓音參數(shù)之間的差異只是直觀觀測得到的一些結(jié)論。為了更進一步研究嗓音參數(shù)之間的影響關系,又對所有的數(shù)據(jù)按照不同分類進行了顯著性分析。
3.4.1 元音嗓音參數(shù)的顯著性分析
為了更好地了解元音和結(jié)構(gòu)的不同對于元音嗓音參數(shù)的影響,文中以元音和不同的音節(jié)結(jié)構(gòu)為因變量分別對元音的基頻、開商和速度商進行了雙因素分析,分析結(jié)果如表4、表5和表6所示。所有分析均設置置信水平為0.05。由于用于檢驗音節(jié)結(jié)構(gòu)因素的P值為0.29大于置信水平,所以音節(jié)結(jié)構(gòu)的不同對于基頻的影響是不顯著的,同樣可以得到結(jié)論即元音的不同對于元音的基頻數(shù)據(jù)變化影響也是不顯著的。表5和表6中由于P值均小于置信水平,所以音節(jié)結(jié)構(gòu)和元音的不同會造成開商和速度商的顯著性變化,而開商和速度商主要描述的是聲門開啟的時間之間的比例關系,因而可以推斷音節(jié)結(jié)構(gòu)和元音的不同可能導致在發(fā)聲方式上會有所改變。
表4 基頻數(shù)據(jù)方差分析表
表5 開商數(shù)據(jù)方差分析表
表6 速度商數(shù)據(jù)方差分析表
3.4.2 輔音嗓音參數(shù)的顯著性分析
輔音嗓音參數(shù)的分析主要考察的是不同的發(fā)音方式之間的關系。文中主要進行的是以輔音為因變量的單因素方差分析,其中置信水平也設置為0.05,結(jié)果得到關于基頻、開商和速度商的P值均小于置信水平,因而對于嗓音參數(shù)的影響是顯著的,這是綜合的結(jié)果。由于有四種發(fā)音方式,之后又進行了Post-Hoc進行了檢測,以檢測不同發(fā)聲方式之間的差異是否顯著。結(jié)果鼻音和邊音、鼻音和半元音之間差異不顯著,鼻音和顫音、顫音和邊音、顫音和半元音、邊音和半元音之間均有顯著的差異。
3.5 嗓音參數(shù)之間的關系
在分析嗓音參數(shù)之間關系部分,根據(jù)已有的研究結(jié)論,作嗓音聲學分析及電聲門圖數(shù)據(jù)統(tǒng)計時,元音[a]的嗓音分析參數(shù)指標的敏感度更高,因此實驗中選擇元音[a]作為分析樣本[14-15]。圖5、圖6和圖7分別描述了基頻、開商和速度商之間的相互關系。
圖5 基頻和開商關系圖
圖6 基頻和速度商關系圖
圖7 開商和速度商關系圖
上述三幅圖反映了速度商、開商和基頻之間的比例關系,我們對每組數(shù)據(jù)均做了多項式趨勢線,根據(jù)圖示可以發(fā)現(xiàn),隨著基頻數(shù)據(jù)的提高,其開商的數(shù)據(jù)會逐漸減小,基頻和開商之間存在反比關系。同樣基頻和速度商之間的數(shù)據(jù)通過雙坐標軸顯示,兩者也是互為反比關系,基頻數(shù)據(jù)的提升會使速度商變小。另外通過圖示可以發(fā)現(xiàn),速度商和開商二者之間存在正比關系。而開商和速度商分別反應的是諧波能量和共振峰能量的大小,說明了基頻數(shù)據(jù)的變化也會在一定程度上影響發(fā)聲時諧波和共振峰的能量。
文中通過實驗語音學的方法對藏語拉薩話單音節(jié)嗓音聲學參數(shù)基頻、開商和速度商進行了研究,并進行了顯著性分析,總結(jié)整理出關于嗓音信號的規(guī)律表現(xiàn): 1)元音相鄰輔音的生理特性會使得元音基頻值變大。2)輔音聲母會提升元音的開商值,輔音韻尾會降低元音的開商值,但是輔音韻尾對元音開商值的影響要大于輔音聲母的影響。3)輔音聲母會降低元音的速度商,而輔音韻尾會提升元音的速度商,其中輔音韻尾對元音速度商的影響更大一些。4)通過顯著性分析發(fā)現(xiàn),音節(jié)結(jié)構(gòu)和元音的不同可能導致在發(fā)聲方式上會有所改變。輔音的嗓音參數(shù)中,鼻音和邊音、鼻音和半元音之間差異不顯著,鼻音和顫音、顫音和邊音、顫音和半元音、邊音和半元音之間均有顯著的差異。5)三種主要參數(shù)之間,基頻和開商之間存在反比關系,基頻和速度商之間也是互為反比關系,速度商和開商二者之間存在正比關系。
這些規(guī)律反映出藏語拉薩話在發(fā)聲形態(tài)上的一些差別,對于語音信號的進一步處理提供了數(shù)據(jù)支撐,而且對語音學、言語工程和信號處理等不同領域的相關研究都有一定的推動作用。本文對藏語拉薩話嗓音聲學參數(shù)研究還處于探索階段,如何通過嗓音研究來量化不同的嗓音發(fā)聲類型和不同人的嗓音特性是下一步要繼續(xù)研究的重點和難點。
[1] 孔江平.論語言發(fā)聲[M].北京:中央民族大學出版社,2001:1-3.
[2] 吳宗濟,林茂燦.實驗語音學概要[M].北京:高等教育出版社,1989:34-44.
[3] 孔江平.語言發(fā)聲研究及相關領域[C]//第五屆全國現(xiàn)代語音學學術會議論文集.北京: 中文信息學會,2001:1-8.
[4] 瞿靄堂,金效靜.藏語方言的研究方法[J].西南民族大學學報,1981,03:76-84.
[5] 陳小瑩,華侃等.藏語拉薩話元音單音節(jié)嗓音聲學參數(shù)分析[J].語文學刊,2010,15:66-67.
[6] 陳小瑩,陳晨等.基于EGG信號的安多藏語元音嗓音特征研究[J].西北民族大學學報,2010,1:20-23.
[7] 金鵬.藏語簡志[M].北京: 人民出版社,1983:7-16.
[8] 于洪志,高璐等.藏語機讀音標SAMPA_ST的設計[J].中文信息學報,2012,26(4):66-72.
[9] 胡阿旭.基于氣流氣壓信號的漢語普通話聲韻母研究[D].蘭州: 西北民族大學碩士學位論文,2010.
[10] 圖雅.關于聲學語音學研究方法的幾個問題[J]. 內(nèi)蒙古大學學報,2004,06:94-98.
[11] 吳宗濟.實驗語音學與語言學[J].語文研究,1981,01: 11-16.
[12] 尹基德.漢語韻律的嗓音發(fā)聲研究[D].北京: 北京大學博士學位論文,2011.
[13] 楊陽蕊,李永宏等.言語聲學參數(shù)分析系統(tǒng)設計[J].西北民族大學學報,2009,01:37-41.
[14] 蔡青.元音聲樣的選擇對嗓音聲學分析及電聲門圖檢查的影響[D]. 武漢: 湖北醫(yī)科大學碩士學位論文,2000.
[15] 侯麗珍,韓德民等.嗓音檢測中元音聲樣的選擇[J]. 聽力學及言語疾病雜志,2002,01:16-18.
Acoustic Analysis of Monosyllabic Voice of Lhasa Tibetan
CHEN Xiaoying1, AI Jinyong2, YU Hongzhi3
(1. School of Information Engineering, Tibet University for Nationalities, Xianyang Shaanxi 712082,China; 2. Library of Tibet University for Nationalities, Xianyang,Shaanxi 712082,China; 3. Northwest University for Nationalities,Chinese National Language Information Technology,Lanzhou,Gansu 730030,China)
This paper describes an empirical study on the voice characteristics of Lhasa Tibetan words. Based on the annotation of the monosyllabic voice in Tibetan Lhasa dialect, the acoustic parameters in of vowels and consonants are then extracted, followed by a statistical analysis of the pitch, open quotient and speed quotient. The results show that the voice parameters of different vowel and consonant are affected by the vocal style and the syllable position, and different vowels and syllables structure will affect the open quotient and speed quotient value.
Lhasa dialect; characteristic of phonation; F0; open quotient (OQ); speed quotient (SQ)
陳小瑩(1983—),碩士,實驗師,主要研究領域為實驗語音學。E?mail:ajycyt@126.com艾金勇(1983—),碩士,館員,主要研究領域為藏文信息處理。E?mail:ajy0529@126.com于洪志(1947—),博士生導師,教授,主要研究領域為藏文信息處理。E?mail:yuhongzhi@hotmail.com
1003-0077(2015)03-0184-06
2013-06-27 定稿日期: 2014-08-28
西藏自治區(qū)專項資金項目(13BYY001);中國民族語言文字信息技術實驗室開放基金課題(2012KF013);藏語方言的孤立詞識別技術研究(11myz05)
TP391
A