国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)頻分布的漢語(yǔ)語(yǔ)音關(guān)鍵頻率分布研究

2011-03-14 05:12:48王鐘斐王彪
電子設(shè)計(jì)工程 2011年10期
關(guān)鍵詞:語(yǔ)譜韻母時(shí)頻

王鐘斐,王彪

(寶雞文理學(xué)院數(shù)學(xué)系,陜西寶雞721013)

語(yǔ)音識(shí)別(speech recognition)是機(jī)器通過(guò)識(shí)別和理解過(guò)程把人類的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。其根本目的是研究出一種具有聽(tīng)覺(jué)功能的機(jī)器,這種機(jī)器能直接接受人的語(yǔ)音,理解人的意圖,并做出相應(yīng)的反映[1]。

目前,語(yǔ)音識(shí)別技術(shù)已成為世界上最熱門的技術(shù)之一,它以語(yǔ)音為研究對(duì)象。因此,掌握語(yǔ)音的關(guān)鍵信息將有助于提高語(yǔ)音識(shí)別效果,而本文就是通過(guò)時(shí)間-頻率聯(lián)合分布來(lái)研究漢語(yǔ)語(yǔ)音關(guān)鍵頻率分布的情況。

1 漢語(yǔ)語(yǔ)音簡(jiǎn)介

語(yǔ)音是指人類通過(guò)發(fā)音器官發(fā)出來(lái)并且具有一定意義的聲音,其目的是進(jìn)行社會(huì)交際。漢語(yǔ)語(yǔ)音[2]的特點(diǎn)是音節(jié)結(jié)構(gòu)簡(jiǎn)單,音節(jié)界限分明,聲調(diào)是音節(jié)的重要組成成分。音素是按照音質(zhì)的不同劃分出的最小的語(yǔ)音單位。

音節(jié)是語(yǔ)音結(jié)構(gòu)的基本單位,是說(shuō)話時(shí)自然發(fā)出、聽(tīng)話時(shí)自然感到的最小的語(yǔ)音片斷。一般來(lái)說(shuō),漢語(yǔ)中用一個(gè)漢字來(lái)代表一個(gè)音節(jié)。只有兒化韻兩個(gè)漢字只記錄一個(gè)音節(jié)。音節(jié)可以構(gòu)成詞,詞可以構(gòu)成句子。漢語(yǔ)的音節(jié)結(jié)構(gòu)有很強(qiáng)的規(guī)律性。中國(guó)傳統(tǒng)把一個(gè)音節(jié)分為聲母、韻母和聲調(diào)3部分。聲母是指處在音節(jié)開(kāi)頭的輔音。音節(jié)的開(kāi)頭如果沒(méi)有聲母,就是零聲母音節(jié)。韻母是指音節(jié)中聲母后面的成分,可以只是一個(gè)元音,也可以是元音的組合或元音和輔音的組合。漢語(yǔ)各方言雖然語(yǔ)音分歧相當(dāng)大,但聲母、韻母和聲調(diào)的基本結(jié)構(gòu)是一致的。

研究漢語(yǔ)語(yǔ)音關(guān)鍵頻率分布,要首先研究聲母和韻母的頻率分布,因?yàn)槎呓Y(jié)合起來(lái)就是漢語(yǔ)語(yǔ)音,了解了聲母和韻母的頻率分布,就必然能夠大體確定漢語(yǔ)語(yǔ)音關(guān)鍵頻率分布。因此,下面主要以聲母和韻母為例來(lái)研究。

2 語(yǔ)音信號(hào)時(shí)頻分析

語(yǔ)音信號(hào)時(shí)域分析和頻域分析都有一定的局限性:前者對(duì)語(yǔ)音信號(hào)的頻率特性沒(méi)有直觀的了解;而后者提供的信息中又沒(méi)有語(yǔ)音信號(hào)隨時(shí)間的變化關(guān)系,即無(wú)法標(biāo)定信號(hào)發(fā)生的時(shí)間位置和發(fā)生變化的劇烈程度。因此要想比較準(zhǔn)確的分析語(yǔ)音信號(hào),單獨(dú)依靠時(shí)域分析或者是頻域分析,是不能完成的。要從時(shí)域、頻域兩方面同時(shí)入手,對(duì)語(yǔ)音信號(hào)進(jìn)行分析,得到代表其本質(zhì)的特征參數(shù),才能達(dá)到辨析語(yǔ)音的要求。

而時(shí)頻分析方法就提供了時(shí)間域與頻率域的聯(lián)合分布信息,清楚地描述了信號(hào)頻率隨時(shí)間變化的關(guān)系。其基本思想是:設(shè)計(jì)時(shí)間和頻率的聯(lián)合函數(shù),用它同時(shí)描述語(yǔ)音信號(hào)在不同時(shí)間和頻率的能量密度或強(qiáng)度。時(shí)間和頻率的這種聯(lián)合函數(shù)簡(jiǎn)稱為時(shí)頻分布。利用時(shí)頻分布來(lái)分析信號(hào),能給出各個(gè)時(shí)刻的瞬時(shí)頻率及其幅值,并且能夠進(jìn)行時(shí)頻濾波和時(shí)變信號(hào)研究。也就是,借助于時(shí)間和頻率的聯(lián)合表示,能夠準(zhǔn)確地描述非平穩(wěn)信號(hào)的特性,從而能夠?qū)ζ溥M(jìn)行分析[3]。

2.1 時(shí)頻表示

對(duì)于非平穩(wěn)信號(hào),為了得到信號(hào)的頻率隨時(shí)間變化的情況,需要使用時(shí)間和頻率的聯(lián)合函數(shù)來(lái)表示信號(hào),這種表示稱為信號(hào)的時(shí)頻表示。其目的是將一維時(shí)間信號(hào)x(n)或頻域信號(hào)X(ejω)映射成時(shí)間-頻率平面上的二維信號(hào)Px(n,ω)。那么,信號(hào)的瞬時(shí)能量和功率譜可以分別表示為

信號(hào)在時(shí)頻域n∈[n1,n2]和ω∈[ω1,ω2]的能量成分表示為:

可以根據(jù)函數(shù)Px(n,ω)計(jì)算在某一特定時(shí)間內(nèi)的頻率密度,計(jì)算該分布的整體和局部的各階陣等。

目前,有很多種時(shí)頻表示方法,主要有線性時(shí)頻表示、二次時(shí)頻表示(又稱雙線性時(shí)頻表示)。線性時(shí)頻表示主要有短時(shí)傅里葉變換、Gabor變換及小波變換。二次時(shí)頻表示是由能量譜或功率譜演化而來(lái),特點(diǎn)是變換為二次的。在某些實(shí)用場(chǎng)合,要用雙線性時(shí)頻表示來(lái)描述描述語(yǔ)言信號(hào)的能量密度分布,這種更嚴(yán)格意義下的時(shí)頻表示就稱為信號(hào)的時(shí)頻分布。

2.2 時(shí)頻分布

能量譜或功率譜具有雙線性變換特點(diǎn),也就是說(shuō)當(dāng)信號(hào)之間滿足下式時(shí)

能量譜函數(shù)有如下的雙線性關(guān)系:

式中,ε(ejω)、ε1(ejω)與ε2(ejω)分別為x(n)、x1(n)和x2(n)的能量譜,而*號(hào)表示對(duì)信號(hào)的頻譜取共軛操作。此時(shí),當(dāng)x1(n)和x2(n)的頻譜隨時(shí)間變化時(shí),根據(jù)能量譜或功率譜得到的時(shí)頻表示Px1(n,ω)和Px2(n,ω)是二次的,則有

其中,Px(n,ω)是x(n)的時(shí)頻表示。上式右邊的最后一項(xiàng)稱為交叉項(xiàng)或互項(xiàng),而Px1x2(n,ω)稱為x1(n)和x2(n)的互時(shí)頻表示。

此外,其他一些二次型能量化的時(shí)頻表示可統(tǒng)一的由Cohen L提出的廣義雙線性時(shí)頻表示,即

其中,φ(ξ,τ)表示核函數(shù),它決定Px(n,ω)的特性。

采用不同的核函數(shù),會(huì)得到不同的時(shí)頻分布。而對(duì)核函數(shù)要求是:一能壓縮交叉干擾項(xiàng),二能有好的特性。

2.3 語(yǔ)譜圖

語(yǔ)譜圖是語(yǔ)音信號(hào)短時(shí)頻譜的時(shí)間-強(qiáng)度表示[4]。語(yǔ)譜圖是語(yǔ)音信號(hào)時(shí)頻分布的一個(gè)比較好的應(yīng)用。其橫坐標(biāo)表示時(shí)間,縱坐標(biāo)表示頻率,每個(gè)像素的灰度值大小及顏色的濃淡反映相應(yīng)時(shí)刻和相應(yīng)頻率的能量。能量功率譜具體表示為

其中,

ω[n]是一個(gè)長(zhǎng)度為2N+1的窗函數(shù),X(n,ω)表示在時(shí)域以n點(diǎn)為中心的一幀信號(hào)的傅里葉變換在ω處的大小。

下面圖1給出了語(yǔ)音“開(kāi)始”的語(yǔ)譜圖。圖中橫軸表示時(shí)間,縱軸表示頻率,顏色的深淺表示(n,ω)處的能量大小,一般用能量的對(duì)數(shù)表示,即lg(Px(n,ω))。語(yǔ)譜圖根據(jù)帶通濾波器的帶寬分為寬帶語(yǔ)譜圖和窄帶語(yǔ)譜圖。通過(guò)語(yǔ)譜圖很容易看出語(yǔ)音信號(hào)關(guān)鍵頻率的分布情況和能量的分布情況。圖1(a)和(b)分別是“開(kāi)始”的寬帶語(yǔ)譜圖和窄帶語(yǔ)譜圖。

圖1 語(yǔ)音“開(kāi)始”的寬帶語(yǔ)譜圖和窄帶語(yǔ)譜圖Fig.1Speech“start”broadband spectrogram and narrowband spectrogram

由于寬帶語(yǔ)譜圖的頻率分辨率較高,時(shí)間分辨率較低,因而語(yǔ)譜圖呈現(xiàn)的是垂直的條紋;而窄帶語(yǔ)譜圖則相反,從而呈現(xiàn)的是橫向的條紋。從上圖中可以看出,條紋較明顯的分成兩個(gè)部分,其中第一部分是漢字“開(kāi)”的圖譜,第二部分是漢字“始”的圖譜。

3 語(yǔ)音采集及分析處理

3.1 語(yǔ)音信號(hào)采集

本文中所用的語(yǔ)音信號(hào)示例分為兩類:一是電視臺(tái)、廣播臺(tái)播音員的標(biāo)準(zhǔn)普通話語(yǔ)音錄音,二是現(xiàn)實(shí)生活中普通人的普通話錄音。這樣,語(yǔ)音示例既具有標(biāo)準(zhǔn)語(yǔ)音有具有普通語(yǔ)音,能夠比較全面的反映人類語(yǔ)音的大致情況,從而使下面得出的結(jié)論具有一定的代表性。

1)電視臺(tái)、廣播臺(tái)播音員的標(biāo)準(zhǔn)普通話語(yǔ)音錄音可以在網(wǎng)絡(luò)上下載,本文下載了播音員用普通話朗讀漢語(yǔ)拼音聲明、韻母的語(yǔ)音錄音,這樣就得到了較為標(biāo)準(zhǔn)的語(yǔ)音信號(hào)范本。

2)現(xiàn)實(shí)生活中的普通人用普通話朗讀漢語(yǔ)拼音聲明、韻母,然后通過(guò)電腦麥克風(fēng)進(jìn)行錄音,并保存為.wav的文件格式,音頻的位速為352 Kb/s,采樣大小為16位,級(jí)別為22 kHz,為單聲道錄音。而這就是普通人的語(yǔ)音信號(hào)范本。

上面的兩類語(yǔ)音信號(hào)范本作為后面的分析處理對(duì)象。其中,聲母共23個(gè),即:b、p、m、f、d、t、n、l、g、k、h、j、q、x、zh、ch、sh、r、z、c、s、y、w;韻母共24個(gè),即:a、o、e、i、u、v、ai、ei、ui、ao、ou、iu、ie、ve、er、an、en、in、un、vn、ang、eng、ing、ong。

3.2 語(yǔ)音信號(hào)分析處理

在前面介紹了時(shí)頻分布的特點(diǎn)和優(yōu)勢(shì),下面就利用時(shí)頻分布來(lái)處理上一小節(jié)中的語(yǔ)音信號(hào)范本。在此,本文采用了兩類方式進(jìn)行處理:一是使用語(yǔ)音處理軟件Adobe Audition 3.0來(lái)播放語(yǔ)音文件,得到其頻率-能量-時(shí)域圖(即語(yǔ)譜圖),從圖中觀察總結(jié)其頻率分布等重要信息;二是使用自己設(shè)計(jì)的MATLAB程序來(lái)播放語(yǔ)音文件,得到其語(yǔ)譜圖,從而觀察總結(jié)其頻率分布等重要信息。兩種方式相互驗(yàn)證比較,將使結(jié)論變得更全面、更具有說(shuō)服性。

3.2.1 Adobe Audition 3.0軟件處理語(yǔ)音文件

將用Adobe Audition3.0軟件分別播放前面的語(yǔ)音信號(hào)文件,得到其語(yǔ)譜圖,并從中觀察總結(jié)出其關(guān)鍵信息。但由于聲母、韻母較多,在此不一一列舉,分別以韻母a、聲母b為例。

1)韻母

下面圖2是韻母a的語(yǔ)譜圖,分別是標(biāo)準(zhǔn)普通話、普通男聲和普通女聲的圖譜。

圖2中,橫軸表示時(shí)間,單位是ms,縱軸表示頻率,單位是Hz。圖中的帶顏色區(qū)域表示語(yǔ)音信號(hào)在對(duì)應(yīng)時(shí)刻所攜帶的能量,顏色愈亮,表示能量愈大;反之,顏色愈暗,則表示此時(shí)刻能量愈小。圖中開(kāi)始和結(jié)束的地方顏色發(fā)暗發(fā)黑,表示語(yǔ)音信號(hào)未發(fā)音及已發(fā)音結(jié)束,不攜帶能量,所以顏色發(fā)暗發(fā)黑。由于韻母a的發(fā)音平緩且變化不大,所以圖中反映的能量也呈不變趨勢(shì),是一道較平滑的語(yǔ)音帶。從圖2(a)中可以看出,語(yǔ)音a的能量主要集中于0~4 000 Hz頻率范圍之間,在4 000~7 000 Hz的頻率范圍內(nèi)能量分布較少,而當(dāng)頻率高于7 000 Hz時(shí),幾乎沒(méi)有能量。而在0~4 000 Hz頻率范圍內(nèi),能量分布具有如下的特點(diǎn):幾乎語(yǔ)音一半的能量集中于0~1 600 Hz頻率范圍內(nèi),頻率在2 800 Hz及3 800 Hz處又具有較大的能量,其余地方能量相對(duì)較小。從圖2(b)中可以看出,語(yǔ)音a的能量主要分布在兩個(gè)頻率范圍內(nèi),其中第一個(gè)頻率范圍是0~1400Hz,第二個(gè)頻率范圍是3000~5000Hz,且從圖中顏色明亮度可以看出語(yǔ)音a的大約70%的能量集中于第一個(gè)頻率范圍內(nèi),即0~1 400 Hz之間。從圖2(c)中可以看出,語(yǔ)音a的能量主要分布在0~1 800 Hz頻率范圍內(nèi),其余頻率段內(nèi)能量可以忽略不計(jì)。因此,可以得出結(jié)論:韻母a的能量集中分布于0~4 000 Hz頻率范圍之間,而這也就是其關(guān)鍵頻率范圍,而這個(gè)結(jié)論將為其后續(xù)處理提高一定的理論依據(jù)。

2)聲母

下面圖3是聲母b的語(yǔ)譜圖,分別是標(biāo)準(zhǔn)普通話、普通男聲和普通女聲的圖譜。

圖3(a)中可以看出:語(yǔ)音b的能量主要分布在兩個(gè)頻率范圍內(nèi),大約70%的能量分布在0~1 200 Hz頻率范圍內(nèi),其余的能量分布在2 200~4 000 Hz之間。而圖3(b)的情況與圖(a)類似,語(yǔ)音b的能量大致分布在兩個(gè)頻率范圍內(nèi),其中大約80%的能量分布在0~1 200 Hz頻率范圍內(nèi),其余能量大致分布在2 800~4 000 Hz之間,另外在頻率5 000 Hz以上的地方也有一定的能量,可以忽略不計(jì)。從圖3(c)可以看出,語(yǔ)音能量絕大部分分布在0~1 200 Hz頻率段內(nèi),其余能量可以忽略不計(jì)。因此,可以得出結(jié)論:聲母b的能量大致分布在0~4 000 Hz頻率段內(nèi),但主要分布在0~1 200 Hz之間,這也是其關(guān)鍵頻率所在頻率段,是后續(xù)研究的重點(diǎn)區(qū)域。

圖2 韻母a的語(yǔ)譜圖Fig.2Vowels a spectrogram

圖3 聲母b的語(yǔ)譜圖Fig.3Initials b spectrogram

3.2.2 自制MATLAB程序來(lái)處理語(yǔ)音文件

本文應(yīng)用自制MATLAB軟件處理語(yǔ)音信號(hào),通過(guò)調(diào)用MATLAB程序來(lái)得到語(yǔ)音文件的三維立體語(yǔ)譜圖,從中分析總結(jié)出其攜帶的關(guān)鍵信息。與上一小節(jié)類似,分別以韻母a、聲母b為例。

1)韻母

下面圖4是韻母a的語(yǔ)譜圖,分別是標(biāo)準(zhǔn)普通話、普通男聲和普通女聲的圖譜。

上圖中的語(yǔ)音信號(hào)語(yǔ)譜圖是表示時(shí)頻聯(lián)合分布的三維圖,它的橫坐標(biāo)是時(shí)間,單位是ms,縱坐標(biāo)是頻率,單位是Hz,豎坐標(biāo)是幅度,表示語(yǔ)音的數(shù)據(jù)能量,單位是db(分貝)。能量值的大小是通過(guò)顏色深淺來(lái)表示的,顏色深,表示該點(diǎn)的語(yǔ)音能量越強(qiáng);反之,顏色淺,則表示語(yǔ)音能量越小。從圖4(a)中可以看出,語(yǔ)音a的能量主要集中于0~4 000 Hz頻率范圍之間,在4 000~9 000 Hz的頻率范圍內(nèi)能量分布較少,而當(dāng)頻率高于9 000 Hz時(shí),幾乎沒(méi)有能量。而在0~4 000 Hz頻率范圍內(nèi),能量分布具有如下的特點(diǎn):幾乎語(yǔ)音70%的能量集中于600~1 600 Hz頻率范圍內(nèi),頻率在3 500 Hz及4 000 Hz處又具有大約20%的能量,其余地方能量相對(duì)較小。從圖4(b)中可以看出,語(yǔ)音a的能量主要分布在兩個(gè)頻率范圍內(nèi),其中第一個(gè)頻率范圍是0~2 000 Hz,第二個(gè)頻率范圍是2 500~4 500 Hz,且從圖中顏色明亮度可以看出語(yǔ)音a的大約80%的能量集中于第一個(gè)頻率范圍內(nèi),即0~2 000 Hz之間。從圖4(c)中可以看出,語(yǔ)音a的能量主要分布在0~2 000 Hz頻率范圍內(nèi),其余頻率段內(nèi)能量可以忽略不計(jì)。因此,可以得出結(jié)論:韻母a的能量集中分布于0~4 500 Hz頻率范圍之間,而這也就是其關(guān)鍵頻率范圍,而這個(gè)結(jié)論將為其后續(xù)處理提高一定的理論依據(jù)。

2)聲母

下面圖5是聲母b的語(yǔ)譜圖,分別是標(biāo)準(zhǔn)普通話、普通男聲和普通女聲的圖譜。

在圖5(a)中可以看出:語(yǔ)音b的能量主要分布在兩個(gè)頻

圖4韻母a的語(yǔ)譜圖

圖5 聲母b的語(yǔ)譜圖Fig.5Initials b spectrogram

Fig.4Vowels a spectrogram率范圍內(nèi),大約90%的能量分布在0~1 600 Hz頻率范圍內(nèi),其余的能量分布在2 000~4 000 Hz之間。從圖5(b)可以看出,語(yǔ)音b的能量大致分布在兩個(gè)頻率范圍內(nèi),其中大約70%的能量分布在0~1 700 Hz頻率范圍內(nèi),其余能量大致分布在3 000~4 200 Hz之間。從圖5(c)可以看出,語(yǔ)音能量絕大部分分布在0~1 700 Hz頻率段內(nèi),其余能量可以忽略不計(jì)。因此,可以得出結(jié)論:語(yǔ)音b的能量大致分布在0~4 200 Hz頻率段內(nèi),但主要分布在0~1 700 Hz之間,這也是其關(guān)鍵頻率所在頻率段,是后續(xù)研究的重點(diǎn)區(qū)域。

3.3 漢語(yǔ)語(yǔ)音關(guān)鍵頻率分布

按照上面3.2小節(jié)中的方法,將兩種方法結(jié)合起來(lái),可以得出所有聲母和韻母的頻率大致分布情況,而漢語(yǔ)語(yǔ)音是有聲母和韻母拼合而成的,了解了聲母和韻母的頻率大致分布情況,那必然經(jīng)能夠大體確定漢語(yǔ)語(yǔ)音的頻率分布情況,從而為后面的辨析語(yǔ)音提高一定的理論基礎(chǔ)。

經(jīng)過(guò)比較分析得出如下結(jié)論:在所有聲母和韻母中,絕大部分的頻率分布范圍是0~5 000 Hz,在這個(gè)頻率范圍內(nèi),0~1 200 Hz是一個(gè)關(guān)鍵頻率分布范圍段,即在此頻率段內(nèi)語(yǔ)音能量較多,接下來(lái)2 000~4 000 Hz又是一較為關(guān)鍵的頻率段,也具有一定的語(yǔ)音能量,其余頻率段內(nèi)語(yǔ)音能量較小,幾乎可以忽略不計(jì)。由于漢語(yǔ)語(yǔ)音中用一個(gè)漢字來(lái)代表一個(gè)音節(jié),一般來(lái)說(shuō),一個(gè)音節(jié)由聲母、韻母和聲調(diào)3部分組成,因此,確定了聲母和韻母的頻率分布情況,那么也就大體確定了漢語(yǔ)語(yǔ)音的頻率分布情況。所有上面的結(jié)論也適用于絕大部分的漢語(yǔ)語(yǔ)音,這個(gè)結(jié)論為后面的辨析語(yǔ)音提供了很好的理論基礎(chǔ)。

在有關(guān)電子耳蝸的研究中,有的研究所選用濾波器的通帶帶寬在300~6 250 Hz之間[5],說(shuō)明通過(guò)電子耳蝸的語(yǔ)音信號(hào)的關(guān)鍵頻率大致分布在300 Hz到6 250 Hz這個(gè)頻率范圍內(nèi)。而這也間接說(shuō)明了上面的結(jié)論具有一定的準(zhǔn)確性,是可行的,可以作為后續(xù)研究的理論依據(jù)。

4 結(jié)束語(yǔ)

本文首先介紹了有關(guān)漢語(yǔ)拼音[6]的知識(shí);然后介紹了時(shí)頻分布的特點(diǎn)和優(yōu)勢(shì);最后通過(guò)時(shí)頻分布,用兩種方法分析總結(jié)了聲母和韻母的頻率分布情況及關(guān)鍵頻率分布特點(diǎn),從而確定漢語(yǔ)語(yǔ)音的關(guān)鍵頻率分布情況,以為語(yǔ)音識(shí)別的研究提供一定的理論基礎(chǔ)。

當(dāng)然,本文還要一定的不足:聲母和韻母的頻率分布情況能否更加細(xì)化、更加準(zhǔn)確?這是以后工作中亟待解決的問(wèn)題,需要進(jìn)一步去研究。

[1]韓紀(jì)慶,張磊,鄭鐵然.語(yǔ)音信號(hào)處理[M].北京:清華大學(xué)出版社,2004.

[2]付妮妮.漢語(yǔ)拼音字母詞研究[D].遼寧:遼寧師范大學(xué),

2007.

[3]鄭普亮,許剛.時(shí)頻分布不同特性進(jìn)行語(yǔ)音分類[J].計(jì)算機(jī)工程與應(yīng)用,2005(22):48-50.ZHENG Pu-liang,XU Gang.Classification of speech using the different properties of the time-frequency distributions[J].Computer Engineering and Applications,2005(22):48-50.

[4]馬義德,袁敏,齊春亮,等.基于PCNN的語(yǔ)譜圖特征提取在說(shuō)話人識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2005(20):81-84.MA Yi-de,YUAN Min,QI Chun-liang,et al.Research of feature extraction from spectrogram based on pulse coupled neuralnetworkinspeakerrecognition[J].Computer Engineering and Applications,2005(20):81-84.

[5]孟麗,肖靈,李平,等.定點(diǎn)DSP實(shí)現(xiàn)電子耳蝸CIS策略研究[J].中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào),2009,28(3):386-392.MENGLi,XIAOLing,LIPing,etal.Researchonimplementation of CIS strategy for cochlear implants on fixed-point DSP[J].Chinese Journal of Biomedical Engineering,2009,28(3):386-392.

[6]吳葵.漢語(yǔ)拼音在對(duì)內(nèi)漢語(yǔ)教學(xué)中的應(yīng)用研究[D].湖南:湖南師范大學(xué),2007.

猜你喜歡
語(yǔ)譜韻母時(shí)頻
聲母韻母
HR-DCGAN方法的帕金森聲紋樣本擴(kuò)充及識(shí)別研究
單韻母扛聲調(diào)
基于時(shí)頻域特征的場(chǎng)景音頻研究
語(yǔ)譜圖二次傅里葉變換特定人二字漢語(yǔ)詞匯識(shí)別
面向語(yǔ)音情感識(shí)別的語(yǔ)譜圖特征提取算法
基于時(shí)頻分析的逆合成孔徑雷達(dá)成像技術(shù)
對(duì)采樣數(shù)據(jù)序列進(jìn)行時(shí)頻分解法的改進(jìn)
雙線性時(shí)頻分布交叉項(xiàng)提取及損傷識(shí)別應(yīng)用
淺析《守望燈塔》中的時(shí)頻
三门峡市| 江城| 来安县| 株洲市| 磴口县| 沁阳市| 朝阳区| 蒲江县| 保德县| 古田县| 新蔡县| 湘阴县| 宜川县| 屯门区| 华阴市| 渭南市| 大理市| 沐川县| 济源市| 南昌市| 红桥区| 额敏县| 盐亭县| 商丘市| 黄山市| 崇礼县| 炎陵县| 西乌珠穆沁旗| 湖北省| 岚皋县| 临西县| 利川市| 唐海县| 富裕县| 阿坝县| 尼木县| 博野县| 富蕴县| 昂仁县| 文登市| 柏乡县|