国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

支持向量機(jī)在語(yǔ)音識(shí)別中的應(yīng)用

2015-03-02 12:05高家寶
軟件導(dǎo)刊 2015年1期
關(guān)鍵詞:語(yǔ)音識(shí)別支持向量機(jī)機(jī)器學(xué)習(xí)

摘要:支持向量機(jī)采用數(shù)學(xué)方法和優(yōu)化技術(shù),將向量映射到一個(gè)更高維的空間里,建立一個(gè)有最大間隔的超平面,其在語(yǔ)音識(shí)別技術(shù)中應(yīng)用廣泛。

闡述語(yǔ)音識(shí)別技術(shù)及支持向量機(jī)的原理,介紹支持向量機(jī)在語(yǔ)音識(shí)別中的應(yīng)用。

關(guān)鍵詞:語(yǔ)音識(shí)別;支持向量機(jī);機(jī)器學(xué)習(xí)

DOIDOI:10.11907/rjdk.143728

中圖分類號(hào):TP301

文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào)文章編號(hào):16727800(2015)001003902

基金項(xiàng)目基金項(xiàng)目:廣西教育廳科研基金(201010LX454)

作者簡(jiǎn)介作者簡(jiǎn)介:高家寶(1976-),男,廣西平南人,桂林電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院碩士研究生,河池學(xué)院現(xiàn)代教育技術(shù)中心工程師,研究方向?yàn)橛?jì)算機(jī)應(yīng)用。

0 引言

語(yǔ)音識(shí)別起源于上世紀(jì)50年代,它首次實(shí)現(xiàn)了10個(gè)英文數(shù)字的語(yǔ)音識(shí)別,開(kāi)始了語(yǔ)音識(shí)別研究工作的序幕。語(yǔ)音識(shí)別技術(shù)就是讓計(jì)算機(jī)通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的現(xiàn)代信息技術(shù),其關(guān)鍵技術(shù)是語(yǔ)音識(shí)別單元的選取和特征參數(shù)的提取。近20年來(lái),語(yǔ)音識(shí)別技術(shù)研究工作取得了顯著進(jìn)展,開(kāi)始從實(shí)驗(yàn)室研究逐步走向市場(chǎng)應(yīng)用。人們預(yù)測(cè),在不久的將來(lái),語(yǔ)音識(shí)別技術(shù)會(huì)溶入到工業(yè)、軍事、通信、醫(yī)療、汽車內(nèi)環(huán)境噪音抑制、測(cè)謊、家庭服務(wù)等各個(gè)領(lǐng)域,并對(duì)各領(lǐng)域的發(fā)展起到強(qiáng)有力的推動(dòng)作用。漢字語(yǔ)音錄入就是語(yǔ)音識(shí)別技術(shù)在實(shí)際生活中的一個(gè)具體應(yīng)用例子。IT界很多專家學(xué)者都認(rèn)為語(yǔ)音識(shí)別技術(shù)是2000年以來(lái)信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。

語(yǔ)音識(shí)別是一門交叉學(xué)科,也是模式識(shí)別的一個(gè)非常重要分支,它與生理學(xué)、心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)以及信號(hào)處理等都有密切的聯(lián)系,其最終目的就是要實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語(yǔ)言通信,用語(yǔ)言代替手指來(lái)操縱計(jì)算機(jī)。

支持向量機(jī)(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它采用數(shù)學(xué)方法和優(yōu)化技術(shù),將向量映射到一個(gè)更高維的空間里,并在這個(gè)空間里建立一個(gè)有最大間隔的超平面,便于解決數(shù)據(jù)挖掘中的問(wèn)題,在某種程度上攻克了“維數(shù)災(zāi)難”和“過(guò)學(xué)習(xí)”等困難,并在語(yǔ)音識(shí)別、生物信息等領(lǐng)域應(yīng)用。近年來(lái),把支持向量機(jī)應(yīng)用到語(yǔ)音識(shí)別技術(shù)中研究越來(lái)越多,取得了很大的成就[13]。

1 支持向量機(jī)原理

1.1 線性支持向量機(jī)

考慮訓(xùn)練集Τ={(x1,y1),…,(xl,yl)}∈(Rn×Y)l,其中xi∈Rn,yi∈Y={1,-1},i=1,…,l.若存在ω∈Rn,b∈R和正數(shù)ε,使得對(duì)所有使yi=1的下標(biāo)i,有(ω·xi)+b≥ε,而對(duì)所有使yi=-1的下標(biāo)i,有(ω·xi)+b≥-ε,則稱訓(xùn)練集T線性可分,也稱相應(yīng)的分類問(wèn)題是線性可分的。對(duì)線性可分問(wèn)題,可轉(zhuǎn)化為求解變量ω和b凸的二次規(guī)劃問(wèn)題。

minω,b12ω2s.t. yi((ω·xi)+b)≥1,i=1,…,l.(1)

對(duì)一般分類問(wèn)題(包括線性不可分問(wèn)題),可引入松弛變量ξi≥0,i=1,…,l。把問(wèn)題(1)改為原始優(yōu)化問(wèn)題

minω,b,ξ12ω2+C∑li=1ξis.t. yi((ω·xi)+b)≥1-ξi,i=1,…,l,(2)ξi≥0,i=1,…,l,

其中ξ=(ξ1,…,ξl)T,C>0是一個(gè)懲罰參數(shù)。

1.2 非線性支持向量機(jī)

把“線性分劃”推廣到“非線性分劃”,只需引進(jìn)一個(gè)適當(dāng)?shù)淖儞QΦ。引進(jìn)從空間Rn到Hilbert空間Η的變換x=Φ(x)。

Φ:Rn→Ηx→x=Φ(x).(3)

訓(xùn)練集T經(jīng)變換(3)后變?yōu)?/p>

ΤΦ={(xi,yi),i=1,…,l}∈(Η×Y)l,(4)

其中xi=Φ(xi)∈Η,yi∈Y={-1,1},i=1,…,l。此時(shí),非線性分劃解的優(yōu)化問(wèn)題為:

minω,b,ξ12ω2+C∑li=1ξi

s.t. yi((ω·Φ(xi))+b)≥1-ξi,i=1,…,l(5)ξi≥0,i=1,…,l.

1.3 常用核函數(shù)

1.3.1 最基本的核函數(shù)

(1)定義在Rn×Rn上的函數(shù)Κ(x,x′)=(x·x′)是核函數(shù)。(2)若f(x)是定義在Rn上的實(shí)值函數(shù),則Κ(x,x′)=f(x)f(x′)是核函數(shù)。

1.3.2 多項(xiàng)式核函數(shù) d為正整數(shù),則d階齊次多項(xiàng)式函數(shù)Κ(x,x′)=(x·x′)d及d階非齊次多項(xiàng)式函數(shù)Κ(x,x′)=((x·x′)+1)d都是核函數(shù)。

1.3.3 Gauss徑向基核函數(shù) 以σ為參數(shù)的Gauss徑向基函數(shù)Κ(x,x′)=exp(-x-x′2σ2)是核函數(shù)。

2 支持向量機(jī)在語(yǔ)音識(shí)別中的應(yīng)用

使用支持向量機(jī)進(jìn)行語(yǔ)音識(shí)別步驟:

①輸入語(yǔ)音數(shù)據(jù);

②選擇核函數(shù)類型(包括選擇核函數(shù)類型、多項(xiàng)式核函數(shù)、RBF 核函數(shù)及其它核函數(shù));

③選擇模型參數(shù);

④解決二次優(yōu)化問(wèn)題;

⑤支持向量集;

⑥分類器。

支持向量機(jī)學(xué)習(xí)性能的好壞關(guān)鍵在于核函數(shù)及其參數(shù)選擇。用戶在利用支持向量機(jī)進(jìn)行求解分類問(wèn)題時(shí),首先需要選擇一個(gè)核函數(shù)類型,然后確定核函數(shù)的參數(shù)和懲罰因子。核函數(shù)對(duì)應(yīng)于非線性映射函數(shù)及其特征空間,確定了核函數(shù)就等于確定了非線性映射和特征空間。由此可見(jiàn),要想支持向量機(jī)有突出的推廣效果,首先必須選取適當(dāng)?shù)暮撕瘮?shù)并將數(shù)據(jù)映射到正確的特征空間。如果核函數(shù)不同,那么數(shù)據(jù)映射到特征空間也相應(yīng)不一樣。用戶在確定了核函數(shù)的類型后,接下來(lái)要做的就是選擇相應(yīng)的參數(shù),其參數(shù)值直接決定著支持向量機(jī)的分類精度和學(xué)習(xí)性能。

綜上所述,核函數(shù)類型、核參數(shù)和懲罰因子的選擇在不同程度上影響著支持向量機(jī)的性能。但是,支持向量機(jī)的核函數(shù)及參數(shù)選擇直到現(xiàn)在還沒(méi)有形成統(tǒng)一的模式,也沒(méi)有找出指導(dǎo)支持向量機(jī)核函數(shù)及參數(shù)選擇的好辦法,用戶對(duì)參數(shù)選擇只能根據(jù)以往經(jīng)驗(yàn)和頻繁進(jìn)行對(duì)比實(shí)驗(yàn),存在著很大的局限性。

語(yǔ)音信號(hào)中含有豐富的信息,特征提取是從語(yǔ)音信號(hào)中提取出有效信息,它是語(yǔ)音識(shí)別的關(guān)鍵。機(jī)器對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理,去掉與語(yǔ)音識(shí)別無(wú)關(guān)的冗余信息, 提取能夠有效表征說(shuō)話人特征的參數(shù)。對(duì)于非特定人語(yǔ)音識(shí)別來(lái)說(shuō),應(yīng)盡可能地使特征參數(shù)更多地反映語(yǔ)義信息,盡可能降低說(shuō)話人的個(gè)人信息;對(duì)于特定人語(yǔ)音識(shí)別來(lái)說(shuō),則恰好相反。在實(shí)際應(yīng)用中,通常直接把語(yǔ)音數(shù)據(jù)文件作為處理對(duì)象,人為地添加高斯白噪聲。語(yǔ)音特征可采用 MFCC特征、LPC特征、LPCC特征或ZCPA特征。說(shuō)話人在發(fā)同一個(gè)音時(shí),其持續(xù)時(shí)間長(zhǎng)度和各音素的相對(duì)時(shí)長(zhǎng)都是隨機(jī)變化的,為了便于處理,將提取的特征參數(shù)通過(guò)動(dòng)態(tài)時(shí)間歸整算法進(jìn)行時(shí)間歸一化處理,然后作為支持向量機(jī)的輸入?yún)?shù)。在支持向量機(jī)語(yǔ)音識(shí)別系統(tǒng)中,可以通過(guò)采用不同的核函數(shù)對(duì)語(yǔ)音信息進(jìn)行訓(xùn)練和識(shí)別,以取得最好的識(shí)別結(jié)果。

3 結(jié)語(yǔ)

支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,其應(yīng)用范圍廣泛,如:語(yǔ)音識(shí)別、數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡(luò)等,有相對(duì)完善的理論基礎(chǔ)。雖然支持向量機(jī)在理論上有明顯優(yōu)勢(shì),但支持向量機(jī)起步較晚,應(yīng)用研究相對(duì)滯后,科研成果不夠突出,目前,大多數(shù)是做仿真和對(duì)比實(shí)驗(yàn)。支持向量機(jī)的應(yīng)用研究是一個(gè)很有潛力的研究方向。

猜你喜歡
語(yǔ)音識(shí)別支持向量機(jī)機(jī)器學(xué)習(xí)
通話中的語(yǔ)音識(shí)別技術(shù)
前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
南华县| 长沙县| 社旗县| 南靖县| 武夷山市| 崇州市| 徐水县| 额尔古纳市| 浦东新区| 平果县| 报价| 大丰市| 祁门县| 石棉县| 西乡县| 万州区| 获嘉县| 利津县| 东宁县| 永嘉县| 荃湾区| 德昌县| 乌鲁木齐县| 雅江县| 静乐县| 安顺市| 顺平县| 涟水县| 左贡县| 兴和县| 都匀市| 航空| 枝江市| 清原| 蒙阴县| 出国| 松阳县| 巴彦淖尔市| 本溪市| 海淀区| 高邑县|