摘要:面對(duì)多人對(duì)話(huà)語(yǔ)音單一特征表征性別組合信息不足,導(dǎo)致語(yǔ)音識(shí)剮結(jié)果不精準(zhǔn)的問(wèn)題,提出了基于支持向量機(jī)的復(fù)雜場(chǎng)景中多人對(duì)話(huà)語(yǔ)音智能識(shí)別方法。使用距離度量方法,檢測(cè)復(fù)雜場(chǎng)景多人對(duì)話(huà)變化點(diǎn)。計(jì)算任意兩個(gè)數(shù)據(jù)集的對(duì)數(shù)似然概率值,構(gòu)建得分集。結(jié)臺(tái)T-Test相似性度量方法,判斷兩個(gè)數(shù)據(jù)集顯著差異性。構(gòu)造支持向量機(jī)判別函數(shù),利用支持向量機(jī)的映射邏輯實(shí)現(xiàn)相似話(huà)音的分離。使用支持向量機(jī)的二元分類(lèi)超線(xiàn)性分類(lèi)器構(gòu)建最優(yōu)判別函數(shù),結(jié)合男性、女性基音頻率、信號(hào)非諧振頻率特征,實(shí)現(xiàn)多人對(duì)話(huà)語(yǔ)音智能識(shí)別。由實(shí)驗(yàn)結(jié)果可知,所研究方法對(duì)于基音頻率識(shí)別結(jié)果,男性、士性幅度波動(dòng)范圍分別為-0.5~0.5、-0.7~0.7,與實(shí)驗(yàn)數(shù)據(jù)一致;對(duì)于信號(hào)非諧振頻率識(shí)別結(jié)果,男性、士性頻率波動(dòng)范圍分別為-600~600 Hz、-360~405 Hz,男性頻率波動(dòng)范圍與實(shí)驗(yàn)數(shù)據(jù)僅存在50 Hz的誤差,女性頻率波動(dòng)范圍與實(shí)驗(yàn)數(shù)據(jù)一致。
關(guān)鍵詞:支持向量機(jī);復(fù)雜場(chǎng)景;多人對(duì)話(huà);語(yǔ)音智能識(shí)別
中圖分類(lèi)號(hào):TP274 文獻(xiàn)標(biāo)識(shí)碼:A
計(jì)算技術(shù)與自動(dòng)化2024年4期