摘 要:在社會(huì)信息化、網(wǎng)絡(luò)化、智能化的發(fā)展趨勢(shì)下,人們對(duì)信息獲取與信息溝通方式提出了越來(lái)越高的要求。語(yǔ)音識(shí)別技術(shù)以語(yǔ)音為研究對(duì)象,在實(shí)際生活中有著巨大作用。
關(guān)鍵詞:語(yǔ)音識(shí)別;應(yīng)用;局限性
在法制紀(jì)錄片《誰(shuí)喊不許動(dòng)》中,警方所掌握的全部信息只有受害人記憶中兇手喊出的一聲“不許動(dòng)”,如何根據(jù)這一語(yǔ)音線索找出兇手成了破案的關(guān)鍵。語(yǔ)音是人類發(fā)音器官發(fā)出的具有區(qū)別意義功能的聲音,和指紋一樣,幾乎沒(méi)有兩個(gè)人的語(yǔ)音是完全一樣的。不同的說(shuō)話人由于性別、年齡等因素的不同,相同內(nèi)容的發(fā)音存在很大差異;同時(shí)由于情緒和環(huán)境的影響,發(fā)音也發(fā)生改變。語(yǔ)音包含了人的一些基本信息,如口音,聲調(diào)等,可以揭露人的物理信息乃至籍貫。通過(guò)對(duì)罪案中留下的聲音的分析鑒定,警方就能快速鎖定犯罪嫌疑人——這些過(guò)去只在偵探小說(shuō)或者美國(guó)大片中出現(xiàn)的情節(jié),已經(jīng)成為現(xiàn)實(shí)。公安機(jī)關(guān)通過(guò)提取不同口音的說(shuō)話人的語(yǔ)音特征作為偵查工作的重要也是唯一突破口, 通過(guò)語(yǔ)音識(shí)別和說(shuō)話內(nèi)容分析技術(shù), 最終判斷了嫌疑人的身份, 這一案件充中分給人們展示了語(yǔ)音識(shí)別在破案中的應(yīng)用。
語(yǔ)音識(shí)別是一門交叉學(xué)科,與機(jī)器進(jìn)行語(yǔ)音交流, 讓機(jī)器明白你說(shuō)什么, 這是人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。語(yǔ)音識(shí)別是以語(yǔ)音為研究對(duì)象,讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別是一門涉及面很廣的交叉學(xué)科,它與聲學(xué)、語(yǔ)音學(xué)、語(yǔ)言學(xué)、信息理論、模式識(shí)別理論以及神經(jīng)生物學(xué)等學(xué)科都有非常密切的關(guān)系。語(yǔ)音識(shí)別技術(shù)正逐步成為計(jì)算機(jī)信息處理技術(shù)中的關(guān)鍵技術(shù),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。
一、語(yǔ)音識(shí)別技術(shù)的應(yīng)用
(一)語(yǔ)音識(shí)別技術(shù)在軍事領(lǐng)域內(nèi)的應(yīng)用
隨著軍隊(duì)現(xiàn)代化建設(shè)水平的提高和新戰(zhàn)爭(zhēng)形態(tài)的出現(xiàn), 最近10年內(nèi)語(yǔ)音識(shí)別技術(shù)軍事化應(yīng)用非常廣泛。目前研究比較多的有語(yǔ)音識(shí)別技術(shù)在智能武裝備開發(fā)領(lǐng)域的應(yīng)用、在軍事作戰(zhàn)文書自動(dòng)化過(guò)程中的應(yīng)用、在軍事測(cè)試設(shè)備的應(yīng)用和軍隊(duì)智能話務(wù)臺(tái)的應(yīng)用等。
(二)語(yǔ)音識(shí)別技術(shù)在案件偵破中的應(yīng)用
語(yǔ)音識(shí)別在公安系統(tǒng)中的應(yīng)用主要體現(xiàn)在偵查工作、抓捕工作和取證工作中。某些案件中, 在受案和偵查的初始階段, 公安機(jī)關(guān)所能掌握的線索可能只有一段錄音, 而提取嫌疑人的語(yǔ)音特征, 通過(guò)語(yǔ)音識(shí)別和說(shuō)話內(nèi)容分析, 對(duì)說(shuō)話人身份進(jìn)行判斷, 是偵查工作的重要突破口。特別是針對(duì)敲詐勒索、威脅恐嚇、綁架詐騙、傳播謠言、行賄索賄、泄露國(guó)家或商業(yè)秘密等涉及聲音證據(jù)的刑事案件偵辦,有著十分明確而重要的實(shí)戰(zhàn)價(jià)值,應(yīng)用前景十分廣闊。語(yǔ)音識(shí)別和語(yǔ)音資料的司法鑒定, 在綁架案、敲詐案、貪污受賄案、財(cái)產(chǎn)糾紛案和惡意擾亂社會(huì)秩序的案件中也是重要的取證手段。(朱淑鑫&謝忠紅,2009)
(三)語(yǔ)音識(shí)別技術(shù)在公共事業(yè)領(lǐng)域內(nèi)的應(yīng)用
語(yǔ)音識(shí)別技術(shù)在公共事業(yè)領(lǐng)域內(nèi)的應(yīng)用具有重要意義, 其應(yīng)用范圍也在進(jìn)一步擴(kuò)展。如在智能話務(wù)中的應(yīng)用、在數(shù)字圖書館檢索系統(tǒng)中的應(yīng)用、在醫(yī)療系統(tǒng)中的應(yīng)用和在人工郵件分揀過(guò)程中的應(yīng)用等。包括由語(yǔ)音控制和操作的游戲和玩具、幫助殘疾人的語(yǔ)音識(shí)別系統(tǒng)、車輛行駛中一些非關(guān)鍵功能的語(yǔ)音控制,如車載交通路況控制系統(tǒng)、音響系統(tǒng)。錄音作為視聽(tīng)資料的一種, 是《民事訴訟法》規(guī)定的7種法定證據(jù)形式之一。
(四)語(yǔ)音識(shí)別技術(shù)在娛樂(lè)領(lǐng)域的應(yīng)用
就娛樂(lè)領(lǐng)域來(lái)講, 也可以激發(fā)出許多的新應(yīng)用。隨著科技的迅速發(fā)展,QQ等聊天軟件給人們帶來(lái)了極大的方便,也拉進(jìn)了人與人之間的距離。但俗話說(shuō),君子動(dòng)口不動(dòng)手,人們隨之對(duì)其提出了更高的要求,能不能動(dòng)動(dòng)嘴將信息發(fā)出去,取代打字呢。如今,QQ,微信,人人等聊天軟件均推出了語(yǔ)音發(fā)送功能,網(wǎng)友們也極力呼吁聊天工具推出語(yǔ)音識(shí)別技術(shù)。百度也推出了語(yǔ)音搜索功能du掌柜,對(duì)著手機(jī)說(shuō)出你想查詢的事物,在頻幕上會(huì)出現(xiàn)相應(yīng)的文字搜索。在KTV進(jìn)行電視點(diǎn)播時(shí), 可以直接說(shuō)出哪個(gè)歌手的哪首歌, 電視臺(tái)就接受語(yǔ)音輸入而顯示相應(yīng)的曲目。
然而,語(yǔ)音識(shí)別技術(shù)并不是完美無(wú)缺的,作為人類設(shè)定出來(lái)的機(jī)器,它也有其自身的局限性和問(wèn)題。首先,語(yǔ)音識(shí)別技術(shù)是以普通話為對(duì)照的,而方言和口音會(huì)降低語(yǔ)音識(shí)別率。二是背景噪音。人多的公共場(chǎng)所的巨大噪音對(duì)語(yǔ)音識(shí)別的影響自不用說(shuō),就算在實(shí)驗(yàn)室環(huán)境下,敲擊鍵盤,挪動(dòng)麥克風(fēng)都會(huì)成為背景噪音。語(yǔ)音識(shí)別技術(shù)要進(jìn)一步發(fā)展就要研究如何讓把原始語(yǔ)音從背景噪音中分離出來(lái),這會(huì)使識(shí)別系統(tǒng)有很強(qiáng)的適應(yīng)性。第三就是口語(yǔ)的問(wèn)題。它既涉及到自然語(yǔ)言理解,又與聲學(xué)有關(guān)。
語(yǔ)音識(shí)別技術(shù)是非常重要的人機(jī)交互技術(shù), 應(yīng)用語(yǔ)音的自動(dòng)理解和翻譯, 可消除人類相互交往的語(yǔ)言障礙, 事實(shí)證明大量的語(yǔ)音識(shí)別產(chǎn)品已經(jīng)進(jìn)入市場(chǎng)和服務(wù)領(lǐng)域。人們已經(jīng)習(xí)慣通過(guò)電話網(wǎng)絡(luò)用語(yǔ)音識(shí)別口語(yǔ)對(duì)話系統(tǒng)查詢有關(guān)的機(jī)票、旅游、銀行信息, 語(yǔ)音識(shí)別技術(shù)和電子商務(wù)的結(jié)合使我們可以足不出戶就能夠“逛”商場(chǎng), 購(gòu)買到我們所需要的東西。人們有理由相信,在不久的未來(lái),語(yǔ)音識(shí)別技術(shù)將會(huì)以其自身的優(yōu)勢(shì)改變?nèi)藗兊纳睢?/p>
參考文獻(xiàn):
[1] 董國(guó)超, 寇凈磊.語(yǔ)音識(shí)別技術(shù)及應(yīng)用綜述[J]. 內(nèi)蒙古科技與經(jīng)濟(jì),2009.
[2] 朱淑鑫,謝忠紅.淺談?wù)Z音識(shí)別技術(shù)的應(yīng)用及發(fā)展[J]. 長(zhǎng)春理工大學(xué)學(xué)報(bào),2009, (2).
[3] 任天平,門茂琛.語(yǔ)音識(shí)別技術(shù)應(yīng)用的進(jìn)展[J].河南科技學(xué)報(bào),2005, (2).
[4] 何浩義. 計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)及其應(yīng)用[J].大眾科技,2005,(6)
[5] 任天平.語(yǔ)音識(shí)別技術(shù)應(yīng)用的進(jìn)展[J].河南科技,2005(2).
[6] 俞鐵城.語(yǔ)音識(shí)別的發(fā)展現(xiàn)狀[J].通訊世界,2005(2).
[7] 劉加,劉潤(rùn)生.語(yǔ)音識(shí)別技術(shù)及應(yīng)用[J].世界電子元器材,2001(11).
[8] 陳方,高升.語(yǔ)音識(shí)別技術(shù)及發(fā)展[J].電信科學(xué), 1996,(12) .
作者簡(jiǎn)介:李晶玉(1990-),女,山東煙臺(tái)人,聊城大學(xué)外國(guó)語(yǔ)學(xué)院2012級(jí)英語(yǔ)語(yǔ)言文學(xué)專業(yè)研究生,研究方向?yàn)榉g理論與實(shí)踐。