国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語音識別技術(shù)的維蒙藏語音產(chǎn)品開發(fā)及應(yīng)用

2020-06-04 09:39馬仕瑛
計算機(jī)時代 2020年5期
關(guān)鍵詞:語音識別

馬仕瑛

摘? 要: 為使更多人了解使用少數(shù)民族語音產(chǎn)品,有效解決我國少數(shù)民族地區(qū)與其他區(qū)域之間的語言障礙問題,促進(jìn)民族間的相互交流。通過搜集資料,以國內(nèi)基于語音識別技術(shù)的維吾爾語、蒙古語、藏語的語音產(chǎn)品為研究對象,梳理其開發(fā)和應(yīng)用情況,發(fā)現(xiàn)目前開發(fā)的相關(guān)產(chǎn)品主要集中于語音輸入法、語音翻譯軟件和轉(zhuǎn)錄產(chǎn)品三方面,在此基礎(chǔ)上,對產(chǎn)品使用產(chǎn)生的影響進(jìn)行分析,并對相關(guān)語音產(chǎn)品的發(fā)展前景進(jìn)行展望。

關(guān)鍵詞: 語音識別; 少數(shù)民族語音產(chǎn)品; 語音輸入法; 語音翻譯軟件; 轉(zhuǎn)錄產(chǎn)品

Abstract: In order to make more people understand and use minority speech products, effectively solve the problem of language barrier between minority areas and other regions in China, and promote the mutual communication between ethnic groups, taking the domestic speech recognition technology based Uygur, Mongolian and Tibetan speech products as the research object, through the collection of data, combing their development and application, finds out that the current development products mainly focus on three aspects: speech input method, speech translation software and transcription. According to the research, the impact of the use of products is analyzed, and the development of related speech products is prospected.

0 引言

基于智能語音及語言的人機(jī)交互技術(shù)涵蓋了寬廣的研究領(lǐng)域。其中語音識別、語音合成和自然語言理解在智能語音及語言交互技術(shù)中處于最為關(guān)鍵的核心位置。語音識別所要解決的問題就是讓計算機(jī)能“聽懂”人類的語音,并在各種情況下準(zhǔn)確地將語音中所包含的文字“信息”提取出來,該技術(shù)在“能聽會說”的計算機(jī)系統(tǒng)中扮演著重要角色。這等于給計算機(jī)系統(tǒng)賦予了聽覺能力,不僅使其“能聽”,還能“聽懂”,進(jìn)而實現(xiàn)信息時代利用“語音”這一最自然、最便捷的途徑進(jìn)行人機(jī)交互[1]。

我國是一個多民族國家,很多少數(shù)民族地區(qū)的居民仍不會說國家通用語和漢語方言,這使其無法在除本村鎮(zhèn)以外的場合進(jìn)行有效地交流及溝通,嚴(yán)重制約其辦事效率。

開發(fā)研制基于語音識別技術(shù)的少數(shù)民族語音產(chǎn)品,目的是幫助這些不懂漢語的少數(shù)民族在不熟悉的環(huán)境里有效交流,從而解決這些民族地區(qū)的語言障礙問題,在此基礎(chǔ)上,推動民族地區(qū)經(jīng)濟(jì)、文化等領(lǐng)域的發(fā)展,促進(jìn)各民族團(tuán)結(jié)、融合。由于維吾爾語、蒙古語和藏語等為重要的中國少數(shù)民族語種,發(fā)展歷史相對較長,與其他民族相比,其語音識別技術(shù)研究較豐富,所以開發(fā)語言產(chǎn)品是有基礎(chǔ)的。

本文梳理和歸納了基于語音識別技術(shù)的維吾爾語、蒙古語、藏語的語音產(chǎn)品開發(fā)和應(yīng)用情況,在此基礎(chǔ)上分析這些語音產(chǎn)品開發(fā)及其使用所產(chǎn)生的影響。

1 基于語音識別的維蒙藏語音產(chǎn)品開發(fā)及應(yīng)用現(xiàn)狀

近年來基于語音識別技術(shù)的維蒙藏語音產(chǎn)品不斷增多,給人們的生活帶來了便利?,F(xiàn)根據(jù)研發(fā)單位的不同,對這些語音產(chǎn)品的基本功能作簡要介紹。

1.1 中國民族語文翻譯局

中國民族語文翻譯局[2]基于基礎(chǔ)語料采集工作,將智能翻譯系統(tǒng)與民族文語音識別系統(tǒng)相結(jié)合,相繼研發(fā)多款語音軟件。

維吾爾文語音輸入法,功能包括漢語和維吾爾語的文字手寫輸入和語音識別輸入。

維漢智能語音翻譯軟件,實現(xiàn)了維吾爾語和漢語的語音輸入、語音朗讀功能和維吾爾語與漢語之間的互譯功能。

語音轉(zhuǎn)寫通,采用清華靈云識別技術(shù),可實時、不間斷地把整句語音進(jìn)行識別,然后轉(zhuǎn)成維吾爾文、蒙古文、藏文和漢字。

民漢對話通,基于語音識別技術(shù),支持漢字、維吾爾文、蒙古文、藏文的語音錄入,并且可以進(jìn)行朗讀。

維漢智能機(jī)器人,是一套支持維漢雙語的智能人機(jī)交互的機(jī)器人設(shè)備,其根植入的維漢語言智能語音識別技術(shù)、自然語言理解技術(shù)和智能機(jī)器翻譯技術(shù),實現(xiàn)了少數(shù)民族辦事大廳的引導(dǎo),智能問答,自助業(yè)務(wù)辦理等智能查詢功能。

1.2 捷通華聲

捷通華聲作為中國最早從事人工智能技術(shù)研究與應(yīng)用的企業(yè)之一,其始終重視少數(shù)民族語言的智能語音技術(shù)研究。

早在2005年,國內(nèi)首款靈云維漢友誼橋應(yīng)用軟件[3]公測版已經(jīng)推出。該款軟件在維吾爾語、漢語雙語翻譯技術(shù)的基礎(chǔ)上,采用語音識別和合成技術(shù),使用者所說的話通過識別轉(zhuǎn)成文字,而后再轉(zhuǎn)化為另外一種語言,并由軟件進(jìn)行朗讀。

隨著技術(shù)不斷成熟,2018年,靈云智會、智錄、智聲三款智能語音轉(zhuǎn)錄產(chǎn)品[4]推出,分別服務(wù)于多人會議、一對一談話、單人錄入等場景,三款產(chǎn)品均支持維吾爾語、蒙古語、藏語的語音識別。其中,“靈云智會”是“為多人會話推出的智能語音轉(zhuǎn)寫軟件,可分角色實時將發(fā)言轉(zhuǎn)為文字”,值得注意的是,其專門面向政法領(lǐng)域會議、庭審、審訊等場景推出了語音轉(zhuǎn)寫方案,語音識別準(zhǔn)確率高達(dá)98%。“靈云智錄”應(yīng)用于一對一談話的識別。例如公安訊問、檢察談話等場景,把對話內(nèi)容實時分角色記錄,擁有較快的轉(zhuǎn)寫速度和較高的準(zhǔn)確率?!办`云智聲”是一款智能語音輸入法,其提供政務(wù)、醫(yī)療領(lǐng)域?qū)S谜Z音識別模型,應(yīng)用在政務(wù)會議材料整理、醫(yī)療電子病歷錄入等場景;而且其在語音識別有自己的云端,無需連接互聯(lián)網(wǎng),滿足軍政機(jī)關(guān)保密要求等。

1.3 科大訊飛

2016年,西藏大學(xué)·訊飛語音及語言聯(lián)合實驗室發(fā)布訊飛藏語識別、合成和翻譯系統(tǒng)[5]。其中,三位一體藏語輸入法、漢藏互譯通兩產(chǎn)品均涉及藏語語音識別技術(shù)。“三位一體藏語輸入法”是全球首款基于蜂巢輸入模型的全能藏語輸入軟件,集成了聯(lián)合實驗室獨家研發(fā)的藏語語音識別技術(shù)和藏語手寫識別技術(shù)成果;“漢藏互譯通”軟件集豐富的情景例句、實時語音識別翻譯功能于一體,提供漢藏翻譯。

1.4 騰訊公司

騰訊公司開發(fā)了“騰訊民漢翻譯”小程序[6],目前已支持維語、藏語(衛(wèi)藏藏語、安多藏語、康巴藏語)與中文的互譯。團(tuán)隊多年對民族語音、語言、圖像、文本進(jìn)行了大量標(biāo)注,使得該小程序相較于同行業(yè)其他產(chǎn)品,在功能上實現(xiàn)了“實時語音識別+標(biāo)點斷句+翻譯+語音合成”的首創(chuàng)。

1.5 相關(guān)學(xué)科研究者

開發(fā)手機(jī)語音助手。迪麗尼格爾·熱夏提[7]實現(xiàn)了基于Android系統(tǒng)的維吾爾語語音助理應(yīng)用軟件,該軟件實現(xiàn)的功能有打電話、發(fā)短信、打開應(yīng)用程序、音樂搜索等八大功能。之后,米爾阿迪力江·麥麥提、吾守爾·斯拉木等人[8]用同樣的方法開發(fā)出維吾爾語手機(jī)語音控制軟件,實現(xiàn)了打電話、發(fā)短信、打開應(yīng)用、新聞、天氣查詢等十大功能。

開發(fā)在線教育網(wǎng)站。趙睿[9]開發(fā)出藏語連續(xù)語音識別系統(tǒng),將該系統(tǒng)應(yīng)用到遠(yuǎn)程教育中的藏族中小學(xué)語文教學(xué)視頻中,首先識別出音頻文件中的藏語,然后和視頻文件整合,形成具有字幕的教學(xué)視頻。李要嬙[10]搭建了藏語在線教育視頻語音內(nèi)容識別系統(tǒng),實現(xiàn)藏語實時采音和語音識別,最終把識別結(jié)果通過藏文文字形式顯示在視頻下方,形成帶有字幕的教學(xué)視頻。

開發(fā)智能家居領(lǐng)域。吾提庫爾·艾爾肯[11]將維吾爾語語音識別技術(shù)應(yīng)用到智能家居領(lǐng)域中,實現(xiàn)通過開關(guān)與遙控這兩類電器設(shè)備的控制,如:電視,熱水器等。

2 基于語音識別技術(shù)的少數(shù)民族語音產(chǎn)品影響

進(jìn)入21世紀(jì),在國家政策的扶持下,在專家學(xué)者和相關(guān)科技公司的努力下,眾多基于語音識別技術(shù)的少數(shù)民族語音產(chǎn)品投入實際應(yīng)用,給國家、社會以及個人都帶來了積極影響。

2.1 國家層面

對外能夠推動國家友好交流與合作。許多少數(shù)民族語言與周邊國家的官方語言實屬同一種語言,通過對這些少數(shù)民族語言進(jìn)行語音識別,可以有效促進(jìn)交流,從而加強(qiáng)與沿線國家的交往與合作。

對內(nèi)有助于了解少數(shù)民族群眾較關(guān)注的話題,掌握社會輿情變化。通過使用少數(shù)民族語音識別系統(tǒng),政府機(jī)構(gòu)可以對使用者的關(guān)注話題和情緒變化有一定的掌握,了解民情民意,從而為政府政策的制定和調(diào)整提供參考依據(jù),從而順利推行國家政策。

2.2 社會層面

有效促進(jìn)民族之間經(jīng)濟(jì)交流、文化傳播和傳承。隨著語音識別技術(shù)的應(yīng)用,能夠幫助少數(shù)民族同胞與漢族民眾進(jìn)行有效地交流溝通,從而極大地方便民族間的商務(wù)、文化交流,推動少數(shù)民族地區(qū)經(jīng)濟(jì)發(fā)展,也有利于少數(shù)民族文化傳播。

有助于保護(hù)瀕危民族語言與文化。語音識別技術(shù)的發(fā)展基礎(chǔ)之一就是需要建立語音識別資料庫,只有收集了大量的語音語料,才能夠開展后續(xù)的建模和構(gòu)建識別系統(tǒng)的工作。大量的語音語料的收集則對于保護(hù)、發(fā)展少數(shù)民族語言和文化有至關(guān)重要的作用。

促進(jìn)少數(shù)民族地區(qū)的教育發(fā)展。一些研究者經(jīng)過實證研究,發(fā)現(xiàn)語音識別系統(tǒng)能將視頻中的音頻信息轉(zhuǎn)換為相對應(yīng)的少數(shù)民族文字,為學(xué)習(xí)者提供輔助學(xué)習(xí)功能,促進(jìn)優(yōu)質(zhì)教育教學(xué)資源在少數(shù)民族地區(qū)傳播,推動教育信息化進(jìn)程,從而縮小與發(fā)達(dá)地區(qū)的教育差距,有效提高少數(shù)民族地區(qū)綜合競爭力[9-10]。

2.3 個人層面

提高相關(guān)單位工作人員的效率,方便辦事群眾的生活。通過語音識別進(jìn)行輸入和翻譯,可以解放工作人員的雙手,提高工作效率,也能幫助工作人員和少數(shù)民族群眾提高溝通效率,從而減少群眾的等待時間。

為不懂國家通用語言文字的少數(shù)民族殘障人士提供便利。通過字幕形式實時展現(xiàn)對話,方便了聽力障礙人士;通過語音輸入,不需要打字便可以錄入文字,也方便了手腳不便的殘障人士。

3 基于語音識別技術(shù)的少數(shù)民族語音產(chǎn)品發(fā)展前景

維吾爾語語音識別的研究工作開始于20世紀(jì)90年代初,蒙古語和藏語的相關(guān)研究工作開始于21世紀(jì)初,隨著語音識別技術(shù)的不斷發(fā)展,相關(guān)語音產(chǎn)品的數(shù)量不斷增多,在教育、醫(yī)療、司法等方面發(fā)揮著重要作用。但是目前產(chǎn)品的開發(fā)方向主要集中于語音輸入法、語音翻譯軟件和轉(zhuǎn)錄產(chǎn)品,種類仍較為單一,受眾多為政府、公安和法律等部門的人員,且產(chǎn)品推廣力度不夠,因此使用人數(shù)較少,受眾范圍較窄。

未來,少數(shù)民族的語音識別技術(shù)和相關(guān)產(chǎn)品開發(fā)定是熱門的研究領(lǐng)域,有較好的發(fā)展前景。首先,通過在真實場景中應(yīng)用語音產(chǎn)品,研究者得到的真實數(shù)據(jù)會越來越多,語音識別會更加準(zhǔn)確,能更好地把握用戶的需求;其次,隨著更多少數(shù)民族學(xué)者投入研究,支持彝語、壯語等少數(shù)民族語的語音產(chǎn)品也會推出;最后,新的語音產(chǎn)品研發(fā)將會從群眾需求出發(fā),例如:智能家居的控制、車載語音系統(tǒng)的開發(fā)、公安消防報警系統(tǒng)的改良等,以提高其受教育的質(zhì)量、更好地保障其人身財產(chǎn)安全等為目的,有效擴(kuò)大受眾范圍,增強(qiáng)少數(shù)民族群眾的幸福感,從而促進(jìn)社會的和諧與進(jìn)步。

參考文獻(xiàn)(References):

[1] 李鵬飛.基于深度學(xué)習(xí)的維語語音識別研究[D].安徽大學(xué),2016.

[2] 佚名.民族語文信息化成果[EB/OL].中國民族語文翻譯局網(wǎng),http://www.mzfy.org.cn/information/i=15&comContentId=15.html,2019-07-26.

[3] 佚名. 維漢語音轉(zhuǎn)寫通官方介紹[EB/OL]. PC下載網(wǎng), https://www.pcsoft.com.cn/soft/163351.html,2019-08-15.

[4] 佚名. 捷通華聲靈云智會、智錄:性價比更高的智能語音轉(zhuǎn)錄方案[EB/OL].國脈電子政務(wù)網(wǎng), http://www.echinagov.com/keji/250594.html,2019-08-15.

[5] 佚名. 西藏大學(xué)·訊飛語音及語言聯(lián)合實驗室發(fā)布系列技術(shù)成果[EB/OL].西藏自治區(qū)人民政府網(wǎng), http://xizang.gov.cn/xwzx/qnyw/201611/t20161108_93128.html,2019-08-18.

[6] 佚名. 騰訊民漢翻譯踐行“科技向善”[EB/OL]. 騰訊云網(wǎng),https://cloud.tencent.com/developer/article/1454493,2019-08-16.

[7] 迪麗尼格爾·熱夏提.基于Android的維吾爾語語音助理應(yīng)用軟件的研發(fā)[D].新疆大學(xué),2014.

[8] 米爾阿迪力江·麥麥提,吾守爾·斯拉木,努爾麥麥提·尤魯瓦斯,熱依曼·吐爾遜,艾尼宛爾·托乎提.基于智能手機(jī)的維吾爾語語音控制系統(tǒng)的開發(fā)[J].計算機(jī)應(yīng)用與軟件,2016.33(6):220-223,305

[9] 趙睿.藏語語音識別在遠(yuǎn)程教育中的應(yīng)用[D].中央民族大學(xué),2017.

[10] 李要嬙.基于主動學(xué)習(xí)的藏語語音識別在在線教育中的應(yīng)用[D].中央民族大學(xué),2018.

[11] 吾提庫爾·艾爾肯.維吾爾語語音識別技術(shù)在智能家居中的研究與應(yīng)用[D].新疆大學(xué),2017.

[12] 張建華.基于深度學(xué)習(xí)的語音識別應(yīng)用研究[D].北京郵電大學(xué),2015.

[13] 孫杰,吾守爾·斯拉木,熱依曼·吐爾遜.基于CMN網(wǎng)絡(luò)的低資源柯爾克孜語識別研究[J].現(xiàn)代電子技術(shù),2018.41(24):132-136,140

猜你喜歡
語音識別
空管陸空通話英語發(fā)音模板設(shè)計與應(yīng)用
通話中的語音識別技術(shù)
面向移動終端的語音簽到系統(tǒng)
農(nóng)業(yè)物聯(lián)網(wǎng)平臺手機(jī)秘書功能分析與實現(xiàn)
基于LD3320的非特定人識別聲控?zé)粝到y(tǒng)設(shè)計
航天三維可視化系統(tǒng)中語音控制技術(shù)的研究與應(yīng)用
基于語音識別的萬能遙控器的設(shè)計
基于語音技術(shù)的商務(wù)英語移動學(xué)習(xí)平臺設(shè)計與實現(xiàn)
基于Android手機(jī)語音和Arduino控制板的機(jī)器人控制系統(tǒng)
支持向量機(jī)在語音識別中的應(yīng)用
巩义市| 武鸣县| 巨野县| 马关县| 江安县| 揭东县| 肃宁县| 阆中市| 河间市| 庐江县| 崇左市| 页游| 武义县| 永顺县| 安顺市| 龙里县| 德昌县| 陇南市| 柞水县| 塔城市| 夏河县| 海淀区| 贞丰县| 重庆市| 万山特区| 来宾市| 彭泽县| 阿鲁科尔沁旗| 滨海县| 沙湾县| 仙桃市| 陇西县| 远安县| 墨玉县| 桐乡市| 湟中县| 上杭县| 上饶市| 安庆市| 仪征市| 乐清市|