国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語音技術(shù)的商務(wù)英語移動學(xué)習(xí)平臺設(shè)計與實現(xiàn)

2015-04-02 14:23趙崇里李利正
無線互聯(lián)科技 2015年2期
關(guān)鍵詞:語音識別

趙崇里 李利正

摘 要:文章介紹了基于語音識別和語音合成技術(shù)的商務(wù)英語移動學(xué)習(xí)平臺設(shè)計技術(shù)。闡述了平臺開發(fā)的背景,提出了平臺開發(fā)的技術(shù)路線、功能結(jié)構(gòu)和關(guān)鍵技術(shù),結(jié)合商務(wù)英語專業(yè)教師提供的教學(xué)資料,平臺在本校商務(wù)英語專業(yè)中測試通過,為學(xué)生利用課外零碎時間學(xué)習(xí)商務(wù)英語提供了方便和有效的工具,豐富了學(xué)生的學(xué)習(xí)資源。

關(guān)鍵詞:語音合成;語音識別;移動學(xué)習(xí)平臺

隨著全球化趨勢的發(fā)展,英語作為一種交流工具扮演著越來越重要的角色。商務(wù)英語是以適應(yīng)職場生活的語言要求為目的一種專業(yè)性語言,需要掌握的核心技能包括口語交流和函件閱讀、撰寫。對于如何提高商務(wù)英語的學(xué)習(xí)效果和應(yīng)用能力,已經(jīng)成為廣大英語教育工作者和從事外貿(mào)工作的職員所關(guān)注的重要問題。移動學(xué)習(xí)作為一種新型學(xué)習(xí)方式,能夠有效利用時空資源實現(xiàn)高效學(xué)習(xí),正受到越來越多的關(guān)注。商務(wù)英語移動學(xué)習(xí)平臺不失為是一種幫助學(xué)習(xí)者提高商務(wù)英語學(xué)習(xí)效率的有效手段。目前市場上基于計算機的英語智能學(xué)習(xí)軟件很多,通過計算機輔助學(xué)習(xí)技術(shù),系統(tǒng)的給出學(xué)習(xí)計劃,生成單詞發(fā)音、基于情境的對話,基于特征提取、模式匹配及時得到發(fā)音質(zhì)量評分的智能化功能。然而受移動設(shè)備運算速度、存儲空間和總線帶寬等因素的限制,很難將此類軟件移植到手機平臺。因此,需要根據(jù)商務(wù)英語的特點,綜合利用Android設(shè)備的優(yōu)勢和Google TTS和百度語音識別技術(shù)的開源應(yīng)用等各種先進(jìn)技術(shù),對商務(wù)英語移動學(xué)習(xí)平臺進(jìn)行功能設(shè)計和軟件開發(fā)。文章對基于TTS、百度語音識別的商務(wù)英語移動學(xué)習(xí)軟件平臺的設(shè)計進(jìn)行了研究,意在為廣大商務(wù)英語學(xué)習(xí)者、應(yīng)用者提供一個不受時空限制的商務(wù)英語學(xué)習(xí)平臺。

1 語音技術(shù)

語音合成和語音識別技術(shù)是實現(xiàn)人機語音通信,建立具有聽和講功能的口語系統(tǒng)所必需的兩項關(guān)鍵技術(shù)[1]。

Text To Speech(簡稱TTS),從文本到語音所使用的關(guān)鍵技術(shù)就是語音合成技術(shù),能將文字信息轉(zhuǎn)變?yōu)榭梢月牰?、流利的語音輸出技術(shù)。早期的TTS一般采用專業(yè)的芯片實現(xiàn),在語音處理專家的努力下,目前已日益成熟,合成效果越來越接近于自然語境[2]。

語音識別(Speech Recognition),是通過計算機將人類語音信號轉(zhuǎn)換為文本序列的過程。語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面[3],涉及信號處理、模式識別、概率論和信息論、發(fā)聲機理、聽覺機理、人工智能等領(lǐng)域,是一門非常復(fù)雜的交叉學(xué)科。

2 項目背景

利用隨身攜帶的移動設(shè)備安裝英語學(xué)習(xí)軟件就可以拋棄厚重資料、利用碎片時間學(xué)習(xí)英語。英語的移動學(xué)習(xí)軟件市場研究較早,應(yīng)用也甚廣。這些移動學(xué)習(xí)軟件中,有些詞匯量龐大,像我愛背單詞、超級英語詞典等;有些教材比較系統(tǒng)和完整,無論處在哪個英語學(xué)習(xí)階段,都可以從新概念英語中找到相應(yīng)的教材,并且功能豐富,幫助學(xué)習(xí)者很好地學(xué)習(xí)和記憶單詞或是英語語法;有些通過英文原聲電影寓教于樂形式輕松地記住一些日常單詞和口語的用法。這些軟件功能齊全,但是在商務(wù)英語教育、學(xué)習(xí)方面,缺少系統(tǒng)的編排。而現(xiàn)有的商務(wù)英文口語900句等軟件又缺少中英文互譯或者不支持發(fā)音功能。因此開發(fā)一個支持中英文互譯、又具備發(fā)音功能的免費簡易商務(wù)英語學(xué)習(xí)軟件是非常有意義的。

3 移動學(xué)習(xí)平臺功能分析及其設(shè)計

移動學(xué)習(xí)平臺的設(shè)計應(yīng)考慮到移動學(xué)習(xí)所具有的四個特性,即:學(xué)習(xí)便捷性、知識導(dǎo)航性、情境相關(guān)性、交互便捷性[4]。針對以上特性,總結(jié)現(xiàn)有英語學(xué)習(xí)軟件的優(yōu)點,本平臺設(shè)計了商務(wù)情境,提供了商務(wù)情境下的學(xué)習(xí)內(nèi)容。

3.1 技術(shù)路線

⑴平臺采用C/S架構(gòu),客戶端程序運行在Android移動設(shè)備上,服務(wù)器端程序運行在服務(wù)器上。

⑵客戶端與服務(wù)器端交互采用Http協(xié)議進(jìn)行數(shù)據(jù)通信,服務(wù)器端在收到客戶端請求后,以XML文件格式發(fā)送數(shù)據(jù)到客戶端。

⑶數(shù)據(jù)存儲上采用本地數(shù)據(jù)和服務(wù)器數(shù)據(jù)兩者結(jié)合,既能提高數(shù)據(jù)存儲容量,又能加快軟件運行速度。

3.2 應(yīng)用系統(tǒng)搭建

基于TTS和百度語音識別技術(shù),構(gòu)建應(yīng)用系統(tǒng),如圖1所示。

⑴自學(xué)模塊:包括計劃學(xué)習(xí)和隨機學(xué)習(xí)兩種模式。計劃學(xué)習(xí)按系統(tǒng)編排進(jìn)行商務(wù)單詞學(xué)習(xí)、商務(wù)短句學(xué)習(xí)、情境對話學(xué)習(xí)、商務(wù)函件學(xué)習(xí)等。隨機學(xué)習(xí)模式是根據(jù)學(xué)習(xí)者提交的知識范圍系統(tǒng)隨機抽取學(xué)習(xí)庫中文件進(jìn)行學(xué)習(xí)。學(xué)習(xí)者開始學(xué)習(xí)后,平臺會在展示文本的同時根據(jù)學(xué)習(xí)者意愿播放語音,讓學(xué)習(xí)者跟讀。

⑵成績測試模塊:對自學(xué)模塊的單詞、短句、商務(wù)函件等模塊知識進(jìn)行測試,并給出相應(yīng)得分,幫學(xué)習(xí)者查漏補缺。

⑶中英文互譯:借助google translate和tts技術(shù)實現(xiàn)中英文互譯、朗讀。在學(xué)習(xí)者碰到生詞、僻詞可以進(jìn)行中英文轉(zhuǎn)譯,并給出英文發(fā)音,讓學(xué)習(xí)者在記住單詞意思的同時,能正確發(fā)音。

4 關(guān)鍵技術(shù)

4.1 語音合成技術(shù)

TTS是Android從1.6版本開始支持的新功能,需要由TTS Engine的支持,系統(tǒng)默認(rèn)的TTS引擎是Pico TTS,該引擎支持English、French、German、Italian和Spanish,但是不支持中文,因此本文引入第三方開源引擎eSpeak。

TTS提供了兩個接口和兩個類來實現(xiàn)語音合成功能,具體步驟如下:

⑴[5]通過新建Intent檢查移動設(shè)備是否安裝或缺少TTS語言數(shù)據(jù),并根據(jù)返回結(jié)果進(jìn)行處理,若檢查成功創(chuàng)建一個TextToSpeech對象,若失敗則需要下載TTS數(shù)據(jù),關(guān)鍵代碼如下:

Public void onCreate(){

Intent intent = new Intent();

intent.setAction(TextToSpeech.Engine.ACTION_CHECK_TTS_DATA);

startActivityForResult(checkIntent,REQ_TTS_STATUS_CHECK);

}

protected void onActivityResult(int requestCode,int resultCode,Intent data){

Case TextToSpeech.Engine.CHECK_VOICE_DATA_PASS:

mTts = new TextToSpeech(this,this);

}

⑵當(dāng)TTS引擎檢測到新生成TextToSpeech對象,就會調(diào)用OnInitListener接口中定義的回調(diào)函數(shù)onInit(),該函數(shù)里若檢測到TTS引擎初始化成功,用TTS的setLanguage()方法設(shè)置語言,speak()方法進(jìn)行文語轉(zhuǎn)換。

4.2 語言識別技術(shù)

語音識別是以語音為研究對象,通過特征提取、模式識別技術(shù)讓設(shè)備聽懂人類發(fā)出的語言,并轉(zhuǎn)換為文本的一種高技術(shù)。目前語音識別的方法主要有隱馬爾科夫模型(HMM)、動態(tài)時間規(guī)整技術(shù)(DTW)、矢量量化(VQ)等[6],本文主要利用百度語音識別SDK提供的API接口實現(xiàn)人機口語交互。

百度語音識別API關(guān)鍵類是Voice Recognitiion Client,該類提供了speakFinish()、startVoiceRecognition()和stopVoiceRecognition()方法分別用來控制語音輸入結(jié)束、語音識別開始和語音識別結(jié)束。首先在主程序中實例化該類,在接收語音輸入前通過VoiceRecognitionConfig類設(shè)置識別類型,開啟語義解析,設(shè)置識別開始提示音、識別結(jié)束提示音和采樣率,并由VoiceRecognitionClient類的startVoiceRecognition方法發(fā)起語音識別,語音識別回調(diào)接口VoiceClientStatusChangeListener根據(jù)語音識別過程中不同的狀態(tài)做出不同的反饋,當(dāng)檢測到VoiceRecognitionClient.CLIENT_STATUS_FINISH即語音識別完成,則通過UpdateRecognitionResult方法將識別內(nèi)容顯示,本文是通過Android自帶的Google Translate進(jìn)行中英文互譯。

5 結(jié)語

文章結(jié)合如何設(shè)計一個基于語音識別和語音合成技術(shù)的移動商務(wù)英語學(xué)習(xí)平臺,詳細(xì)闡明了平臺開發(fā)的解決方案及核心技術(shù)要點。該平臺已經(jīng)投入商務(wù)英語專業(yè)教師的教學(xué)活動當(dāng)中,獲得了師生們的好評,他們一致認(rèn)為該平臺為學(xué)生利用課外零碎時間學(xué)習(xí)提供了有力工具,豐富了學(xué)生的自主自我學(xué)習(xí)方式,也提高了教師教育教學(xué)的質(zhì)量。

[參考文獻(xiàn)]

[1]胡延峰,程濤.寬帶增值服務(wù)——語音上網(wǎng)[J].有線電視技術(shù),2004,165(21):58-60,33.

[2]邢敬宏,趙雙萍,劉軍.基于Web的TTS應(yīng)用編程實現(xiàn)[J].甘肅科技,2007,23(3):78-80.

[3]張海峰,趙凱,陸倜.輕量級認(rèn)證與授權(quán)研究綜述[J].計算機工程,2003,29(1):168-170,198.

[4]高毅,崔向平.淺析移動學(xué)習(xí)的特征及應(yīng)用模式[J].絲綢之路,2009,169(24):104-106.

[5]Lauren Darcey,Shane Conder.Android移動開發(fā)一本就夠[M].北京:人民郵電出版社,2011.

[6]涂惠燕,陳一寧.基于語音識別和手機平臺的英語口語發(fā)音學(xué)習(xí)系統(tǒng)[J].計算機應(yīng)用與軟件,2011,28(9):64-66,147.

猜你喜歡
語音識別
空管陸空通話英語發(fā)音模板設(shè)計與應(yīng)用
通話中的語音識別技術(shù)
基于LD3320的非特定人識別聲控?zé)粝到y(tǒng)設(shè)計
航天三維可視化系統(tǒng)中語音控制技術(shù)的研究與應(yīng)用