国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于科大訊飛開放平臺(tái)的語音識(shí)別技術(shù)在背誦檢查中的應(yīng)用研究

2019-04-25 00:33戰(zhàn)玉娟苑芳兵
關(guān)鍵詞:語音識(shí)別

戰(zhàn)玉娟 苑芳兵

摘 要:為了解決背誦作業(yè)檢查占用課堂時(shí)間較多的問題,文章在科大訊飛開放平臺(tái)的語音識(shí)別技術(shù)基礎(chǔ)上,將背誦識(shí)別結(jié)果進(jìn)行分詞、標(biāo)點(diǎn)過濾、拼音轉(zhuǎn)換等一系列處理,然后運(yùn)用LD文本比較算法計(jì)算文本相似度以及其他評(píng)價(jià)指標(biāo),準(zhǔn)確地反映了學(xué)生背誦的完成情況,對(duì)智能自動(dòng)檢查學(xué)生背誦作業(yè)提供了一種有效的解決方案。

關(guān)鍵詞:語音識(shí)別;文本比較;背誦檢查;語音評(píng)測(cè);科大訊飛

中圖分類號(hào):G434? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ? ?文章編號(hào):1673-8454(2019)06-0033-03

在語文教學(xué)過程中,有大量的課文內(nèi)容需要學(xué)生背誦,任課教師為了檢查學(xué)習(xí)效果,需要經(jīng)常檢查學(xué)生的背誦完成情況,這往往需要占用大量的課堂教學(xué)時(shí)間,并且通常情況下教師只能抽查一小部分學(xué)生,要想實(shí)現(xiàn)全面覆蓋的背誦檢查,只能依靠各種形式的學(xué)生自查,而這樣往往效果又不太理想。其他需要大量記憶的課目,比如史、地、生等同樣也存在這一矛盾。針對(duì)這一情況,筆者嘗試?yán)脟鴥?nèi)比較成熟的科大訊飛開放平臺(tái)的智能語音技術(shù),實(shí)現(xiàn)語音的連續(xù)識(shí)別和評(píng)測(cè),使教師能夠?qū)θw學(xué)生背誦情況進(jìn)行智能自動(dòng)檢查。

一、現(xiàn)狀及目標(biāo)分析

經(jīng)過對(duì)相關(guān)文獻(xiàn)的查閱整理,發(fā)現(xiàn)將語音識(shí)別技術(shù)應(yīng)用于背誦檢查領(lǐng)域方面的研究還很少,基本處于空白狀態(tài)。目前在文本相關(guān)(text-dependent)的語音識(shí)別領(lǐng)域,研究還主要集中在普通話或者外語口語測(cè)試等語音評(píng)測(cè)方面,技術(shù)也已經(jīng)比較成熟[1]。經(jīng)過對(duì)比研究,雖然都是文本相關(guān)的語音識(shí)別應(yīng)用,但相對(duì)于語音評(píng)測(cè)方面的應(yīng)用,背誦檢查還是有不小的區(qū)別。

首先,背誦檢查和語音評(píng)測(cè)雖然都是文本相關(guān)的,但從概念上說背誦檢查是語音評(píng)測(cè)的外延,它不僅需要檢查學(xué)生發(fā)音的準(zhǔn)確性,還要求背誦的文本跟課文完全一致;其次,不同于語音評(píng)測(cè)主要題型是嚴(yán)格按照文本順序的朗讀,在語音識(shí)別時(shí)只要做簡(jiǎn)單的“類似切分”進(jìn)行強(qiáng)制文本對(duì)齊,而背誦很可能出現(xiàn)漏背、重復(fù)、亂序、停頓、無效語氣詞等情況,所以相對(duì)較難實(shí)現(xiàn)文本對(duì)齊;最后,在結(jié)果的呈現(xiàn)上,語音評(píng)測(cè)可以根據(jù)評(píng)分標(biāo)準(zhǔn)給出一個(gè)量化分?jǐn)?shù),而背誦雖然也可以給出某些特征評(píng)分,但還需要詳細(xì)地告訴學(xué)生哪些地方有背誦錯(cuò)誤。所以語音識(shí)別在背誦檢查方面的應(yīng)用研究是很有必要的。

因?yàn)轫?xiàng)目最終使用者是技術(shù)基礎(chǔ)比較薄弱的一線教師或者學(xué)生,所以必須滿足易用性特征,盡量智能化、自動(dòng)化,無需或盡量少的環(huán)境配置,無需培訓(xùn)或者只需稍加引導(dǎo)即可使用,每次使用除了需要維護(hù)原始背誦文本,盡量減少附加維護(hù)工作。由于實(shí)際使用環(huán)境一般處于噪音較大的教室或者辦公室,所以還應(yīng)盡量提高噪音環(huán)境中的魯棒性、容錯(cuò)性,提高噪音環(huán)境中的識(shí)別正確率。要便于背誦結(jié)果查詢對(duì)比,方便教師發(fā)現(xiàn)學(xué)生背誦過程中存在的各種問題,以便針對(duì)性地加以引導(dǎo)。

二、系統(tǒng)模型

實(shí)現(xiàn)背誦智能檢查這一目標(biāo)的難點(diǎn)主要有兩個(gè)方面:

1.在一定噪音背景下的語音準(zhǔn)確識(shí)別

針對(duì)這一難點(diǎn),為了降低噪音影響,首先對(duì)語音進(jìn)行預(yù)處理,選擇了卡爾曼濾波算法將原始語音進(jìn)行去噪增強(qiáng)[2]。對(duì)于語音識(shí)別,目前國內(nèi)該領(lǐng)域的技術(shù)已經(jīng)比較成熟,識(shí)別正確率大部分已經(jīng)可以做到97%以上,所以本文無意在語音識(shí)別技術(shù)方面做深入研究,而是直接利用現(xiàn)有的開放數(shù)據(jù)接口。通過分析對(duì)比,我們選擇了國內(nèi)最早研究語音技術(shù)也是技術(shù)最成熟的科大訊飛語音開放平臺(tái)[3]作為語音識(shí)別的技術(shù)基礎(chǔ),同時(shí)科大訊飛還有一個(gè)語音評(píng)測(cè)的開放接口,在檢查背誦的同時(shí),還能夠指導(dǎo)學(xué)生普通話發(fā)音,通過智能語音技術(shù)自動(dòng)對(duì)發(fā)音水平進(jìn)行評(píng)價(jià),對(duì)發(fā)音錯(cuò)誤、缺陷進(jìn)行定位和問題分析,可謂是錦上添花。由于訊飛語音聽寫接口要求上傳的每段語音不超過60秒,所以需要在上傳之前將語音進(jìn)行適當(dāng)分割,然后分段上傳識(shí)別。

2.識(shí)別完成后對(duì)識(shí)別結(jié)果與原始文本的準(zhǔn)確合理的對(duì)比評(píng)價(jià)

對(duì)于該難點(diǎn),本文采取了四個(gè)措施以保證評(píng)價(jià)結(jié)果能夠準(zhǔn)確反映出學(xué)生的實(shí)際背誦情況。

(1)嘗試建立一個(gè)多維度的綜合評(píng)價(jià)指標(biāo)體系(見表1),從多個(gè)維度對(duì)學(xué)生的背誦給出評(píng)分,然后給出一個(gè)綜合加權(quán)評(píng)分,教師可以根據(jù)自己的喜好選擇自己偏重的維度,比如有的教師要求一字不錯(cuò)才算背過,那就需要文本相似度、完成度和正確率三個(gè)指標(biāo)都達(dá)到100%。有的教師還要求不能重復(fù),那就必須插入錯(cuò)誤率為0。

(2)定義了一個(gè)簡(jiǎn)單的文本相似度函數(shù)。由于背誦文本一般不長,并且檢查時(shí)一般不考慮語義相似性,只要字符不一致即判斷為背誦不正確,所以采用相對(duì)比較簡(jiǎn)單的LD(Levenshtein Distance)文本比較算法[4]計(jì)算兩段文本的編輯距離(Edit Distance),進(jìn)而根據(jù)表1中的文本相似度公式求出兩個(gè)文本的文本相似度,然后根據(jù)該算法的LD矩陣計(jì)算回溯路徑,得到原始文本和識(shí)別文本的匹配字符串,以不同的顏色標(biāo)注出一致、漏背、多余、錯(cuò)誤的字符。經(jīng)過比較,雖然LD算法在文本比較算法中并不是最優(yōu)的,尤其其空間復(fù)雜度為O(MN)[5],當(dāng)文本較長時(shí)性能較差,但好在一般中學(xué)階段的文本背誦作業(yè)文本長度都不算很長,所以對(duì)本項(xiàng)目影響可以忽略。

(3)考慮到中文文本的特點(diǎn),一段文本是由一系列的詞組構(gòu)成,如果詞組中的單字背錯(cuò),可以認(rèn)為該詞組也是錯(cuò)誤的,所以可以以詞組為單位進(jìn)行文本比較,這樣不但減少LD算法計(jì)算過程中的文本的長度,同時(shí)也可以降低誤判概率,本文采用中國科學(xué)院計(jì)算技術(shù)研究所的NLPIR分詞系統(tǒng)[6],首先對(duì)原始文本和識(shí)別文本進(jìn)行分詞,再以詞組為單位對(duì)兩文本進(jìn)行編輯距離的計(jì)算。

(4)經(jīng)過分詞系統(tǒng)切分詞組后,還采取了兩個(gè)手段進(jìn)一步減少對(duì)文本相似度計(jì)算的干擾,一是將原始文本和識(shí)別結(jié)果全部轉(zhuǎn)成拼音形式對(duì)比,以應(yīng)對(duì)中文文本中多音字較多、語音識(shí)別結(jié)果與原始文本可能音同字不同的情況;二是將原始文本和識(shí)別文本的標(biāo)點(diǎn)全部過濾掉,因?yàn)樽詣?dòng)識(shí)別的文本一般標(biāo)點(diǎn)不夠規(guī)范,如果比對(duì)標(biāo)點(diǎn),會(huì)造成文本相似度比實(shí)際值偏低。當(dāng)然在結(jié)果呈現(xiàn)中,為了直觀還是要轉(zhuǎn)換到原來的中文文本的,這可以通過在過濾前向文本序列添加索引并保存在臨時(shí)變量中實(shí)現(xiàn)。

經(jīng)過上面的分析,我們?cè)O(shè)計(jì)了如圖1所示的系統(tǒng)模型。在學(xué)生界面中包含身份認(rèn)證、作業(yè)入口、語音錄制、語音回放、語音上傳、成績(jī)查詢、評(píng)測(cè)申訴等模塊,教師界面中除了包含學(xué)生界面的全部功能,還包含學(xué)生維護(hù)、作業(yè)維護(hù)、作業(yè)下發(fā)、手工檢查、成績(jī)查詢、歷史成績(jī)對(duì)比等模塊。

三、系統(tǒng)實(shí)現(xiàn)

考慮到背誦檢查的環(huán)境一般為教室、辦公室或者由父母監(jiān)督的家中,對(duì)可移動(dòng)性要求較高,所以本項(xiàng)目選擇了在普及度比較高的Android平臺(tái)實(shí)現(xiàn)。編程環(huán)境選擇了官方的Android Studio集成開發(fā)環(huán)境。因?yàn)轫?xiàng)目的核心使用了科大訊飛的開放平臺(tái)接口,所以還需要導(dǎo)入科大訊飛的語音識(shí)別和語音評(píng)測(cè)Android版SDK。音頻錄制、分割部分使用了Android自帶的AudioRecorder、AudioManager類來處理。文本分詞系統(tǒng)采用了中國科學(xué)院計(jì)算技術(shù)研究所的NLPIR分詞系統(tǒng),同樣需要導(dǎo)入到項(xiàng)目中。

系統(tǒng)核心部分的流程是首先將錄制的背誦音頻文件暫存到臨時(shí)目錄,錄制完成使用卡爾曼濾波算法對(duì)音頻文件進(jìn)行降噪、增強(qiáng)處理,然后以1分鐘為單位將音頻切割成若干段,分別調(diào)用科大訊飛開放平臺(tái)的在線語音識(shí)別(SpeechRecognizer)和語音評(píng)測(cè)(SpeechEvaluator)接口進(jìn)行語音識(shí)別和評(píng)測(cè),將語音評(píng)測(cè)結(jié)果合并后經(jīng)過格式化(對(duì)不同的錯(cuò)誤發(fā)音標(biāo)以不同的顏色)后直接輸出,對(duì)語音識(shí)別結(jié)果合并后復(fù)制為兩份,一份暫存,另一份先調(diào)用NLPIR分詞系統(tǒng)進(jìn)行分詞,然后轉(zhuǎn)換為拼音格式并進(jìn)行標(biāo)點(diǎn)過濾,對(duì)原始文本同樣進(jìn)行分詞、拼音轉(zhuǎn)換、標(biāo)點(diǎn)過濾處理,將得到的兩份文本作為輸入,依次計(jì)算文本相似度、完成度、正確率等表1中列出的指標(biāo),其中計(jì)算插入錯(cuò)誤率統(tǒng)計(jì)語氣詞時(shí)不但要參考維護(hù)好的語氣詞列表,還要參考原始文本,防止將原始文本中本來就有的語氣詞統(tǒng)計(jì)進(jìn)去。最后將計(jì)算結(jié)果輸出,并根據(jù)相似度計(jì)算矩陣回溯結(jié)果,將暫存的那份語音識(shí)別結(jié)果根據(jù)回溯結(jié)果以不同的顏色標(biāo)注出一致、漏背、多余、錯(cuò)誤的字符并輸出。

四、效益及性能分析

系統(tǒng)實(shí)現(xiàn)后在學(xué)校中進(jìn)行了小范圍的測(cè)試和試用,受到了試用教師和學(xué)生的一致好評(píng)。對(duì)教師來說,該系統(tǒng)讓學(xué)生在教室或辦公室使用教師的Android設(shè)備或者在家使用家長的Android手機(jī)完成背誦作業(yè),免除了教師在課堂上檢查背誦占用過多時(shí)間的困擾,節(jié)約了大量寶貴的教學(xué)時(shí)間,顯著提高了教學(xué)效率。同時(shí),系統(tǒng)可以測(cè)算學(xué)生背誦作業(yè)的各種指標(biāo),明確顯示出背誦錯(cuò)誤,還能順帶準(zhǔn)確地指出發(fā)音錯(cuò)誤,相對(duì)于教師人工檢查能夠提供更準(zhǔn)確、更清晰的學(xué)習(xí)指導(dǎo),方便因材施教、因勢(shì)利導(dǎo)。如果教師對(duì)某個(gè)學(xué)生的背誦不放心,可以在教師界面回放檢查該學(xué)生的背誦錄音,非常方便。對(duì)學(xué)生來說,檢查時(shí)不用面對(duì)教師和全體學(xué)生的注視,背誦時(shí)能夠更加放松,往往發(fā)揮得更好,更容易完成教師布置的背誦作業(yè),如果學(xué)生質(zhì)疑系統(tǒng)的評(píng)測(cè),可以在學(xué)生界面對(duì)評(píng)測(cè)發(fā)起申訴,教師可以人工檢查學(xué)生的背誦錄音。

對(duì)系統(tǒng)的性能我們也進(jìn)行了基本的測(cè)試,主要對(duì)不同環(huán)境噪音背景下的語音識(shí)別正確率進(jìn)行了量化測(cè)試。經(jīng)過測(cè)試,在辦公室和家中基本安靜的條件下,語音識(shí)別的正確率還是很高的,基本能夠達(dá)到科大訊飛聲稱的97%左右。在教室其余學(xué)生都在背誦的嘈雜環(huán)境中,識(shí)別率較低,學(xué)生必須將手機(jī)的麥克風(fēng)離自己的嘴足夠近,并且前后左右同學(xué)沒有特別大聲的干擾,才能有較好的識(shí)別率。

五、小結(jié)與展望

本文以科大訊飛的語音識(shí)別技術(shù)為基礎(chǔ),將識(shí)別結(jié)果進(jìn)行一系列處理后,采用LD算法將識(shí)別結(jié)果和原始文本進(jìn)行比較,實(shí)現(xiàn)了學(xué)生背誦作業(yè)的智能自動(dòng)檢查,經(jīng)過試用,取得了一定的經(jīng)濟(jì)和社會(huì)效益。

在系統(tǒng)使用過程中,我們也發(fā)現(xiàn)還有不少改進(jìn)的空間,比如少部分學(xué)生在背誦過程中可能會(huì)偷懶照讀課本,還有部分學(xué)生讓別人頂替完成作業(yè),所以計(jì)劃下一步在系統(tǒng)中加入不定時(shí)拍照、面部識(shí)別以及聲紋識(shí)別功能以應(yīng)對(duì)這兩種情況。還有系統(tǒng)為了提高識(shí)別率采用了在線語音識(shí)別,需要上傳音頻文件,如果教室中沒有WiFi用流量上傳,需要消耗較高的流量,效費(fèi)比較低,下一步考慮自動(dòng)檢測(cè)網(wǎng)絡(luò)環(huán)境,在非WiFi環(huán)境中使用離線語音識(shí)別。

參考文獻(xiàn):

[1]嚴(yán)可.英文朗讀題及復(fù)述題自動(dòng)評(píng)測(cè)技術(shù)研究[D].合肥:中國科學(xué)技術(shù)大學(xué), 2009.

[2]沈亞強(qiáng),程仲文.建立在卡爾曼濾波基礎(chǔ)上的語音增強(qiáng)方法[J].聲學(xué)學(xué)報(bào),1994(3).

[3]科大訊飛科技有限公司.科大訊飛MSC Android版SDK的用戶指南[DB/OL]. https://doc.xfyun.cn/msc_android/index.html.

[4]姜華,韓安琪,王美佳等.基于改進(jìn)編輯距離的字符串相似度求解算法[J].計(jì)算機(jī)工程,2014,40(1):222-227.

[5]Eugene W. Myers. An O(ND) difference algorithm and its variations[J]. Algorithmica,1986(1).

[6]劉群,張華平,俞鴻魁,程學(xué)旗.基于層疊隱馬模型的漢語詞法分析[J].計(jì)算機(jī)研究與發(fā)展,2004(8):1421-1429.

(編輯:魯利瑞)

猜你喜歡
語音識(shí)別
空管陸空通話英語發(fā)音模板設(shè)計(jì)與應(yīng)用
通話中的語音識(shí)別技術(shù)
面向移動(dòng)終端的語音簽到系統(tǒng)
農(nóng)業(yè)物聯(lián)網(wǎng)平臺(tái)手機(jī)秘書功能分析與實(shí)現(xiàn)
基于LD3320的非特定人識(shí)別聲控?zé)粝到y(tǒng)設(shè)計(jì)
航天三維可視化系統(tǒng)中語音控制技術(shù)的研究與應(yīng)用
基于語音識(shí)別的萬能遙控器的設(shè)計(jì)
基于語音技術(shù)的商務(wù)英語移動(dòng)學(xué)習(xí)平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)
基于Android手機(jī)語音和Arduino控制板的機(jī)器人控制系統(tǒng)
支持向量機(jī)在語音識(shí)別中的應(yīng)用
宣恩县| 青冈县| 贵港市| 灵武市| 万安县| 玉山县| 浏阳市| 方正县| 股票| 同德县| 个旧市| 苏尼特右旗| 郸城县| 三明市| 翁牛特旗| 湟源县| 常宁市| 南充市| 准格尔旗| 如皋市| 延川县| 会理县| 阿勒泰市| 凌源市| 临沂市| 洪泽县| 吉安县| 富裕县| 延寿县| 堆龙德庆县| 逊克县| 梧州市| 樟树市| 扎兰屯市| 乌鲁木齐市| 当雄县| 五大连池市| 泰来县| 秦安县| 宣汉县| 澳门|