【摘要】文中以近些年自動(dòng)語音識(shí)別技術(shù)在大學(xué)非英語專業(yè)音素教改中的融入為研究基礎(chǔ),通過分析目前大學(xué)非英語專業(yè)因素教改中存在的問題,探討大學(xué)非英語專業(yè)因素教改中自動(dòng)語音識(shí)別技術(shù)的應(yīng)用優(yōu)勢(shì)并引入案例嘗試分析如何提升自動(dòng)語音識(shí)別技術(shù)在大學(xué)非英語專業(yè)音素教改中應(yīng)用的有效性等。
【關(guān)鍵詞】大學(xué)非英語專業(yè) 音素教改 自動(dòng)語音識(shí)別技術(shù) 融合
【中圖分類號(hào)】H319 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2018)17-0091-02
一、大學(xué)非英語專業(yè)因素教改中存在的問題
近些年隨著跨文化交際機(jī)會(huì)的不斷增多,大學(xué)非英語專業(yè)教學(xué)中英語語言的標(biāo)準(zhǔn)化學(xué)習(xí)要求日漸豐富。作為非英語專業(yè)的英語教學(xué),雖然培訓(xùn)標(biāo)準(zhǔn)的嚴(yán)苛程度低于英語專業(yè),但是語言習(xí)得聽、說、讀、寫四項(xiàng)培訓(xùn)工作的培訓(xùn)規(guī)則與英語專業(yè)一致。也正因?yàn)槿绱?,以朗讀為切入點(diǎn),借助口語水平的提升來提高非英語專業(yè)語言學(xué)習(xí)成效的教學(xué)方式就存在了現(xiàn)實(shí)可行性。
目前,絕大多數(shù)高校在非英語專業(yè)英語教學(xué)的過程中,并沒有關(guān)于朗讀質(zhì)量的及時(shí)有效反饋源,如此也導(dǎo)致學(xué)習(xí)者發(fā)音中的錯(cuò)誤無法被及時(shí)糾正。大學(xué)非英語專業(yè)音素教改的傳統(tǒng)應(yīng)用手段基本可將文字與語音融合為一體,從語音習(xí)得入手,糾正學(xué)習(xí)者錯(cuò)誤發(fā)音,規(guī)范學(xué)習(xí)者音素應(yīng)用方式等。此種教學(xué)方式的確卓有成效,但是按照新時(shí)期大學(xué)非英語專業(yè)音素教改的要求,顯然是不夠的。
語音作為語言習(xí)得的重要物質(zhì)基礎(chǔ),利于學(xué)習(xí)者更為便捷的捕捉語言信息并掌握語言技巧。基于語言教學(xué)中語音教學(xué)的重要性作用,在大學(xué)非英語專業(yè)的音素教改中,就需要將其視為獨(dú)立的部分進(jìn)行針對(duì)性的分析,繼而結(jié)合大學(xué)非英語專業(yè)語言習(xí)得要求、標(biāo)準(zhǔn)等,著手相關(guān)方案或者措施的設(shè)計(jì)。在此過程中,為提升大學(xué)非英語專業(yè)學(xué)生語言習(xí)得的主動(dòng)性和積極性,建議嘗試在大學(xué)非英語專業(yè)音素教改中融合自動(dòng)語音識(shí)別技術(shù),以此來提升語音教改向每個(gè)學(xué)習(xí)者提供及時(shí)反饋需求及個(gè)體練習(xí)等的服務(wù)性。
二、大學(xué)非英語專業(yè)因素教改中自動(dòng)語音識(shí)別技術(shù)的應(yīng)用優(yōu)勢(shì)
盡管計(jì)算機(jī)輔助語言學(xué)習(xí)技術(shù)可幫助增加大學(xué)非英語專業(yè)音素教改的成效,但是如果計(jì)算機(jī)輔助語言學(xué)習(xí)技術(shù)選擇及應(yīng)用不當(dāng),或者忽視學(xué)生實(shí)際學(xué)情,依然無法保障大學(xué)非英語專業(yè)音素教改成效。
但是自動(dòng)語音識(shí)別技術(shù)(ASR)可以讓計(jì)算機(jī)通過“聽”不同人連續(xù)的和階段性的說出的語音,在電腦中“寫”出所說內(nèi)容的方式,與人工判斷比較,自動(dòng)語音識(shí)別技術(shù)不僅能完成聲音向文字的轉(zhuǎn)換,按照使用需求,自動(dòng)語音識(shí)別技術(shù)可依照系統(tǒng)用戶情況分為特定和特定人的識(shí)別系統(tǒng),按照系統(tǒng)詞匯量可分為大詞、中詞、小詞的匯量系統(tǒng),按照輸入語音發(fā)音方式可分為自然發(fā)音的口語式和朗讀式兩種,按照輸入語音方言背景可分為方言語音、方言背景普通話、普通話三類識(shí)別系統(tǒng),按照輸入語音情感狀態(tài)可分為情感語音識(shí)別系統(tǒng)及中性系統(tǒng),借助以上功能優(yōu)勢(shì),自動(dòng)語音識(shí)別技術(shù):一方面可清晰的辨識(shí)出不同方言影響下非英語專業(yè)習(xí)得者發(fā)音的不夠標(biāo)準(zhǔn)化所引發(fā)的問題,幫助語言習(xí)得者和教師及時(shí)糾正及檢測(cè)語言習(xí)得給定的音素發(fā)音錯(cuò)誤。另一方面,自動(dòng)語音識(shí)別技術(shù)能便捷使用,具有強(qiáng)大數(shù)據(jù)分析能力及計(jì)算能力、能對(duì)學(xué)習(xí)者一對(duì)一自主分析性功能,在語音識(shí)別技術(shù)輔助下可實(shí)時(shí)檢測(cè)學(xué)習(xí)者發(fā)音錯(cuò)誤并提供糾正意見,能輔助學(xué)生及教師獲得反映發(fā)音質(zhì)量的指標(biāo),因此,作為計(jì)算機(jī)輔助語言學(xué)習(xí)技術(shù)中的佼佼者,則以其可及時(shí)、實(shí)時(shí)總結(jié)學(xué)生弱點(diǎn),推薦針對(duì)性強(qiáng)化訓(xùn)練方案等優(yōu)勢(shì)勝出。
三、大學(xué)非英語專業(yè)音素教改中自動(dòng)語音識(shí)別技術(shù)的應(yīng)用思路
第一步,實(shí)驗(yàn)數(shù)據(jù)的錄制及分析。
考慮到大學(xué)非英語專業(yè)音素教改中自動(dòng)語音識(shí)別技術(shù)的應(yīng)用方式多樣,自動(dòng)語音識(shí)別技術(shù)所依賴的載體也多種多樣,因此,以下以嵌入式設(shè)備如智能手機(jī)作為自動(dòng)語音識(shí)別技術(shù)應(yīng)用的載體,實(shí)驗(yàn)語音數(shù)據(jù)錄入使用自帶麥克風(fēng)的PDA。朗讀文本選擇英語900句作為語料,錄制每人20句,實(shí)驗(yàn)人隨機(jī)抽選大學(xué)非英語專業(yè)學(xué)生45人。年齡集中在20-25歲之間。
在明確錄制要求和對(duì)象之后,按照英語專家所設(shè)定的朗讀數(shù)據(jù)語素正確發(fā)音標(biāo)準(zhǔn)及標(biāo)注,定義音素發(fā)音情況為三類,如漏讀、錯(cuò)讀、正確。在系統(tǒng)衡量指標(biāo)并建設(shè)基本音素檢錯(cuò)系統(tǒng)之前,以簡(jiǎn)化模型為目標(biāo),增讀暫時(shí)忽視,標(biāo)注統(tǒng)計(jì)結(jié)果如下:
專家1音素發(fā)音標(biāo)注結(jié)果中正確17468、錯(cuò)讀519、漏讀402;
專家2音素發(fā)音標(biāo)注結(jié)果中正確17202、錯(cuò)讀713、漏讀474。
引入發(fā)音錯(cuò)誤標(biāo)注示例為“Would you answer the phone please”,錯(cuò)誤標(biāo)注為“w uh d y uw aa n s ax dh[z] ax fou n [ ] p liy z”。
第二步,確定系統(tǒng)衡量指標(biāo)。
按照衡量系統(tǒng)總體性能進(jìn)行兩大重要指標(biāo)的界定,即準(zhǔn)確率和召回率,以專家1標(biāo)注結(jié)果為標(biāo)準(zhǔn),計(jì)算準(zhǔn)確率和召回率分別為59%和69%。公式為:
召回率=系統(tǒng)檢測(cè)出的錯(cuò)誤數(shù)量/測(cè)試集中的音素?cái)?shù)量*100%
針對(duì)計(jì)算結(jié)果進(jìn)行分析可得,正確發(fā)音在所選語料中占多達(dá)數(shù),兩位專家標(biāo)注的結(jié)果類似,漏讀和錯(cuò)度的比率類似,這意味著大學(xué)非英語專業(yè)學(xué)生英語發(fā)音時(shí)容易漏讀音素而不是音素發(fā)音錯(cuò)誤。
第三步,建立基本音素檢錯(cuò)系統(tǒng)。
大學(xué)非英語專業(yè)音素教改中自動(dòng)語音識(shí)別技術(shù)的應(yīng)用到此階段,需要使用音素發(fā)音自動(dòng)檢錯(cuò)技術(shù)來輔助大學(xué)非英語專業(yè)音素教改的實(shí)踐應(yīng)用。判斷工作劉成偉,按照音素序列自動(dòng)切分朗讀句子,切分所的為每個(gè)音素對(duì)應(yīng)的語音小片段,之后進(jìn)行小片段發(fā)音質(zhì)量的判斷,此處可引入音素發(fā)音質(zhì)量COP輔助構(gòu)建系統(tǒng)。在實(shí)踐應(yīng)用中,音素切分網(wǎng)絡(luò)可直接使用朗讀文本對(duì)應(yīng)的音素序列作為切分網(wǎng)絡(luò),在聲學(xué)模型選擇方面,建議使用目前自動(dòng)語音識(shí)別中慣常使用的HMM模型,發(fā)音數(shù)據(jù)則選擇標(biāo)準(zhǔn)英文發(fā)音數(shù)據(jù),升學(xué)特征參數(shù)選擇MEL頻率倒數(shù)系數(shù)MFCC,音素識(shí)別列表方面按照常見的競(jìng)爭(zhēng)子集。
按照以上的操作方式,在部分音素競(jìng)爭(zhēng)子集的選擇階段,需要依照語音學(xué)和聲學(xué)經(jīng)驗(yàn),客觀規(guī)律中每個(gè)音素模型間的相似度和距離,統(tǒng)計(jì)人工標(biāo)注中容易混淆的音素對(duì)。部分音素競(jìng)爭(zhēng)子集可對(duì)應(yīng)如下:
(1)aa,對(duì)應(yīng)ae、ax、eh;(2)ao,對(duì)應(yīng)ax、er、eh;(3)aw,對(duì)應(yīng)ao、oo、uw;(4)ch,對(duì)應(yīng)sh、t;(5)eh,對(duì)應(yīng)ih、ax、el、ey;(6)s,對(duì)應(yīng)z。
第四步,使用獨(dú)立閾值提升錯(cuò)讀檢測(cè)性能。
按照上述三個(gè)步驟進(jìn)行基本英文發(fā)音檢錯(cuò)系統(tǒng)的描述,之后結(jié)果顯示所有音素的判斷閾值均一致。但是在研究結(jié)果中也充分體現(xiàn)出不同音素錯(cuò)讀和正確讀出的COP分布情況大相徑庭。以“ey”和“ax”為例,兩者錯(cuò)讀和正確讀出的區(qū)分相差度甚至二倍出現(xiàn)。基于此,進(jìn)行獨(dú)立閾值的優(yōu)化時(shí),可將所有訓(xùn)練數(shù)據(jù)里的COP值以音素為歸類和升序排序依據(jù),歸類所得形成N個(gè)棧VI,用VI[J]代表音素i的第i個(gè)樣本是否為錯(cuò)誤發(fā)音,可取值0或者1,之后將最佳獨(dú)立閾值訓(xùn)練過程抽象成數(shù)學(xué)問題,即從頂部開始,每個(gè)棧全出個(gè)ai數(shù)據(jù)繼而求出最優(yōu)化ai構(gòu)成的B維向量。按照以上思路進(jìn)行計(jì)算時(shí),可在初始化階段將樣本個(gè)數(shù)設(shè)置為0,得到的最多錯(cuò)誤樣本個(gè)數(shù)設(shè)定為E[m],那么可得最佳a(bǔ)in=0。在逐步進(jìn)行向量計(jì)算后,最終得到第i個(gè)棧中的第ain個(gè)樣本對(duì)應(yīng)COP值為最終訓(xùn)練所得到與因素對(duì)應(yīng)的檢錯(cuò)門限。
第五步,檢測(cè)改進(jìn)因素對(duì)齊網(wǎng)絡(luò)實(shí)現(xiàn)漏讀。
上文分析可得大學(xué)非英語專業(yè)學(xué)生在朗讀英語時(shí)會(huì)出現(xiàn)漏讀一個(gè)或者多個(gè)因素,建議假定發(fā)音人按照句子里的因素排列順序能完整朗讀整個(gè)例句,在因素切分之前可檢測(cè)出發(fā)音人漏讀音素,放棄音素邊界的劃分,并以此作為提升系統(tǒng)應(yīng)用性能的切入點(diǎn)。
在檢測(cè)后可限定因素對(duì)齊網(wǎng)絡(luò),比如搭建起識(shí)別網(wǎng)絡(luò),網(wǎng)絡(luò)主路徑可依照單詞中每個(gè)因素的排列順序來依次連接,每個(gè)因素均可跳過去,如此一旦出現(xiàn)某個(gè)因素漏讀,此識(shí)別網(wǎng)絡(luò)就可自動(dòng)識(shí)別漏讀二并得強(qiáng)制劃分出可匹配漏讀情況的小段語音數(shù)據(jù)。在識(shí)別器及自動(dòng)識(shí)別技術(shù)應(yīng)用靈敏度較高的情況下此種設(shè)計(jì)才能確保有效。但是識(shí)別網(wǎng)絡(luò)需要被限制,不能所有音素都能輕易被跳過。否則就會(huì)失去檢驗(yàn)和應(yīng)用的初衷。
參考文獻(xiàn):
[1]劉琳.基于自動(dòng)語音識(shí)別技術(shù)的計(jì)算機(jī)輔助語音培訓(xùn)軟件在大學(xué)非英語專業(yè)音素教學(xué)中成效性的實(shí)證研究[D].山東大學(xué),2012.
[2]胥文華.基于自動(dòng)語音識(shí)別的在線軟件對(duì)中國大學(xué)生音素學(xué)習(xí)的有效性研究[D].湖南大學(xué),2010.
[3]崔昆.高校英語語音教學(xué)中多媒體技術(shù)的運(yùn)用分析[J].科技展望,2016,26(08):214-215.