萬阿平
(江蘇聯(lián)合職業(yè)技術(shù)學(xué)院揚(yáng)州分院,江蘇 揚(yáng)州 225003)
隨著大數(shù)據(jù)技術(shù)的發(fā)展,有必要開發(fā)出具有更強(qiáng)大計(jì)算能力的芯片。傳統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)的芯片在用于大數(shù)據(jù)并行計(jì)算時需要復(fù)雜的指令系統(tǒng),計(jì)算速度不能滿足實(shí)際要求。芯片的本質(zhì)是集成電路,其主要制作工藝是將集成電路制造在半導(dǎo)體晶圓上,當(dāng)前集成電路技術(shù)發(fā)展迅速,晶體管可達(dá)到每平方毫米100萬的數(shù)量級。
在信息化時代,電子產(chǎn)品得到越來越廣泛的應(yīng)用,其核心技術(shù)是芯片的設(shè)計(jì)制造。芯片被視作微型“計(jì)算機(jī)”,能夠嵌入在卡片、存貨清單和設(shè)備中,人工智能芯片這種具有復(fù)雜算法處理能力的芯片其性能主要取決于內(nèi)部特定的結(jié)構(gòu)設(shè)計(jì)和簡單的指令集,如類腦芯片。與傳統(tǒng)語音芯片相比,智能語音芯片的特點(diǎn)和優(yōu)勢在于它可以通過使用元器件對接收到的命令進(jìn)行信息分析和分類,并指導(dǎo)機(jī)器執(zhí)行各種動作。同時,智能語音芯片還可以進(jìn)行高質(zhì)量、高壓縮率的錄音,并在需要時進(jìn)行回放,從而實(shí)現(xiàn)人機(jī)對話。
人工智能或機(jī)器翻譯技術(shù)在自然語言處理方面已獲得許多成果。經(jīng)過國內(nèi)外媒體的廣泛報(bào)道,智能語音技術(shù)受到公眾的廣泛關(guān)注,這也使得智能語音技術(shù)得到飛速發(fā)展。目前,人機(jī)交互技術(shù)依托人工智能和大數(shù)據(jù)技術(shù)發(fā)展,在智能化、自動化趨勢下蘊(yùn)含巨大的商業(yè)價值。而語音芯片作為現(xiàn)代汽車智能化的表現(xiàn),能夠滿足車輛消費(fèi)者在車內(nèi)工作、休閑娛樂等要求,是行業(yè)發(fā)展的必然趨勢。
目前,智慧系統(tǒng)的研發(fā)困境主要是自主核心技術(shù)缺乏,產(chǎn)品信息共享體系不足和校企聯(lián)合培養(yǎng)人才儲備不足等。我國的新能源汽車需要在車載新能源系統(tǒng)、驅(qū)動系統(tǒng)及控制系統(tǒng)方面逐步實(shí)現(xiàn)國產(chǎn)化,這在合資發(fā)展道路上是難以實(shí)現(xiàn)的,從而造成在生產(chǎn)或出口過程中投資成本較大。而智能網(wǎng)聯(lián)市場還處在萌芽期,部分細(xì)分市場蘊(yùn)藏著巨大的潛力,未來還可能應(yīng)用到發(fā)動機(jī)、變速箱等機(jī)械設(shè)備中,無人駕駛是重點(diǎn)發(fā)展方向[1]。近年來,各車企紛紛發(fā)布智能網(wǎng)聯(lián)汽車戰(zhàn)略,盡管他們的智能網(wǎng)聯(lián)系統(tǒng)名稱不同,但功能大多包含語音識別、語音控制、云服務(wù)和空中下載技術(shù)等[2]。如今,傳統(tǒng)信息共享平臺已不能滿足研發(fā)企業(yè)的大量信息共享需求,因此需要對信息交互平臺進(jìn)行完善,以便其能更廣泛地應(yīng)用于新能源汽車領(lǐng)域。在我國高等職業(yè)院校教育改革目標(biāo)下,采取“校企合作,產(chǎn)教融合”的教學(xué)模式推動我國實(shí)用性技術(shù)人才培養(yǎng),但目前還處于探索階段,還需在地方政府政策引導(dǎo)下不斷拓展和加深合作范圍及合作深度。
目前,國家不斷提倡環(huán)境保護(hù),營造采用綠色能源的社會環(huán)境,因此新能源汽車成為汽車行業(yè)的主要發(fā)展方向。而數(shù)字化系統(tǒng)在新能源汽車中的應(yīng)用也越來越廣泛,如音樂播放器、藍(lán)牙電話、車載導(dǎo)航和可視化通訊等,這些都帶來了更加舒適便利的駕駛體驗(yàn)。新能源汽車本身就具有人工智能的技術(shù)和硬件基礎(chǔ),搭載智能語音系統(tǒng)以后使得其應(yīng)用場景更為豐富和廣泛,可以滿足用戶的更多需求,如商務(wù)汽車和房車需要具備工作學(xué)習(xí)和生活的必備條件,智能翻譯可以幫助連線跨國會議和接打國際長途電話等。一方面,智能語音技術(shù)可以賦能傳統(tǒng)家電,延伸設(shè)備的功能,提升人們的智能使用體驗(yàn);另一方面,隨著人類生活水平的改善,未來的家居電氣設(shè)備種類將日益增多,能夠搭載智能語音功能的或?qū)⑦_(dá)到近百款。
語音芯片需要運(yùn)用到多種智能語音技術(shù),包括信號處理與模式、發(fā)生機(jī)理與聽覺機(jī)理、概率論與信息論和人工智能等。而芯片與集成電路制造屬于精密儀器制造,對制造環(huán)境和運(yùn)行環(huán)境具有較高要求,對應(yīng)的開發(fā)與制造成本相對較高。
語音芯片按照對象與內(nèi)容可以分為特定人語音芯片和非特定人語音芯片[3]。特定人語音芯片用于對指定的人進(jìn)行語音識別,在進(jìn)行語音識別前必須將用戶的語音參考樣本存儲在數(shù)據(jù)庫中作為比較,也就是說,必須在使用前對特定人的語音進(jìn)行訓(xùn)練。通常在機(jī)器提示下訓(xùn)練固定次數(shù),機(jī)器便能掌握特定人員的講話習(xí)慣與特點(diǎn),進(jìn)行更為貼切的交互。非特定人語音芯片是指無特定人員語音資料庫的語音技術(shù),無論年齡和性別,只要說的是同一種語言,機(jī)器就能進(jìn)行識別。非特定人語音芯片的應(yīng)用模式是在產(chǎn)品定型前,根據(jù)確定的十幾個語音交互條目,采集約200人的語音樣本,通過計(jì)算機(jī)算法處理交互條目的語音模型和特征數(shù)據(jù)庫,然后在芯片上燒錄。若將該燒錄芯片應(yīng)用于智能娃娃、電子寵物等機(jī)器,這些機(jī)器就具有人機(jī)交互功能,實(shí)現(xiàn)兒童與玩具的雙向互動,起到陪伴作用。但該模式具有顯著的優(yōu)缺點(diǎn),優(yōu)點(diǎn)是無需采集多人語音樣本即可進(jìn)行交互,缺點(diǎn)是識別準(zhǔn)確率不高,性能也不穩(wěn)定。
圖1給出了語音芯片在新能源汽車中的應(yīng)用設(shè)計(jì)流程。語音芯片的設(shè)計(jì)需滿足如下功能:① 準(zhǔn)確簡單的語音指令;② 完成簡單的人機(jī)語音交互;③ 提升語音準(zhǔn)確率,降低背景噪聲干擾;④ 多復(fù)用設(shè)計(jì),在多種場景下可以自動匹配模式;⑤ 低功耗,保證使用時間可達(dá)一周;⑥ 系統(tǒng)遇到故障能自動重啟,保證使用的穩(wěn)定性;⑦ 具有一定的糾錯功能,自動錄入錯誤并糾正;⑧ 適用性廣,可嵌入多種電子設(shè)備并保持正常運(yùn)行。
圖1 語音芯片應(yīng)用設(shè)計(jì)流程
語音系統(tǒng)的設(shè)計(jì)架構(gòu)如圖2所示,其一般操作順序?yàn)椋合到y(tǒng)錄入語音,完成語音詞匯特征提取,構(gòu)建聲學(xué)模型,構(gòu)建語音模型,詞匯與語音庫詞匯解碼,設(shè)置好中斷函數(shù),最后開啟中斷允許位。如果不使用中斷函數(shù)的方式,需要在“開始語音”后判斷寄存器(B2H)中的值,如果寄存器中的值為21H,就表示有結(jié)果產(chǎn)生,如果沒有就返回,此后的讀取候選列表等操作與中斷方式相同。
圖2 語音系統(tǒng)設(shè)計(jì)架構(gòu)
嵌入式語音芯片可分為封閉域和開放域,封閉域范圍圍繞指定的字詞集合,即在開發(fā)系統(tǒng)的時候會設(shè)定好應(yīng)當(dāng)注意的字詞,對范圍外的詞語語音系統(tǒng)識別得不夠準(zhǔn)確。而這樣的設(shè)定字或詞的方式可通過聲學(xué)模型和語音模型進(jìn)行裁剪,有利于減小引擎的運(yùn)算量,最后再將引擎封到嵌入式語音芯片中,這樣便可完全脫離云端,無需連網(wǎng)也可以完成智能語音識別。目前主流的語音芯片是將日常生活語音轉(zhuǎn)化成文本,屬于開放域語音識別,如果不與人工智能結(jié)合,其應(yīng)用場景不如封閉域語音識別廣泛。典型的應(yīng)用場景就是在汽車人機(jī)交互導(dǎo)航地址搜索框中錄入語音,系統(tǒng)根據(jù)用戶發(fā)布的語音進(jìn)行識別,搜索出相關(guān)的地址信息進(jìn)行導(dǎo)航。
伴隨著人工智能、大數(shù)據(jù)等技術(shù)的發(fā)展,新能源汽車的智能化水平不斷提升,增強(qiáng)了產(chǎn)品的舒適性和便利性。語音芯片的設(shè)計(jì)和應(yīng)用推動了第3次人工智能熱潮,未來智能語音技術(shù)將在集成更多功能的同時控制能耗,并將大量應(yīng)用到新能源汽車等領(lǐng)域,使人機(jī)交互方式得到推廣和應(yīng)用。