林敏 李強
摘 要:隨著科技的進步,家用電器逐步走向智能化、人性化。不同的家用電器便利了我們的家庭。但是隨著人們對生活要求的提高,總會發(fā)現(xiàn)便中還有著不便,而面對著這些新的不便,創(chuàng)客們正在用自己的智慧改造他們。而我們就打算利用語音控制使我們的生活走向新的科技生活,讓我們“靠嘴生活”。該項目主要利用arduino結(jié)合語音控制模塊以及相關(guān)的繼電器等器件,實現(xiàn)語音控制電燈、插座等家用電器的目標。
關(guān)鍵詞:arduino 語音控制 家用電器
中圖分類號:TP271 文獻標識碼:A 文章編號:1672-3791(2016)05(c)-0038-02
1 項目簡介
1.1 項目名稱
基于arduino的語音控制系統(tǒng)。
1.2 項目含義
近年來, 隨著語音識別與確認技術(shù)的逐漸成熟,基于語音識別技術(shù)的對話控制系統(tǒng)受到了越來越多的關(guān)注?,F(xiàn)有的語音技術(shù)有些是要先錄入聲音,然后采用對照的方式進行識別,這樣一來,不同的人說同樣的話,可能識別結(jié)果不一樣,該系統(tǒng)采用專門的控制板,不需要事先錄入,只需設(shè)置相應(yīng)的關(guān)鍵詞,就可以進行識別,配合arduino控制器,從而進行相應(yīng)的執(zhí)行動作。
1.3 項目產(chǎn)生的背景及原因
語音識別技術(shù),也被稱為自動語音識別(Automatic Speech Recognition,ASR),其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。
語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語音到語音的翻譯。
語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
1960年代,人工神經(jīng)網(wǎng)絡(luò)被引入了語音識別。這一時代的兩大突破是線性預(yù)測編碼Linear Predictive Coding (LPC)和動態(tài)時間規(guī)整Dynamic Time Warp技術(shù)。
1.4 項目實施的必要性
語音識別一直是人類的夢想,故事“阿里巴巴和四十大盜”里面的“芝麻開門”便反映了古人對語音產(chǎn)品的一個構(gòu)想。科技發(fā)展到今天,人類對語音識別的研究工作始于20世紀50年代。經(jīng)過50多年的努力和積淀,尤其進入90年代后,語音識別技術(shù)進一步成熟,開始向市場提供商業(yè)化運作比較成熟的產(chǎn)品。許多發(fā)達國家如美國、日本、韓國以及IBM、Apple、 Nuance 、Microsoft等公司都為語音識別系統(tǒng)的實用化開發(fā)研究投以巨資,但在生活中,語音識別似乎應(yīng)用的不太多,該項目采用簡單的結(jié)構(gòu),以語音識別模塊為核心,實現(xiàn)簡單的語音控制應(yīng)用,是語音識別技術(shù)在生活中的一個應(yīng)用實例。
語音識別技術(shù)發(fā)展到今天,特別是中小詞匯量非特定人語音識別系統(tǒng)識別精度已經(jīng)大于98%,對特定人語音識別系統(tǒng)的識別精度就更高。這些技術(shù)已經(jīng)能夠滿足通常應(yīng)用的要求。
2 項目實現(xiàn)的目標及實現(xiàn)方法
2.1 項目目標
該項目實現(xiàn)的目標為:通過語音識別模塊,識別人說話的意思,并發(fā)送信號給arduino,由arduino程序去控制相應(yīng)的執(zhí)行機構(gòu)動作,例如:開燈,關(guān)燈,打開或者關(guān)閉風扇等等。從而實現(xiàn)人機互動。語音模塊具備以下性能。
(1)高準確度和實用的語音識別效果。
(2)非特定人語音識別技術(shù):不需要用戶進行錄音訓(xùn)練。
(3)可動態(tài)編輯的識別關(guān)鍵詞列表:只需要把識別的關(guān)鍵詞以字符串的形式傳送進芯片,即可以在下次識別中立即生效。比如,用戶在51等MCU的編程中,簡單地通過設(shè)置芯片的寄存器,把諸如“你好”這樣的識別關(guān)鍵詞的內(nèi)容動態(tài)地傳入芯片中,芯片就可以識別這樣設(shè)定的關(guān)鍵詞語了。
(4)支持用戶自由編輯50條關(guān)鍵詞:在同一時刻,最多在50條關(guān)鍵詞語中進行識別,終端用戶可以根據(jù)場景需要,隨時編輯和更新這50條關(guān)鍵詞語的內(nèi)容。
2.2 實現(xiàn)方法
該項目采用現(xiàn)成的語音控制模塊,但是模塊本身有局限性,就是只有2個控制引腳,只能控制2個外部器件。大大限制了其實用性,好在其自帶串口通信引腳,我們就用arduino(arduino本質(zhì)上是一種AVR單片機,開發(fā)者對其進行了二次開發(fā),大大降低了使用的難度)和其進行串口通信,arduino本身自帶50多個控制引腳并且還可以擴展以獲得更多引腳,這樣,通過對語音控制模塊編程,語音控制模塊負責將聲音轉(zhuǎn)換為相應(yīng)的代碼(例如語音“打開電燈”對應(yīng)“001”,“關(guān)閉電燈”對應(yīng)“002”),并通過串口發(fā)送給arduino,然后再對arduino編程,使其接受到相應(yīng)的代碼后,能執(zhí)行相關(guān)操作(例如將arduino的13號輸出腳通過繼電器控制電燈,當arduino接受到“001”時候,使得13號輸出腳輸出高電平從而點亮電燈,接受到“002”時候,使得13號輸出腳輸出低電平從而關(guān)閉電燈)。這樣,需要控制多種電器的話,只需要依次對應(yīng)在語音模塊和arduino里增加程序即可!
3 結(jié)語
該項目是南京機電職業(yè)技術(shù)學(xué)院2015年度三創(chuàng)大賽決賽的入圍作品,通過近一個月的努力,我們最終調(diào)試完成,并在決賽中獲得了二等獎的好成績!
“車到山前必有路”并不是自我安慰,而是真實的心理現(xiàn)象。每個人都有一些創(chuàng)意,但是當這些創(chuàng)意真正需要實現(xiàn)的時候,往往覺得無從下手。其實,當你真想完成這個項目的時候,通過查閱資料、請教他人、相互討論等方式,是可以克服這些困難的。
當你敢想、敢做的時候,哪怕最終失敗,你也是最優(yōu)秀的創(chuàng)客!
參考文獻
[1] Simon Monk,著.創(chuàng)客電子電子制作DIY指南[M].孫宇,譯.人民郵電出版社,2014.
[2] Simon Monk,著.arduino編程從零開始[M].劉椮楠,譯.科學(xué)出版社,2013.
[3] 陳呂洲.arduino程序設(shè)計基礎(chǔ)[M].北京航空航天大學(xué)出版社,2015.