韓吉辰
聲音是一種振動(dòng)波,具有一定的能量,利用聲電傳感器(比如簡(jiǎn)單的話筒)就可以變成電信號(hào),從而控制某個(gè)動(dòng)作。
我們?cè)S多人都見(jiàn)過(guò)一種有趣的“聲控娃娃”,你對(duì)它拍一下手掌,它就會(huì)哈哈大笑,有時(shí)你打一個(gè)噴嚏或外面放一顆爆竹,它也會(huì)哈哈大笑;另一種高級(jí)“聲控娃娃”、“聲控狗”、“聲控貓”則只對(duì)掌聲反應(yīng),拍一下手掌它就動(dòng)起來(lái),再拍一下手掌就停止,其他響聲對(duì)它不起作用,原來(lái)這種聲控技術(shù)復(fù)雜一些,它可以自動(dòng)識(shí)別聲音的頻率,手掌的聲音和其他的聲音的頻率,是有區(qū)別的。
家庭使用的“聲控電燈”,是用一個(gè)特制的發(fā)聲哨音控制,也可以根據(jù)人的腳步聲控制,使用起來(lái)十分方便;“聲控電扇”可以利用掌聲控制開(kāi)關(guān)和轉(zhuǎn)速;還有“聲控照相機(jī)”,可以根據(jù)掌聲控制快門(mén),使照片拍得更加自然。此外還有“聲控收音機(jī)”、“聲控彩色電視機(jī)”、“聲控空調(diào)”、“聲控微波爐”和“聲控噴泉魚(yú)缸”等等。
科學(xué)家還發(fā)明了具有兼容性的“聲音遙控器”,它可以同時(shí)適用8種家用電器,遙控器中先進(jìn)的語(yǔ)音識(shí)別系統(tǒng),可以對(duì)不同用戶的聲音進(jìn)行識(shí)別,最多可以識(shí)別4個(gè)用戶。這個(gè)遙控器還可以對(duì)語(yǔ)音進(jìn)行自動(dòng)編程,并可以進(jìn)行修改,它最多可以識(shí)別54個(gè)聲音指令。
利用“口令”的聲控技術(shù)
真正可以聽(tīng)懂語(yǔ)言的聲控技術(shù)就復(fù)雜多了。我們知道,語(yǔ)言千變?nèi)f化,但是最基本的發(fā)音只有幾十個(gè)拼音字母,稱為“語(yǔ)音代碼”。科學(xué)家將常用單字、詞匯編成數(shù)據(jù)輸入電腦,當(dāng)對(duì)它口授一個(gè)字詞時(shí),電腦會(huì)緊張地與“字典”中各字詞對(duì)照,找出相應(yīng)的字詞并送出電信號(hào),接通相應(yīng)的開(kāi)關(guān),從而控制相應(yīng)的動(dòng)作。
這種會(huì)聽(tīng)話的機(jī)器用途廣泛,例如“聲控電話”,只要對(duì)著話筒說(shuō)出電話號(hào)碼。就會(huì)自動(dòng)接通。紐約電話公司生產(chǎn)的一種聲控電話機(jī),具有更高的“智能”,雙職工家庭中的孩子,遇到事情,只要拿起電話高叫一聲:“媽媽!”便可與他們正在工作的媽媽通話。
在“聲控電梯”中,只要說(shuō):“先上5樓,再到8樓!”就會(huì)按序自動(dòng)執(zhí)行;有一種“聲控輪椅”能按口令前進(jìn)后退或轉(zhuǎn)彎,給殘疾人帶來(lái)了方便;還有一種“自動(dòng)聲控洗衣機(jī)”可以按照口令進(jìn)行一系列程序完成洗衣工作;在高級(jí)辦公室或高級(jí)病房中,有一種“聲控機(jī)器人”能聽(tīng)懂幾十條口令,甚至能做到“人機(jī)對(duì)話”,很受歡迎。
世界上第一輛能用人的語(yǔ)音控制的新型汽車,最近由英國(guó)埃塞克斯的一家汽車配件供應(yīng)廠研制成功。讓汽車進(jìn)行語(yǔ)音辨別的基本程序是:駕車人的口令事先存貯在汽車的微電腦中。駕車時(shí),只要重復(fù)所需的口令,電腦馬上會(huì)將你說(shuō)的口令與原先存貯的口令作比較。如果吻合,汽車就會(huì)按照口令的要求自動(dòng)操作。人的口令是由話筒傳達(dá)的,聲控系統(tǒng)辨別口令的時(shí)間只需1秒,汽車在0.5秒內(nèi)即能產(chǎn)生反應(yīng)。
最近,德國(guó)也開(kāi)發(fā)出“車載語(yǔ)音識(shí)別導(dǎo)航系統(tǒng)”,可以識(shí)別800個(gè)地名,駕乘人員只需說(shuō)出目的地,導(dǎo)航系統(tǒng)便能很快找出最佳路線,在行駛過(guò)程中的每一個(gè)路口均給出語(yǔ)音提示,并在屏幕上顯示出相關(guān)路線。
飛機(jī)在飛行或空戰(zhàn)中,一旦飛行員負(fù)了傷,是非常危險(xiǎn)的?,F(xiàn)在,飛行員可以用聲音來(lái)繼續(xù)駕駛飛機(jī)了。語(yǔ)音識(shí)別器將飛行員的講話聲音與貯存的聲音相比較,只要聲音一致,飛機(jī)就能自動(dòng)地完成各種動(dòng)作,從而化險(xiǎn)為夷,安全返回。而在航天飛機(jī)中,由于飛行速度必須達(dá)到極快的“第一宇宙速度”,在飛行過(guò)程中,宇航員處于超重或失重狀態(tài),行動(dòng)十分不便,于是科學(xué)家研制了“航天專用聲控機(jī)”。它能聽(tīng)懂14條口令:指令、停止、前進(jìn)、后退、向左、向右、旋轉(zhuǎn)、保持、開(kāi)動(dòng)、俯仰、偏航、下降、上升、移動(dòng),以及由它們構(gòu)成的有意義指令,如向上移動(dòng),向右旋轉(zhuǎn)等,使宇航員以口代手,既方便又安全。更為先進(jìn)的聲控裝置還在研制中,將使人類飛向茫茫宇宙變得更加安全可靠。
“能聽(tīng)會(huì)說(shuō)”的計(jì)算機(jī)
聲控技術(shù)的發(fā)展使“語(yǔ)音寫(xiě)作”成為現(xiàn)實(shí),我們對(duì)著計(jì)算機(jī)讀完一篇文稿,屏幕上立即出現(xiàn)相應(yīng)的文字,隨即,計(jì)算機(jī)將文稿朗讀一遍,以便進(jìn)行校對(duì)。然后,作者在手寫(xiě)輸入板上用筆進(jìn)行修改后,即可發(fā)出打印指令,一篇稿件就這樣完成了。
這是中國(guó)科技大學(xué)最近研制成功的“能聽(tīng)會(huì)說(shuō)”的計(jì)算機(jī)的特殊功能。對(duì)每個(gè)詞匯的識(shí)別時(shí)間為0.3秒。只要操作者使用標(biāo)準(zhǔn)語(yǔ),以播音速度念出單詞或句子,電腦便能將語(yǔ)音信號(hào)轉(zhuǎn)換成文字,顯示在屏幕上。系統(tǒng)還設(shè)有瞬時(shí)反饋裝置,當(dāng)電腦不能正確識(shí)別某一語(yǔ)句時(shí),屏幕右下角的卡通人便會(huì)用手搔搔頭皮,并發(fā)出“聽(tīng)不懂!”的呼聲,表示不能理解你的意思。你只好再重復(fù)一次。這項(xiàng)技術(shù)也可以用于“語(yǔ)音排版”上面,非常便捷。
有一些高級(jí)醫(yī)院開(kāi)發(fā)的聲控電腦管理系統(tǒng),可將病人口述的病情以及醫(yī)生的診斷和處方顯示在屏幕上并打印出來(lái)。聲控技術(shù)的發(fā)展出現(xiàn)了能夠進(jìn)行人機(jī)對(duì)話的產(chǎn)品,即機(jī)器人能夠聽(tīng)懂人的語(yǔ)音命令,并作出相應(yīng)的反應(yīng)(如做動(dòng)作、說(shuō)話發(fā)聲等),比如只要你向它發(fā)出問(wèn)候,它就會(huì)迅速而準(zhǔn)確地作出回答,聲音近似于播音員的嗓音。一個(gè)小朋友念了一句唐詩(shī)“白日依山盡”,機(jī)器人竟機(jī)靈地接了一句“黃河入海流”,博得周圍人們的陣陣贊嘆。
能識(shí)別主人的“聲控技術(shù)”
一般聲控裝置只認(rèn)口令,誰(shuí)發(fā)話它都執(zhí)行。但有些場(chǎng)合,人們希望它只聽(tīng)一個(gè)人或指定的幾個(gè)人的命令。你想,任何人一喊“芝麻開(kāi)門(mén)”,山門(mén)就大開(kāi),這樣的裝置多不保險(xiǎn)啊!于是聲控技術(shù)出現(xiàn)新產(chǎn)品,就是“聲紋鎖”。我們每個(gè)人的聲音各不相同,和指紋一樣,一般終身不變,稱作“聲紋”。經(jīng)過(guò)高科技處理的聲紋圖譜能夠提供一種有效的個(gè)人識(shí)別方法。將主人的“聲紋”預(yù)留在聲控裝置中,只有主人說(shuō)一句話,它才打開(kāi),其他人說(shuō)同樣一句話,它卻無(wú)動(dòng)于衷。這樣的防盜門(mén)和保險(xiǎn)箱就更加安全了。國(guó)外流行一種“聲控信用卡”,將卡放入銀行出納機(jī)內(nèi),對(duì)微型話筒說(shuō)口令,裝置識(shí)別無(wú)誤后,進(jìn)行交易。如果換一個(gè)人持卡去說(shuō)同樣的口令,出納機(jī)拒絕交易。這種能識(shí)別主人聲音的聲控技術(shù)很受歡迎。發(fā)展很快,還出現(xiàn)能識(shí)別特定的“幾個(gè)”主人聲音的“聲紋鎖”,非常靈活又非??煽?。
還有一種手機(jī)特有的聲控技術(shù),預(yù)置近40個(gè)聲控指令,可通過(guò)簡(jiǎn)短的詞語(yǔ)激發(fā)設(shè)定的功能。如果你只設(shè)定本人“聲紋鎖”,那么別人就無(wú)法使用這個(gè)手機(jī),非常安全。
核武器具有極大的威懾力量,也具有巨大的破壞力,因此核武器的使用必須極為慎重,一般直接由國(guó)家最高領(lǐng)導(dǎo)人本人掌握。于是,對(duì)于核武器的啟動(dòng)發(fā)射設(shè)計(jì)了復(fù)雜的開(kāi)啟程序,除了使用一套嚴(yán)密的加密系統(tǒng)以外,還使用先進(jìn)的“聲紋”系統(tǒng)加大安全性。只有當(dāng)最高領(lǐng)導(dǎo)人“本人”親自發(fā)出口令,系統(tǒng)與原來(lái)儲(chǔ)藏的“聲紋”核對(duì)無(wú)誤后,核武器才能最終啟動(dòng)。
德國(guó)一家大企業(yè)安置了一套“電子門(mén)衛(wèi)”,語(yǔ)音識(shí)別器中貯存了本單位幾百名職工的“聲音特征”。只要是本單位的職工,對(duì)著崗?fù)ぶ械脑捦沧詧?bào)姓名,門(mén)就打開(kāi):請(qǐng)進(jìn)!幾百名職工的聲音它都能識(shí)別,即使有的職工患病聲音嘶啞,它也能識(shí)別放行(這叫模糊識(shí)別技術(shù))。但是如果是外單位的人,假冒職工姓名,它卻讓來(lái)者吃“閉門(mén)羹”:“對(duì)不起,不認(rèn)識(shí)你!”這套聲控系統(tǒng)實(shí)施以來(lái),沒(méi)有發(fā)生任何事故,受到歡迎。那么,這套先進(jìn)的“聲控電子門(mén)衛(wèi)”叫什么名字呢?就叫“芝麻,開(kāi)門(mén)!”
責(zé)任編輯:龐云