墨汁做壽
與我們已經(jīng)習(xí)慣的所見即所得操控交互方式不同,語音操控可以讓用戶無需接觸輸入設(shè)備進(jìn)行遠(yuǎn)程操控,在很多情況下設(shè)備也會(huì)以語音方式進(jìn)行回饋,所以用戶也無需注視設(shè)備。無需接觸和注視設(shè)備的交互和操控方式,在很多情況下有著非常重要的意義,例如在運(yùn)動(dòng)、駕駛時(shí),可以對(duì)多媒體、通訊設(shè)備等進(jìn)行操控(圖1),無需使用雙手和轉(zhuǎn)移視線,顯然更加安全。
與PC時(shí)代和早期的語音識(shí)別技術(shù)不同,目前語音交互中最關(guān)鍵的語音識(shí)別和語義解釋能力,大部分并不是基于本機(jī)的數(shù)據(jù)庫和計(jì)算能力,而是通過互聯(lián)網(wǎng)連接到廠商的語音引擎,甚至可能是廠商購買的各大語音引擎提供商的相應(yīng)服務(wù)器上進(jìn)行處理的。借助服務(wù)器端提供的超大數(shù)據(jù)庫和強(qiáng)大的計(jì)算能力,現(xiàn)代語音交互的能力當(dāng)然可以遠(yuǎn)超單機(jī)端,不過不同的智能產(chǎn)品,實(shí)際的交互能力還是從限定的單詞到比較隨意的日常語言都有,其使用的方便程度恰恰就反映出這些智能產(chǎn)品的智能程度。
在選擇語音設(shè)備的時(shí)候,應(yīng)該注意哪些問題呢?其實(shí)從很多發(fā)布會(huì)的演示就可以看出來,影響語音交互能力的主要就是識(shí)別能力,而識(shí)別能力的內(nèi)在是數(shù)據(jù)庫和計(jì)算能力,外在則是拾音效果。不過,科技大佬們?cè)谡古_(tái)上的講話和演示實(shí)在距離我們太遠(yuǎn),因此我們自己也進(jìn)行了一些測(cè)試,來看看不同設(shè)備和使用狀況究竟會(huì)對(duì)語音交互能力造成怎樣的影響。
外部環(huán)境測(cè)試中,我們采用手機(jī)安裝識(shí)別率非常好的訊飛語音引擎進(jìn)行測(cè)試,分別在特意靠近至離嘴部?jī)H有30cm,以及距離1m左右的典型使用距離下,還使用了外接藍(lán)牙耳機(jī)。同一臺(tái)手機(jī)在30cm距離上的語音識(shí)別效果很好,基本可以做到不遺漏地執(zhí)行所有操作和輸入任務(wù)(圖2),在1m處則出現(xiàn)了一些識(shí)別錯(cuò)誤,且加大聲音也不能獲得完美效果,這應(yīng)該與外界干擾和拾音的定向能力有關(guān)(圖3)。需要注意的是,我們的測(cè)試為相對(duì)安靜的室內(nèi)環(huán)境,如果在室外或行車途中,因?yàn)闀?huì)收錄到更多的環(huán)境噪聲,識(shí)別率還會(huì)下降。
在外設(shè)測(cè)試中,我們使用了多款藍(lán)牙和有線耳麥,測(cè)試過程中出現(xiàn)了非常有趣的問題,部分藍(lán)牙與有線耳機(jī)的識(shí)別效果與在近處使用手機(jī)麥克風(fēng)類似,識(shí)別能力很不錯(cuò),但也有通話質(zhì)量非常好的耳機(jī)出現(xiàn)了與語音軟件的兼容性問題。另一方面,有些耳機(jī)自帶語音控制鍵(圖4),可啟動(dòng)大部分手機(jī)、平板電腦等設(shè)備自帶的語音軟件,也可以明顯提升語音互動(dòng)功能的易用性。
內(nèi)在能力的測(cè)試與各個(gè)廠商的技術(shù)有關(guān),由于各個(gè)廠商甚至各個(gè)版本的著重點(diǎn)不同,在各個(gè)方面的表現(xiàn)可能出現(xiàn)特別明顯的差異,我們更需要的是與設(shè)備定位最適合的能力,而難以判斷哪一個(gè)廠商的產(chǎn)品是最好的。所以我們嘗試進(jìn)行了另一項(xiàng)測(cè)試,那就是使用同樣引擎的產(chǎn)品,是否會(huì)有性能差異,例如內(nèi)地廠商廣泛采用的訊飛引擎,在不同的設(shè)備和APP中是否會(huì)有不同的表現(xiàn)。
我們使用多個(gè)基于訊飛語音引擎的手機(jī)自帶語音互動(dòng)程序和基于訊飛語音引擎的APP,如語點(diǎn)數(shù)碼、咪咕靈犀、訊飛輸入法等等。另外筆者也有幸接觸過一些機(jī)器人生產(chǎn)商,并進(jìn)行過一些實(shí)際體驗(yàn),這些機(jī)器人產(chǎn)品的語音智能部分,同樣大都是使用訊飛的技術(shù)。從筆者的測(cè)試看,這些產(chǎn)品除了定位功能不同外,竟然也存在著語音識(shí)別的差異,這可能與各個(gè)軟硬件廠商自身的一些優(yōu)化設(shè)計(jì)有關(guān),也可能與其購買的訊飛服務(wù)等級(jí)有關(guān)系。
從以上的結(jié)果可以看出,即使是使用同一技術(shù)或同一品牌,甚至同型號(hào)不同檔次的語音互動(dòng)設(shè)備,都可能存在著性能的差異,大家在實(shí)際選購時(shí)應(yīng)該予以重視。
前面已經(jīng)提到,語音交互是目前智能化產(chǎn)品中使用最廣泛的智能交互方式,幾乎所有類型的智能設(shè)備,如智能手機(jī)與平板電腦、智能穿戴設(shè)備、智能家居等,都大量使用了這一交互模式。我們以下介紹的只是其中一些常見或典型的產(chǎn)品,僅供大家了解或參考選擇。
AI音箱是近期智能硬件的熱點(diǎn)之一,市場(chǎng)嗅覺一向靈敏的小米當(dāng)然也不會(huì)放過這個(gè)領(lǐng)域,小米AI音箱就是一款性能全面、價(jià)格實(shí)惠的產(chǎn)品。雖然價(jià)格并不昂貴,但這款音箱的定位卻相當(dāng)高,它并非是簡(jiǎn)單的陪伴式互動(dòng)產(chǎn)品,而是加入了智能家居控制、自我學(xué)習(xí)與記憶能力,大大提升了實(shí)用性(圖5)。
小米AI音箱的最基本功能是各種語音交互和陪伴能力,例如可以用語音操控其音量、播放,也可以要求它播放一首歌、念一首詩、讀一篇童話故事或是詢問今天的天氣等。如果家中有兼容的智能家居,還可以將其與智能家居連接,作為智能家居的中心,通過語音直接操控這些智能家居產(chǎn)品。通過學(xué)習(xí)與記憶能力,用戶可以讓其逐漸了解自己的欣賞習(xí)慣、保留語音備忘、設(shè)置鬧鐘等。再進(jìn)一步,用戶可以讓它提供更智能化的服務(wù),例如起床、離家或回家后,只需要一個(gè)特定命令,就能通過小米AI音箱同時(shí)指揮多個(gè)智能家居提供服務(wù)。如離家時(shí)向小米AI音箱道別,就會(huì)自動(dòng)關(guān)閉一些電器和燈光等,而歸家后只需打個(gè)招呼,就可以開啟燈光、熱水器、咖啡機(jī)等。
目前很多所謂的機(jī)器人,實(shí)際上就是一種基于語音交互的智能前端設(shè)備,例如科大訊飛自己推出的阿爾法蛋系列產(chǎn)品。阿爾法蛋有多種產(chǎn)品,尺寸差異較大,但外形設(shè)計(jì)和基本能力類似,搭載訊飛淘云TY OS智能系統(tǒng),主打陪伴市場(chǎng)(圖6)。
阿爾法小蛋主要面向兒童市場(chǎng),可以提供語音互動(dòng)、云端資源、雙語教學(xué)、生活查詢等功能,其中語音互動(dòng)則包括與家長(zhǎng)的遠(yuǎn)程聊天和通過訊飛技術(shù)與阿爾法蛋進(jìn)行語音交流。其前端的屏幕可以顯示多種表情或播放視頻,讓孩子獲得更好的交互體驗(yàn)。
暴風(fēng)電視系列已經(jīng)全面進(jìn)入了AI智能時(shí)代,全面采用語音操控,而其面向大屏需求推出的“無屏電視”,即Max 6和Real 6投影機(jī)也具有相應(yīng)的功能。相對(duì)于Max 6,更新的Real 6除了在亮度、投影性能等方面進(jìn)行了升級(jí),也提升了語音交互能力和智能表現(xiàn),用戶可以用日常語言對(duì)Real 6進(jìn)行操控,并且可以同時(shí)布置多個(gè)任務(wù)。而Real 6除了能夠自行分析用戶語言,更準(zhǔn)確地理解操控指令外,還可以分辨家庭內(nèi)多個(gè)用戶的語音,并通過各個(gè)用戶的常用操作,猜測(cè)用戶的喜好,針對(duì)性地進(jìn)行個(gè)性化推薦(圖7)。
暴風(fēng)的其他電視機(jī)(圖8)在語音互動(dòng)和AI方面的表現(xiàn)也比較突出,相對(duì)于使用遙控器進(jìn)行語音操控的很多其他品牌產(chǎn)品,暴風(fēng)更強(qiáng)調(diào)直接語音操控,特別適合無法使用遙控器的場(chǎng)合,如廚房,或者不適合學(xué)習(xí)使用遙控器的用戶,如兒童或老人。因此其“暴風(fēng)大耳朵”系統(tǒng)就需要使用更靈敏、聚焦范圍更廣的拾音裝置,并且能夠更好地分辨人聲與噪聲、日常對(duì)話和命令語句。
智能手表,特別是偏向運(yùn)動(dòng)的智能手表,也是非常適合語音互動(dòng)的智能設(shè)備,畢竟手表表盤的面積相對(duì)于我們的手指來說過于狹小了。Ticwatch 2悅動(dòng)智能手表是一款高性價(jià)比的全能型產(chǎn)品,它在不足千元的價(jià)位上,提供了計(jì)步、心率、GPS定位等運(yùn)動(dòng)功能,同時(shí)支持手表聽歌和離線支付功能,并且有多款色彩和大量表帶設(shè)計(jì)可選。在不同的使用狀況下,Ticwatch 2悅動(dòng)智能手表的續(xù)航時(shí)間在12小時(shí)~48小時(shí)之間,基本可以滿足日常使用和出游的需要, IP65的防護(hù)級(jí)別可以保證用戶在戶外運(yùn)動(dòng)時(shí)無懼雨雪,但不能佩戴它游泳和洗澡(圖9)。
這款手表的語音助手支持撥打電話、查詢地圖和各種信息、翻譯、設(shè)定鬧鐘等多種功能,配合其特色的手勢(shì)操作、表殼觸控等,可以快捷地進(jìn)行各種操控。Ticwatch還提供了多個(gè)系列和定位的智能手表產(chǎn)品,均支持語音互動(dòng),對(duì)自主通話、NFC、高端防護(hù)等有需求的用戶,可以選擇Ticwatch的其他智能手表產(chǎn)品(圖10)。
作為一種特色鮮明,同時(shí)門檻相對(duì)較低的智能互動(dòng)方式,語音互動(dòng)設(shè)備和相關(guān)產(chǎn)品非常多。例如一些藍(lán)牙耳機(jī)就自帶語音互動(dòng)按鍵,在與兼容的手機(jī)配對(duì)后,可以很方便地呼出語音助手。另外還有一些大家可能很少了解的產(chǎn)品,例如支持語音的鼠標(biāo)(圖11)、可通過語音進(jìn)行遙控的電視遙控器等,它們同樣會(huì)帶給用戶新鮮便捷的使用體驗(yàn),而且大都價(jià)格并不昂貴,對(duì)語音互動(dòng)方式感興趣的朋友不妨考慮入手。