關(guān)鍵詞 智能語音識(shí)別技術(shù) 應(yīng)用 風(fēng)險(xiǎn)防范
作者簡(jiǎn)介:王懿,東北大學(xué)文法學(xué)院,研究方向:公共管理與公共政策。
中圖分類號(hào):D920.4 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.19387/j.cnki.1009-0592.2020.05.225
智能語音作為最早落地成型的人工智能技術(shù),也是市場(chǎng)上應(yīng)用最為廣泛的人工智能技術(shù),它在使人們生活得到便利的同時(shí),在法律與道德層面都帶來一定風(fēng)險(xiǎn)。是否能正確認(rèn)識(shí)智能語音技術(shù)、是否明確風(fēng)險(xiǎn)、如何應(yīng)對(duì)風(fēng)險(xiǎn)成為現(xiàn)階段需要探討的問題。
智能語音技術(shù)是在弱人工智能時(shí)代,依托人工智能算法實(shí)現(xiàn)人機(jī)交互的關(guān)鍵技術(shù)。取代了傳統(tǒng)語音交換技術(shù),使一個(gè)簡(jiǎn)單的機(jī)器具備了“能聽會(huì)說”的特征,賦予智能終端更高的能力。
(一) 智能語音技術(shù)的原理
語音識(shí)別,就是將使用者的語音內(nèi)容準(zhǔn)確轉(zhuǎn)化為文字的技術(shù)。面臨著“同音多字”、口音差異、地域方言等問題,需要智能語音通過不斷的試驗(yàn),準(zhǔn)確判斷。接近于過去的語音文字轉(zhuǎn)換技術(shù),經(jīng)過反復(fù)訓(xùn)練,得到搜索出的候選結(jié)果作為語音識(shí)別階段的結(jié)果。
語音理解,通過各種機(jī)器學(xué)習(xí)建模方法,將特定文本內(nèi)容準(zhǔn)確理解,包含對(duì)詞匯、句子、篇章的理解,從而使機(jī)器可作出正確的反應(yīng)。智能語音技術(shù)中的“詞義理解”與日常交流對(duì)特定詞語意思的理解過程一樣是根據(jù)上下文理解,根據(jù)學(xué)習(xí)訓(xùn)練中詞語之間的關(guān)聯(lián)程度來確定詞語,實(shí)現(xiàn)“詞義消歧”。
語音合成,就是將文本回答轉(zhuǎn)換為語音流暢輸出。對(duì)語音合成最基本的要求就是語法正確、表達(dá)精準(zhǔn)、語音流暢,其次是語音合成內(nèi)容盡可能人性化,符合用戶需求。
這些功能是支撐智能語音技術(shù)運(yùn)行的基礎(chǔ),也是實(shí)現(xiàn)智能語音技術(shù)應(yīng)用的關(guān)鍵,了解其基本原理,明確智能語音技術(shù)實(shí)現(xiàn)的各個(gè)環(huán)節(jié),才能準(zhǔn)確的與現(xiàn)代生活需求對(duì)接,防范未來智能語音技術(shù)各種風(fēng)險(xiǎn)的出現(xiàn)。
(二)智能語音技術(shù)的應(yīng)用
智能語音助手是國(guó)內(nèi)外電商巨頭在人工智能領(lǐng)域的主要布局方向。通過將智能語音技術(shù)與移動(dòng)客戶端連接,語音實(shí)現(xiàn)操控智能設(shè)備、獲取網(wǎng)絡(luò)信息、預(yù)定服務(wù)及購買產(chǎn)品等服務(wù)功能。國(guó)際上比較成功的智能語音識(shí)別系統(tǒng)各有優(yōu)勢(shì),尤其是蘋果的Siri和谷歌的Google Assistant,大范圍通過與其產(chǎn)業(yè)下游移動(dòng)通信產(chǎn)品結(jié)合,實(shí)現(xiàn)了全球性的推廣(見圖2)。
智能語音醫(yī)療因公共衛(wèi)生領(lǐng)域所需的大量人力資源,成為當(dāng)下熱門研究領(lǐng)域。目前,智能語音醫(yī)療建設(shè)主要集中在語音錄入文本方面,在普遍提倡“無紙化辦公”的情況下,大量節(jié)約記錄電子病歷的時(shí)間,使醫(yī)生更專注于與患者的溝通交流,避免了手寫病歷難以辨認(rèn),人工錄入電子病歷信息不全面的問題。此外,智能語音技術(shù)供應(yīng)商與公共衛(wèi)生部門合作正在積極進(jìn)行智能語音醫(yī)療機(jī)器人的研發(fā),可與患者交流,提供信息采集、自我診斷、醫(yī)療咨詢、導(dǎo)診、緊急呼救等服務(wù)。
圖 2:2017年全球語音助手市場(chǎng)份額
智能語音家居產(chǎn)品將現(xiàn)代家居與智能語音技術(shù)合二為一,服務(wù)于智能家居的控制系統(tǒng),用于遠(yuǎn)程化、非觸摸式的操縱控制。方便對(duì)現(xiàn)代電子設(shè)備不夠了解的老人兒童使用,避免觸電、錯(cuò)誤操作的問題。其可與用戶進(jìn)行溝通交流的特點(diǎn),一定程度上起到看護(hù)陪伴的作用,并對(duì)可能出現(xiàn)的危險(xiǎn)進(jìn)行預(yù)警,在遇到危險(xiǎn)時(shí)也可通過語音進(jìn)行緊急呼救。
智能語音客服是指將智能語音技術(shù)應(yīng)用于電信呼叫服務(wù)領(lǐng)域,代替人工客服進(jìn)行基礎(chǔ)性服務(wù),適用于電信公司、機(jī)場(chǎng)等呼叫中心,但不適用急救、消防中心等緊急求救呼叫服務(wù)。同時(shí),智能語音客服相對(duì)于傳統(tǒng)人工客服擁有二十四小時(shí)不間斷、服務(wù)效率高、服務(wù)水平穩(wěn)定等特點(diǎn),可以有效規(guī)避降低因人工客服所造成的問題。
目前,智能語音技術(shù)已滲透到人們?nèi)粘I畹母鱾€(gè)領(lǐng)域,隨之而來的就是其可能造成的風(fēng)險(xiǎn),尤其是一些無具體法律可依,卻對(duì)人民群眾的生命財(cái)產(chǎn)安全造成情況。
(一) 破壞連接設(shè)備的風(fēng)險(xiǎn)
智能語音技術(shù)可以將用戶語音轉(zhuǎn)換為操作控制的電信號(hào),然而這一系列這種“聲音與電”的轉(zhuǎn)換是不能被用戶看見的,過程中一旦出現(xiàn)失誤也不能阻止甚至來不及阻止。智能語音技術(shù)有意或無意的錯(cuò)誤操作,輕則僅是本次操作失敗需要重新輸入指令或人工操作;重則則是因不恰當(dāng)操作引起的家用電器損壞,引發(fā)火災(zāi),造成人員傷亡的情況。
在法律上,訴訟的主體應(yīng)該是人,而不能是智能語音技術(shù)或相關(guān)的產(chǎn)品等物質(zhì)化的東西。判定的罪名、索取的賠償都不能由智能語音技術(shù)承擔(dān)提供。但用戶的語音命令正確,未存在操作不當(dāng)?shù)默F(xiàn)象;供應(yīng)商在設(shè)計(jì)時(shí)也未設(shè)置讓其錯(cuò)誤操作的程序。就事實(shí)上來看確實(shí)雙方都沒有為智能語音技術(shù)操作失誤而承擔(dān)責(zé)任的法律依據(jù)。但已經(jīng)確定由智能語音技術(shù)造成的損失及傷害又應(yīng)由誰來承擔(dān)呢?用戶又應(yīng)該向誰索求賠償你?由此看來,人工智能方面法律缺失造成可能的風(fēng)險(xiǎn)不斷。
(二)信息泄露的風(fēng)險(xiǎn)
智能語音技術(shù)在竊聽通話內(nèi)容上面臨信息泄露風(fēng)險(xiǎn),其可能造成的危害可以以智能手機(jī)信息泄露為例子參考,最典型的例子就是蘋果手機(jī)竊聽事件。通過手機(jī)內(nèi)置程序,監(jiān)聽用戶通話內(nèi)容,造成個(gè)人信息甚至與國(guó)家利益相關(guān)的機(jī)密信息被泄露,對(duì)個(gè)人及國(guó)家都造成了巨大危害。
與智能語音技術(shù)相連接的設(shè)配普遍配有攝像頭或其他影像識(shí)別設(shè)備,以使進(jìn)行語音識(shí)別時(shí),可通過對(duì)用戶的微表情識(shí)別,更加準(zhǔn)確的判斷語句內(nèi)容。但攝像頭與智能語音技術(shù)的連接給予不法分子操作,監(jiān)控他人生活甚至將其擴(kuò)散的可能。造成用戶使用智能語音技術(shù)的負(fù)擔(dān)。
(三)違規(guī)表達(dá)的風(fēng)險(xiǎn)
當(dāng)前智能語音技術(shù)所給予的反饋具有人性化,極度貼近生活,并存在日常交流的“玩笑”。但是針對(duì)心理情緒狀態(tài)不佳的用戶,給予消極的、“玩笑的”甚至無情感回復(fù),就可能引起用戶異常的情感波動(dòng),造成不可控的風(fēng)險(xiǎn),這在法律上是沒有問題的,但在道德上恐怕是不被接受的。
錯(cuò)誤引導(dǎo)提示可能帶來的風(fēng)險(xiǎn):一是用戶有意或無意表達(dá)的不恰當(dāng)言論是否應(yīng)該由智能語音設(shè)備進(jìn)行提醒或者制止。面臨客戶體驗(yàn)和語言道德兩難的情況,智能語音技術(shù)是否能作出最恰當(dāng)?shù)木駬?,能否保持最基本的道德評(píng)判標(biāo)準(zhǔn)。二是因年齡層、國(guó)家、民族文化差異造成語言習(xí)慣,是否能進(jìn)行準(zhǔn)確判斷,并給出合理提示,尤其是在國(guó)家、民族不同的情況下,是否可作出特定的語音提醒設(shè)置,以免冒犯用戶。
應(yīng)對(duì)其所帶來各種形式的風(fēng)險(xiǎn),即不能僅從用戶的角度一味的批判,也不能僅從設(shè)計(jì)者和銷售方的角度一味的推諉,而道德倫理或是立法方式也不能完全應(yīng)對(duì)這些可能出現(xiàn)的風(fēng)險(xiǎn),作出合理防范。需要將雙方利益統(tǒng)一在一個(gè)合理的范圍內(nèi),提出可行的解決建議。
(一)多管齊下,有限風(fēng)險(xiǎn)
“多管齊下”是指通過多種可變通、協(xié)商、調(diào)節(jié)的方式解決智能語音技術(shù)可能面臨的法律風(fēng)險(xiǎn)問題。比如針對(duì)智能語音技術(shù)在智能家居領(lǐng)域可能造成家用電器損壞或人身安全隱患的風(fēng)險(xiǎn),可以通過購買保險(xiǎn)或購買售后服務(wù)的方式解決。智能語音技術(shù)提供商、智能家居廠商、用戶三方達(dá)成購買協(xié)議,用戶額外支付一定費(fèi)用獲得保障,一旦出現(xiàn)某些風(fēng)險(xiǎn)可以獲得保修、賠償?shù)确?wù);或者與保險(xiǎn)公司合作,達(dá)成協(xié)議提供理賠保障。
“有限風(fēng)險(xiǎn)”在這里是對(duì)智能語音技術(shù)應(yīng)用可能造成的風(fēng)險(xiǎn)進(jìn)行責(zé)任承擔(dān)的有限劃分。首先,用戶應(yīng)該對(duì)風(fēng)險(xiǎn)有一定的可接受性。任何一種新興事物在初次應(yīng)用時(shí),都會(huì)受到各種質(zhì)疑,但隨著其便利性的凸顯逐漸流行,同時(shí)也接受了其可能帶來的風(fēng)險(xiǎn)。其次,制造方和銷售方應(yīng)盡風(fēng)險(xiǎn)說明的義務(wù),進(jìn)行一定范圍內(nèi)財(cái)產(chǎn)損失的有限風(fēng)險(xiǎn)承擔(dān),給予客戶合理補(bǔ)償。
(二)法律輔助,數(shù)據(jù)阻隔
“法律輔助”則是出于智能語音技術(shù)應(yīng)用現(xiàn)狀的考慮,其商用未造成影響嚴(yán)重的事故,未對(duì)人民生命財(cái)產(chǎn)安全造成巨大損害,針對(duì)其進(jìn)行立法為時(shí)尚早,行業(yè)內(nèi)協(xié)同制定了相應(yīng)的行業(yè)規(guī)范,限制某些有違法律的人工智能形態(tài)規(guī)范生產(chǎn)。就其目前可能出現(xiàn)法律風(fēng)險(xiǎn)而言,可以根據(jù)之前在飛機(jī)自動(dòng)駕駛、手機(jī)竊聽等相似案例作為依據(jù)進(jìn)行處理。智能語音技術(shù)供應(yīng)商也應(yīng)有統(tǒng)一的行業(yè)規(guī)范,禁止通過后臺(tái)私自傳輸信息的行為,維護(hù)用戶個(gè)人隱私安全,限制自我學(xué)習(xí)中可能侵犯用戶利益的行為發(fā)生。
“數(shù)據(jù)阻隔”是指對(duì)智能語音設(shè)備記錄的數(shù)據(jù)進(jìn)行單項(xiàng)阻隔,即在設(shè)計(jì)時(shí)就阻止將數(shù)據(jù)傳輸至云端或其他設(shè)備。將智能語音技術(shù)與網(wǎng)絡(luò)的關(guān)聯(lián),局限在信息索取這條單項(xiàng)路徑上,僅允許通過網(wǎng)絡(luò)學(xué)習(xí)搜索,以反饋用戶;通過技術(shù)手段,完全禁止反向的數(shù)據(jù)傳輸。尤其是一些配備攝像頭的設(shè)備,允許用戶自行設(shè)置是否開啟,并嚴(yán)禁數(shù)據(jù)記錄上傳。
(三)技術(shù)為主,自我調(diào)節(jié)
“技術(shù)為主”指的是在智能語音技術(shù)設(shè)計(jì)時(shí),通過內(nèi)置“敏感詞”限制的功能使其在深度學(xué)習(xí)中避免接觸到不恰當(dāng)言論內(nèi)容,保證進(jìn)行的是內(nèi)容積極健康的對(duì)話。同時(shí)“敏感詞”也應(yīng)設(shè)置一定可接受范圍,并允許根據(jù)國(guó)家和民族的進(jìn)行不同調(diào)整。對(duì)某些過激,或者有損國(guó)家榮譽(yù)利益的言論進(jìn)行提醒警示,達(dá)到一定的道德引導(dǎo)目的。其次是注重對(duì)使用者情感上的,交流中要給予樂觀向上的情感導(dǎo)向。根據(jù)用戶表達(dá)的語音語氣進(jìn)行內(nèi)容判斷的同時(shí)注重情感性的分析,并據(jù)此調(diào)整回復(fù)內(nèi)容。
“自我調(diào)節(jié)”是指用戶在使用智能語音技術(shù)相關(guān)產(chǎn)品時(shí)注意自我言論及情緒心理。當(dāng)心理情緒處于一個(gè)消極狀態(tài)時(shí)盡量避免與智能語音交流消極話題,可以選擇情緒開導(dǎo)。此外,針對(duì)個(gè)人言論是否合理問題要有一個(gè)自我判斷,理性對(duì)待智能語音技術(shù)所設(shè)定的敏感話語提示,不要遷怒或者惡意投訴,也是積極配合國(guó)家凈網(wǎng)工作的開展。
智能語音技術(shù)以其靈活、便捷、高效的特點(diǎn)已成為商業(yè)合作的重要對(duì)象,與相關(guān)設(shè)備結(jié)合普遍應(yīng)用于現(xiàn)實(shí)生活。面對(duì)可能出現(xiàn)的風(fēng)險(xiǎn),應(yīng)理性看待,接受“風(fēng)險(xiǎn)與便利”并存的事實(shí)。供應(yīng)商也應(yīng)積極應(yīng)對(duì),在內(nèi)加強(qiáng)技術(shù)優(yōu)化,在外制定行業(yè)規(guī)范,逐漸解決問題。共同營(yíng)造良好的使用環(huán)境,保障用戶安全及利益,為日后人工智能的普遍商用提供有效借鑒。
參考文獻(xiàn):
[1]甘玉玨,蘇軍根,林健,洪博宇,魯維.智能語音產(chǎn)品現(xiàn)狀及展望[J].廣東通信技術(shù),2017,37(12):66-68.
[2]李瑋,朱巖.AI語音交互技術(shù)及測(cè)評(píng)研究[J].信息通信技術(shù)與政策,2019(12):83-87.
[3]王飛,胡川,羅浩,汪鵬.醫(yī)療場(chǎng)景智能語音識(shí)別技術(shù)的應(yīng)用研究[J].中國(guó)數(shù)字醫(yī)學(xué),2019,14(12):19-21.
[4]張秀瑞,李樹新,葛文珍,張昭.基于自動(dòng)化的智能家居系統(tǒng)探究[J].電子測(cè)試,2020(3):58-59+7.
[5]李琛.論人工智能的法學(xué)分析方法——以著作權(quán)為例[J].知識(shí)產(chǎn)權(quán),2019(7):14-22.