汪 露,陳美華
(東南大學(xué),南京 211189)
隨著信息技術(shù)的飛速發(fā)展,個人生物信息被越來越多地運用在日常生活、財政金融、公共安全中。生物信息包括指紋、面容、虹膜和聲紋等,這些個人生物特征是獨一無二的,承載了許多個人信息與個人隱私。作為生物信息的一種,語言信息已被廣泛應(yīng)用于數(shù)字化時代,針對人類語言所表現(xiàn)出的可識別特征,可以對個體聲紋進(jìn)行身份識別認(rèn)證和對群體聲紋進(jìn)行方言識別鑒定。聲紋是一種獨特且易于訪問的生物特征,無須說話人的同意就可以從遠(yuǎn)程收集,且只需一個麥克風(fēng)或一部手機(jī)或電腦就可以收集聲紋。聲紋具有普遍性、特定性、相對穩(wěn)定性和不易復(fù)制性,是個體生物獨一無二的語言生物信息,也是語言生物信息的重要內(nèi)容。
聲紋是對語音中所蘊(yùn)含的、能表征和標(biāo)識說話人的語音特征,以及基于這些特征參數(shù)所建立的語音模型的總稱[1]。聲紋具有普遍性,可廣泛應(yīng)用于身份認(rèn)證等領(lǐng)域。由于每個人說話時的短時頻譜、韻律及語言學(xué)特征均有所差異,因此每個人的聲紋都是唯一而獨特的。即使有些人可以模仿他人說話,但是他們無法模仿說話人聲音中最本質(zhì)的特性,在聲紋特征分析中仍會有所差異,因此聲紋是無法復(fù)制的。成年以后,人的發(fā)音習(xí)慣趨于穩(wěn)定,人的聲紋特征在長時間內(nèi)保持穩(wěn)定不變,因此聲紋具有相對穩(wěn)定性。
聲紋識別,又稱為說話人識別,是指根據(jù)待識別語音的聲紋特征識別該段語音所對應(yīng)的說話人的過程,是一種通過對聲音的光譜檢查來識別人的方法[1-2]。聲紋識別使用人們話語中的獨特特征,聲紋的獨特性是由聲腔和發(fā)音器官所決定的。就算聲音被模仿、扭曲或掩蔽,也改變不了說話者的聲道特征與發(fā)音特征,世界上任何兩個人的聲紋圖譜都不一樣,因此也就不會破壞聲紋識別[2-3]。
按照實際應(yīng)用的范疇,聲紋識別可以分為聲紋辨認(rèn)和聲紋確認(rèn)兩類。聲紋辨認(rèn)是指判斷一條語音屬于模型庫中的哪一個人的過程,而聲紋確認(rèn)是指確認(rèn)一條語音是否來自其所宣稱的說話人的過程[3]。聲紋辨認(rèn)技術(shù)常常被廣泛應(yīng)用于公安司法和軍事領(lǐng)域,而聲紋確認(rèn)技術(shù)的應(yīng)用更加貼近廣大群眾的實際生活,目前已被廣泛應(yīng)用于金融和聲紋鎖控等領(lǐng)域。
1.2.1 聲紋辨認(rèn)技術(shù)的應(yīng)用
1)聲紋辨認(rèn)技術(shù)已廣泛應(yīng)用于公安技偵領(lǐng)域,幫助公安與司法人員解決眾多事務(wù)。如,廈門公安局指揮中心與廈門天聰智能軟件有限公司合作,搭建了報警聲紋采集與輔警系統(tǒng);北京得意音通技術(shù)有限責(zé)任公司(以下簡稱北京得意公司)與深圳市中大信通科技有限公司合作,將聲紋識別技術(shù)應(yīng)用于社區(qū)矯正項目[3]。聲紋識別技術(shù)在公安司法領(lǐng)域具體的實際應(yīng)用表現(xiàn)在智慧警務(wù)建設(shè)、構(gòu)建重點人員聲紋庫、日常治安防控、電詐打擊和案件偵破等方面[4-5]。
將聲紋識別技術(shù)融入警務(wù)部門的人口信息采集與案件辦理過程,可以提高基層民警的工作效率、節(jié)省警力資源,同時將社區(qū)人口的聲紋信息納入社區(qū)聲紋數(shù)據(jù)庫,完善智慧警務(wù)語音云平臺的建設(shè)。
采集如涉恐、涉毒等重點人員的聲紋信息,構(gòu)建重點人員聲紋庫,通過對比數(shù)據(jù),公安部門可以有效遏制和打擊涉恐、涉毒人員,維護(hù)社會長治久安。建立海量聲音數(shù)據(jù)庫,通過對比聲音數(shù)據(jù)庫和犯罪現(xiàn)場捕捉到的聲音來識別嫌疑犯,鎖定嫌犯的定位。
將聲紋識別技術(shù)與打擊電話詐騙相結(jié)合,采集詐騙分子的語音,提取其聲紋特征,通過聲紋對比可以快速識別詐騙信息,對廣大民眾預(yù)警詐騙信息,并快速鎖定詐騙分子身份[6]。在偵查案件時,可以利用聲紋識別技術(shù)對犯罪嫌疑人的語音信息提取聲紋特征,推斷其性別、年齡、身高、體態(tài)、文化水平和出生地等信息,刻畫嫌疑人外在特征與心理特征,提供破案線索,縮小搜捕范圍。對刑滿釋放人員或在逃人員運用聲紋識別技術(shù)進(jìn)行監(jiān)聽,能夠阻止其再次犯案或快速有效實施逮捕[7]。
2)聲紋辨認(rèn)技術(shù)在軍事領(lǐng)域有著重要的應(yīng)用價值,目前已在軍事保密、指令確認(rèn)、情報偵聽等方面得以應(yīng)用[8]。
在軍事系統(tǒng)應(yīng)用聲紋辨認(rèn)技術(shù)進(jìn)行身份驗證,可以防止非法用戶進(jìn)入系統(tǒng),也可以實現(xiàn)對軍用計算機(jī)進(jìn)行加密,保護(hù)機(jī)密文件不被竊取、篡改、破壞等。將聲紋辨認(rèn)技術(shù)應(yīng)用至軍事要地或軍事禁地的門禁系統(tǒng)中,進(jìn)行聲紋身份認(rèn)證,可以有效識別合法與非法出入者。
語音指令是軍事行動中較為常用的信息傳遞方式,應(yīng)用聲紋辨認(rèn)技術(shù)對命令發(fā)出者進(jìn)行身份確認(rèn),可以避免敵軍偽裝我方指揮者發(fā)出假命令的情況出現(xiàn)。
軍事活動非常重視情報,將聲紋識別技術(shù)應(yīng)用至電子監(jiān)聽系統(tǒng),當(dāng)截獲到敵方的語音通話后,就可以準(zhǔn)確識別出通話者的身份,尤其是高層領(lǐng)導(dǎo)者的身份,從而掌握大量的絕密情報,并判斷情報的價值。
1.2.2 聲紋確認(rèn)技術(shù)的應(yīng)用
2004 年,美國Beep Card 公司發(fā)明了聲紋識別信用卡;2006 年,荷蘭銀行(ABN AMRO)使用美國Voice Vault 聲紋識別系統(tǒng),實現(xiàn)了用戶身份認(rèn)證;2008 年,Voice Commerce Group 推出了基于聲紋識別的Voice Pay 服務(wù);2011 年,中國建設(shè)銀行與北京得意公司合作開發(fā)了聲紋電話銀行系統(tǒng);2016 年,中國建設(shè)銀行通過聲紋認(rèn)證技術(shù)對手機(jī)用戶身份進(jìn)行認(rèn)證;2019 年,平安科技、金融壹賬通與廣發(fā)銀行簽署了聲紋核身項目[3];2022 年,中國建設(shè)銀行與北京得意公司合作建立金融科技“聲紋+”聯(lián)合創(chuàng)新中心。由此可見,聲紋確認(rèn)技術(shù)在金融領(lǐng)域的應(yīng)用十分廣泛,目前主要包括移動金融業(yè)務(wù)、電話銀行業(yè)務(wù)、雇員管理業(yè)務(wù)[9]。
在網(wǎng)銀賬戶登錄、網(wǎng)絡(luò)支付、線上轉(zhuǎn)賬和信用卡還款等方面,尤其是在征信機(jī)構(gòu)[10],聲紋可以被當(dāng)作登錄憑證來核驗身份,可以有效提高資金交易的安全性與客戶身份的驗證速度。在遠(yuǎn)程開戶和核保核賠等業(yè)務(wù)中,聲紋確認(rèn)技術(shù)可以輔助人工核實用戶身份,提高工作效率,而線上業(yè)務(wù)中的語音資料也會被存檔作為依據(jù),便于未來追蹤。
作為金融行業(yè)的一項重要業(yè)務(wù),電話銀行業(yè)務(wù)所有的操作都需要通過語音交互完成,因此聲紋識別技術(shù)在電話銀行業(yè)務(wù)中具有非常廣泛的應(yīng)用和非常重要的作用。當(dāng)來電客戶開通了聲紋識別業(yè)務(wù)后,就可以直接通過聲紋識別系統(tǒng)進(jìn)行身份核實,節(jié)省大量時間。
將聲紋識別系統(tǒng)與門禁系統(tǒng)相結(jié)合,聲紋識別門禁系統(tǒng)可應(yīng)用于銀行等高度戒備的場所,尤其是保障加鈔間出入口的門禁安全[11],實現(xiàn)進(jìn)出權(quán)限管理、實時監(jiān)控、異常報警等功能。
聲紋識別技術(shù)的普遍應(yīng)用給人們的生活帶來了極大的便利,但由于聲紋承載著人們獨特的生物信息,聲紋信息一旦被泄露,基于生理特征的身份識別系統(tǒng)將會徹底崩潰[12]。隨著越來越多的語音助手的出現(xiàn),保護(hù)聲紋一類的生物識別碼變得越來越重要。
2019 年,亞馬遜旗下的語音助手Alexa 和智能音箱Echo Dot Kids 被控訴在未經(jīng)兒童或其父母同意的情況下,對數(shù)百萬名兒童進(jìn)行錄音并收集聲紋信息,收集兒童觀看與收聽的習(xí)慣,即使用戶刪除了設(shè)備上的語音記錄,亞馬遜仍保留了這些個人信息。此外,亞馬遜擁有數(shù)千名負(fù)責(zé)審核語音對話的員工,將對話進(jìn)行轉(zhuǎn)錄并發(fā)送給公司內(nèi)相關(guān)的團(tuán)隊以便于更好地理解人類語言,但亞馬遜在此之前從未對外公開過這一團(tuán)隊的存在,也沒有對廣大用戶說明Alexa 語音技術(shù)背后有人工的介入。語音助手和智能音箱已經(jīng)深入人們生活的方方面面,諸如此類的聲控語音設(shè)備通過聲紋識別、語音識別等技術(shù)與用戶進(jìn)行互動,逐漸對用戶的數(shù)據(jù)提出了越來越多的要求。聲紋信息中含有大量個人隱私,如用戶的性別、年齡、個人愛好、家庭成員與家庭地址等敏感信息,不論是將用戶的聲紋信息運用于提高聲紋識別功能以便于提高用戶體驗,抑或是將用戶聲紋信息轉(zhuǎn)賣給第三方企業(yè)以便于從中牟利,都觸犯到了廣大用戶的隱私保護(hù)權(quán)利。
“滴滴出行”App 在乘客使用順風(fēng)車服務(wù)時頻繁索取用戶手機(jī)的電話權(quán)限,自2021 年9 月起,在網(wǎng)約車業(yè)務(wù)中試運營全程錄音功能,用戶在使用該軟件時必須授權(quán)錄音功能,否則將無法使用滴滴出行服務(wù)。啟動錄音功能后,可以通過一定長度的語音識別出乘客的聲紋信息,進(jìn)而泄露用戶的個人隱私與敏感信息,與個人相關(guān)的大量深層信息將會面臨曝光的風(fēng)險。聲紋信息一旦被泄露,所有與生物信息認(rèn)證相關(guān)的活動都會受到影響,如出入門禁、工作考勤、支付驗證和行蹤記錄等,將嚴(yán)重影響公民的日常生活。滴滴公司違法處理647 億余條個人信息,其中包含人臉識別信息、聲紋信息、精準(zhǔn)位置信息等敏感信息,嚴(yán)重違反了《中華人民共和國網(wǎng)絡(luò)安全法》《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護(hù)法》。
眾多互聯(lián)網(wǎng)企業(yè)的類似案例表明用戶的聲紋數(shù)據(jù)面臨泄露、買賣與曝光的風(fēng)險,隨之而來的是用戶個人信息與個人隱私的泄露。生物信息的應(yīng)用與發(fā)展給個人隱私與國家安全帶來了新的挑戰(zhàn),保障生物信息安全是各國目前發(fā)展所面臨的重點。
大數(shù)據(jù)和人工智能技術(shù)的廣泛應(yīng)用和快速發(fā)展使得聲紋信息以各種方式被泄露,不法分子和不良企業(yè)利用聲紋識別技術(shù)的漏洞鉆空子,侵害人身安全、財產(chǎn)安全、個人隱私,個人生物信息保護(hù)問題亟待解決??梢詮慕⒔∪嚓P(guān)法律法規(guī)、規(guī)范行業(yè)標(biāo)準(zhǔn)、處理整頓相關(guān)企業(yè)和平臺,以及提高個人信息安全意識與能力4 個方面來應(yīng)對。
聲紋識別技術(shù)是近幾十年新興的生物特征識別技術(shù),部分國家已有保護(hù)公民聲紋數(shù)據(jù)的相關(guān)條例,我國正處于聲紋識別技術(shù)應(yīng)用的上升期,利用聲紋數(shù)據(jù)泄露個人隱私的案例時有發(fā)生,國家應(yīng)從法律法規(guī)層面予以規(guī)范。目前我國越來越重對視語言生物信息的保護(hù),逐步出臺了相關(guān)的法律法規(guī),如2020 年在《中華人民共和國民法典》中明確了自然人聲音等生物信息的保護(hù),進(jìn)一步規(guī)范了個人生物信息的采集、存儲、使用和加工等方面的要求。完善生物信息安全法治建設(shè)需從立法、執(zhí)法、司法3 個方面共同推進(jìn),對違法違規(guī)的服務(wù)提供商與個人進(jìn)行處罰、教育與管理,凈化生物信息識別技術(shù)行業(yè)環(huán)境,為個人生物信息安全保駕護(hù)航。
聲紋識別技術(shù)廣泛應(yīng)用于金融和公安等行業(yè)領(lǐng)域,各行各業(yè)可以針對聲紋技術(shù)在行業(yè)的發(fā)展情況推行各自的行業(yè)標(biāo)準(zhǔn),一方面有利于聲紋技術(shù)的應(yīng)用與發(fā)展,另一方面也有助于行業(yè)未來的發(fā)展進(jìn)步。比如,2019 年,中國標(biāo)準(zhǔn)化研究院聯(lián)手聲紋識別技術(shù)研發(fā)公司在福建廈門建立了我國首個聲紋識別技術(shù)標(biāo)準(zhǔn)化研究基地,推動了多行業(yè)制定聲紋識別技術(shù)的應(yīng)用標(biāo)準(zhǔn)。金融和公安領(lǐng)域已經(jīng)推行了聲紋識別技術(shù)的應(yīng)用標(biāo)準(zhǔn)與規(guī)范,中國人民銀行于2018 年發(fā)布了聲紋識別技術(shù)的金融行業(yè)標(biāo)準(zhǔn),即JR/T 0164—2018《移動金融基于聲紋識別的安全應(yīng)用技術(shù)規(guī)范》,并將此規(guī)范下發(fā)給全國各大銀行和金融機(jī)構(gòu),對聲紋識別技術(shù)在金融行業(yè)的功能、性能、安全等方面做出了嚴(yán)格的要求[13]。
企業(yè)應(yīng)當(dāng)遵守語言生物信息相關(guān)的法律法規(guī)和認(rèn)真執(zhí)行行業(yè)的相關(guān)標(biāo)準(zhǔn),明確聲紋識別技術(shù)的應(yīng)用范圍,不強(qiáng)制要求用戶授權(quán),杜絕過度采集用戶個人信息;在儲存和上傳用戶的語音文件前,應(yīng)詢問使用者是否同意,并向用戶明確說明所需信息內(nèi)容、語音數(shù)據(jù)用途、文件保存時間等重要信息;杜絕傳送用戶的全部錄音,必要情況下只選取用戶部分特定的語音傳輸至云端,所有和用戶本人個人信息相關(guān)的信息應(yīng)保存在用戶的本地設(shè)備上,以避免用戶個人聲紋的要素被泄露[14]。此外,服務(wù)提供商或運用聲紋識別技術(shù)的企業(yè)應(yīng)提高身份認(rèn)證系統(tǒng)的多樣性,為用戶提供多種登錄方式。
聲紋是個人生物特征之一,承載了個人身份信息與眾多個人隱私,但仍有許多人對聲紋識別技術(shù)的概念的應(yīng)用缺乏認(rèn)知與了解,因此要盡快向公眾普及語言生物信息安全知識,提高人們對聲紋的認(rèn)識,了解聲紋所包含的個人信息及聲紋識別技術(shù)的應(yīng)用情況,加強(qiáng)每一個人對個人聲紋信息保護(hù)的重視,不輕易允許應(yīng)用程序授權(quán)使用和收集設(shè)備與數(shù)據(jù)中的個人生物信息;在使用聲紋密碼登錄賬號或認(rèn)證身份時,選擇較為私密的地點,避開其他人在場;不隨意將自己特定的錄音文件發(fā)送給他人,尤其是清晰地朗讀數(shù)字、字母表,以免被有心之人剪輯和拼接用于電話詐騙或身份認(rèn)證;仔細(xì)閱讀應(yīng)用程序中與個人信息相關(guān)的使用條例,主動了解國家地方的個人信息相關(guān)政策和維權(quán)的有效途徑。
聲紋是語言生物信息的重要內(nèi)容,聲紋識別技術(shù)已被廣泛應(yīng)用于公安、軍事、金融等領(lǐng)域,應(yīng)用前景廣闊,受到高度重視。聲紋承載了眾多個人隱私與敏感信息,但仍有許多人缺乏對語言生物信息的認(rèn)知與自我保護(hù)意識,同意或在不知情的情況下允許部分不良企業(yè)與平臺不斷要求自己提供個人生物信息。不法分子通過收集聲紋數(shù)據(jù)竊取、泄露或買賣公民個人信息,嚴(yán)重威脅公民的人身財產(chǎn)安全。語音輸入、語音助手等與個人語音相關(guān)的功能使得用戶聲紋信息被迫暴露給企業(yè)商家或應(yīng)用程序,由聲紋識別而帶來的個人信息泄露也導(dǎo)致個人原始生物特征的泄露,嚴(yán)重侵犯個人隱私與人身安全,因此保護(hù)個體和群體聲紋信息是保護(hù)語言生物信息安全和我國語言生物信息安全體系建構(gòu)的重中之重。