舒 皓 向銀杉 成 舸 鄭 方
1(中國建設銀行北京科創(chuàng)支行 北京 100080)2(北京得意音通技術(shù)有限責任公司 北京 100084)3(清華大學人工智能研究院聽覺智能研究中心 北京 100084) (shuh22@mails.tsinghua.edu.cn)
數(shù)字人民幣是人民銀行發(fā)行的數(shù)字形式的法定貨幣,由指定運營機構(gòu)參與運營,以廣義賬戶體系為基礎,支持銀行賬戶松耦合功能,與實物人民幣等價,具有價值特征和法償性.數(shù)字人民幣一方面是數(shù)字形式的法定貨幣;另一方面,數(shù)字人民幣與紙鈔和硬幣完全等價,主要定位于現(xiàn)金類支付憑證M0[1];數(shù)字人民幣采取中心化管理、雙層運營模式;此外,數(shù)字人民幣是一種零售型央行數(shù)字貨幣,主要用于滿足國內(nèi)零售支付需求;并且,在未來的數(shù)字化零售支付體系中,數(shù)字人民幣和指定運營機構(gòu)的電子賬戶資金具有通用性,共同構(gòu)成現(xiàn)金類支付工具.數(shù)字人民幣的應用試點呈現(xiàn)出運營體系漸趨完善、試點范圍再次擴大、應用場景縱深化發(fā)展等特征[2].
數(shù)字人民幣作為中國法定數(shù)字貨幣,以其多樣的支付形式體現(xiàn)匯集了實物現(xiàn)金與電子支付工具的優(yōu)勢特點,實現(xiàn)了以國家信用為擔保,以儲存、交易安全,可控匿名,無壁壘流通等為目標,其主要特征如表1所示.
數(shù)字人民幣作為未來重要的金融基礎設施之一,對發(fā)展數(shù)字經(jīng)濟和零售支付、降低市場交易成本、提高支付安全性、促進金融穩(wěn)定等方面起到了重要的作用.
表1 數(shù)字人民幣主要特征和主要內(nèi)容
數(shù)字人民幣的推廣使用將加快運營機構(gòu)及其他商業(yè)銀行數(shù)字化轉(zhuǎn)型步伐,降低業(yè)務日常營運成本:一是降低紙幣現(xiàn)金管理成本,銀行在日常運營過程中會產(chǎn)生大量現(xiàn)鈔的運輸、存取管理、鈔票真?zhèn)螜z驗,殘損鈔票回收以及ATM機具和CDM機的布局、維護等費用支出,占用了大量社會資源;二是提高反洗錢精準度,降低反洗錢的繁瑣度;三是從環(huán)保的角度,紙幣和硬幣的回收再利用不可避免地消耗了大量能源與資源,產(chǎn)生一定的環(huán)境資源成本[3].
數(shù)字人民幣作為法定貨幣具有法償性,且具有實時交易、“支付即結(jié)算”的特點,可提供更低成本、更快捷、更安全的支付手段[4].
現(xiàn)有互聯(lián)網(wǎng)場景下的支付普遍基于銀行結(jié)算賬戶的電子支付,雖然發(fā)展迅猛,但其覆蓋面仍有限,且在客戶資金安全、客戶信息保護、資金風險防控等方面普遍存在一定問題,部分產(chǎn)品還存在套利問題.與非銀行支付機構(gòu)基于商業(yè)信用、企業(yè)信用的支付手段不同,央行數(shù)字人民幣以國家信用為支撐,與紙幣和硬幣等價,具有無限法償性.且其不可偽造、可控匿名等特性,可最大限度地保護使用者的隱私和信息安全[5].
數(shù)字人民幣作為人民銀行的負債,可有效維持現(xiàn)有二元賬戶結(jié)構(gòu),不會引發(fā)商業(yè)銀行擠兌;在外匯儲備管理方面,數(shù)字人民幣運營商支付的外匯儲備由央行管理,同樣作為央行的負債,因此既保證了法定數(shù)字貨幣的法律效力,又在一定程度上防范了資金過多和發(fā)生擠兌的風險[6].
此外,數(shù)字人民幣具有可追蹤性,“幣”與智能合約的融合應用可實現(xiàn)定向資金使用,提高貨幣調(diào)控的預見性、精準性和有效性.同時通過整合風險數(shù)據(jù),可構(gòu)建智能高效的系統(tǒng)性風險監(jiān)測、預警和管理模型,在反貪腐、反洗錢、減少欺詐事件等方面也有著巨大的價值.
我國的數(shù)字人民幣(e-CNY)是由中國人民銀行發(fā)行的數(shù)字形式的法定貨幣,是人民幣體系的重要組成部分.它以廣義賬戶體系為基礎,采用“賬戶松耦合設計”,以滿足“流通現(xiàn)金”(M0)的使用功能和“可控匿名”的管理要求,其本質(zhì)是實現(xiàn)“現(xiàn)金的數(shù)字化”.
表2 中國貨幣供應量劃分[2]
當前,我國的貨幣體系已基本實現(xiàn)M1和M2的電子化和數(shù)字化,但過去的主流電子支付工具仍無法完全替代M0.無論是刷卡還是掃碼支付,用戶側(cè)都需要依賴某種終端介質(zhì)(銀行卡或智能手機)以及用戶密碼.一旦忘帶或丟失終端、遺忘或丟失密碼,就會導致不便或不安全.
事實上,在過去的金融支付體系中發(fā)生的多數(shù)“盜刷”現(xiàn)象,很大程度上都是因為“終端持有人”與“賬戶所有人”并非是同一人導致的.
現(xiàn)金錢包—銀行賬戶—終端持有人≠賬戶所有人.
不僅如此,基于手機APP的掃碼支付方式對老年人不夠友好,也早已成為阻礙普惠金融、導致“數(shù)字鴻溝”的重要原因之一.可見,要解決好M0的數(shù)字化支付問題,非常有必要引入新的技術(shù)手段.
生物特征識別技術(shù)是基于生物特征的唯一性,實現(xiàn)“人證合一”,從而“自己證明自己”.近年來作為新興的身份驗證手段已得到越來越多的應用.
不過在金融行業(yè),從中國人民銀行業(yè)已頒布的技術(shù)標準體系來看,目前還只有聲紋識別這一種生物識別技術(shù)有可遵循的現(xiàn)行應用標準.究其原因,主要是指紋、人臉等常見生物特征存在3大問題難以得到有效解決:1)安全風險.這類生物特征較容易被竊取、纂改和偽造,導致相當大的安全隱患.2)用戶意愿.這類生物特征無法體現(xiàn)個人意愿,容易導致在用戶無感知的情況下“被知情”“被同意”“被支付”的情況出現(xiàn).3)隱私問題.這類生物特征的不可撤銷性強,收集的用戶敏感信息(指紋或面部特征)較多,使得個人隱私泄露越來越成為一個社會問題.
學術(shù)界通常將生物特征分為2大類:靜態(tài)生理特征和動態(tài)行為特征.而在所有生物特征中,聲紋非常特殊,它是一種兼具行為特征特性的生理特征,具有表象變化和本質(zhì)不變的高度統(tǒng)一[7].當人說話時的語音數(shù)據(jù)被采集后,任意取一個時間切片都無法反推得到其身份信息,只有將整個語音段連起來形成連續(xù)時間片段,與身份相關(guān)的聲紋特征才存在并得以顯現(xiàn).正是這種特殊性,使得聲紋特征較之其他生物特征更不容易被竊取.
此外,聲紋識別還與說話的內(nèi)容有關(guān).基于這種特性可以設計多種方案,以更好地保障安全和規(guī)避隱私.如果說的只是一串隨機分配的動態(tài)密碼(中國人民銀行聲紋應用標準采取的方案,中國人民銀行稱之為動態(tài)聲紋密碼[8]),則可使被假冒盜用和隱私泄露的風險降到最低.
在解除終端依賴、提高安全性、降低隱私泄露后,再來看數(shù)字人民幣對賬戶安全的特殊要求,分析聲紋識別與這些要求的匹配度,進而探討其應用場景:
1) “賬戶松耦合”與賬戶管理場景.
針對公眾使用移動支付所付出的隱私成本過高的問題,數(shù)字人民幣遵循“小額匿名、大額依法可溯”的“可控匿名“原則,換句話說就是“可松可緊”.一方面,大額支付時要求高強度用戶身份認證,以保障足夠的安全性,規(guī)避詐騙、洗錢等金融風險.另一方面,在小額支付時,要求可支持脫離銀行賬戶實現(xiàn)端對端的價值轉(zhuǎn)移,從而實現(xiàn)支付即結(jié)算,也就是像現(xiàn)金一樣“匿名支付”;此外,還要求可方便偏遠地區(qū)民眾在不持有傳統(tǒng)銀行賬戶的情況下開立數(shù)字人民幣錢包,以利于提高金融服務的覆蓋率.
現(xiàn)金錢包A—數(shù)字人民幣結(jié)算系統(tǒng)—現(xiàn)金錢包B.
實際上,由于聲紋具有前述動態(tài)特性,難以從語音片段反推出聲紋特征,因此只需要在聲紋采集時不與用戶的身份證號等敏感信息直接關(guān)聯(lián),便可以較好地契合上述“匿名支付”要求.而在大額情況下,聲紋特征的唯一性和動態(tài)聲紋密碼的安全性,又能使賬戶認證強度得到足夠的保障.
數(shù)字人民幣在個人、商戶、運營機構(gòu)、商業(yè)銀行、發(fā)幣行之間進行流通時,涉及到非常多的賬戶管理要求,均可以通過聲紋識別來完成,如圖1所示:
圖1 聲紋技術(shù)用于賬戶管理場景
2) “雙離線支付”與交易確權(quán)場景.
在有網(wǎng)的情況下,數(shù)字人民幣“聲紋支付”的流程與現(xiàn)有中國建設銀行手機銀行上“聲紋轉(zhuǎn)賬”的流程基本無異.當鎖定雙方賬戶和輸入金額后,用聲紋識別(確切說是動態(tài)聲紋密碼)模塊取代輸入密碼/驗證碼或刷臉等傳統(tǒng)技術(shù)手段,即可快速完成身份核驗后完成支付.
然而,數(shù)字人民幣的普惠性要求其必須同時滿足有網(wǎng)/無網(wǎng)2種情況,以保證在無網(wǎng)條件下或網(wǎng)絡不佳的地區(qū),都能順利完成支付等交易環(huán)節(jié).也就是說收、付雙方都處于“離線”的情況下也可以完成記賬,直到能做安全驗證時再完成扣款,即所謂“實時扣款,延時收款”.
目前,數(shù)字人民幣應用的雙離線支付功能主要采用NFC技術(shù)來實現(xiàn).而“聲紋識別+聲波傳輸”技術(shù)為數(shù)字人民幣的雙離線支付提供了另一種可行方案.它主要由本地聲紋識別、聲波近場傳輸、聲紋“時空戳”追溯3大模塊構(gòu)成,可確保交易雙方在使用硬件錢包的前提下達成“近場支付”.
當用戶處在地下室、停車場、邊遠山區(qū)甚至是地理災害等特殊環(huán)境下時,由于網(wǎng)絡信號不好或根本就處于無網(wǎng)環(huán)境,無法遠程連接到銀行后臺,只能進行脫機交易.此時,只需將聲紋識別模塊嵌入手機SIM卡芯片,再利用手機之間的聲波通信模塊完成端到端信號傳輸.這樣在實際場景中,付款人只需對自己的手機說句話就可以完成認證,然后收、付方通過類似手機“碰一碰”的方式完成支付.
具體來說可分為如下3種場景:1)大額支付時的高安全身份核驗.當支付額度超過一定限度時(如大宗網(wǎng)購、期貨交易等),利用聲紋識別可提高實時身份核驗的準確性和安全性.2)小額支付時的免密功能開通.當發(fā)生高頻次小金額支付(如公共出行、水電續(xù)費、向小商戶付款等)時,可通過聲紋識別完成身份核驗后開通免密支付功能.3)當在用戶之間發(fā)生個人轉(zhuǎn)賬時,發(fā)起方和接收方均可以調(diào)用聲紋識別功能,實現(xiàn)交易確權(quán),以保障轉(zhuǎn)出主體和接收主體的真實可靠,如圖2所示:
圖2 聲紋技術(shù)用于交易確權(quán)場景
3) “信息無障礙”與適老化場景.
目前主流人機交互手段以鍵盤和觸摸屏為代表,即使用戶通過了層層認證,由于菜單操作過于復雜,對信息輸入的要求過高,老年人仍需花費相當?shù)木Σ拍茼樌瓿芍Ц?而數(shù)字人民幣作為全民通用的數(shù)字法幣,要求更好地滿足“信息無障礙”的需要,特別是針對老年人群的“適老化”需求.
語音作為人和人交流最自然的交互方式,在解決上述問題時具有得天獨厚的優(yōu)勢.由于人的身份信息、說話內(nèi)容信息、說話時的情緒信息等,都蘊含在同一段語音片段中,這就使得將聲紋識別、語音識別、情感識別等技術(shù)有機融合后,用戶只需說“一句話”,就能近乎無感式地實現(xiàn)身份認證、業(yè)務指令識別和意圖理解等一系列操作,方便快捷又安全,既可滿足有障礙人士的需要,更能大大緩解老年人在數(shù)字化時代不會用、不敢用電子產(chǎn)品的困境.
圖3 聲紋技術(shù)用于適老化場景
針對上述信息無障礙需求,可采用基于聲紋識別技術(shù)的“一句話(OS4E)”語音模式,這是一種“所說即所得”的交互形式[9],可用于手機充值、水電費繳納等日常生活繳費,以及與家人、朋友、商戶之間的相互轉(zhuǎn)賬(如圖3所示)等高頻場景.
采用“一句話”語音模式的應用,當用戶發(fā)起轉(zhuǎn)賬、支付、繳費等交易請求時,原有交互流程從驗證發(fā)起人身份、識別目標賬戶、輸入金額等至少3步縮減為只需1步,交互時長可由至少需數(shù)十秒減少為只需幾秒鐘.不僅可大大提高交互效率、降低使用門檻,而且在保證同等安全級別的前提下,有力提升了用戶體驗,可謂“無需騰出手,只要動動嘴”.
通過本文研究分析可以發(fā)現(xiàn),由于聲紋特征自身固有的特性以及人類說話方式的豐富性,使得聲紋識別技術(shù)與數(shù)字人民幣的賬戶安全需求高度契合,可在增強用戶體驗感的同時保障賬戶安全,因此是數(shù)字人民幣應用極具潛力的身份認證手段,應用場景十分廣闊.另一方面,未來隨著數(shù)字人民幣試點應用的不斷深入展開,對技術(shù)通用性的要求將進一步提高,比如在噪音、多人對話等復雜條件下如何確保聲紋識別的魯棒性,將是下一步在技術(shù)上要努力探索解決的課題.