楊冰清,高 珊,張 冕
(阜陽師范大學 數(shù)學與統(tǒng)計學院,安徽 阜陽 236037)
伴隨現(xiàn)金交易支付方式向非現(xiàn)金交易支付方式的演進,以及私人數(shù)字貨幣的相繼出現(xiàn)[1],社會各界逐漸對央行發(fā)型的數(shù)字貨幣予以廣泛關(guān)注。中國的迅速崛起得益于貿(mào)易的全球化,值得注意的是,近幾十年的發(fā)展中,在中美關(guān)系中,美國作為超級大國,一直對正處于發(fā)展中的中國虎視眈眈。與此同時美國充分利用美元在國際儲備貨幣的地位和其在國際金融治理體系的話語權(quán)不斷謀求金融霸權(quán),阻礙人民幣的國際化及全球金融治理體系的變革[2]。數(shù)字人民幣是金融科技創(chuàng)新的產(chǎn)物也是區(qū)塊鏈技術(shù)發(fā)展的產(chǎn)物,對推動國際貨幣體系的改革和全球金融治理體系的變革具有重要意義。但我國央行數(shù)字貨幣的研發(fā)和推廣過程中,一直面臨不同領(lǐng)域的風險與考驗,其中迫在眉睫的問題是,如何才能有效地推進數(shù)字人民幣的使用。
央行數(shù)字貨幣是指由各國中央銀行發(fā)行的具有無限法償性的數(shù)字貨幣,統(tǒng)稱CBDC(Central Bank Digital Currencies)[3]。目前在全球范圍內(nèi),很多國家都在嘗試數(shù)字貨幣的研發(fā)和試點。加拿大央行也推出CADcoin項目,該項目的目的是為了搭建一個基于分布式賬簿的大額支付系統(tǒng)。俄羅斯總統(tǒng)普京宣布將發(fā)行可隨時兌換盧比的官方數(shù)字貨幣‘CryptoRuble’。韓國首爾市長樸元淳宣布首爾市將研發(fā)加密貨幣‘S-coin’并將其應用到公共福利領(lǐng)域[3]。2020年10月深圳市人民政府聯(lián)合央行進行數(shù)字人民幣試點活動,本次活動派發(fā)一千萬數(shù)字人民幣紅包,并首次向社會公眾進行測試。盡管各國已經(jīng)相繼推出數(shù)字人民幣,但學術(shù)界目前對于數(shù)字人民幣的用戶調(diào)查研究仍有待進一步深入,例如:數(shù)字人民幣群眾的用戶畫像、試點地區(qū)和非試點地區(qū)用戶的差異等問題。相比用傳統(tǒng)的‘搖號抽簽’形式發(fā)放,政府采取根據(jù)用戶對數(shù)字人民幣的意愿發(fā)放形式,能夠更好地推動數(shù)字人民幣的使用和推廣。
文章通過問卷調(diào)查方式收集試點地區(qū)和非試點地區(qū)群眾的信息,以及群眾對數(shù)字人民幣的意愿數(shù)據(jù)。通過將原始數(shù)據(jù)進行0-1編碼和woe編碼,采用向后LR進行變量篩選,將構(gòu)建的Logistic模型進行對比,并得出群眾意愿度分析模型,最后對數(shù)字人民幣的使用和健全發(fā)展提出相關(guān)建議。
Logistic回歸模型是研究因變量為定性變量的分類模型。本文研究的因變量為是否愿意成為志愿者。假設(shè)n維列向量y=(y1,y2,…,yn)'表示獨立0-1隨機變量,β=(β0,β1,β2,…,βk)'表示k維變量的系數(shù),xi=(1,xi1,xi2,…,xik)'表示第i個樣本,X表示n×k維矩陣,其中xi'表示矩陣的第i行,xik表示第個i行的第k個變量[4],pi=P(yi=1|xi)表示yi=1的概率,1-pi表示yi=0的概率,存在:
證據(jù)權(quán)重轉(zhuǎn)換用于衡量同一屬性變量的不同分類的貢獻情況,通過將分類變量轉(zhuǎn)化為數(shù)值型變量,可降低模型建立和模型解釋時的復雜度[6]。
p(Y=ym|xij)表示當變量xij時,樣本Y=ym的概率,p(Y≠ym|xij)表示當變量xij時,樣本Y≠ym的概率。經(jīng)過WOE轉(zhuǎn)換可以將原始數(shù)據(jù)中0-1編碼的復雜數(shù)據(jù)轉(zhuǎn)變?yōu)閿?shù)值型數(shù)據(jù),此舉可縮減自變量的個數(shù),且有利于后續(xù)模型的解釋和分析。
考慮到我國關(guān)于數(shù)字人民幣尚未全國試行,但未試行地區(qū)是未來推進數(shù)字人民幣發(fā)展的重點城市,本文的調(diào)查對象不僅包括試點城市也包括非試點城市。群眾對于數(shù)字人民幣的使用意愿會受個人和環(huán)境的影響,我們選取性別、年齡段、最高學歷、職業(yè)作為個人屬性的度量,選取城市劃分和是否試點城市作為環(huán)境屬性的度量。探究個人和環(huán)境這兩個主因素對群眾數(shù)字人民幣的使用意愿影響,經(jīng)過預調(diào)查對設(shè)計的問卷進行適當修正,使問卷合理且有效[7]。然后在網(wǎng)絡(luò)上發(fā)放問卷,共收回685份問卷,通過刪除無效和不完整問卷,最后剩余677份問卷作為本次分析的原始數(shù)據(jù)。
如表1所示,變量名包括性別、年齡段、最高學歷、月收入、職業(yè)、城市劃分、是否試點城市、是否愿意成為志愿者,分別是自變量x1、x2、x3、x4、x5、x6、x7以及因變量y,所有變量均為定性變量,具體賦值如變量賦值列所示。
表1 變量解釋
當自變量之間存在高度相關(guān)性時,其作為自變量構(gòu)建的模型會失真或者模型準確性很低。這往往是因為某些自變量和因變量之間相關(guān)性較弱,或者自變量內(nèi)部存在較高相關(guān)性[8]。第一個問題可以通過變量選擇,剔除不相關(guān)變量從而提升預測的結(jié)果;第二個問題,通過計算每個自變量的VIF值判斷模型是否存在多重共線性。該模型先計算所有變量的值,滿足不存在多重共線性[9]。然后,通過向后LR進行變量篩選,從而實現(xiàn)變量選擇,以提高模型解釋力。
由于本文的數(shù)據(jù)多是定性變量,包括有序定性變量和無序定性變量,首先對數(shù)據(jù)采用0-1編碼和woe編碼。對于截面數(shù)據(jù),由于不同樣本所處的非解釋變量的外部因素不同,隨機誤差項的方差不隨某個解釋變量的變化呈規(guī)律性變化,即存在隨機誤差項異方差的情況。在存在異方差時模型最小方差性不成立,從而導致參數(shù)顯著性檢驗失效,預測精度降低,不利于后續(xù)結(jié)果的準確性。針對該問題,通過woe編碼可以減弱異方差的存在。
1、波動不敏感。該編碼方式可以減弱異方差的存在,對數(shù)據(jù)的波動并不敏感;
2、一致性。評估過程前后一致,不受評估專員的主觀影響;
3、易操作。業(yè)務人員憑借評分卡可直接計算出該用戶的使用意愿,易于操作。
類比不同編碼方法在模型上的效果見表2,該數(shù)據(jù)通過0-1編碼,在不采用變量選擇時,模型預測正確率為83.8%;0-1編碼的同時采用向后LR進行變量選擇,建立的模型預測正確率相比未進行變量選擇時提升1%。由此可知,本數(shù)據(jù)進行變量選擇后的模型結(jié)果要好于未進行變量選擇的模型結(jié)果。對比第二種方法和第三種方法,將原始分類數(shù)據(jù)轉(zhuǎn)變成woe連續(xù)型數(shù)據(jù),然后再通過向后LR進行變量選擇,最終模型的自變量更少且模型的正確率更高,對比0-1編碼的數(shù)據(jù),模型正確率提升2.8%。由此可得,基于本數(shù)據(jù)通過woe編碼優(yōu)于0-1編碼。
表2 變量篩選和編碼
將通過兩種方法編碼后的數(shù)據(jù)輸入logistic模型,通過向后LR進行變量篩選后,兩個模型的混淆矩陣如表3和表4所示。
表3 0-1編碼的模型預測分類表
表4 基于woe編碼的模型預測分類表
將表5中的系數(shù)代入公式(5)。
表5 基于woe編碼的模型統(tǒng)計量
表6 標準評分卡
表6中各分變量對應的分值越低,說明具有該特征的群眾使用意愿越大[11]。從評分卡可以看出,群眾所在城市是否為數(shù)字人民幣試點城市對群眾使用意愿有影響,且所在城市為試點城市的群眾使用意愿大于非試點城市,可能因為在數(shù)字人民幣的宣傳力度上試點城市的力度要遠高于非試點地區(qū)。觀察群眾每月收入和使用意愿之間的關(guān)系可得,每月收入越高的群眾使用意愿越高,高收入人群對于國家宏觀政策導向和國際金融體系相對更為了解,因此高收入人群對數(shù)字人民幣的使用意愿更強。
通過分類表可知群眾意向度模型的分類正確率為87.7%,表示此模型的預測結(jié)果具有一定的準確度,能夠較好地辨別群眾是否愿意成為志愿者,為數(shù)字人民幣的前期推廣提供有利的引導。
針對Logistic模型的輸出結(jié)果復雜、不易理解、不易解釋的問題,本文基于相關(guān)文獻和問卷調(diào)查數(shù)據(jù)提出一種Logistic評分模型。首先,計算各變量的woe值;其次,采用向后LR變量篩選方法,基于原始0-1編碼數(shù)據(jù)和woe編碼數(shù)據(jù)運用Logistic方法構(gòu)建模型;接下來,對比兩種編碼方式下的模型正確率;最后,基于模型輸出參數(shù)和woe構(gòu)建評分卡,通過評分卡計算每個群眾的志愿者意愿。該模型方便在數(shù)字人民幣的推廣過程中對人群進行精準推廣差異化服務。
第一,試點城市先行,試點城市多元化。推廣數(shù)字人民幣的試點城市不應全為一線城市,而應包含多元化的城市劃分,方便后期數(shù)字人民幣的拓展。
第二,因地制宜,有效精準地采取推廣策略。由模型可知,是否為試點城市、月收入等因素對愿意成為志愿者概率模型有顯著影響,且收入越高,群眾對數(shù)字人民幣的使用意向越強。在推廣數(shù)字人民幣的過程中,可以對高收入人群進行高強度推廣,針對不同城市采取不同相應的推廣策略,以制定符合當?shù)禺a(chǎn)業(yè)結(jié)構(gòu)特點的推廣政策。
第三,加強對數(shù)字人民幣的宣傳和普及。通過對問卷調(diào)查結(jié)果前期描述性統(tǒng)計,發(fā)現(xiàn)部分群眾未能理解數(shù)字人民幣的功能和優(yōu)點。此舉對數(shù)字人民幣的推廣產(chǎn)生一定影響,因此政府和相關(guān)金融部門可以加大宣傳力度,采取不同途徑對各層次的群眾進行宣傳和講解。
第四,多場景交易,完善生態(tài)閉環(huán)。金融機構(gòu)等各類交易場所應該主動引入數(shù)字人民幣交易場景,從而方便支付交易。大數(shù)據(jù)平臺部門通過對交易數(shù)據(jù)利用云計算、人工智能等技術(shù)進行合理且深入的分析,從而不斷提高用戶的滿意度。
第五,科技賦能,提高群眾的使用感。央行應優(yōu)化技術(shù)水平,讓數(shù)字人民幣滿足便捷性、安全性、高效性、個性化等特點,以滿足個人及企業(yè)的金融需求。