一個可供選擇的全隨機化模型

2021-10-14 10:21董俊超

煙臺大學(xué)學(xué)報（自然科學(xué)與工程版） 2021年4期

董俊超

(煙臺大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,山東煙臺 264005)

1965年WARNER[1]第一次引進了隨機化抽樣方法,用于處理定性敏感性問題的抽樣調(diào)查，隨后這種方法得到了很大的發(fā)展。大體思路為:首先是對定性敏感性問題隨機化方法進行各種各樣的優(yōu)化，這方面的研究成果很多，本文不再贅述; 隨后GREENBERG等[2]把隨機化方法擴展到定量敏感性問題。目前,對于定量敏感性問題的隨機化技術(shù)，按照文獻[3-4]的觀點，可把它分為3類：全隨機化模型(full randomized response model)，偏隨機化模型(partial randomized response model)，可選性隨機化模型(optional randomized response model)．

全隨機化模型最早在文獻[5]中有提及,詳細(xì)的論述在文獻[6], 它的優(yōu)點是對被調(diào)查者的真實數(shù)據(jù)進行編碼,可以更好地保護被調(diào)查者的隱私, 適合高敏感性問題的抽樣調(diào)查, 比如吸毒、販賣軍火等等。偏隨機化模型最早在文獻[7]中對定性敏感性問題有提及, 在文獻[8]中有詳述, 該方法是由被調(diào)查者做一個隨機試驗，由試驗的結(jié)果決定被調(diào)查者做真實的回答還是對真實信息進行編碼再回答?？蛇x性隨機化模型在文獻[3-4,9]中有論述, 該方法是由被調(diào)查者自身決定，感覺被調(diào)查的問題敏感就進行編碼回答，否則就進行真實回答。GREENBERG等[2]的隨機化模型是被調(diào)查者根據(jù)隨機試驗的結(jié)果給出敏感性問題的真實答案或一個無關(guān)問題的答案,其可以歸結(jié)到偏隨機化模型中。

1 提出新模型

Zad=Y+X。

(1)

另一個為乘隨機化模型(multiplication randomized response model), 其編碼的方法是, 由被調(diào)查者利用隨機試驗抽取一個服從X分布的隨機數(shù)乘上自身的敏感性指標(biāo)報告給調(diào)查者。若用Zmu表示觀察到的變量,該模型可表達為:

Zmu=YX。

(2)

無論是加隨機化模型還是乘隨機化模型,編碼方法均比較單一, 可能會造成被調(diào)查者的不信任感,害怕自身的隱私被泄露。比如在偷稅的調(diào)查中, 如果一個被調(diào)查者自身的指標(biāo)比較大,而抽到的隨機數(shù)又較大, 這時無論對加隨機化模型還是乘隨機化模型, 都會造成被調(diào)查者心理上的某種不安或恐懼，從而可能造成不真實的回答，得到不可靠的數(shù)據(jù)。本文提出一個新模型,給被調(diào)查者一個選擇, 由他們根據(jù)自身的愿望選擇編碼方法。具體做法為: 從總體中按放回方式抽取一個樣本, 每個被調(diào)查者再做一個隨機試驗, 按照放回方式抽取分布為X的一個隨機數(shù), 由被調(diào)查者根據(jù)自身的意愿選擇是把自身的敏感指標(biāo)加上或者減去該隨機數(shù), 然后報告給調(diào)查者。假定總體中有以概率p的被調(diào)查者選擇“加”, 以概率1-p的被調(diào)查者選擇“減”，該模型可表示為

(3)

其中，p是一個未知參數(shù),由總體的性質(zhì)所確定，它的期望為

E(Z)=pE(Y+X)+(1-p)E(Y-X)=

μy+(2p-1)μ。

(4)

它的方差為

V(Z)=E(Z2)-E2(Z)=pE(Y+X)2+

(1-p)E(Y-X)2-E2(Z)=

E(Y2)+E(X2)+2(2p-1)E(YX)-E2(Z)=

(σy2+μy2)+σ2+μ2+

2(2p-1)μyμ-(μy+(2p-1)μ)2=

(5)

(6)

(7)

進一步,有

(8)

其中，V(Zi)是把式(5)中的μ換為μi,σ換為σi(i=1,2)所得。

定理1得證。

由于樣本方差是總體方差的無偏估計,所以很容易得到下面定理:

(9)

2 新模型與已有模型的比較

下面就本文提出的模型(3)，在隱私保護度及估計量的精度方面與已有的模型作比較。

2.1 保護度的比較

YAN等[10]提出了對模型保護度的一個計算方法。現(xiàn)計算該模型的保護度：

Δ=E(Z-Y)2=

pE(X2)+(1-p)E((-X)2)=

E(X2)=σ2+μ2。

(10)

對于加隨機化模型(1), 根據(jù)文獻[5]中結(jié)論, 該模型對被調(diào)查者的保護度為

Δad=σ2+μ2。

(11)

對于乘隨機化模型(2), 根據(jù)文獻[10]中計算結(jié)果, 該模型對被調(diào)查者的保護度為

(12)

2.2 精度的比較

(13)

(14)

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

一個可供選擇的全隨機化模型

1 提出新模型

2 新模型與已有模型的比較

2.1 保護度的比較

2.2 精度的比較

3 結(jié)束語