国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于擬合決策邊界表達(dá)式的對抗攻擊方法

2021-10-30 05:19:20趙永泉
關(guān)鍵詞:黑盒表達(dá)式類別

◆趙永泉

基于擬合決策邊界表達(dá)式的對抗攻擊方法

◆趙永泉

(云南電網(wǎng)有限責(zé)任公司西雙版納供電局 云南 666100)

基于深度學(xué)習(xí)的圖像分類器已經(jīng)被廣泛使用,由于模型魯棒性問題導(dǎo)致其不能正確分類,進(jìn)而增加微小擾動(dòng)的樣本,稱之為對抗攻擊?,F(xiàn)有黑盒攻擊算法難以在較低的訪問次數(shù)下獲得準(zhǔn)確決策邊界信息,本文提出基于擬合決策邊界表達(dá)式的對抗攻擊方法。該方法定義根據(jù)目標(biāo)函數(shù)以及決策邊界的定義,推導(dǎo)出決策邊界表達(dá)式,并利用投影操作尋找決策邊界附近的對抗樣本。試驗(yàn)結(jié)果標(biāo)明,該方法相比現(xiàn)有的黑盒攻擊方法具有更高的攻擊成功率。

對抗攻擊;計(jì)算機(jī)視覺;深度學(xué)習(xí)

對抗攻擊指的是在原始樣本中加入擾動(dòng),以獲得一個(gè)可以欺騙目標(biāo)深度學(xué)習(xí)分類器的樣本。文獻(xiàn)[1]首次發(fā)現(xiàn)深度學(xué)習(xí)模型易受攻擊的特點(diǎn),進(jìn)而提出框約束L-BFGS算法進(jìn)行迭代對抗攻擊。L-BFGS算法針對特定的原始圖像隨機(jī)添加擾動(dòng)生成對抗樣本。文獻(xiàn)[2]提出的生成方法基于隱空間聚類。文獻(xiàn)[3]提出了一種基于快速邊界攻擊的有目標(biāo)攻擊樣本生成方法,將搜索拆分為面上和線上兩部分,并通過二分法減少搜索規(guī)模。文獻(xiàn)[4]提出了基于AE-WGAN的定向?qū)箻颖旧煞椒?,通過高質(zhì)量映射轉(zhuǎn)換和隱層編碼遷移算法生成指定標(biāo)簽的對抗樣本。文獻(xiàn)[5]提出的ZOO方法通過目標(biāo)模型的輸出來擬合模型梯度,其在攻擊成功率和擾動(dòng)大小兩個(gè)指標(biāo)上都很優(yōu)秀。本文通過轉(zhuǎn)換模型擬合目標(biāo)函數(shù)構(gòu)建決策邊界近似表達(dá)式,根據(jù)決策邊界近似的表達(dá)式,利用投影操作進(jìn)行對抗樣本生成,提升攻擊成功率。

1 對抗樣本定義

在對抗攻擊的過程中,根據(jù)攻擊目標(biāo)的不同,可以分為有目標(biāo)攻擊和無目標(biāo)攻擊,其形式化定義如公式(1)所示:

其中,C代表可以對樣本進(jìn)行分類的深度學(xué)習(xí)模型(目標(biāo)模型),是模型參數(shù)。y為目標(biāo)模型對x的分類結(jié)果,是原始樣本的正確類別。在有目標(biāo)攻擊中,目標(biāo)模型將x分類到攻擊者指定的類別。在無目標(biāo)攻擊中,目標(biāo)模型將對抗樣本分類到樣本正確類別外的其他類別(不指定誤分類的類別)。

2 基于決策邊界的圖像對抗攻擊算法

Croce等人[6]嘗試尋找目標(biāo)模型的決策邊界,通過使用目標(biāo)模型的梯度信息、模型的結(jié)構(gòu)與模型的參數(shù),精確地將樣本投影在目標(biāo)模型決策邊界附近,從而獲得性能良好的對抗樣本。

在獲得決策邊界近似的表達(dá)式后,Croce等人根據(jù)決策邊界的平面表達(dá)式,計(jì)算樣本到?jīng)Q策邊界的距離,如式(3)所示:

3 基于擬合決策邊界表達(dá)式的對抗攻擊方法

受到Croce等人[6]在白盒攻擊中利用模型的決策邊界信息進(jìn)行對抗攻擊(FAB算法)的啟發(fā),本文提出一種在黑盒場景下,基于擬合決策邊界的對抗攻擊方法,結(jié)構(gòu)如圖1所示。

圖1 算法框架

在黑盒場景中進(jìn)行對抗攻擊,攻擊者不能獲得目標(biāo)模型的結(jié)構(gòu)以及參數(shù)信息,即模型的內(nèi)部信息,本文通過定義含有決策邊界的目標(biāo)函數(shù),并利用轉(zhuǎn)換模型擬合目標(biāo)函數(shù),求解決策邊界表達(dá)式,在黑盒場景中利用決策邊界信息進(jìn)行對抗攻擊。此方法與已有的基于替代模型的攻擊方法相似,但基于替代模型的攻擊方法在擬合替代模型時(shí),考慮訓(xùn)練樣本與所有類別之間的關(guān)聯(lián),根據(jù)目標(biāo)模型關(guān)于所有類別預(yù)測概率對替代模型進(jìn)行擬合,目的是使替代模型學(xué)習(xí)到目標(biāo)模型對樣本每個(gè)類別的預(yù)測概率,并擬合目標(biāo)模型中所有類別之間的決策邊界,使替代模型分類的性能接近目標(biāo)模型,之后通過對替代模型進(jìn)行白盒攻擊獲得對抗樣本,最終利用得到的對抗樣本對目標(biāo)模型進(jìn)行攻擊。與替代模型相比,本文提出的基于擬合決策邊界的攻擊方法,方法框架如圖2所示,首先根據(jù)對抗攻擊的目的,構(gòu)建相應(yīng)的模型。在模型擬合的過程中,本方法只針對與攻擊相關(guān)的兩個(gè)類別的信息進(jìn)行擬合,在迭代過程中忽略與攻擊目標(biāo)無關(guān)的類別,相比于替代模型方法,能夠更有針對性的擬合在攻擊過程中所需的目標(biāo)模型的內(nèi)部信息。在進(jìn)行對抗攻擊時(shí),本方法利用擬合模型的信息生成對抗樣本進(jìn)行攻擊,并且在對抗樣本生成過程的同時(shí),利用目標(biāo)模型對對抗樣本的分類概率指導(dǎo)轉(zhuǎn)換模型的擬合。此外,在利用模型的分類概率擬合替代模型時(shí),替代模型方法希望擬合每一個(gè)類別的輸出概率,而本方法只需要擬合兩個(gè)類別概率之間的差值,并且在兩個(gè)類別的預(yù)測概率不同的情況下,預(yù)測概率之間的差值也可能相同,因此本方法需要擬合的目標(biāo)模型信息少于替代模型方法,在相同的訪問次數(shù)情況下,本方法擬合的信息更接近對抗攻擊所需的目標(biāo)模型的內(nèi)部信息,使得其在進(jìn)行對抗攻擊時(shí),可獲得比替代模型方法更好的效果。

3.1 決策邊界函數(shù)

(5)

3.2 擬合轉(zhuǎn)換模型

圖2 轉(zhuǎn)換模型構(gòu)建框架

擬合構(gòu)建的轉(zhuǎn)換模型由標(biāo)簽映射模塊以及轉(zhuǎn)換模型的訓(xùn)練模塊組合。由于在白盒場景中,攻擊者可以獲得目標(biāo)模型的內(nèi)部信息,因此可以分別計(jì)算關(guān)于兩個(gè)類別的梯度信息獲取決策邊界表達(dá)式中需要的梯度信息。但是在黑盒場景中,只能獲取到目標(biāo)模型的輸出結(jié)果,構(gòu)建的目標(biāo)函數(shù)擬合的信息為兩個(gè)類別分類概率之間的差值,所以決策邊界表達(dá)式中的導(dǎo)數(shù)求解過程由分別計(jì)算兩個(gè)輸出概率的梯度信息,并將它們轉(zhuǎn)換為利用轉(zhuǎn)換模型的一個(gè)位置的輸出信息計(jì)算目標(biāo)函數(shù)的梯度信息。因此,在進(jìn)行目標(biāo)函數(shù)擬合過程前,本方法需要對原始樣本的初始類別以及攻擊的目標(biāo)類別進(jìn)行標(biāo)簽映射,將兩個(gè)類別的標(biāo)簽映射為轉(zhuǎn)換模型的一個(gè)類別,使獲取的目標(biāo)模型的輸出結(jié)果對轉(zhuǎn)換模型的訓(xùn)練有指導(dǎo)意義,從而擬合轉(zhuǎn)換模型,標(biāo)簽轉(zhuǎn)換過程如圖3所示。

在標(biāo)簽轉(zhuǎn)換過程中,根據(jù)原始類別的標(biāo)簽以及目標(biāo)類別的標(biāo)簽的組合進(jìn)行映射,將每兩個(gè)類別的組合映射到新標(biāo)簽中的一個(gè)位置,獲得圖中所示的映射矩陣,對應(yīng)位置的值的計(jì)算如式(9)所示:

根據(jù)標(biāo)簽轉(zhuǎn)換矩陣每個(gè)位置值的計(jì)算方式,本方法獲得的映射矩陣是關(guān)于主對角線反對稱的矩陣,因此在計(jì)算標(biāo)簽映射過程只考慮映射矩陣對角線上半部分的映射,并通過構(gòu)建因子(Negative-Positive Factor)表示主對角線下半部分的標(biāo)簽,因子計(jì)算公式如式(10)所示:

3.3 對抗樣本生成

在完成迭代搜索后,對生成的對抗樣本進(jìn)行微調(diào),進(jìn)一步降低對抗樣本的平均擾動(dòng),獲得滿足攻擊條件的對抗樣本。

4 實(shí)驗(yàn)

4.1 數(shù)據(jù)源

數(shù)據(jù)源采用的是圖像識(shí)別領(lǐng)域經(jīng)典的數(shù)據(jù)集, 包含十個(gè)類別的手寫數(shù)字(0-9)的圖像信息,每一張圖片的大小為28x28,并且每一個(gè)像素點(diǎn)只由一個(gè)灰度值進(jìn)行表示,圖像的維度是784。

4.2 實(shí)驗(yàn)環(huán)境

硬件環(huán)境:處理器i9-9820X、顯卡2080Ti、服務(wù)器內(nèi)存64GB。

軟件環(huán)境:Ubuntu 16.04 64位,編程語言Python3.5,框架tensorflow 1.13.1,CUDA版本:10.0.130。

4.3 實(shí)驗(yàn)方法

本文為研究決策邊界信息在對抗攻擊中的作用,提出了基于擬合決策邊界表達(dá)式的攻擊方法,使用MNIST數(shù)據(jù)集驗(yàn)證算法性能。同時(shí)根據(jù)黑盒攻擊常用的攻擊成功率、平均擾動(dòng)以及平均訪問次數(shù)三個(gè)評(píng)價(jià)指標(biāo)[7],與ZOO算法、隱空間聚類方法以及AdvGAN算法[8]進(jìn)行對比。平均訪問次數(shù)影響了目標(biāo)模型是否能覺察到攻擊的存在,因此越低的訪問次數(shù)對應(yīng)著越好的攻擊性能。實(shí)驗(yàn)結(jié)果如表1所示。

4.4 實(shí)驗(yàn)結(jié)果

表1 無目標(biāo)攻擊結(jié)果

表2 有目標(biāo)攻擊結(jié)果

通過實(shí)驗(yàn)結(jié)果可以看出,無論是有目標(biāo)攻擊還是無目標(biāo)攻擊,本方法在對目標(biāo)模型查詢次數(shù)不高于其他方法的條件下,本方法在攻擊成功率上要優(yōu)于其他方法。此外,本方法生成的對抗樣本的擾動(dòng)大小無目標(biāo)攻擊下與其他方法大致相當(dāng),而在有目標(biāo)攻擊中優(yōu)于其他方法。

5 結(jié)束語

為在黑盒場景中獲得決策邊界表達(dá)式,本文提出基于擬合決策邊界信息的對抗攻擊方法,構(gòu)建與決策邊界相關(guān)的目標(biāo)函數(shù),通過目標(biāo)模型的輸出信息,利用轉(zhuǎn)換模型對目標(biāo)函數(shù)進(jìn)行擬合,根據(jù)擬合后的轉(zhuǎn)換模型與構(gòu)建的決策邊界信息,對原始樣本進(jìn)行投影操作,進(jìn)而生成對抗樣本。并且在MNIST數(shù)據(jù)集上進(jìn)行驗(yàn)證,利用決策邊界的信息生成對抗樣本,生成性能較好的對抗樣本,減少對目標(biāo)模型的訪問次數(shù)。

[1]Szegedy C,Zaremba W,Sutskever I, et al. Intriguing Properties of Neural Networks[C]//International Conference on Learning Representations. 2014.

[2]周世杰,張準(zhǔn),劉啟和,等. 一種基于隱空間聚類的黑盒對抗樣本生成算法,CN111191717A[P],2020.

[3]郭書杰. 基于快速邊界攻擊的黑盒對抗樣本生成方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2020.

[4]張潔,張志昊. 基于AE-WGAN的定向?qū)箻颖旧杉袄肹J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2020.

[5]Chen P-Y, Zhang H, Sharma Y, et al. Zoo: Zeroth Order Optimization based Black-box Attacks to Deep Neural Networks without Training Substitute Models[C]//Proceedings of the 10th ACM Workshop on Artificial Intelligence and Security. 2017.

[6]Croce F,Hein M. Minimally distorted Adversarial Examples with a Fast Adaptive Boundary Attack[C]//Proceedings of the International Conference on Machine Learning,2020.

[7]Papernot N,McDaniel P,Goodfellow I,et al. Practical Black-box Attacks against Machine Learning[C]//Proceedings of the ACM on Asia Conference on Computer and Communications Security,2017.

[8]Xiao C,Li B,Zhu J-Y,et al. Generating Adversarial Examples with Adversarial Networks[C]//International Conference on Learning Representations,2018.

猜你喜歡
黑盒表達(dá)式類別
一種基于局部平均有限差分的黑盒對抗攻擊方法
一個(gè)混合核Hilbert型積分不等式及其算子范數(shù)表達(dá)式
表達(dá)式轉(zhuǎn)換及求值探析
淺析C語言運(yùn)算符及表達(dá)式的教學(xué)誤區(qū)
服務(wù)類別
新校長(2016年8期)2016-01-10 06:43:59
論類別股東會(huì)
商事法論集(2014年1期)2014-06-27 01:20:42
中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
聚合酶鏈?zhǔn)椒磻?yīng)快速鑒別5種常見肉類別
議C語言中循環(huán)語句
商(2012年11期)2012-07-09 19:07:55
唐山市| 澄城县| 南召县| 千阳县| 加查县| 荆州市| 临沂市| 任丘市| 施甸县| 建瓯市| 西吉县| 林口县| 石渠县| 武乡县| 丰城市| 普兰县| 白沙| 丰原市| 北安市| 姜堰市| 忻州市| 交口县| 吉林省| 克什克腾旗| 禹城市| 永新县| 江源县| 弥勒县| 青州市| 宁阳县| 准格尔旗| 西和县| 信阳市| 滦平县| 吉水县| 渭源县| 湖州市| 屏山县| 新化县| 贵阳市| 衡阳县|