国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于AHP-GRA 的用戶身份可信評價方法*

2020-04-25 13:37:34梁曉實鄒福泰
通信技術 2020年4期
關鍵詞:一致性身份向量

梁曉實,鄒福泰,譚 越

(上海交通大學 網(wǎng)絡空間安全學院,上海 200240)

0 引 言

隨著互聯(lián)網(wǎng)和社交媒體的快速發(fā)展,我國網(wǎng)民數(shù)量不斷攀升,網(wǎng)絡用戶身份信息逐漸復雜,規(guī)模也越來越大。在各類網(wǎng)絡應用中,需要對用戶身份信息可信性做出評價,從而提供不同的服務。隨著電子商務、網(wǎng)絡支付等領域的發(fā)展,我國的經(jīng)濟活動對網(wǎng)絡依賴性逐步增強,涉及到資金和財產(chǎn)的網(wǎng)絡活動加劇,對用戶身份進行認證的需求變得更加迫切。因此,擁有一種可以結合多種屬性、安全可靠地進行用戶身份可信評價的方法,對于日益增長的網(wǎng)絡監(jiān)管需求至關重要。

依據(jù)《信息安全技術個人信息安全規(guī)范》[1]定義,用戶身份信息是指以電子或者其他方式記錄的能夠單獨或者與其他信息結合識別特定自然人身份或者反映特定自然人活動情況的各種信息,包括姓名、出生日期、身份證件號碼、個人生物識別信息、住址、通信通訊聯(lián)系方式、通信記錄和內(nèi)容、賬號密碼、財產(chǎn)信息、征信信息、行蹤軌跡、住宿信息、健康生理信息以及交易信息等。

結合上述定義,可以將用戶身份信息大體分類為自然屬性和社會屬性。自然屬性包括個人的外貌、體型、聲音信息等。此類信息較為穩(wěn)定,且不易被修改,可以用于辨別個體與其他個體之間的差異。社會屬性包括個體的社會關系、人際交往、社會職能、社會行為等方面。此類信息會隨著個體的時間以及環(huán)境變化而產(chǎn)生較大的波動。此外,還有用戶社會活動所帶來的信息,一并歸入社會屬性。

目前,網(wǎng)絡身份管理技術已經(jīng)在政府、銀行、電商、社交網(wǎng)絡等領域建立了各自的管理與服務系統(tǒng),但當前對于用戶的身份信息管理仍存在一些問題:身份信息易被復制和偽造;身份隱私信息易被濫用誤用;身份信息被冒用盜用等。因此,如何有效評價身份與身份信息可信,成為統(tǒng)一管理網(wǎng)絡實體多形態(tài)身份的關鍵。為了解決上述問題,本文提出了一個新型的身份可信認證系統(tǒng),主要貢獻如下:

(1)創(chuàng)新性地提出一種將層次分析法和逆向灰色關聯(lián)分析結合的用戶身份可信評價方法;

(2)收集多種來源的用戶身份信息,并通過多層次關聯(lián)決策分析,提高用戶身份可信評價準確性;

(3)實現(xiàn)了基于層次分析法和灰色關聯(lián)分析的用戶身份可信評價系統(tǒng),采用合理數(shù)據(jù)集進行性能評估實驗。

1 相關工作

目前,已有多個國家提出過公民身份信息可信管理。其中,美國于2011 年4 月發(fā)布《美國網(wǎng)際空間可信標識國家戰(zhàn)略》[2],將可信身份體系建設提升為國家戰(zhàn)略。2013 年,英國政府通過政務服務,引導開放了分級的第三方身份服務市場,通過市場競爭,提供跨部門的身份保障服務[3]。

在技術方面,隨著訪問控制技術的發(fā)展,目前業(yè)界已經(jīng)提出一系列的評價標準,用于跨域系統(tǒng)的互聯(lián)互通和訪問授權時的身份認證。例如,開放身份互聯(lián)接口標準(Open identity interconnection interface standard,OpenID)[4],就是一個以用戶為中心的身份識別框架,可以有效降低管理方的身份管理成本。身份認證標準(Security Assertion Markup Language,SAML)[5]是目前國際上廣泛認可的一個單點登錄和身份認證規(guī)范,實現(xiàn)了聯(lián)合身份認證和認證授權信息交換的標準化。FIDO 標準[6]是一種基于開放協(xié)議標準的在線認證技術,目的在于減少用戶對傳統(tǒng)口令的依賴。

目前,在不同網(wǎng)絡身份平臺上的身份互聯(lián)互通認證依然存在難題。針對這種問題,目前主要有兩種解決思路[7]。第一種是建立一個第三方的可信身份服務平臺,由平臺與公安、工商、電信運營商等權威認證源對接進行身份驗證,為用戶提供跨系統(tǒng)、跨平臺的可信身份認證服務。平臺作為可信第三方不存儲用戶信息,僅提供相關應用接口。第二種則由第三方直接建立相關身份數(shù)據(jù)庫,并向其他應用依賴方提供登錄授權服務。這種服務本質(zhì)上是采用OpenID 和OAuth 結合的一種互聯(lián)互通的身份服務和授權登錄技術。

隨著互聯(lián)網(wǎng)平臺的發(fā)展,單因素身份識別技術在實際場景中遇到了越來越大的挑戰(zhàn),因此多因素身份識別技術開始進入大家的視野。目前,大部分的多因素識別研究和應用都集中在靜動態(tài)信息結合,即利用用戶提供的靜態(tài)身份信息或憑證,結合用戶的行為進行綜合評價。一些大型互聯(lián)網(wǎng)企業(yè)如阿里、騰訊、新浪等已經(jīng)開始使用以行為為中心的身份認證技術,他們通過監(jiān)控用戶的操作和登錄行為,并根據(jù)用戶行為是否異常判斷用戶的身份可信程度。

但是,追蹤用戶的動態(tài)行為需要相對復雜的計算和系統(tǒng)。本文意在解決多平臺下的身份互通認證,故考慮僅使用靜態(tài)信息的方式,即通過用戶提供的個人信息,對比權威認證源提供的身份信息,對用戶進行身份進行可信評價。

2 相關知識

2.1 層次分析模型

層 次 分 析 法[8](Analytic Hierarchy Process,AHP)由美國運籌學家薩蒂于20 世紀70 年代提出。因其在處理復雜決策問題上十分實用和有效,該方法很快在世界范圍內(nèi)得到了傳播與重視。層次分析法將與決策有關的因素分解成目標層、準則層、方案層等層次,在此基礎之上進行定性和定量分析。具體可以分為以下步驟。

2.1.1 建立層次結構模型

將與決策有關的各個元素按照不同屬性自上而下地分為若干層次,同一層的因素從屬于上一層的因素,該層因素對上層因素有影響,同時又支配下一層的因素或受到下層因素的作用。最高層只有一個因素,即為需要決策的目標。最低層為方案層,包含決策時的備選方案。中間層為準則層,可以有若干子層,對應決策所需的各個考慮因素。

在本系統(tǒng)中,目標層為用戶身份可信等級;準則層包含兩層,分為不同身份信息類別和對應的子類別。本系統(tǒng)中使用層次分析法的目的在于確定準則層各因素的影響因子,與方案層的選擇無關,因此不設置方案層具體實例。

2.1.2 構造判斷矩陣

在所述層次結構模型的基礎上,針對決策層的因素,采用比較尺度表通過兩兩比較的方式,確定各項元素對上層某個因素的相對影響程度,從而構造一個判斷矩陣。

表1 1 ~9 比較尺度表

2.1.3 層次單排序及一致性校驗

根據(jù)所述判斷矩陣,求出其最大特征根以及所對應的特征向量,將特征向量歸一化處理后記為w。w 滿足:

計算歸一化后的特征向量的一致性校驗值CI:

引入隨即一致性指標RI:

最后,計算判斷矩陣的檢驗系數(shù)CR:

若CR<0.1,認為該成對比較矩陣通過一致性檢驗,可以用做該層因素的影響權重;否則,驗證不通過,需要重新構造合理的一致性矩陣。

2.1.4 層次總排序及一致性校驗

確定某層所有因素對于總目標重要性的排序過程,該檢驗從最高層開始逐層向下確定權值。層次總排序計算方法為:

其中aj表示其上層A 中第j 個因素對總目標的排序權值,bij為該層第i 個因素相對于上層第j個因素的層次單排序權值??偱判虻囊恢滦詸z驗同式(4)。

2.2 灰色關聯(lián)分析理論

由于影響身份可信評價因素的復雜性,身份可信是很難被嚴格量化。本系統(tǒng)使用逆向灰色關聯(lián)分析,實現(xiàn)對身份可信的量化評估,通過關聯(lián)系數(shù)或綜合關聯(lián)度等特征量分析內(nèi)在聯(lián)系,發(fā)現(xiàn)影響身份可信評價因素的主要關系和主要特征?;疑P聯(lián)分析(Grey Relation Analysis,GRA)[9-11]可以很好地運用于各類綜合評價問題,核心思想是按照一定的規(guī)則確立參考標準序列,并確定各個評估對象序列與其的相似程度,判斷相互間的聯(lián)系是否夠緊密,從而得出最終的評價結果。

使用灰色關聯(lián)分析評估的步驟如下。

(1)確定參考序列和比較序列。將問題抽象為分析序列,構造參考序列和比較序列。其中,參考序列是反映系統(tǒng)行為特征的數(shù)據(jù)序列,以每個指標的最優(yōu)值構成參考序列。在本評價系統(tǒng)中,各個指標最優(yōu)值對應為各個指標劃分的上限。比較序列是影響系統(tǒng)行為的因素組成的數(shù)據(jù)序列。

(2)無量綱化處理。對原始數(shù)據(jù)進行無量綱化處理,消除各維度特征間的量綱差異,同時也令參評數(shù)據(jù)在各維度的得分為1,有利于后期的優(yōu)化與計算??紤]到參評數(shù)據(jù)可能存在某些維度為0 的情況,本系統(tǒng)中使用mask 矩陣對其進行增量轉(zhuǎn)換,從而消除0 值對于無量綱化時的影響。

(3)計算關聯(lián)系數(shù)。計算各因素的灰色關聯(lián)系數(shù),比較序列xi在第k 個指標上的關聯(lián)系數(shù)ξi,計算方法如下:

其中ρ ∈[0,1]為分辨系數(shù),一般取值0.5。

(4)計算關聯(lián)度。對傳統(tǒng)的關聯(lián)度計算準則進行修改,基于層次分析模型算出的各項特征因素的權重,對關聯(lián)系數(shù)矩陣進行加權求和,具體計算公式如下:

其中,rj代表第j 級指標與參評序列的關聯(lián)度,wi代表權重向量w 中的第i 個權值,εij代表關聯(lián)系數(shù)矩陣中第i 行第j 列的元素。關聯(lián)度rj的值越接近1,說明兩個序列間的相關性越好。

3 模型設計

3.1 模型概述

本文設計了一種基于層次分析法和灰色關聯(lián)分析的用戶身份可信評價方法,以現(xiàn)有的權威身份認證提供商提供的身份信息為原始輸入,個體用戶后續(xù)輸入的身份屬性信息通過屬性聚類及相似度計算進行評分,使用層次分析法和灰色關聯(lián)分析將各條屬性可信評價進行多層次關聯(lián)決策分析,并得到用戶身份可信評價。該方法的示意圖如圖1 所示。

圖1 模型框架

(1)身份服務商:身份服務商提供多種權威性身份認證信息數(shù)據(jù),包括身份證號、指紋、虹膜、聲紋、護照號、姓名、性別、就醫(yī)記錄、犯罪記錄、婚姻情況、家庭成員、手機號碼以及政治面貌等。

(2)數(shù)據(jù)收集:收集身份服務商提供的身份信息數(shù)據(jù),采集用戶注冊網(wǎng)絡平臺、多媒體時的信息數(shù)據(jù)。

(3)屬性評價:對同一用戶的同一屬性的信息進行聚類,選取類內(nèi)方差最小的信息作為該屬性代表信息。利用用戶注冊的關鍵信息,如身份證號、銀行卡號、手機號碼等與權威信息數(shù)據(jù)庫中數(shù)據(jù)進行匹配,將用戶注冊的各屬性信息與權威信息數(shù)據(jù)庫中對應屬性進行相似度計算,得到相似度評分。

(4)屬性可信度聚合:將各屬性相似度評分根據(jù)范圍量化劃分為不同的可信等級,如0 ~0.2 不可信,0.2 ~0.5 偏不可信,0.5 ~0.8 偏可信,0.8 ~1可信。對于部分關鍵信息,如指紋、虹膜、性別等,只劃分不可信和可信兩個等級,且可信的閾值較高,如99%。

(5)可信決策:使用層次分析法和灰色關聯(lián)分析,將各條屬性可信評價進行多層次關聯(lián)決策分析,并得到用戶身份可信評價??尚旁u價等級劃分為4 級,分別為不可信、偏不可信、偏可信和可信。

3.2 數(shù)據(jù)預處理

圖2 顯示了基于層次分析法和灰色關聯(lián)分析的用戶身份可信評價方法所采集的數(shù)據(jù)。將這些數(shù)據(jù)分成以下幾類,包括:

(1)個體辨識類:指紋、聲紋、身份證號、護照號;

(2)醫(yī)療類:就醫(yī)記錄、醫(yī)療檢查;

(3)司法類:犯罪記錄、裁決記錄、訴訟記錄;

(4)家庭類:婚姻情況、家庭成員;

(5)通訊類:手機號、微信號、郵箱、社交賬號;

(6)個體特征類:性別、出生日期、民族、宗教信仰;

(7)人事類:政治面貌、教育經(jīng)歷。

可見,共計7 大類,21 種不同的身份屬性信息。

圖2 身份信息分類

3.3 執(zhí)行流程

本文設計的模型流程如圖3 所示。

首先,根據(jù)已有信息與權威身份服務商提供的信息作對比,計算相似度;其次,構建層次分析模型,構造判斷矩陣并輸出權重向量;再次,確定參考序列,并對序列中的數(shù)據(jù)進行無量綱化處理,計算關聯(lián)度;最后,尋找到關聯(lián)度最高的比較序列,并輸出最終評價結果。

4 實驗結果與分析

4.1 實驗環(huán)境

本文實驗使用Linux 系統(tǒng)(Ubuntu 18.04)進行實驗,系統(tǒng)內(nèi)存2 GB。

4.2 數(shù)據(jù)來源

本文使用的數(shù)據(jù)為模擬數(shù)據(jù)集。模擬1 000 個用戶的身份服務商提供的個人信息作為權威信息數(shù)據(jù)庫,及他們在平臺上注冊時輸入的信息數(shù)據(jù)作為評價數(shù)據(jù)。每個用戶有一組權威數(shù)據(jù)及一組評價數(shù)據(jù)。對這1 000 個用戶的模擬數(shù)據(jù)進行實驗。事先根據(jù)合理性對1 000 個用戶的待測評數(shù)據(jù)已進行了等級標記。

圖3 網(wǎng)絡結構

4.3 評價指標

為了評估本文提出的檢測模型的表現(xiàn),本文共選取2 個實驗指標,分別為宏F 值(Macro F-Score,Macro-F1)和Kappa 系數(shù):

其中p0表示總體分類精度,pe為:

4.4 實驗步驟、結果與評估

計算每組評價數(shù)據(jù)與權威數(shù)據(jù)之間的相似度,使用層次分析法和灰度關聯(lián)分析對計算出的相似度進行分析。

4.4.1 構造判斷矩陣

由圖2 身份信息分類可知,共選取7 個類別21種屬性的身份信息,因此共需要構建8 個判斷矩陣。判斷矩陣的參數(shù)由小組成員共同確定,具體如下。

(1)二級指標個體辨識類I1的判斷矩陣B1如圖4 所示。

圖4 二級指標個體辨識類I1 的判斷矩陣B1

二級指標醫(yī)療類I2的判斷矩陣B2如圖5 所示。

圖5 二級指標醫(yī)療類I2 的判斷矩陣B2

二級指標司法類I3的判斷矩陣B3如圖6 所示。

圖6 二級指標司法類I3 的判斷矩陣B3

二級指標家庭類I4的判斷矩陣B4如圖7 所示。

圖7 二級指標家庭類I4 的判斷矩陣B4

二級指標通訊類I5的判斷矩陣B5如圖8 所示。

圖8 二級指標通訊類I5 的判斷矩陣B5

二級指標個體特征類I6的判斷矩陣B6如圖9所示。

圖9 二級指標個體特征類I6 的判斷矩陣B6

二級指標人事類I7的判斷矩陣B7如圖10 所示。

圖10 二級指標人事類I7 的判斷矩陣B7

一級指標的判斷矩陣A1,如圖11 所示。

圖11 一級指標的判斷矩陣A1

4.4.2 計算8 個矩陣的歸一化特征向量和一致性檢驗結果

使用python 計算,得出8 個對比判斷矩陣的一致性檢驗結果和歸一化特征向量分別為:

對比矩陣B1通過一致性檢驗,各向量權重向量Q1為[0.166 666 67,0.166 666 67,0.333 333 33,0.333 333 33],CI=0.0,CR=0.0。

對比矩陣B2通過一致性檢驗,各向量權重向量Q2為[0.833 333 33,0.166 666 67],CI=0.0,CR=0.0。

對比矩陣B3通過一致性檢驗,各向量權重向量Q3為[0.558 424 54+0j,0.121 957 19+0j,0.319 618 26+0j],CI=0.009 147 353 644 82+0j,CR=0.010 163 726 272+0j。

對比矩陣B4通過一致性檢驗,各向量權重向量Q4為[0.666 666 67,0.333 333 33],CI=0.0,CR=0.0。

對比矩陣B5通過一致性檢驗,各向量權重向量Q5為[0.364 229 38+0j,0.364 229 38+0j,0.206 381 36+0j,0.065 159 88+0j],CI=0.009 246 313 859 65+0j,CR=0.008 255 637 374 69+0j。

對比矩陣B6通過一致性檢驗,各向量權重向量Q6為[0.312 5-0j,0.312 5-0j,0.312 5-0j,0.062 5-0j],CI=-1.480 297 366 17e-16+0j,CR=-1.321 694 076 93e-16+0j。

對比矩陣通過B7一致性檢驗,各向量權重向量Q7為[0.8,0.2],CI=0.0,CR=0.0。

對比矩陣A1通過一致性檢驗,各向量權重向量Qa1為[0.487 891 93+0j,0.031 094 56+0j,0.031 094 56+0j,0.151 596 13+0j,0.099 639 98+0j,0.151 596 13+0j,0.047 086 71+0j],CI=0.041 964 656 624 4+0j,CR=0.029 762 167 818 7+0j。

4.4.3 計算身份可信評價等級劃分中各評價因素的關聯(lián)度

(1)確立標準序列和參評序列

模型中,選取和AHP 模型相同的I1~I7共7個維度的準則作為等級劃分的標準。在7 個維度下共21 個屬性,根據(jù)計算得出的子層權重進行綜合量化,具體的量化公式如下:

本模型根據(jù)之前計算的相似度,已經(jīng)將各個屬性按照相似度進行基本分級,將各個層級的最佳案例作為評價級別的代表參數(shù)。每次選取一組待評價數(shù)據(jù)作為參評序列一同進行關聯(lián)度計算。如前文所述,本次模型中逆向使用灰色關聯(lián)分析模型,將4個評價等級序列作為候選序列,參評序列作為標準序列,從候選序列中選出與之最相似的序列,從而實現(xiàn)了對目標事件的等級分級。其中,Level 1 最可信,Level 4 最不可信。

(2)進行無量綱化及關聯(lián)度計算

將待評數(shù)據(jù)根據(jù)計算的權重向量進行處理,由21 維變成7 維。根據(jù)確認的候選序列,與參評序列構成矩陣,對其進行無量綱化和差序列計算。具體無量綱化規(guī)則如2.2 節(jié)所述。根據(jù)計算的一級權重進行關聯(lián)度計算,取關聯(lián)度最大的列,即為與參評序列最相近的候選序列,代表了該待評數(shù)據(jù)的分類。

以用戶1 的待測評數(shù)據(jù)為例。經(jīng)過無量綱化后的矩陣為:

計算得出的關聯(lián)度矩陣為:

根據(jù)4.3.2 節(jié)計算得出的權重,求出各列關聯(lián)度為:

可以看出,level 1 關聯(lián)度最高,即把用戶1 的可信等級分為Level 1 最可信。

4.4.4 實驗結果與評估

根據(jù)以上步驟,使用AHP-GRA 算法對1 000名用戶進行可信等級評價,最后得出的評價結果如圖12 所示。

圖12 可信等級評價分布

具體評價數(shù)據(jù)為Level 1(可信)248 個,Level 2(偏可信)327 個,Level 3(偏不可信)281 個,Level 4(不可信)144個,得出的混淆矩陣如表2所示。

表2 AHP-GRA 方法混淆矩陣

本文同時也建立了K-Means 聚類模型作為對比實驗。K-Means 是一種快速、有效的強聚類方法,基于各個數(shù)據(jù)在特征空間中的位置分布規(guī)律進行聚類,通過不斷迭代優(yōu)化最終達到收斂。

得出的混淆矩陣如表3 所示。

表3 K-Means 混淆矩陣

對兩類方法進行評估,可以得出評價結果如表4 所示。

表4 兩類方法的評價結果

可以看出,K-Means 的Macro-F 值和kappa 系數(shù)均低于AHP-GRA。

具體來說,一位用戶的個體辨識類信息可信度極高,但是其他類別信息可信度較低??紤]到可能用戶在自身發(fā)展過程中其他類別信息有變化,未能及時更新,故該用戶應屬于較為可信級別。再考慮另外一個用戶,個體特征類、人事類等信息可信度較高,但是個體辨識類信息存在不太可信的情況,考慮到個體辨識類信息為不可改變的信息,故該用戶應屬于較為不可信級別。K-Means 方法在無監(jiān)督的情況下并不能很好地區(qū)分這兩類用戶的可信程度,而AHP-GRA 模型可以。AHP-GRA 模型可以對每個因素賦予合理的影響因子,從而得出相對合理的評級結果。

5 結 語

本文提出了一種基于AHP-GRA 的身份可信評價方法,旨在解決不同身份不同網(wǎng)絡身份平臺上的身份互聯(lián)互通認證問題。本評價系統(tǒng)以現(xiàn)有的權威身份認證提供商提供的身份信息為原始輸入,個體用戶后續(xù)輸入的身份屬性信息通過屬性聚類及相似度計算進行評分,使用層次分析法和灰色關聯(lián)分析將各條屬性可信評價進行多層次關聯(lián)決策分析,并得到用戶身份可信評價。通過對模擬數(shù)據(jù)集進行評價,結果表明,基于AHP-GRA 的可信評價模型能夠給身份認證體系提供一個較為合理客觀的評價結果。

猜你喜歡
一致性身份向量
關注減污降碳協(xié)同的一致性和整體性
公民與法治(2022年5期)2022-07-29 00:47:28
向量的分解
注重教、學、評一致性 提高一輪復習效率
IOl-master 700和Pentacam測量Kappa角一致性分析
聚焦“向量與三角”創(chuàng)新題
跟蹤導練(三)(5)
他們的另一個身份,你知道嗎
向量垂直在解析幾何中的應用
基于事件觸發(fā)的多智能體輸入飽和一致性控制
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
凌源市| 富蕴县| 临湘市| 娄底市| 栾城县| 北碚区| 北安市| 玛沁县| 乌兰察布市| 天柱县| 大连市| 泸州市| 进贤县| 三穗县| 西充县| 南溪县| 襄樊市| 北碚区| 五华县| 鄂州市| 九江市| 山阴县| 绥滨县| 思茅市| 新泰市| 常山县| 临汾市| 竹北市| 慈溪市| 合江县| 二手房| 禹城市| 大姚县| 涿州市| 郑州市| 泸定县| 辽中县| 泰和县| 三明市| 鄂托克前旗| 灵璧县|