趙思佳 尹 婷
(湖南環(huán)境生物職業(yè)技術學院,湖南 衡陽 421005)
隨著信息技術的不斷發(fā)展,信息互聯(lián)已經(jīng)成為工作和生活中重要的組成部分,其中有希望廣為傳播的大眾信息,也有只希望個人或限定幾個人了解的隱私信息,甚至還有一些不經(jīng)意間泄露出來的個人敏感信息。由于隱私信息保護不夠嚴密而造成的信息泄露逐漸成為危害網(wǎng)絡世界秩序的重點、難點問題,其不僅帶來個人財產(chǎn)損失、公司保密信息泄密等財物方面的不可控風險,還會成為惡意竊取信息、“人肉搜索”等網(wǎng)絡暴力的幫兇,破壞社會良好的公序良俗,甚至觸犯法律。信息保護是網(wǎng)絡技術發(fā)展的核心內(nèi)容之一。大數(shù)據(jù)分析是建立在對歷史數(shù)據(jù)和擴展信息進行綜合研判的基礎上,提取其中價值信息的方法,是一種新型的技術手段。應用大數(shù)據(jù)分析技術對隱私信息進行保護,既符合網(wǎng)絡環(huán)境下的信息互聯(lián)、共享的大背景,又具有不斷自我完善的AI特性,是一種“治標治本”的隱私信息保護手段。因此,該文進行建模分析,設計新型算法,并采取必要措施,以期實現(xiàn)在大數(shù)據(jù)分析技術路徑下的隱私信息保護。
該文設計的基于大數(shù)據(jù)分析的隱私保護策略結構,立足于保護隱私信息,因此在組件構成中增加了放大器模塊,用以采集信號并實施關鍵信息過濾檢索,并在該模塊框架層面,建立了3個角色的服務框架模型,用于服務注冊代理,即其在網(wǎng)絡中充當了服務提供者和服務請求者之間的通信中介。為了保證通信性能與帶寬不受影響,放大器模塊需要與原框架能夠較好地兼容,并能夠支持通信系統(tǒng)的擴展性,因此該模塊采用轉(zhuǎn)發(fā)式架構,對原通信協(xié)議不會產(chǎn)生影響。由此而生的附加字段需要能夠理解這樣的協(xié)議,為解決技術問題的解析協(xié)議理解起來并不困難,只需要添加協(xié)議棧模塊的功能,使服務注冊代理可以同時為多個服務提供者服務,其結構模型如圖1所示。
服務框架模型的設計理念是讓服務注冊代理充當網(wǎng)絡服務請求者和服務提供者的中轉(zhuǎn)角色,在網(wǎng)絡服務過程中對隱私信息進行甄別并提供保護。服務注冊代理對服務提供者進行管理,對其發(fā)布的信息進行甄別與審核,對隱私信息內(nèi)容進行保護并限制傳輸。服務注冊代理審核服務提供者,審核提供者的傳遞請求后,根據(jù)請求信息生成相應的模塊,將服務地址作為服務發(fā)布地址放入服務注冊列表,并向公眾發(fā)布。服務請求者需要與網(wǎng)絡綁定,明確自身身份角色信息,并判斷自身使用權限。當服務請求者與服務提供者建立鏈路后,管理模塊處于后臺監(jiān)管狀態(tài),并設置服務有效期。過期時模塊會自動失效,服務提供者需要向服務注冊代理申請一個新模塊。
當用戶需要某種類型的Web服務時,可通過服務注冊代理的內(nèi)部檢索,匹配相應的注冊服務,將檢索獲得的地址異步映射(Asynchronous Mapping Procedure ,AMP)對應相應的服務,從而實現(xiàn)與服務提供者的交互訪問,獲得相應的服務。用戶在使用業(yè)務前,服務商預定隱私策略,根據(jù)用戶的偏好設定參數(shù),從而實現(xiàn)個性化保護。
AMP模塊由連接池、休眠池、純管理模塊、策略管理模塊和策略存儲模塊組成。連接池生成一定數(shù)量的存儲服務注冊機構和有效的參數(shù),作為為用戶提供服務的基本單位存儲于休眠池中,并發(fā)布給服務用戶池中休眠的狀態(tài)稱為冬眠,經(jīng)過一段時間仍舊沒有接到服務請求則撤銷服務狀態(tài),返回連接池,等待再次被分配。策略管理模塊管理所有策略,為自定義策略修改參數(shù)表,形成新策略文件,并記錄下自定義的客戶信息,以便在后續(xù)服務中執(zhí)行新策略。策略存儲模塊是記載中心,存儲所有的策略文件。訪問服務時,該模塊根據(jù)“用戶簡介”章節(jié),將用戶信息中涉及個人隱私的內(nèi)容導入相應的臨時信息中,并制作“與臨時信息相關的隱私信息文件”章節(jié)。該臨時信息既可以存儲在相應策略中,完成相應的策略應答,也可以存儲在策略存儲模塊中,作為備份留待后續(xù)使用。策略存儲模塊將臨時信息或用戶審計結果發(fā)送給服務提供商,此時用戶可以從服務提供商獲取相應的服務。當請求的服務執(zhí)行完畢后,用戶將被釋放,策略管理模塊被設置為休眠狀態(tài),進入休眠池中,操作將根據(jù)配置文件的 “隱私保護策略”中的定義對服務過程中基于用戶的信息進行刪除或保存用戶隱私保護級別。為了節(jié)省資源,在休息一段時間后,策略管理模塊會再次單純地進入連接池為用戶提供服務。
為區(qū)別對待用戶的不同類型需求,可根據(jù)不同類型選擇不同的Agent算法。享有高等級權限的用戶可以使用獨立的選擇策略,自主性更強,即可以指定使用基于大數(shù)據(jù)分析的Agent保護信息算法,對普通權限用戶,則在休眠池中隨機選擇算法進行處理,選擇過程不能干預,以避免非法用戶快速獲取目標。在引入隨機態(tài)處理算法的離散性基礎上,根據(jù)不同的應用場景和需求,可以更換不一樣的計算方法來進行計算,該文將介紹基于大數(shù)據(jù)分析的Agent保護信息算法。
在大數(shù)據(jù)中選擇隨機事件有多種方式。例如當用戶按住鼠標,在計算機屏幕上隨機滑動時,鼠標軌跡形成的曲線是隨機的。換句話說,即使是同一個用戶也不能畫出完全一致的曲線。對于該大數(shù)據(jù)事件選擇,可在用戶獲得服務的某段時間內(nèi),對鼠標曲線進行時間采樣。如果需要生成一個01位的序列,則以1/N的間隔對大數(shù)據(jù)進行采樣,得到N個采樣點,每個采樣點以鼠標點在屏幕中的坐標值表示。然后對坐標值進行降級處理,橫縱坐標值相加,取最大整數(shù)。再對此結果進行二值化處理,偶數(shù)記為0,奇數(shù)記為1,則得到一個由0和1組成的隨機數(shù)序列,即Seed[i](其中i=0,1,…,N-1)。具體獲取的Agent目標的概率如公式(1)所示。
圖1 隱私信息保護結構模型
式中:S為第一次的大數(shù)據(jù)捕捉結果;n為大數(shù)據(jù)中的有效代理個數(shù)。
利用線性同余法對大數(shù)據(jù)序列進行進一步處理,得到新的組合數(shù)序列,并得到N個位置在[0,N-1]之間的隨機數(shù),該隨機數(shù)可以記為A[j](其中j=0,1,…,N-1)。具體到某個目標測試樣本時,其加權頻率計算公式如公式(2)所示。
式中:TF為Agent算法中的加權頻率;w為數(shù)據(jù)權重;TF為大數(shù)據(jù)中所涵蓋的數(shù)量;D為有效時間內(nèi)的文本頻率。
隱私信息的竊取行為具有頻發(fā)性的特性,即實施者不會僅針對某些特定信息進行竊取,而是通過頻繁地攻擊,用數(shù)量彌補成功概率低的問題。因此可在防護中抓住這一特點,作為隱私信息竊取行為的標簽,實施防衛(wèi)保護。另外,竊取隱私信息行為的搜索關鍵詞也具有典型特征,與被保護隱私的屬性、特點等向量值具有匹配性,這些關鍵信息恰恰是隱私信息保護的重點目標。因此在算法設計中,可對不同的信息賦予不同的權重,區(qū)分普通信息與核心信息,實現(xiàn)有重點的保護。當服務提供商向AMP服務注冊代理機構提交申請時,服務注冊代理機構會進行加密計算,根據(jù)計算結果確定參數(shù)配置標準以及相應的接口,分配給服務提供商。服務提供商可以根據(jù)自己的需求對每個配置文件進行參數(shù)配置。隱私保護可制定AMP多元化大數(shù)據(jù)策略,使用者可以根據(jù)自己的想法和需求來制定計劃,從而形成個人化的隱私保護管理機制。AMP模塊還有其他隱私保護參數(shù),可甄別出使用量大的參數(shù)信息,實現(xiàn)保護策略的多樣性,應對更為多樣化的非授權獲取行為,達到平衡隱私保護和信息傳輸效率的較佳狀態(tài)。該文設計的隱私信息保護策略提供了一個可擴展、非受控的平臺,可以根據(jù)設計需要自行定義參數(shù),添加限定條件,實現(xiàn)多維度的隱私信息保護。
在大數(shù)據(jù)時代,控制隱私數(shù)據(jù)的信息安全和隱私保護是相當重要的。但其保護手段的構建存在一些限制因素,具體表現(xiàn)如下:首先,在大數(shù)據(jù)環(huán)境下,不好對信息角色做出構建預設。其次,在信息安全管理過程中,計算機信息安全管理者沒有足夠的空間來獲取和訪問數(shù)據(jù)資源。再次,在信息分析中,一些信息用戶無法獲得系統(tǒng)的信息資源。在發(fā)生機制和隱私披露方面,第一步是建立完善的用戶信息隱私機制模型。用戶隱私披露點和發(fā)生機制之間的連接如圖2所示。
用戶不匿名使用網(wǎng)絡服務,會導致隱私泄露。用戶個人信息被網(wǎng)絡服務方充分掌握的形式為隱私攻擊者對信息進行攻擊,導致信息泄露;大數(shù)據(jù)從網(wǎng)絡服務接收信號、挖掘信息,然后開始挖掘第三方數(shù)據(jù)。但由于信息加密無法得到有效的結果,從而導致用戶信息泄露。用戶在使用網(wǎng)絡時,留下的信息被隱私攻擊者竊取,進而導致隱私信息泄露的主要原因是用戶對隱私保護的意識不強,沒有使用有效的保護方法。一般來說,數(shù)據(jù)的存儲主要由網(wǎng)絡用戶、可信組織和驗證者組成。網(wǎng)絡用戶使用可信組織將本地數(shù)據(jù)信息存儲在云中,減少了本地存儲的負擔,并允許合法用戶訪問他們的數(shù)據(jù)。在數(shù)據(jù)存儲過程中,可信組織對數(shù)據(jù)進行塊化處理并生成密鑰,以保證后續(xù)數(shù)據(jù)具有一定的驗證程度,然后將塊化數(shù)據(jù)分發(fā)到不同的節(jié)點,并建立相應的列表,再驗證者檢查數(shù)據(jù)的完整性,并向云服務集群提出申請。當云服務得到反饋結果時,即對反饋結果進行驗證。在該過程中,如果有不能通過校驗的塊數(shù)據(jù),就可以定位該塊數(shù)據(jù),并對其進行適當?shù)奶幚?,以恢復該塊數(shù)據(jù)。
圖2 用戶隱私與發(fā)生機制關系圖
該文在大數(shù)據(jù)分析的基礎上提出了大數(shù)據(jù)隱私保護策略研究,隱私保護框架模塊采用AMP模塊。AMP模塊具有良好的獨立性、擴散性和兼容性,能在滿足大部分場合需求的情況下,建立隱私保護規(guī)則,形成個性化的隱私保護機制。AMP模塊還支持多種通信協(xié)議,可以在不改變原有框架結構的情況下進行通信,在不影響框架結構的基礎上應用于各種業(yè)務。該文的實驗平臺是一個獨立于具體應用的軟件平臺,可根據(jù)不同顧客的不同需求,采取不同的隱私保護措施。開發(fā)保護策略的主要目的是為了保護用戶在使用服務時的個人信息。為了驗證所提出的基于大數(shù)據(jù)的隱私保護模塊較好的性能,該文設計了面向服務參與者的隱私保護仿真試驗,以仿真試驗中基于框架的部分使用設計為例,進行的試驗說明,3個參與者分別是提供服務者、提供注冊信息者以及最后需要使用這項服務的用戶。2個模塊包括互聯(lián)網(wǎng)通信協(xié)議(Internet Protocol version,IPV)模塊和AMP模塊。具體破解率如公式(3)所示。
式中:S為所求破解率;n為代理個數(shù);t為有效時間;s為破解過程中的變化數(shù)值;s為在j點時的數(shù)據(jù)數(shù)值。
在試驗過程中,用戶的隱私信息只提交給Agent,由于該試驗使用了大數(shù)據(jù)連接休眠技術,增強了服務提供者身份的隱秘性,其服務提供過程更不易被挾持,因此非授權的信息獲取方很難獲得對應的Agent進行破解,也無法獲得純包括用戶信息的服務提供者身份,在隱私信息的破解過程中不易找到準確目標,在時間維度上造成了“波門選擇”效應,將非授權獲取信息行為屏蔽在外。即使獲取到零散信息,也僅是暫時掌握了用戶零碎的信息片段,所以服務提供者仍然不知道用戶的真實信息。從以上2點可以看出,AMP模塊有效地保護了用戶的隱私信息。
鑒于試驗的隨機性,該試驗將100次試驗的數(shù)據(jù)為一組,在有效期內(nèi)選取5組試驗的破解率為試驗破解率值的代表。該試驗設保護目標為一個有效期內(nèi)的第一個服務用戶,并假定非法用戶采用破解手段試圖獲取其隱私信息。為降低干擾,在有效期內(nèi)不再提供其他服務。普通連接策略與大數(shù)據(jù)策略的試驗結果對比見表1。
試驗數(shù)據(jù)表明,在傳統(tǒng)網(wǎng)絡保護策略下,非法用戶的破解率均高于采用大數(shù)據(jù)分析的策略的破解率,同等有效時間下,基于大數(shù)據(jù)分析的隱私信息保護策略能有效減少隱私信息的破解,使用該方法時隱私保護效果有較大提升。通過對比傳統(tǒng)方式與基于大數(shù)據(jù)的隱私信息保護方式的破解率可以看出,在代理個數(shù)從20個增長到100個的各個數(shù)據(jù)節(jié)點中,后者的破解率明顯低于前者,說明后者可以更好地破解出入侵信息的病毒及隱私“窺探者”。隱私是當今社會的熱點問題,而個人隱私保護的研究是一個新的課題。雖然該研究在試驗設計和研究方法上具有一定創(chuàng)新性,但在隱私保護策略的細分、個人隱私的偏好程度等方面的研究仍存在不足,即對每個人對隱私的態(tài)度還沒有進行深入研究。需要在今后進一步發(fā)展。
表1 試驗數(shù)據(jù)對比
事實上,將關于自己的隱私信息進行處理和保護是一個復雜且困難的事情,是一個涉及線上秩序以及線下道德體系的綜合問題,其關系到個人、企業(yè)以及社會群體的切身利益,需要采用法律手段,結合社會監(jiān)督和有序懲戒,建立符合社會倫理規(guī)范的法律約束體系,形成以各方自律且有法可依的良性局面,對建立良好的網(wǎng)絡使用秩序具有重要意義。該文對機密計算機信息系統(tǒng)網(wǎng)絡安全影響因素進行分析,發(fā)現(xiàn)人為因素和自然因素都對當前的網(wǎng)絡安全產(chǎn)生了影響。因此,應結合現(xiàn)代網(wǎng)絡安全監(jiān)控技術,將加密技術、防火墻技術和入侵檢測技術應用到對機密計算機信息系統(tǒng)的網(wǎng)絡安全監(jiān)控中,以提高當前的網(wǎng)絡安全水平。