国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法仿真

2022-05-14 10:27:56王玲維黃漢云
計(jì)算機(jī)仿真 2022年4期
關(guān)鍵詞:增量密鑰分布式

王 華,王玲維,黃漢云

(1. 廣東科技學(xué)院計(jì)算機(jī)學(xué)院,廣東 東莞 523083;2. 湖南工業(yè)大學(xué)機(jī)械自動(dòng)化學(xué)院,湖南 株洲 412000)

1 引言

分布式資料庫(kù)系統(tǒng)一般采用小型電腦系統(tǒng)將多臺(tái)不同位置的電腦通過網(wǎng)路連結(jié)在一起,形成邏輯上完整且物理上分散的大型資料庫(kù)[1,2]。由于數(shù)據(jù)庫(kù)中存儲(chǔ)大量的用戶信息和隱私數(shù)據(jù),所以在對(duì)分布式數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)調(diào)用和更新時(shí),可能會(huì)產(chǎn)生隱私信息泄露的問題。因此,需要針對(duì)分布式數(shù)據(jù)庫(kù)中的隱私信息進(jìn)行優(yōu)化,設(shè)計(jì)相應(yīng)的更新方法[3]。

目前,分布式數(shù)據(jù)庫(kù)同步更新已成為學(xué)術(shù)界研究的熱點(diǎn)之一[4],并取得了一系列較為成熟的研究成果,如分布式本體調(diào)試信息的存儲(chǔ)優(yōu)化與增量更新方法[5]、鄰域多粒度粗糙集信息更新增量方法[6]等,但由于實(shí)際運(yùn)行環(huán)境復(fù)雜多變,傳統(tǒng)數(shù)據(jù)庫(kù)更新速度慢,更新效率不高,因此引入增量更新的概念。

增量式開發(fā)過程的技術(shù)基礎(chǔ)是具有參考透明度的特性?;诖颂匦跃涂梢燥@示出數(shù)據(jù)及其規(guī)格的一致性。為此,本研究設(shè)計(jì)了一種分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法,在保證有效保護(hù)數(shù)據(jù)庫(kù)隱私信息的基礎(chǔ)上,提高了數(shù)據(jù)更新的效率。

2 分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法設(shè)計(jì)

2.1 分析分布式數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)

圖1中顯示了具體的數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)。

圖1 分布式數(shù)據(jù)庫(kù)結(jié)構(gòu)圖

從圖1中可以看出,分布式數(shù)據(jù)庫(kù)從結(jié)構(gòu)上可以劃分為四個(gè)層級(jí),在數(shù)據(jù)存儲(chǔ)過程中采用單一數(shù)據(jù)的存儲(chǔ)模式,并在不同的層級(jí)上生成數(shù)據(jù)備份,也就是在數(shù)據(jù)庫(kù)的不同節(jié)點(diǎn)上存儲(chǔ)兩個(gè)相同的數(shù)據(jù)。

2.2 注冊(cè)分布式數(shù)據(jù)庫(kù)

DataSourceRegistrations的作用是為分布式異構(gòu)數(shù)據(jù)庫(kù)同步系統(tǒng)提供數(shù)據(jù)庫(kù)登錄信息和注冊(cè)用戶表結(jié)構(gòu),這些信息全部保存在XML結(jié)構(gòu)中。資料來源登記后可取得之資料庫(kù)資訊有:資料庫(kù)類型、IP位址、用戶名及密碼等[7]。

在數(shù)據(jù)源注冊(cè)成功后,數(shù)據(jù)庫(kù)下所有用戶表的表結(jié)構(gòu)將被提取以生成TableInfo.xml,以便在系統(tǒng)中生成映射文件。如果沒有注冊(cè)數(shù)據(jù)庫(kù),或者數(shù)據(jù)庫(kù)注冊(cè)不成功,則無法參與映射文件的生成。如果已成功注冊(cè)數(shù)據(jù)源,則無法在該數(shù)據(jù)庫(kù)類型下注冊(cè)相同數(shù)據(jù)庫(kù)的名稱;如果已注冊(cè)數(shù)據(jù)源的登錄信息發(fā)生了更改,則可以通過修改功能按鈕修改登錄信息;如果更改用戶表,則還可以通過更新表結(jié)構(gòu)按鈕更新Tablelnfo.xml文件。圖2中顯示了數(shù)據(jù)庫(kù)的具體注冊(cè)過程。

每個(gè)單位的源數(shù)據(jù)庫(kù)系統(tǒng)管理員負(fù)責(zé)數(shù)據(jù)庫(kù)資源的注冊(cè)、共享內(nèi)容的定義、共享數(shù)據(jù)的訪問權(quán)限登記等工作。源數(shù)據(jù)庫(kù)通過數(shù)據(jù)庫(kù)管理員提供的注冊(cè)信息連接到相應(yīng)的數(shù)據(jù)庫(kù),并通過中心數(shù)據(jù)庫(kù)提供的網(wǎng)絡(luò)服務(wù)進(jìn)行注冊(cè),將相關(guān)的同步表信息傳送到中心數(shù)據(jù)庫(kù)。每個(gè)單位的源數(shù)據(jù)庫(kù)管理員根據(jù)系統(tǒng)提供的數(shù)據(jù)庫(kù)表和視圖,并設(shè)置可以共享的內(nèi)容和權(quán)限[8]。每一個(gè)單元的數(shù)據(jù)庫(kù)管理員都要對(duì)自己提交的信息進(jìn)行確認(rèn),然后提交到中心數(shù)據(jù)庫(kù)服務(wù)器,等待系統(tǒng)管理員進(jìn)一步處理數(shù)據(jù)中心數(shù)據(jù)庫(kù)。

中央資料庫(kù)系統(tǒng)管理員負(fù)責(zé)審核各申請(qǐng)登記之異構(gòu)資料來源資料,以及各資料來源共享內(nèi)容及存取權(quán)限的確認(rèn)與分配。此外,在注冊(cè)新的數(shù)據(jù)源時(shí),如果數(shù)據(jù)庫(kù)連接不成功,則注冊(cè)失敗,應(yīng)用程序?qū)⒅苯咏Y(jié)束;如果連接成功,則在整個(gè)注冊(cè)過程結(jié)束時(shí),首先提取用戶表表結(jié)構(gòu)生成TableInfo.xml,然后提取所有表結(jié)構(gòu)并生成DBinfo.xml文件。在修改注冊(cè)信息后,可以通過所選數(shù)據(jù)源更新表結(jié)構(gòu)信息或修改登錄信息。

圖2 數(shù)據(jù)庫(kù)注冊(cè)流程圖

2.3 捕獲增量變更數(shù)據(jù)

在此基礎(chǔ)上,根據(jù)數(shù)據(jù)庫(kù)日志表的增量情況捕獲變更數(shù)據(jù)。在用戶執(zhí)行數(shù)據(jù)庫(kù)寫入操作的同時(shí)啟動(dòng)觸發(fā)器,并將更改和新寫入的信息備份到增量日志表中,手動(dòng)生成事件驅(qū)動(dòng)[9]。具體的變更數(shù)據(jù)捕獲過程如圖3所示。

圖3 觸發(fā)器執(zhí)行框架

圖3中采用了推拉式組合方式,在觸發(fā)器的驅(qū)動(dòng)支持下,將采集到的數(shù)據(jù)變化提交給中間傳輸。源數(shù)據(jù)庫(kù)的增量更新日志表結(jié)構(gòu)如表1所示。

表1 源數(shù)據(jù)庫(kù)日志表結(jié)構(gòu)

數(shù)據(jù)庫(kù)日志表是根據(jù)table info表和word info表中相對(duì)應(yīng)的表信息和字段信息,從table info表中獲取的,因此需要確定數(shù)據(jù)在中心數(shù)據(jù)庫(kù)中的插入位置。圖4中顯示了它們的變更捕獲關(guān)系。

圖4 變化捕獲關(guān)系ER圖

2.4 數(shù)據(jù)庫(kù)隱私信息加密保護(hù)

為確保數(shù)據(jù)庫(kù)更新過程中隱私信息的安全,需要對(duì)數(shù)據(jù)庫(kù)中的隱私信息進(jìn)行加密處理[10]。假定P表示未加密的明文數(shù)據(jù),K表示加密密鑰,那么數(shù)據(jù)的加密過程可以表示為

M=J(K,P)

(1)

式中輸出的是對(duì)應(yīng)于數(shù)據(jù)庫(kù)隱私信息的密文。在數(shù)據(jù)融合過程中,采用隨機(jī)密鑰分配機(jī)制進(jìn)行加密和解密,系統(tǒng)從包含大量密鑰的密鑰池中隨機(jī)抽取少量密鑰,形成密鑰環(huán)。在鄰接節(jié)點(diǎn)之間通過共享密鑰實(shí)現(xiàn)數(shù)據(jù)的安全傳輸。如果鍵池足夠大,機(jī)制的安全性就會(huì)更強(qiáng)。將密鑰總數(shù)設(shè)為k為key-pool,k為key-pool中的密鑰數(shù)。隨機(jī)兩個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中具有相同密鑰的概率是

(2)

式(2)的計(jì)算結(jié)果表明,攻擊者可以竊取任意兩個(gè)通信節(jié)點(diǎn)之間的鏈路,即隱私數(shù)據(jù)被竊聽的概率。由式(2)可知,為了使通信鏈路更安全可靠,需要密鑰池中密鑰的數(shù)量k越大,從而能夠保證節(jié)點(diǎn)間通信鏈路被竊聽的概率Peavesdrop越小,隱私數(shù)據(jù)泄露的可能性越小。假定網(wǎng)絡(luò)中k取值為10000,節(jié)點(diǎn)的鍵環(huán)大小為200,則任何兩個(gè)節(jié)點(diǎn)之間的Poverhear概率值為0.2%,足以滿足數(shù)據(jù)的隱私保護(hù)要求。

2.5 實(shí)現(xiàn)分布式數(shù)據(jù)庫(kù)隱私信息增量式更新

2.5.1 制定數(shù)據(jù)映射文件

單表到單表的映射關(guān)系在一對(duì)一數(shù)據(jù)庫(kù)中分為兩種情況:源表字段少于目標(biāo)表,源表字段多于目標(biāo)表。首先,建立映射文件是基于源表,源表有三個(gè)字段,目標(biāo)表有四個(gè)字段,目標(biāo)表按照系統(tǒng)映射文件準(zhǔn)則,目標(biāo)表字段必然不與源表相對(duì)應(yīng)。若要使兩表成功同步,字段必須為空。因?yàn)檫@種建立映射文件的方法具有目標(biāo)表字段總數(shù)節(jié)點(diǎn)和每個(gè)字段所在位置節(jié)點(diǎn)[11,12]。如果源表字段的數(shù)目超過了目標(biāo)表的數(shù)目,那么仍然選擇按字段建立映射文件方式。在這種情況下,源表字段的數(shù)量大于目標(biāo)表,因此,當(dāng)創(chuàng)建一個(gè)映射文件時(shí),將優(yōu)先考慮目標(biāo)字段的數(shù)量,過程如圖5所示。根據(jù)目標(biāo)表字段數(shù),圖5中只需要建立三次源字段和目標(biāo)字段之間的映射關(guān)系。生成恢復(fù)語(yǔ)句時(shí),只需從源表的三字段中提取有效信息值。

圖5 源表字段個(gè)數(shù)多于目標(biāo)表字段個(gè)數(shù)

2.5.2 數(shù)據(jù)加載

數(shù)據(jù)加載模塊主要完成SQL語(yǔ)句恢復(fù)、沖突處理以及數(shù)據(jù)導(dǎo)入等操作,實(shí)現(xiàn)數(shù)據(jù)導(dǎo)入?;趯?duì)三個(gè)XML文件(Datal.xml、DB info.xml、Mapping File.xml)的解析結(jié)果加載數(shù)據(jù)。分析Data Xml主要使用同步數(shù)據(jù)和源表信息,同步數(shù)據(jù)保存在List容器中。在Mapping File映射文件中,應(yīng)用程序根據(jù)Data Xml中的源表信息獲取目標(biāo)庫(kù)、目標(biāo)表、目標(biāo)字段的值,并判斷整個(gè)映射過程中是否存在表結(jié)構(gòu)沖突等情況。應(yīng)用程序提供解析DB Info.xml文件,根據(jù)映射文件提供的目標(biāo)庫(kù)名稱獲取登錄信息。加載數(shù)據(jù)時(shí),應(yīng)用程序需要解決加載期間的沖突處理問題。如果有命名沖突和表結(jié)構(gòu)沖突,則在恢復(fù)SQL語(yǔ)句時(shí)根據(jù)Mapping File.xml文件的描述進(jìn)行處理;如果有數(shù)據(jù)類型沖突,則需要在應(yīng)用程序中嵌入處理數(shù)據(jù)類型沖突的代碼,例如時(shí)間類型處理。

2.5.3 數(shù)據(jù)復(fù)制

分布式數(shù)據(jù)復(fù)制模塊主要由兩部分組成:源數(shù)據(jù)庫(kù)管理模塊和目標(biāo)數(shù)據(jù)庫(kù)管理模塊。其中,源數(shù)據(jù)庫(kù)管理模塊包括監(jiān)控采集、拷貝管理、同步傳輸控制和日志變更表四個(gè)子模塊功能。目標(biāo)數(shù)據(jù)庫(kù)管理模塊主要有同步傳輸控制、數(shù)據(jù)導(dǎo)入、一致性維護(hù)三個(gè)模塊。在這些模塊中,日志模塊主要記錄觸發(fā)器引發(fā)的語(yǔ)句的操作和數(shù)據(jù)。具體地說,包括被更新表的名稱、字段、運(yùn)行時(shí)間、操作者、同步目的地信息以及相應(yīng)的插入、更新、刪除語(yǔ)句信息等。通過預(yù)先設(shè)置的定時(shí)器觸發(fā)同步傳輸控制模塊,根據(jù)監(jiān)控獲取和日志記錄兩個(gè)模塊提供的純變化數(shù)據(jù),將其打包后以服務(wù)方式傳送到目標(biāo)數(shù)據(jù),接收到傳輸數(shù)據(jù)后加壓,并按照定制規(guī)則將數(shù)據(jù)轉(zhuǎn)換為與目標(biāo)數(shù)據(jù)庫(kù)一致的數(shù)據(jù)格式。在數(shù)據(jù)導(dǎo)入模塊中,按照預(yù)先設(shè)定的規(guī)則對(duì)數(shù)據(jù)進(jìn)行一致性維護(hù)處理,使用事務(wù)的方式導(dǎo)入數(shù)據(jù),返回真值進(jìn)行響應(yīng),若失敗,事務(wù)回滾,源同步控制模塊將再次開始與該記錄同步。圖6中顯示了具體的復(fù)制處理過程。

2.5.4 隱私信息增量式同步更新

數(shù)據(jù)庫(kù)中的數(shù)據(jù)不斷發(fā)生變化,在網(wǎng)絡(luò)服務(wù)適配器的協(xié)調(diào)下實(shí)現(xiàn)數(shù)據(jù)的同步更新。同步時(shí),應(yīng)在中央數(shù)據(jù)庫(kù)的Pure insert STUDENT類中調(diào)用Pure insert STUDENT方法。該方法主要對(duì)同步數(shù)據(jù)進(jìn)行邏輯處理,源表是以Web服務(wù)的形式發(fā)布的中心數(shù)據(jù)庫(kù)。同步更新的數(shù)據(jù)以Web服務(wù)的形式發(fā)布。

圖6 數(shù)據(jù)庫(kù)隱私信息異步復(fù)制流程圖

3 仿真分析

為驗(yàn)證上述設(shè)計(jì)的分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法的應(yīng)用性能,設(shè)計(jì)如下仿真。實(shí)驗(yàn)將VMware虛擬機(jī)設(shè)置在模擬實(shí)驗(yàn)環(huán)境,虛擬機(jī)內(nèi)嵌4核處理器和64位 CentOS6.5操作系統(tǒng)。另外實(shí)驗(yàn)中使用的分布式數(shù)據(jù)庫(kù)配置如表2所示。

表2 實(shí)驗(yàn)數(shù)據(jù)庫(kù)配置表

模擬實(shí)驗(yàn)環(huán)境中分布式數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù)取自 LUBM標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集LUBM-1,LuBM-10,LuBM-100.設(shè)置初始數(shù)據(jù)集中的數(shù)據(jù)量為2.7 GB,并將單位時(shí)間生成的數(shù)據(jù)設(shè)置為分布式。在實(shí)驗(yàn)環(huán)境下,將設(shè)計(jì)的分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法導(dǎo)入其中得出設(shè)計(jì)方法的運(yùn)行界面,如圖7所示。

圖7 增量式更新方法運(yùn)行界面

實(shí)驗(yàn)以更新同步效率和隱私信息保護(hù)性能為驗(yàn)證內(nèi)容。其中,更新同步效率通過數(shù)據(jù)庫(kù)產(chǎn)生新數(shù)據(jù)到數(shù)據(jù)庫(kù)更新完成所消耗的時(shí)間來體現(xiàn),隱私信息保護(hù)性能主要通過更新前后隱私信息數(shù)據(jù)量的變化情況來體現(xiàn)。為了形成實(shí)驗(yàn)對(duì)比,將傳統(tǒng)的分布式本體調(diào)試信息的存儲(chǔ)優(yōu)化與增量更新方法(文獻(xiàn)[5]方法)、鄰域多粒度粗糙集信息更新增量方法(文獻(xiàn)[6]方法)作為對(duì)比。經(jīng)過相關(guān)數(shù)據(jù)的讀取與統(tǒng)計(jì),得出實(shí)驗(yàn)結(jié)果,如表3所示。

表3 仿真測(cè)試對(duì)比結(jié)果

從表3中可以看出,相比于兩種傳統(tǒng)方法,本文設(shè)計(jì)的更新方法的更新速度更快。從隱私信息保護(hù)性能方面來看,本文設(shè)計(jì)的更新方法在運(yùn)行過程中隱私數(shù)據(jù)的丟失量更少。

綜上所述,本研究設(shè)計(jì)的分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法的更新效率更優(yōu),且在隱私信息保護(hù)方面更加具有優(yōu)勢(shì)。

4 結(jié)束語(yǔ)

分布式數(shù)據(jù)庫(kù)能夠保存大量的數(shù)據(jù)信息,本研究設(shè)計(jì)了分布式數(shù)據(jù)庫(kù)隱私信息增量式更新方法,通過增量式概念的應(yīng)用,提升了數(shù)據(jù)的更新效率,能夠保證數(shù)據(jù)庫(kù)中數(shù)據(jù)的時(shí)效性。然而仿真主要從隱私信息盜取方面進(jìn)行測(cè)試,未考慮隱私信息的竊取情況,因此在未來的研究工作中還需要做進(jìn)一步的研究。

猜你喜歡
增量密鑰分布式
探索企業(yè)創(chuàng)新密鑰
提質(zhì)和增量之間的“辯證”
密碼系統(tǒng)中密鑰的狀態(tài)與保護(hù)*
“價(jià)增量減”型應(yīng)用題點(diǎn)撥
一種對(duì)稱密鑰的密鑰管理方法及系統(tǒng)
分布式光伏熱錢洶涌
能源(2017年10期)2017-12-20 05:54:07
分布式光伏:爆發(fā)還是徘徊
能源(2017年5期)2017-07-06 09:25:54
基于ECC的智能家居密鑰管理機(jī)制的實(shí)現(xiàn)
基于均衡增量近鄰查詢的位置隱私保護(hù)方法
基于DDS的分布式三維協(xié)同仿真研究
惠水县| 五家渠市| 平顶山市| 广平县| 南通市| 买车| 新乡县| 平山县| 阳江市| 介休市| 台前县| 琼海市| 扎赉特旗| 远安县| 永仁县| 台南市| 池州市| 娄底市| 乌恰县| 通州区| 桓仁| 合水县| 原平市| 巴林左旗| 图片| 曲靖市| 宿迁市| 吉木萨尔县| 筠连县| 南汇区| 蓝山县| 麟游县| 东阳市| 麻城市| 泽普县| 鄱阳县| 河源市| 襄樊市| 平阳县| 铜陵市| 资溪县|