摘 要:客戶服務(wù)平臺(tái)中存在多個(gè)異構(gòu)數(shù)據(jù)源,數(shù)據(jù)源來自不同的系統(tǒng)、部門或業(yè)務(wù)線,因此數(shù)據(jù)格式、結(jié)構(gòu)和存儲(chǔ)方式等存在差異,影響數(shù)據(jù)共享效率。針對(duì)上述問題,本文提出基于CP-ABE的客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)共享方法。首先,使用加密系統(tǒng)對(duì)客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)進(jìn)行加密與存儲(chǔ)。其次,基于CP-ABE技術(shù),結(jié)合AND、OR等邏輯操作和用戶屬性,設(shè)置訪問策略,保證只有滿足特定屬性集合的用戶才能解密和訪問數(shù)據(jù)。最后,驗(yàn)證用戶uid和屬性集S是否滿足訪問策略,成功則執(zhí)行解密算法,進(jìn)行客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)共享。試驗(yàn)結(jié)果表明,本文設(shè)計(jì)方法能夠顯著提高數(shù)據(jù)共享的效率,并保障數(shù)據(jù)在共享過程中的安全性,能為客戶服務(wù)平臺(tái)的數(shù)據(jù)共享提供強(qiáng)有力的支持。
關(guān)鍵詞:CP-ABE;客戶服務(wù)平臺(tái);異構(gòu)數(shù)據(jù);數(shù)據(jù)共享
中圖分類號(hào):TP 309" " 文獻(xiàn)標(biāo)志碼:A
隨著信息技術(shù)飛速發(fā)展,客戶服務(wù)平臺(tái)面臨日益增長(zhǎng)的數(shù)據(jù)處理需求,尤其是不同來源、結(jié)構(gòu)和格式的異構(gòu)數(shù)據(jù)。如何有效地融合、管理和共享這些異構(gòu)數(shù)據(jù)是客戶服務(wù)平臺(tái)提升服務(wù)質(zhì)量和用戶體驗(yàn)的關(guān)鍵。傳統(tǒng)的數(shù)據(jù)共享方法存在數(shù)據(jù)格式不統(tǒng)一、訪問控制機(jī)制不完善等問題,導(dǎo)致數(shù)據(jù)共享效率低下,并存在安全隱患。
文獻(xiàn)[1]從多個(gè)數(shù)據(jù)源中收集并預(yù)處理異構(gòu)數(shù)據(jù),利用知識(shí)圖譜技術(shù),從異構(gòu)數(shù)據(jù)中抽取并整合實(shí)體、關(guān)系等關(guān)鍵信息,形成統(tǒng)一的知識(shí)圖譜模型。采用實(shí)體對(duì)齊和關(guān)系映射技術(shù)對(duì)數(shù)據(jù)進(jìn)行深度融合,基于知識(shí)圖譜的推理能力進(jìn)行數(shù)據(jù)智能查詢和共享。文獻(xiàn)[2]制定了統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范,對(duì)異構(gòu)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和整合,基于規(guī)范化處理后的數(shù)據(jù)并結(jié)合業(yè)務(wù)需求,構(gòu)建數(shù)據(jù)共享服務(wù)平臺(tái),為用戶提供便捷的數(shù)據(jù)查詢和共享服務(wù)。
盡管上述方法在異構(gòu)數(shù)據(jù)共享領(lǐng)域取得了一定成效,但是2種方法均缺乏動(dòng)態(tài)性,在面對(duì)數(shù)據(jù)動(dòng)態(tài)變化的情況下顯得不夠靈活。為了克服這一局限性,本文提出基于CP-ABE的客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)共享方法,旨在建立更靈活、高效和安全的數(shù)據(jù)共享機(jī)制。
1 客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)加密
為了有效促進(jìn)客戶服務(wù)平臺(tái)中異構(gòu)數(shù)據(jù)的共享,本文采用先進(jìn)的加密系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行加密處理。加密系統(tǒng)由4個(gè)核心組件,即屬性管理者、云服務(wù)層、數(shù)據(jù)提供者和數(shù)據(jù)使用者構(gòu)成[3]。這些組件在復(fù)雜的系統(tǒng)中相互協(xié)作、緊密配合,無論是在跨越網(wǎng)絡(luò)邊界進(jìn)行數(shù)據(jù)傳輸?shù)倪^程中,還是在各類存儲(chǔ)介質(zhì)中靜置保存數(shù)據(jù)的過程中,都能使數(shù)據(jù)具有高度安全性和嚴(yán)格保密性,并能夠有效抵御外部威脅,如果遇到未經(jīng)授權(quán)的訪問和數(shù)據(jù)竊取,還能防止內(nèi)部泄露,為數(shù)據(jù)的完整性和隱私性筑起一道堅(jiān)不可摧的防線。加密過程如圖1所示。
數(shù)據(jù)提供者是客戶服務(wù)平臺(tái)中各種業(yè)務(wù)系統(tǒng)的代表,可生成含有異構(gòu)信息的數(shù)據(jù),并區(qū)分隱私數(shù)據(jù)和非隱私數(shù)據(jù)。假設(shè)存在異構(gòu)數(shù)據(jù)集D,其中每個(gè)數(shù)據(jù)項(xiàng)di∈D都有一個(gè)與之關(guān)聯(lián)的隱私屬性Pi,該屬性是一個(gè)二元變量,其中1表示隱私數(shù)據(jù),0表示非隱私數(shù)據(jù)。定義一個(gè)指示函數(shù)I(di)來表示數(shù)據(jù)項(xiàng)di是否為隱私數(shù)據(jù),如公式(1)所示。
(1)
對(duì)于隱私數(shù)據(jù),系統(tǒng)直接進(jìn)行加密保護(hù);對(duì)于非隱私數(shù)據(jù),系統(tǒng)根據(jù)實(shí)際需求進(jìn)行相應(yīng)的加密處理。在加密過程中,系統(tǒng)利用數(shù)據(jù)屬性加密結(jié)構(gòu)生成隨機(jī)序列,并根據(jù)數(shù)據(jù)屬性的隨機(jī)特征進(jìn)行編碼,將數(shù)據(jù)原始形式轉(zhuǎn)化為一種難以被破解的編碼形式。加密過程如公式(2)所示。
E'(D)=E(di,R(Ai)) (2)
式中:Ai為數(shù)據(jù)項(xiàng)di的一組屬性;R(Ai)為根據(jù)Ai生成隨機(jī)序列的函數(shù);E(di,R(Ai))為使用R(Ai)對(duì)di進(jìn)行編碼的函數(shù);E'(D)為加密后的數(shù)據(jù)。
將加密后的客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)上傳到云服務(wù)層進(jìn)行存儲(chǔ)。云服務(wù)層是存儲(chǔ)核心,采用分布式架構(gòu)應(yīng)對(duì)數(shù)據(jù)量的不斷增長(zhǎng)。當(dāng)數(shù)據(jù)量擴(kuò)大到單一機(jī)器無法承載時(shí),引入數(shù)據(jù)分片技術(shù),將數(shù)據(jù)分散至多臺(tái)機(jī)器進(jìn)行存儲(chǔ),從而在不依賴高性能服務(wù)器的情況下滿足大規(guī)模數(shù)據(jù)的存儲(chǔ)需求[4]。
2 基于CP-ABE的訪問策略設(shè)置
本文以對(duì)數(shù)據(jù)進(jìn)行加密的方式保障異構(gòu)數(shù)據(jù)的安全性。為了精細(xì)控制數(shù)據(jù)訪問,本文基于CP-ABE技術(shù),在客戶服務(wù)平臺(tái)上為異構(gòu)數(shù)據(jù)制定了一套精細(xì)的訪問策略,只有滿足特定屬性集合的用戶才能解密和訪問數(shù)據(jù)[5]。所采用的樹狀型訪問控制結(jié)構(gòu)如圖2所示。
圖2中,A、B和C為不同的葉子節(jié)點(diǎn),每個(gè)葉子節(jié)點(diǎn)代表不同的屬性,它們與特定的門限函數(shù)AND、OR相關(guān)聯(lián)。這些門限函數(shù)不僅定義了訪問控制的邏輯,還反映了節(jié)點(diǎn)的權(quán)限級(jí)別。在訪問控制結(jié)構(gòu)中,節(jié)點(diǎn)越靠近樹根,權(quán)限越大。
為了精確設(shè)定訪問控制策略,數(shù)據(jù)提供者需要清晰界定需要重點(diǎn)保護(hù)的數(shù)據(jù),并細(xì)致分析應(yīng)被授權(quán)訪問這些數(shù)據(jù)的用戶群體,并運(yùn)用CP-ABE高級(jí)加密技術(shù)靈活地構(gòu)建訪問策略。這些策略巧妙地結(jié)合了邏輯操作,例如AND、OR等,保證只有同時(shí)滿足一系列預(yù)設(shè)屬性條件的用戶才能解密并訪問受保護(hù)的數(shù)據(jù),從而進(jìn)行既高效又安全的數(shù)據(jù)訪問管理。設(shè)置過程如所示。
在構(gòu)建ABE中的訪問控制樹過程中,每個(gè)非葉子節(jié)點(diǎn)代表一個(gè)控制門限,該門限指定了訪問與該節(jié)點(diǎn)關(guān)聯(lián)的異構(gòu)數(shù)據(jù)所需滿足的最小屬性數(shù)量[6]。從根節(jié)點(diǎn)開始,為每個(gè)節(jié)點(diǎn)分配一個(gè)多項(xiàng)式函數(shù)。節(jié)點(diǎn)N的多項(xiàng)式函數(shù)fN(x)的最高次數(shù)為kN-1,其中kN是該節(jié)點(diǎn)的門限值,如公式(3)所示。
fN(x)=akN-1+xkN-1+akN-2xkN-2+…+aix+eN (3)
式中:ai為隨機(jī)生成的系數(shù);eN為常數(shù)項(xiàng),是數(shù)據(jù)加密的密鑰。
對(duì)于非葉子節(jié)點(diǎn),將子節(jié)點(diǎn)的索引值代入其父節(jié)點(diǎn)的多項(xiàng)式函數(shù)可計(jì)算出子節(jié)點(diǎn)的密鑰。假設(shè)節(jié)點(diǎn)N有子節(jié)點(diǎn)C1,C2,...,Cn,其中每個(gè)子節(jié)點(diǎn)的索引為i1,i2,...,in,則子節(jié)點(diǎn)Cj索引ij的密鑰ecj如公式(4)所示。
ecj=fN(ij) (4)
使用封裝密鑰算法生成封裝密鑰對(duì)(lL,CL),lL為加密葉子節(jié)點(diǎn)的加密值,CL為與屬性相關(guān)的其他信息。當(dāng)用戶嘗試訪問客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)時(shí),必須提供與屬性基加密樹(Attribute-based Encryption Tree,ACT)中葉子節(jié)點(diǎn)相匹配的屬性密鑰。只有用戶擁有與葉子節(jié)點(diǎn)對(duì)應(yīng)的屬性密鑰,才能解密相應(yīng)的加密值[7]。綜上所述,只有滿足密文策略中定義條件的用戶才能解密并訪問數(shù)據(jù),從而達(dá)到精細(xì)控制數(shù)據(jù)的訪問權(quán)限并保證數(shù)據(jù)的機(jī)密性和完整性的目的。由于訪問策略與密文綁定,即使數(shù)據(jù)在共享過程中被截獲,沒有適當(dāng)屬性的攻擊者也無法解密數(shù)據(jù),因此系統(tǒng)的安全性得到了提升。
3 異構(gòu)數(shù)據(jù)解密和數(shù)據(jù)共享
在客戶服務(wù)平臺(tái)的數(shù)據(jù)共享場(chǎng)景中,用戶檢索與所需數(shù)據(jù)相關(guān)的元數(shù)據(jù)信息,這些信息包括文件標(biāo)識(shí)符、密文以及訪問控制列表[8]。為了解密這些數(shù)據(jù),用戶需要執(zhí)行特定的解密算法,解密算法部分代碼如下所示。
\text{is_valid_user}(uid,RL)=\begin{cases}
\text{true},amp; \text{if } uid \in RL \\
\text{],amp; \text{otherwise}
\end{cases}
解密過程需要驗(yàn)證用戶的uid是否在RL中。如果uid不存在,用戶將收到訪問失敗的提示并終止操作。如果uid存在于RL中,算法將進(jìn)一步檢查客戶的屬性集S是否滿足數(shù)據(jù)提供者定義的訪問結(jié)構(gòu)。驗(yàn)證過程部分代碼如下所示。
\text {satisfies_poliey}(S,OBDD)=\begin{cases}
\text{true},amp; \text{if }S \text{satisfies }OBDD \\
\text{}, amp; \text {otherwise}
\end{cases}
在上述代碼中,“satisfies_policy”是一個(gè)抽象函數(shù),表示用戶屬性集是否滿足數(shù)據(jù)提供者定義的訪問策略。解密算法從特定節(jié)點(diǎn)開始遍歷所有分支。算法會(huì)檢查每個(gè)節(jié)點(diǎn)關(guān)聯(lián)的屬性是否在用戶的屬性集S中,并據(jù)此決定向高子節(jié)點(diǎn)或低子節(jié)點(diǎn)移動(dòng)[9]。如果用戶的屬性集S符合某條有效路徑,算法將生成解密密鑰Y。此時(shí),數(shù)據(jù)提供者將密文W和解密密鑰Y作為輸入,將解密結(jié)果G(W,Y)輸出為正?;虍惓?,如公式(5)所示。
(5)
式中:M為解密后的明文;Fail為解密失敗或異常結(jié)果。
如果解密處理后得到的是明文數(shù)據(jù),就能得到異構(gòu)數(shù)據(jù)的共享。如果解密失敗,就會(huì)重新生成解密密鑰,重復(fù)解密步驟,直到獲得明文數(shù)據(jù)。至此完成客戶服務(wù)平臺(tái)異構(gòu)數(shù)據(jù)共享。
4 試驗(yàn)
4.1 試驗(yàn)準(zhǔn)備
為了驗(yàn)證本文方法在提升數(shù)據(jù)共享效率方面的實(shí)際效果與優(yōu)勢(shì),本文設(shè)計(jì)并實(shí)施了一系列試驗(yàn)。在試驗(yàn)準(zhǔn)備階段,考慮服務(wù)器為高性能配置,并需要滿足大規(guī)模數(shù)據(jù)處理的需求,本文檢測(cè)了網(wǎng)絡(luò)設(shè)備的穩(wěn)定性與帶寬能力,對(duì)操作系統(tǒng)的兼容性、穩(wěn)定性與安全性進(jìn)行了嚴(yán)格篩選,選用了能夠優(yōu)化數(shù)據(jù)檢索與并發(fā)處理能力的數(shù)據(jù)庫(kù)管理系統(tǒng)。在數(shù)據(jù)集成工具的選用與配置上,力求實(shí)現(xiàn)數(shù)據(jù)的無縫對(duì)接與高效整合。
選擇配備Intel Xeon Gold 6248R處理器和2.7 GHz、20核心的服務(wù)器,并為其配備具有強(qiáng)大計(jì)算能力和數(shù)據(jù)存儲(chǔ)性能的128 GB DDR4 ECC REG RAM和2 TB NVMe SSD。在網(wǎng)絡(luò)設(shè)備方面,采用具有穩(wěn)定網(wǎng)絡(luò)連接和高效數(shù)據(jù)傳輸能力的Cisco Catalyst 9300系列交換機(jī)和Cisco 2911集成服務(wù)路由器。對(duì)于數(shù)據(jù)集成和共享的需求,本文將Apache NiFi 1.15.0作為數(shù)據(jù)集成工具,處理各種來源的異構(gòu)數(shù)據(jù)。在網(wǎng)絡(luò)配置方面,為試驗(yàn)環(huán)境分配192.168.1.0/24的IP地址段,并設(shè)置防火墻規(guī)則,允許TCP 80、443、5432和8080等關(guān)鍵端口通信,以滿足不同服務(wù)的需求。在數(shù)據(jù)庫(kù)管理系統(tǒng)方面,設(shè)置每日凌晨1:00的全庫(kù)備份和每小時(shí)的增量備份策略,使數(shù)據(jù)具有安全性和可恢復(fù)性。
在試驗(yàn)中,本文模擬不同來源、結(jié)構(gòu)和格式的異構(gòu)數(shù)據(jù)在客戶服務(wù)平臺(tái)上的共享過程,旨在評(píng)估所提方法在數(shù)據(jù)共享效率方面的具體表現(xiàn)。鑒于試驗(yàn)涉及多種異構(gòu)數(shù)據(jù)的共享,數(shù)據(jù)格式的兼容性和轉(zhuǎn)換效率尤為重要。因此,在數(shù)據(jù)集成環(huán)節(jié),必須特別注意不同數(shù)據(jù)源間的數(shù)據(jù)格式差異,并保證數(shù)據(jù)集成工具能有效、精確地處理這些差異,從而實(shí)現(xiàn)數(shù)據(jù)的順暢共享。同時(shí),考慮試驗(yàn)環(huán)境較復(fù)雜和所涉及的數(shù)據(jù)量較大,對(duì)服務(wù)器的性能和穩(wěn)定性提出了極高要求。在服務(wù)器運(yùn)行期間,需要密切監(jiān)控各項(xiàng)性能指標(biāo),包括CPU利用率、內(nèi)存占用以及磁盤I/O等,以保證服務(wù)器具有持續(xù)、穩(wěn)定進(jìn)行高性能數(shù)據(jù)處理的能力,從而滿足試驗(yàn)需求。
4.2 試驗(yàn)結(jié)果和分析
為了驗(yàn)證本文方法在異構(gòu)數(shù)據(jù)共享效率方面的優(yōu)越性,按照上述試驗(yàn)準(zhǔn)備,將本文方法與文獻(xiàn)[1]、文獻(xiàn)[2]方法應(yīng)用于客戶服務(wù)平臺(tái)中進(jìn)行對(duì)比試驗(yàn)。比較3種方法在不同條件下的異構(gòu)數(shù)據(jù)共享效率,試驗(yàn)結(jié)果見表1。
由表1中的試驗(yàn)結(jié)果可知,本文方法在異構(gòu)數(shù)據(jù)共享效率方面具有顯著優(yōu)勢(shì)。在不同試驗(yàn)條件下,無論是數(shù)據(jù)量較小、數(shù)據(jù)格式簡(jiǎn)單的場(chǎng)景,還是中等數(shù)據(jù)量、多種數(shù)據(jù)格式的場(chǎng)景,甚至大數(shù)據(jù)量、復(fù)雜數(shù)據(jù)格式的復(fù)雜情況,本文方法均能保持較高的共享效率。特別是在數(shù)據(jù)量較大、數(shù)據(jù)格式復(fù)雜的條件下,本文方法的優(yōu)勢(shì)尤為明顯,其共享效率遠(yuǎn)超對(duì)比方法。在網(wǎng)絡(luò)帶寬有限的限制下,本文方法依然能夠保持較高的共享效率,顯示出其在網(wǎng)絡(luò)受限環(huán)境下的良好適應(yīng)性。當(dāng)服務(wù)器處于高負(fù)載狀態(tài)時(shí),本文方法也能保持穩(wěn)定的共享效率,證明其抗壓能力較高。值得一提的是,在實(shí)時(shí)性要求極高的場(chǎng)景下,本文方法同樣能保持高效的共享效率,并且優(yōu)于對(duì)比方法,充分說明本文方法在處理實(shí)時(shí)數(shù)據(jù)共享任務(wù)中的有效性。綜上所述,本文方法在異構(gòu)數(shù)據(jù)共享效率方面表現(xiàn)出色,為異構(gòu)數(shù)據(jù)共享提供了一種高效、可靠的解決方案。
5 結(jié)語
本文提出了能夠高效融合、管理和共享異構(gòu)數(shù)據(jù)的方法。該方法不僅解決了數(shù)據(jù)格式不統(tǒng)一和訪問控制機(jī)制不完善的問題,還利用CP-ABE技術(shù)實(shí)現(xiàn)了對(duì)數(shù)據(jù)訪問的細(xì)粒度控制和動(dòng)態(tài)管理,顯著提升了數(shù)據(jù)共享的安全性和效率。在未來的研究工作中,本文將繼續(xù)探索CP-ABE技術(shù)在異構(gòu)數(shù)據(jù)共享領(lǐng)域的更多應(yīng)用,進(jìn)一步優(yōu)化和完善現(xiàn)有方法。同時(shí)還將關(guān)注新技術(shù)的發(fā)展,探索如何將新興技術(shù),例如將人工智能、區(qū)塊鏈等與CP-ABE相結(jié)合,提升數(shù)據(jù)共享的性能和安全性。
參考文獻(xiàn)
[1]潘建宏,王磊,樊家樹,等.一種基于知識(shí)圖譜技術(shù)的多源異構(gòu)數(shù)據(jù)融合、共享方法[J].電子設(shè)計(jì)工程,2022,30(23):185-188,193.
[2]陳玲玲,陳靜霖,楊玉賢.面向電力多源異構(gòu)的數(shù)據(jù)治理及共享服務(wù)研究與應(yīng)用[J].中國(guó)高新科技,2021,(21):76,78.
[3]張學(xué)旺,姚亞寧,付佳麗,等.策略隱藏的高效多授權(quán)機(jī)構(gòu)CP-ABE物聯(lián)網(wǎng)數(shù)據(jù)共享方案[J].計(jì)算機(jī)研究與發(fā)展,2023,60(10):2193-2202.
[4]張恪易.基于云服務(wù)技術(shù)的數(shù)據(jù)共享交換集成應(yīng)用探究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2023(9):67-69.
[5]譚海軍.異構(gòu)環(huán)境下分布式數(shù)據(jù)共享機(jī)制的研究[J].無線互聯(lián)科技,2023,20(12):113-115.
[6]羅仲達(dá),李容嵩,彭凌煙,等.基于區(qū)塊鏈和CP-ABE的電力工程檢測(cè)數(shù)據(jù)安全共享方法[J].電力信息與通信技術(shù),2023,21(3):80-86.
[7]黃吉林.基于密文策略屬性加密的廣電監(jiān)管數(shù)據(jù)共享系統(tǒng)[J].廣播與電視技術(shù),2023,50(1):105-109.
[8]黃思云,齊金平.云計(jì)算環(huán)境下基于XML的異構(gòu)數(shù)據(jù)共享研究[J].信息與電腦(理論版),2022,34(19):16-19.
[9]侯戌非.物聯(lián)網(wǎng)環(huán)境下海量多源異構(gòu)數(shù)據(jù)的存儲(chǔ)算法[J].寧夏師范學(xué)院學(xué)報(bào),2022,43(7):80-85.