摘要:跨系統(tǒng)協(xié)同過濾推薦算法與信息管理系統(tǒng)間存在緊密的關(guān)系。為了應(yīng)對不良商家利用托攻擊帶來的挑戰(zhàn),并提高推薦的準確性,本文設(shè)計了一種跨系統(tǒng)協(xié)同過濾推薦算法,其結(jié)合安全多方計算理論與隨機擾亂技術(shù),可有效保證用戶隱私不泄露給協(xié)同系統(tǒng),并在此基礎(chǔ)上,可以精確地計算用戶間的相似度,降低預(yù)測誤差。通過試驗驗證,該算法能夠有效防止不良商家的托攻擊行為,并顯著提高推薦系統(tǒng)的準確性。
關(guān)鍵詞:協(xié)同過濾算法;安全計算模型;隱私保護
中圖分類號:TP309""""""""" 文獻標志碼:A
隨著信息技術(shù)的發(fā)展和普及,信息管理系統(tǒng)在各個領(lǐng)域中得到廣泛應(yīng)用,信息管理系統(tǒng)中的隱私保護與信息安全成為了亟待解決的重要問題??缦到y(tǒng)協(xié)同過濾推薦算法是一種用于推薦系統(tǒng)的算法,通過整合多個獨立的推薦系統(tǒng),共同提供個性化的推薦結(jié)果。傳統(tǒng)的協(xié)同過濾算法主要利用單一系統(tǒng)內(nèi)的用戶-項目評分矩陣來進行推薦操作,跨系統(tǒng)協(xié)同過濾推薦算法則擴展了這個概念,將多個系統(tǒng)中的用戶和項目數(shù)據(jù)進行聯(lián)合分析和推薦。信息管理系統(tǒng)提供數(shù)據(jù)源和數(shù)據(jù)共享機制,為跨系統(tǒng)協(xié)同過濾推薦算法提供支持和基礎(chǔ)。
1傳統(tǒng)的協(xié)同過濾算法的問題
傳統(tǒng)的協(xié)同過濾算法在實際應(yīng)用中存在以下問題。1)數(shù)據(jù)稀疏性:協(xié)同過濾算法利用用戶-項目評分矩陣來進行推薦,但是大部分用戶只對少數(shù)項目進行評分,這導(dǎo)致算法難以準確地預(yù)測用戶對未評分項目的興趣。2)冷啟動問題:當(dāng)新用戶加入系統(tǒng)或推出新項目時,因為缺乏足夠的評分數(shù)據(jù)進行準確推薦,所以協(xié)同過濾算法無法準確預(yù)測他們的興趣。3)算法偏好:傳統(tǒng)的協(xié)同過濾算法主要基于用戶間的相似度或項目間的相似度來進行推薦。這種方法容易使推薦結(jié)果出現(xiàn)算法偏好,即推薦給用戶的項目往往與他們喜歡的項目相似,缺乏多樣性。4)靈活性差:傳統(tǒng)的協(xié)同過濾算法通常只考慮用戶-項目間的關(guān)系,忽略了其他因素的影響,例如時間、地點、社交關(guān)系等。這限制了算法在個性化推薦方面的靈活性和準確性。5)數(shù)據(jù)隱私問題:協(xié)同過濾算法需要收集和分析用戶的個人數(shù)據(jù),涉及用戶隱私。如果不妥善保護,就可能引發(fā)數(shù)據(jù)泄露和濫用的風(fēng)險。
2跨系統(tǒng)的隱私保持協(xié)同過濾算法
2.1提出問題
跨系統(tǒng)協(xié)同過濾是指在不同系統(tǒng)間共享個性化推薦服務(wù),對系統(tǒng)間進行協(xié)作。在這種情況下,不同系統(tǒng)可以通過共享用戶評分和模型來提高推薦的準確性和個性化程度。假設(shè)存在n個系統(tǒng):S1,S2,…,Sn,則系統(tǒng)i的用戶評分矩陣如公式(1)所示。
(1)
式中:(Ri)n,n為系統(tǒng)i中的用戶對第n個項目的評分。
鎖定了目標用戶后,利用協(xié)同過濾推薦技術(shù),使不同系統(tǒng)間能夠攜手合作。通過各個系統(tǒng)間的協(xié)作,結(jié)合各個系統(tǒng)中所有用戶的評分數(shù)據(jù),預(yù)測用戶對某個特定項目的評分。
隨機擾亂技術(shù)是一種保護用戶隱私的方法,它通過對原始數(shù)據(jù)進行隨機化噪聲處理,來保護用戶評分信息。在協(xié)同過濾推薦系統(tǒng)中,當(dāng)需要計算用戶相似度時,可以使用隨機擾亂技術(shù)來保證評分信息不會泄露給其他協(xié)作系統(tǒng)。利用隨機擾亂技術(shù),當(dāng)跨系統(tǒng)推薦時,協(xié)同過濾推薦系統(tǒng)能夠保障用戶隱私的安全。同時,這種方法也可以降低數(shù)據(jù)共享帶來的用戶隱私泄露風(fēng)險,提高用戶對推薦系統(tǒng)的信任度。
設(shè)想有兩個均值均為0的向量,分別標記為A=(a1,a2,…,an)和B=(b1,b2,…,bn)。通過對向量A和B應(yīng)用向量∈=(∈1,∈2,…,∈n)和向量δ=(δ1,δ2,…,δn)的隨機擾動,可以得到新的向量A'=A+∈,B'=B+δ。在這個過程中,向量∈和δ的隨機化數(shù)據(jù)是遵循高斯分布或均勻分布的,其數(shù)值為[-m,m]。根據(jù)這種形式,基于A'·B'可以有效地估算所需A·B的數(shù)值。如公式(2)所示。
(2)
因為向量A和δ均值均為0并且相互獨立,因此能夠得
出ai≈0。同理,能夠得出bi≈0以及由
此可以得出公式(3)。
在隨機擾亂處理前,標準化處理是一項重要的步驟,它有助于縮小推薦算法的誤差。通過運用z-score標準化方法,可基于算術(shù)均值和標準差消除不同特征間量綱差異,完成原始數(shù)據(jù)轉(zhuǎn)化,從而提高算法的穩(wěn)定性和準確性。其計算過程如公式(4)所示。
(4)
式中:Rui為用戶u對項目i的原始評分;Ru、σu、Iu分別為用戶u的評分均值、標準差以及項目集合。標準差的計算過程如公式(5)所示。
2/Iu(5)
當(dāng)采用隨機擾亂技術(shù)時,需要注意的是擾亂過度可能會影響推薦算法的精確度??梢酝ㄟ^改進相似度度量標準來提高推薦的準確性。保護用戶隱私的同時,也能提高推薦系統(tǒng)的準確性和用戶滿意度。
2.2安全計算模型
本文提出了一種基于安全多方計算的理論模型,這為跨系統(tǒng)的協(xié)同過濾提供了安全保障。在該模型中,用多個公共的第三方來保障原始數(shù)據(jù)的安全傳遞,從而避免了數(shù)據(jù)泄露給中間節(jié)點的風(fēng)險。通過使用輕量
級分組密碼系統(tǒng)LBlock和RSA加密算法,本文的安全計算模型能夠有效地保護數(shù)據(jù)的機密性和完整性。LBlock有高效的數(shù)據(jù)加密和解密功能,用RSA保護密鑰的安全性。這樣即使在跨系統(tǒng)協(xié)同過濾過程中有潛在的安全風(fēng)險和攻擊威脅,也能夠保障數(shù)據(jù)的安全傳輸。同時,引入混淆傳輸?shù)母拍?,防止第三方惡意串通。通過混淆傳輸,使第三方無法獲知真實的數(shù)據(jù)內(nèi)容,提高數(shù)據(jù)的安全性和隱私保護。安全計算模型如圖1所示。
該安全計算模型使用RSA密碼系統(tǒng)生成公鑰和私鑰,利用LBlock密碼系統(tǒng)生成密鑰,并通過加密和解密操作安全傳輸數(shù)據(jù)。同時,使用茫然傳輸協(xié)議保護數(shù)據(jù)免受第三方的惡意串通。具體步驟如下[1]。所有系統(tǒng)都會創(chuàng)建一對RSA公鑰PK和私鑰SK。將公鑰分享給其他系統(tǒng),而將私鑰則安全地傳遞給n個第三方機構(gòu)。2)所有系統(tǒng)使用LBlock密碼系統(tǒng)生成n個獨立的密鑰Ki。3)各系統(tǒng)會使用之前分享的RSA公鑰對每個密鑰進行加密,生成對應(yīng)的密文K'i。將這些密文傳送到LBlock密鑰庫中。4)第三方機構(gòu)i從密鑰庫中檢索到對應(yīng)的密文K'i后,利用先前接收的RSA私鑰進行解密操作,進而還原原始的密鑰Ki。5)當(dāng)需要發(fā)送數(shù)據(jù)時,所有系統(tǒng)會使用與其對應(yīng)的密鑰Ki,通過LBlock算法對數(shù)據(jù)進行加密,生成加密后的密文ci。6)基于茫然傳輸協(xié)議可將完成加密的密文ci安全無誤地輸送至中間節(jié)點。7)中間節(jié)點將在n個第三方機構(gòu)所提供的密文組中挑選一組數(shù)據(jù)ci,且以安全的方式將其轉(zhuǎn)交給目標系統(tǒng)。8)目標系統(tǒng)會使用與密文ci對應(yīng)的密鑰Ki,通過LBlock解密算法還原原始的數(shù)據(jù)mi。
通過這樣的流程,可以保障數(shù)據(jù)的傳輸和存儲過程都是安全的,同時保護了用戶的隱私,并提高了系統(tǒng)的整體安全性。
2.3模型優(yōu)化
2.4隱私保護推薦算法
可以將基于安全計算模型和隨機擾動的跨系統(tǒng)協(xié)同過濾推薦算法描述為一種隱私保護的推薦算法。它通過安全計算模型和隨機擾動技術(shù),保證用戶的個人信息在推薦過程中不會泄露。這種算法允許不同系統(tǒng)間進行協(xié)同過濾推薦,無須共享用戶的真實數(shù)據(jù)。同時,通過引入隨機擾動,推薦結(jié)果會有一定程度的變化,使攻擊者無法準確了解用戶的真實偏好。保護用戶隱私的同時,提供個性化且準確的推薦結(jié)果。
以系統(tǒng)Alice和Bob為例,評分數(shù)據(jù)會對其進行z-score標準化處理,并得到數(shù)據(jù)rui。同時引入隨機噪聲進行擾動。這樣即使在協(xié)同過濾推薦系統(tǒng)中,存在潛在的安全風(fēng)險和攻擊威脅,也能夠保護用戶的隱私和數(shù)據(jù)的安全性。同時,由于評分數(shù)據(jù)通常較小,因此加性加入噪聲的方法能夠有效地增強數(shù)據(jù)的隱私保護效果。為增強隱私保護效果,對處理后的數(shù)據(jù)rui添加隨機擾動。具體做法:將rui加上一個隨機數(shù)γui,得到擾動后的數(shù)據(jù)r'ui=rui+γui。這里的γui可以是服從高斯分布或均勻分布在一定范圍內(nèi)的隨機數(shù)。
通過這樣的處理,評分數(shù)據(jù)標準化,在每個系統(tǒng)中添加隨機擾動,以保護用戶的隱私協(xié)同過濾推薦計算中,使用處理后的評分數(shù)據(jù)r'ui來進行相似度計算、預(yù)測等操作,從而生成最終的推薦結(jié)果。
根據(jù)輸入的描述,基于RSA密碼系統(tǒng)和LBlock密碼系統(tǒng)的跨系統(tǒng)協(xié)同過濾推薦算法的過程如下。1)Alice和Bob共同生成一對密鑰,包括公鑰PK和私鑰SK,將公鑰PK安全地發(fā)送給第三方。2)利用LBlock密碼系統(tǒng),Alice和Bob分別創(chuàng)建了n個密鑰,KAi和KBi,并在LBlock密鑰庫中存放這些密鑰加密后的密文。3)第三方機構(gòu)提取密鑰庫中完成加密的密鑰密文,通過私鑰SK對其逐一進行解密操作,從而獲取KAi、KBi。第三方使用KAi對數(shù)據(jù)RA、rA進行加密,生成R'A、r'A;同樣,使用KBi對數(shù)據(jù)RB、rB進行加密,生成R'B、r'B。4)第三方將加密后的數(shù)據(jù)密文組(c1、c2、...、cn)傳輸至中間節(jié)點。中間節(jié)點在密文組中挑選對應(yīng)數(shù)據(jù)ci,同時向Alice、Bob分別傳輸R'A和r'A、R'B和r'B。5)Alice與Bob接收到密文后各自運用相應(yīng)密鑰KAi、KBi進行解密,從而分別獲取其原始數(shù)據(jù)RA、rA和RB、rB。6)Alice與Bob分別將其組合后的數(shù)據(jù)XA+RA與YB+RB發(fā)送給對方。7)Bob進一步處理數(shù)據(jù),將X'YB+rB和|IB|發(fā)送給Alice。8)Alice利用接收到的數(shù)據(jù)計算差值X'YB+rB-Y'RA+rA,得到XA與YB的乘積。9)Alice基于XAYB和|IB|,通過相似度近似估計目標-Bob用戶的相似度。10)Alice采用預(yù)測評分公式來計算特定項目的預(yù)測評分Pui。
通過以上步驟,基于RSA密碼系統(tǒng)和LBlock密碼系統(tǒng)的跨系統(tǒng)協(xié)同過濾推薦算法可對目標用戶進行個性化推薦。
3試驗及分析
3.1安全性能試驗
為了研究不同密鑰長度對RSA算法執(zhí)行效率的影響,選擇512位、1024位和2048位3種長度進行測試,并詳細記錄了密鑰生成、加密及解密所需的時間。測試結(jié)果表明,隨著RSA密鑰長度增加,生成密鑰所需的計算時間顯著增長,而加密與解密操作所需的計算時間雖然也有所增加,但增長相對平緩。在RSA密鑰生成過程中,需要生成兩個大素數(shù),并計算其乘積作為公鑰模數(shù)。隨著密鑰長度增加,找到足夠大的素數(shù)變得更加困難,因此密鑰生成時間呈指數(shù)級增長。而在RSA加密和解密過程中,涉及對大數(shù)進行模冪運算。模冪運算的時間復(fù)雜度為指數(shù)級,由于使用了快速模冪算法等優(yōu)化技術(shù),因此加密和解密時間呈線性增長趨勢。為保障RSA算法安全,應(yīng)選擇足夠大的素數(shù)作為密鑰,這樣可以大大降低攻擊者通過公鑰推導(dǎo)出私鑰的可能性。
3.2相似性度量比較
為比較跨系統(tǒng)協(xié)同過濾和單系統(tǒng)協(xié)同過濾的精度,本文進行對比試驗。首先,為對比跨系統(tǒng)協(xié)作過濾與單系統(tǒng)協(xié)作過濾器的精度,本文進行比較試驗。從數(shù)量相對稀少的資料表隨機選擇一百個用戶打分向量作為系統(tǒng)A,從數(shù)量相對密集的資料表隨機選擇一百個用戶打分向量作為系統(tǒng)B。因為有關(guān)系統(tǒng)A的信息極其稀少,所以系統(tǒng)A給系統(tǒng)B發(fā)送協(xié)同運算要求,接受到反饋后,兩系統(tǒng)按PPCFSCM方法進行協(xié)同運算。對系統(tǒng)A、系統(tǒng)B以及系統(tǒng)A和系統(tǒng)B間的跨系統(tǒng)協(xié)作算法進行均方絕對誤差(MAE)比較試驗。研究結(jié)果表明,隨著數(shù)據(jù)集的稀疏性增強,協(xié)同過濾的推薦精度呈現(xiàn)下降趨勢。在跨系統(tǒng)協(xié)作計算中,數(shù)據(jù)經(jīng)過加密和茫然傳輸?shù)劝踩胧┍Wo,第三方只能獲取加密后的數(shù)據(jù),無法獲知真實的數(shù)據(jù)內(nèi)容。因此,通過跨系統(tǒng)協(xié)作計算和基于安全計算模型的數(shù)據(jù)保護措施,可以在用戶數(shù)據(jù)稀疏的情況下提高協(xié)同過濾推薦算法的精度,保障用戶隱私的安全性。
4結(jié)語
本文對信息管理系統(tǒng)的隱私保護與信息安全問題進行深入研究。通過運用安全多方計算理論、輕量級分組密碼算法和RSA密碼系統(tǒng)等技術(shù),提出了安全計算模型,該安全計算模型和算法可保護用戶隱私,提高推薦算法的準確性和安全性,為信息管理系統(tǒng)的隱私保護和信息安全問題提供了有效的解決方案。因此,信息管理系統(tǒng)的隱私保護與信息安全問題的研究具有重要意義。
參考文獻
[1]劉國麗,李昂,李艷萍,等. 跨系統(tǒng)協(xié)同過濾推薦算法的隱私保護技術(shù)研究[J]. 計算機應(yīng)用研究,2017,34(9):4.
[2]張明磊,韓明,王震洲. 基于安全多方計算的系統(tǒng)間隱私保持推薦算法[J]. 河北工業(yè)大學(xué)學(xué)報,2012(4):5.