世界上沒有兩片完全相同的葉子,也沒有兩個完全相同的人,而背后基因是關(guān)鍵。簡單來講,基因數(shù)據(jù)有幾個特點:一是基因數(shù)據(jù)不可篡改?;驍?shù)據(jù)從出生就決定了一部分來自于母親,一部分來自于父親,不會簡單地隨著時間的變化而變化。二是基因攜帶了很多很多信息,包括人的表情、體征、祖源、血型等等。三是基因數(shù)據(jù)代表的不僅僅是你,同時代表了你的親屬、家族的信息。可以說,掌握了你的基因就掌握了你家族的信息。這就是為什么基因數(shù)據(jù)保護如此重要!
據(jù)華大智造副總裁蔣慧介紹,現(xiàn)在基因測序的成本越來越低,以前做一個基因測序大概需要30億美金,而現(xiàn)在僅需要600美金,人類基因組數(shù)據(jù)會越來越多。這就要求我們,在不斷產(chǎn)生大數(shù)據(jù)的同時,需要更多更好的措施來進行隱私保護和安全共享。
為了實現(xiàn)隱私保護和安全共享要求,密碼學家們也是絞盡了腦汁,最終不負眾望練就了兩項“絕技”,一項是全同態(tài)加密,另一項是安全多方計算。
什么是全同態(tài)加密?要搞清這個概念,我們首先設(shè)想這樣一個場景:假如你有海量的數(shù)據(jù),放在個人電腦上,這很占內(nèi)存;放在云端,又擔心不夠安全,害怕數(shù)據(jù)泄露出去,怎么辦呢?是的,對這些數(shù)據(jù)進行加密儲存,這是一個好方法。
可問題來了!如果你現(xiàn)在要把數(shù)據(jù)中“A”和“B”做運算,比如做加法。通常來講,我們先把“A”和“B”的密文解密出來,進行明文運算。不過,這個過程既繁瑣,數(shù)據(jù)又容易泄露。
那怎么解決?全同態(tài)加密應(yīng)運而生,即構(gòu)建一種明文與密文之間的關(guān)系,在加密情況下直接進行運算,得到一個密文結(jié)果,再把密文結(jié)果解密出來,這就是我們想要的結(jié)果。
聽起來好像比較簡單,但直到2009年理論上才有所突破,實際應(yīng)用起來的效率也不盡人意。而安全多方計算就要早一些,它在1982年提出。為了更好的說明,我們先來看看生活中的兩個例子。
第一個例子:Alice認為她得了某種遺傳疾病,想驗證自己的想法。正好她知道Bob有一個關(guān)于疾病的DNA模型的數(shù)據(jù)庫。如果她把自己的DNA樣品寄給Bob,那么Bob可以給出她的DNA的診斷結(jié)果。但是Alice又不想別人知道,這是她的隱私。所以,她請求Bob幫忙診斷自己DNA的方式是不可行的。因為這樣Bob就知道了她的DNA及相關(guān)私人信息。
第二個例子:兩個金融組織計劃為了共同的利益決定互相合作一個項目。每個組織都想自己的需求獲得滿足。然而,他們的需求都是他們自己專有的數(shù)據(jù),沒人愿意透露給其他方,甚至是“信任”的第三方。那么他們?nèi)绾卧诒Wo數(shù)據(jù)私密性的前提下合作項目呢?
遇到上面兩種情況你該怎么辦呢?安全多方計算就可以應(yīng)用到這樣的場景。同樣,我們來做這樣一個計算:一個房間里有X個人,每人都有一定的財富,現(xiàn)在我們想把所有人的財富加起來,得到一個總數(shù)。但是,我們誰也不愿意泄露自己財富,哪怕是可“信任”的第三方。這個時候,我們可以做一個安全多方計算的協(xié)議,僅僅是個協(xié)議,無需加密,通過交互完成后得到最終的結(jié)果。不過,這并不是說信息完全不會泄露,如果在場的有一個很有錢,而其他人的都可以忽略不計,那么可以根據(jù)最終結(jié)果大致知道這個人有多少財富。
當然,選擇哪項技術(shù),還有賴于具體的應(yīng)用場景。不過,目前這兩項計算都需要很高的成本。但是,兩項加密技術(shù)還在發(fā)展當中,相信未來會有更多更好更廉價的技術(shù)出現(xiàn),來保障我們的數(shù)據(jù)安全。(編輯/任偉)