陶短房
事實上,所謂“大數(shù)據(jù)時代”的說法并不新鮮,早在2010年,“大數(shù)據(jù)”的概念就已由美國數(shù)據(jù)科學家維克托·邁爾·舍恩伯格系統(tǒng)地提出。他在《大數(shù)據(jù)時代》一書中說,以前,一旦完成了收集數(shù)據(jù)的目的之后,數(shù)據(jù)就會被認為已經(jīng)沒有用處了。比如,在飛機降落之后,票價數(shù)據(jù)就沒有用了;一個網(wǎng)絡檢索命令完成之后,這項指令也已進入過去時。但如今,數(shù)據(jù)已經(jīng)成為一種商業(yè)資本,可以創(chuàng)造新的經(jīng)濟利益。
數(shù)據(jù)能夠成為一種資本,與移動互聯(lián)網(wǎng)有密切關系。隨著智能手機、平板電腦等移動數(shù)碼產品的“白菜化”,WiFi信號覆蓋的無孔不入,越來越多的人不再有“在線時間”和“不在線時間”之分,只要他們愿意,便可幾乎24小時一刻不停地掛在線上;在線交易、在線支付、在線注冊等網(wǎng)絡服務的普及固然方便了用戶,卻也讓人們更加依賴網(wǎng)絡,依賴五花八門的網(wǎng)上平臺。
而隨著科技的進步,以往需要幾盒軟盤或一張光盤保存的信息,如今只需一片指甲蓋大小的芯片,即可全部儲存而且綽綽有余;以往需要電腦、顯示器、讀卡器等專門設備才能讀取的數(shù)碼信息載體,如今或許只需一部智能手機和一個免費下載的APP第三方應用程序,便可將數(shù)據(jù)一覽無余。
大數(shù)據(jù)時代的科技進步,讓人們身上更多看似平常的東西成為“移動數(shù)據(jù)庫”,如帶有存儲芯片的第二代銀行卡、信用卡,帶有芯片讀取功能的新型護照、駕駛證、社???、圖書證,等等。
數(shù)字化時代使得信息搜集、歸納和分析變得越來越方便,傳統(tǒng)的隨機抽樣被“所有數(shù)據(jù)的匯攏”所取代,基于隨機抽樣而變得重要的一些屬性,如抽樣的精確性、邏輯思辨和推理判斷能力,就變得不那么重要;盡可能匯集所有數(shù)據(jù),并根據(jù)這些數(shù)據(jù)得出趨勢和結論才至為關鍵。簡單說,以往的思維決斷模式是基于“為什么”,而在大數(shù)據(jù)時代,則已可直接根據(jù)“是什么”來下結論。由于這樣的結論剔除了個人情緒、心理動機、抽樣精確性等因素的干擾,因此,將更精確,更有預見性。
不過,一些學者指出,由于大數(shù)據(jù)理論過于依靠數(shù)據(jù)的匯集,那么一旦數(shù)據(jù)本身有問題,在“只問有什么,不問為什么”的模式下,就很可能出現(xiàn)“災難性大數(shù)據(jù)”,即因為數(shù)據(jù)本身的問題,而作出錯誤的預測和決策。
斯坦福大學專家特來沃爾·哈斯蒂也指出,大數(shù)據(jù)的理論是“在稻草堆里找一根針”,而面臨的問題是“所有稻草看上去都挺像那根針”。而喬治·梅森大學專家瑞貝克·高爾丁則提出“數(shù)據(jù)提供者造假”的危險,在大數(shù)據(jù)時代變得更有害,因為大數(shù)據(jù)理論建立在“海量數(shù)據(jù)都是事實”的基礎上,但人們無法控制數(shù)據(jù)提供者和搜集者本人的偏見和篩選。
近年來已有不少學者指出,擁有最完善的數(shù)據(jù)庫、最先接受大數(shù)據(jù)理念的華爾街投行和歐美大評級機構,卻每每在重大問題上判斷出錯,這本身就揭示了大數(shù)據(jù)的局限性。
不僅如此,大數(shù)據(jù)時代也造就了一個傳感器和數(shù)據(jù)庫無所不在的世界,而政府、情報部門和大商業(yè)機構在這方面有著先天優(yōu)勢,這很容易造成信息數(shù)據(jù)的“單向透明”,對小公司、個人的隱私和利益構成傷害。
以前,一旦完成了收集數(shù)據(jù)的目的之后,數(shù)據(jù)就會被認為已經(jīng)沒有用處了。但如今,數(shù)據(jù)已經(jīng)成為一種商業(yè)資本,可以創(chuàng)造新的經(jīng)濟利益。
由于大數(shù)據(jù)炙手可熱,數(shù)據(jù)的流失、泄露和私下買賣也成為噩夢,全球各地不時發(fā)生的個人信息被盜,可被看做大數(shù)據(jù)時代對個人生活的傷害,而“維基泄密事件”則提醒強力部門和各國政府,大數(shù)據(jù)的魔力同樣會對強者構成威脅。
或許是為了證明這一點,2013年4月24日,一名加拿大廣播公司的記者,為驗證某北美信用卡公司信誓旦旦的“安全承諾”,在大庭廣眾下做了個試驗:他使用一臺市面常見的三星Galaxy S3智能手機,在谷歌Play在線商店下載了一個免費APP第三方應用程序,在公共場合距離一名陌生人三四英寸(約10厘米)遠,用手機掃描,成功讀取了裝在陌生人衣袋中錢包里的一張信用卡芯片中的資料,包括卡號、持卡人姓名和到期日,然后他用竊取的這些信用卡信息,讓這位陌生人為自己埋單——在自動售貨機上買了一罐可樂。
事實證明,在大數(shù)據(jù)時代,芯片卡可能比磁條卡安全系數(shù)更差——密碼的設置和芯片加密功能可防范傳統(tǒng)的竊密手法,卻在移動數(shù)碼產品APP第三方應用程序的配置面前不堪一擊。加拿大安大略省女皇大學教授戴維·斯基利科恩指出,無需什么特別的專業(yè)技術和設備,一個普通人僅憑一部巴掌大的智能手機,就可以在幾英寸距離內窺視其他人“移動數(shù)據(jù)庫”里的隱私?;蛟S你沒有信用卡,不使用智能手機和平板電腦,但護照、身份證、社保卡、圖書證、健身卡、駕照……你總會有一樣或幾樣,而所有“移動數(shù)據(jù)庫”內都會儲存幾項大同小異的關鍵信息:持卡人姓名和生日,這些關鍵信息或許能幫助竊密者破解更多的“數(shù)據(jù)庫”。
一些商家對大數(shù)據(jù)時代的商業(yè)捆綁開發(fā),也在有意無意間助長了個人信息數(shù)據(jù)的“不設防”:
臉譜上點一個“贊”,或許不知不覺就參與了一項商業(yè)營銷活動,用戶的個人數(shù)據(jù)也在懵懂中向相關廣告方敞開;第三方應用程序廉價又方便,但使用者點擊“授權”時,或許已打開自己的“移動數(shù)據(jù)庫”大門而不自知……
今年3月,歐洲議會公布的一項研究報告指出,云計算時代的大數(shù)據(jù)對個人隱私的威脅不僅存在,而且比人們想象的更嚴重。個人信息搜集在大數(shù)據(jù)時代變得十分容易,而對個人信息數(shù)據(jù)保護則變得越來越難。
2011年,加拿大隱私委員會曾做過一項調查,結果顯示,60%的受訪者認為,和十年前相比,如今他們的個人隱私變得更加不安全了,其中55%的受訪者認為,社交網(wǎng)絡會泄露他們的個人隱私。
業(yè)內人士指出,由于大數(shù)據(jù)時代商業(yè)和經(jīng)濟驅動力的巨大推動,信息交換變得極為方便,然而保護卻變得十分困難,作為個人,即便加倍小心,也往往防不勝防。如今,許多人的生活已變得越來越離不開智能手機、平板電腦和社交網(wǎng)絡,而這也令個人數(shù)據(jù)的安全形勢變得更加復雜——你很難判斷,究竟誰在獲取你的個人信息,以及他們打算怎樣使用這些“偷來的數(shù)據(jù)”。