馮麗
摘要:大數(shù)據(jù)技術(shù)并不是指數(shù)據(jù)量很大,而是指數(shù)據(jù)源頭、數(shù)據(jù)格式和數(shù)據(jù)渠道的多樣性及相關(guān)匯總分析。簡稱為“三多一分析”。大數(shù)據(jù)分析和其他計算機分析技術(shù)的差別在于它所分析的不是單一源頭、單一渠道、單一格式數(shù)據(jù),而是多樣性數(shù)據(jù),大數(shù)據(jù)安全是傳統(tǒng)數(shù)據(jù)安全特性的和新安全特定的結(jié)合。針對新安全特性,采用發(fā)布干擾消息、風(fēng)險預(yù)警和防范、大數(shù)據(jù)反分析等技術(shù)進行安全建設(shè)。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)據(jù)源;數(shù)據(jù)格式;數(shù)據(jù)渠道;多樣化;數(shù)據(jù)分析;大數(shù)據(jù)安全
中圖分類號: TP399? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)25-0013-02
1 大數(shù)據(jù)技術(shù)的特征
大數(shù)據(jù)技術(shù)是近些年來比較熱門的話題,很多機構(gòu)和人員都在研究。但是,相當(dāng)一部分人員對大數(shù)據(jù)技術(shù)的認識并不清晰。僅僅從字面將它理解為信息量很大的數(shù)據(jù),這是典型的以偏概全。信息量很大的數(shù)據(jù)被稱為海量數(shù)據(jù)。海量數(shù)據(jù)與大數(shù)據(jù)技術(shù)并不是一回事,根據(jù)筆者的分析和認識,大數(shù)據(jù)技術(shù)有如下幾個顯著特點:
數(shù)據(jù)格式多樣:結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù);文字、圖片、影像、聲音等等各種各樣格式的數(shù)據(jù),均可以被統(tǒng)稱為大數(shù)據(jù)技術(shù)的數(shù)據(jù)格式。
數(shù)據(jù)來源多樣:電腦、手機、傳感器均可以作為大數(shù)據(jù)技術(shù)的數(shù)據(jù)源。
通信方式多樣:網(wǎng)站、郵件、手機短信、即時聊天工具、影音播放器都可以作為大數(shù)據(jù)技術(shù)的通信方式。
著重數(shù)據(jù)分析:通過多個源頭、多種渠道收集到的多種格式數(shù)據(jù),要根據(jù)某一個計算模型,進行計算分析,并得到某一個有價值的結(jié)論。
用一句話概括:大數(shù)據(jù)技術(shù)就是“三多一分析”。
以一個真實案例來說明大數(shù)據(jù)的特性。根據(jù)釘釘軟件的考勤統(tǒng)計報告,某男性A近期出現(xiàn)很多缺勤記錄。通過手機監(jiān)視程序發(fā)現(xiàn),該A男性近期經(jīng)常光臨淘寶、京東等電商平臺,查看嬰兒床、嬰兒紙尿褲等用品;同時,該男性所在城市的婦幼保健醫(yī)院攝像頭顯示,A男性有若干次出入醫(yī)院的記錄。由此我們可以分析出,A男性的老婆、姐妹或者其他女性親屬是孕婦,并且將要臨產(chǎn)。如果保險公司得到該結(jié)論,并獲得該男性聯(lián)系方式,可以向該男性推薦生育保險。當(dāng)然,我們的分析是人工完成的,在真實的應(yīng)用環(huán)境當(dāng)中,數(shù)據(jù)分析主要通過程序或者人機結(jié)合的方式獲得,這就是大數(shù)據(jù)技術(shù)的典型應(yīng)用。
根據(jù)這個案例,我們可以知道,大數(shù)據(jù)技術(shù)的涵蓋面非常廣,它可能是涵蓋面最廣的計算機技術(shù),所有電子數(shù)據(jù)內(nèi)容、數(shù)據(jù)源和通信方式,都是大數(shù)據(jù)技術(shù)的輸入。此外,大數(shù)據(jù)技術(shù)的彈性非常大,少到分析一個人的一條短信和一段視頻,多到分析一個國家全年的醫(yī)療影像和用藥記錄,雖說規(guī)模差別巨大,但都從屬于大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)這個名稱,本身沒有明確指出大數(shù)據(jù)技術(shù)的本質(zhì)特點,所以才會被簡單理解為海量數(shù)據(jù)。
2 大數(shù)據(jù)分析技術(shù)與其他數(shù)據(jù)分析技術(shù)的區(qū)別
數(shù)據(jù)加分析,是很多計算機技術(shù)的特性,比如模式識別技術(shù)、自然語言處理技術(shù)、人工智能技術(shù),那么大數(shù)據(jù)技術(shù)與這些技術(shù)的區(qū)別是什么?
大數(shù)據(jù)技術(shù)最突出的特征,是數(shù)據(jù)的源頭、格式和渠道的多樣性。大數(shù)據(jù)技術(shù)的數(shù)據(jù)分析與其他計算機技術(shù)的數(shù)據(jù)分析差別不大,甚至還要弱一些,即使數(shù)據(jù)分析有差別,也是因為原始數(shù)據(jù)的源頭、渠道和格式的多樣化造成的。
3 大數(shù)據(jù)典型應(yīng)用
由于數(shù)據(jù)源頭、格式和渠道的多樣性,大數(shù)據(jù)涵蓋面廣。凡是涉及數(shù)據(jù)的地方,都能應(yīng)用大數(shù)據(jù)技術(shù)。典型應(yīng)用就是預(yù)測技術(shù):用戶行為預(yù)測、市場物價預(yù)測、人體健康預(yù)測、疾病疫情預(yù)測、交通行為預(yù)測、災(zāi)害災(zāi)難預(yù)測。
4 大數(shù)據(jù)安全
大數(shù)據(jù)安全是個籠統(tǒng)的概念,可以有如下三種解釋:一、利用大數(shù)據(jù)技術(shù)保護傳統(tǒng)信息系統(tǒng)安全。二、如何保護大數(shù)據(jù)技術(shù)本身的安全。三、如何防止基于大數(shù)據(jù)技術(shù)的破壞活動。
第一個解釋,屬于大數(shù)據(jù)技術(shù)的一個應(yīng)用,應(yīng)用對象是傳統(tǒng)信息系統(tǒng)安全。從多個角度、多種技術(shù)收集數(shù)據(jù),并針對安全問題進行分析,得到有價值的結(jié)論。問題的關(guān)鍵是數(shù)據(jù)源、數(shù)據(jù)渠道和分析模型,通過充足的數(shù)據(jù)源和數(shù)據(jù)渠道,迅速收集到有價值的數(shù)據(jù),并根據(jù)模型分析出有效的安全結(jié)論。
第二解釋,屬于大數(shù)據(jù)技術(shù)自身的安全,針對的目標是大數(shù)據(jù)本身。問題的關(guān)鍵是大數(shù)據(jù)基礎(chǔ)設(shè)施如服務(wù)器、網(wǎng)絡(luò)設(shè)備、是否具備有效的安全防護措施,數(shù)據(jù)源、數(shù)據(jù)渠道是否被屏蔽、數(shù)據(jù)內(nèi)容是否真實。分析模型是否有效。分析結(jié)論是否被竊取或者篡改。
第三種解釋,指如何防范基于大數(shù)據(jù)技術(shù)的入侵行為。針對目標是基于大數(shù)據(jù)技術(shù)的入侵行為。
三種解釋當(dāng)中,第二、第三種會帶來安全問題,第二種屬于傳統(tǒng)安全問題,第三種屬于新安全問題。因為犯罪分子利用大數(shù)據(jù)技術(shù)這一新技術(shù)進行破壞,傳統(tǒng)的安全防護措施,不能有效抵擋這種新型進攻,要專門制定新的模型和安全措施。為了陳述方便,將第三種解釋重命名為基于大數(shù)據(jù)技術(shù)的入侵行為。
為了防范基于大數(shù)據(jù)技術(shù)的入侵行為。要根據(jù)大數(shù)據(jù)技術(shù)“三多一分析”的特點,制定防范措施。防護措施分為數(shù)據(jù)源防護、數(shù)據(jù)渠道防護、數(shù)據(jù)內(nèi)容防護,數(shù)據(jù)分析阻斷四個角度。其中數(shù)據(jù)源防護、數(shù)據(jù)渠道防護、數(shù)據(jù)內(nèi)容防護未脫離傳統(tǒng)信息安全領(lǐng)域,可以采用傳統(tǒng)的身份鑒別、訪問控制、安全審計、通信加密等技術(shù)。數(shù)據(jù)分析不在我方進行,而是在不法販子方進行,較難阻斷,我方可以采用發(fā)送干擾數(shù)據(jù)的方法,干擾不法分子的數(shù)據(jù)分析結(jié)論。
大數(shù)據(jù)技術(shù)本身可以作為防護手段,防范基于大數(shù)據(jù)技術(shù)的入侵行為。大數(shù)據(jù)技術(shù)的一個重要應(yīng)用就是預(yù)測技術(shù),我方采用大數(shù)據(jù)技術(shù)構(gòu)造風(fēng)險預(yù)警平臺,提前預(yù)知可能發(fā)生的基于大數(shù)據(jù)技術(shù)的入侵行為。
同時,可以對不法分子的攻擊行為大數(shù)據(jù)分析,即反向大數(shù)據(jù)分析。通過多源頭、多渠道采集不同格式的犯罪分子數(shù)據(jù),并做關(guān)聯(lián)分析,為捕獲不法分子創(chuàng)造可能。
5 總結(jié)
科學(xué)技術(shù)是把雙刃劍,大數(shù)據(jù)技術(shù)也不例外,它既可以為我們創(chuàng)造價值,也可以被不法分子利用并進行破壞,我們要慎重合理對待大數(shù)據(jù)技術(shù),不可以過于樂觀,也不可以盲目悲觀。要以平和端正的態(tài)度,從客觀事實出發(fā),一分為二地看待問題,充分利用大數(shù)據(jù)技術(shù)的優(yōu)勢,積極抵御大數(shù)據(jù)技術(shù)帶來的危害,為人類造福。
【通聯(lián)編輯:唐一東】