国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

警惕大數(shù)據(jù)的真實(shí)性風(fēng)險(xiǎn)

2016-11-09 02:13:20楊劉保
長春市委黨校學(xué)報(bào) 2016年5期
關(guān)鍵詞:海量分析信息

文/楊劉保

警惕大數(shù)據(jù)的真實(shí)性風(fēng)險(xiǎn)

文/楊劉保

大數(shù)據(jù)是一種數(shù)據(jù)集成,也是一項(xiàng)IT技術(shù)。大數(shù)據(jù)在給經(jīng)濟(jì)社會(huì)發(fā)展帶來巨大便利和商機(jī)的同時(shí),也蘊(yùn)藏著各種潛在的風(fēng)險(xiǎn)。大數(shù)據(jù)的真實(shí)性風(fēng)險(xiǎn)實(shí)質(zhì)上就是指大數(shù)據(jù)的質(zhì)量究竟是高還是低。大數(shù)據(jù)在現(xiàn)實(shí)中面臨著三種風(fēng)險(xiǎn),即數(shù)據(jù)出處來源的可靠性風(fēng)險(xiǎn)、數(shù)據(jù)傳遞過程的失真性風(fēng)險(xiǎn)、數(shù)據(jù)分析結(jié)果的可信度風(fēng)險(xiǎn)。

大數(shù)據(jù);數(shù)據(jù)質(zhì)量

大數(shù)據(jù)是一種數(shù)據(jù)集成。大數(shù)據(jù)是指無法在可容忍的時(shí)間內(nèi)用傳統(tǒng) IT 技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。大數(shù)據(jù)也是一項(xiàng)IT技術(shù)。大數(shù)據(jù)是繼云計(jì)算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次顛覆性、革命性的技術(shù)變革。“大數(shù)據(jù)時(shí)代”的來臨已成不可阻擋之勢?,F(xiàn)代社會(huì)大數(shù)據(jù)正在改變著世界,改變著人們的生活,已經(jīng)成為影響一個(gè)國家及其全體國民的重要事物。對現(xiàn)有的各種大數(shù)據(jù)進(jìn)行系統(tǒng)集成和有效利用是現(xiàn)階段信息化建設(shè)的核心任務(wù)。但同時(shí)大數(shù)據(jù)在給經(jīng)濟(jì)社會(huì)發(fā)展帶來巨大便利和商機(jī)的同時(shí),也蘊(yùn)藏著各種潛在的風(fēng)險(xiǎn)。

一、數(shù)據(jù)出處來源的可靠性風(fēng)險(xiǎn)

大數(shù)據(jù)時(shí)代,隨著網(wǎng)絡(luò)存儲(chǔ)技術(shù)和手段的發(fā)展,各種移動(dòng)設(shè)備、智能終端通過有線和無線網(wǎng)絡(luò)彼此交互相連,每個(gè)在線用戶都在交互網(wǎng)絡(luò)中制造、輸送和傳播信息,成為各種信息數(shù)據(jù)的制造者和提供者。交互網(wǎng)絡(luò)中的數(shù)據(jù)呈海量式增長,數(shù)據(jù)種類也日益繁多。這種海量式、多樣化的數(shù)據(jù)不僅以傳統(tǒng)文本形式的數(shù)據(jù)存在,也有以非傳統(tǒng)的網(wǎng)絡(luò)日志、音頻、視頻、圖片等形式的數(shù)據(jù)存在。在數(shù)據(jù)規(guī)模的日益擴(kuò)大和拓展過程中,因數(shù)據(jù)信息來源的多樣化,數(shù)據(jù)信息本身也存在著混雜甚至混亂的特征,許多不科學(xué)、不真實(shí)、不可靠、未經(jīng)驗(yàn)證的數(shù)據(jù)進(jìn)入了數(shù)據(jù)庫,這就很難保證每一條數(shù)據(jù)信息都是真實(shí)可信的。所以,那種以為數(shù)據(jù)越多越精確的想法是萬萬不可取的。大數(shù)據(jù)的價(jià)值之一就在于可以通過對其進(jìn)行分析挖掘出有價(jià)值的信息,進(jìn)而作出科學(xué)的預(yù)測和決策。通過對這些海量數(shù)據(jù)的正確甄別、有效分析和深入研究,以期對某一領(lǐng)域、某一部門或整個(gè)經(jīng)濟(jì)社會(huì)發(fā)展作出科學(xué)的預(yù)判和規(guī)劃,這才是大數(shù)據(jù)分析和研究的真正目的,是大數(shù)據(jù)的真正用武之地。因此,數(shù)據(jù)出處來源的真實(shí)可靠是對大數(shù)據(jù)進(jìn)行科學(xué)分析、挖掘和研究的前提條件,如果數(shù)據(jù)的出處來源環(huán)節(jié)就出了問題,待分析的數(shù)據(jù)本身就不具有可信度,那么得出的結(jié)論、做出的決策不僅毫無價(jià)值,往往還會(huì)產(chǎn)生不小的危害,甚至帶來方向性的誤導(dǎo)。在進(jìn)行數(shù)據(jù)的初始收集和整理的時(shí)候,應(yīng)該對所收集整理數(shù)據(jù)的真實(shí)性和可信度進(jìn)行嚴(yán)格的監(jiān)測和細(xì)致的過濾,通過嚴(yán)格鑒別數(shù)據(jù)的出處和來源,正確識別并剔除掉虛假數(shù)據(jù)信息甚至惡意數(shù)據(jù)信息,真正收集整理出真實(shí)有用的數(shù)據(jù)信息。

二、數(shù)據(jù)傳遞過程的失真性風(fēng)險(xiǎn)

數(shù)據(jù)傳遞過程的失真性風(fēng)險(xiǎn)主要是指大數(shù)據(jù)信息在網(wǎng)絡(luò)傳播的過程中有可能失真。失真的原因大致包括三個(gè)方面。一是人為選擇性失真,即人為干預(yù)了數(shù)據(jù)的采集、收集、存儲(chǔ)過程,有選擇性地、有指向性地、有側(cè)重地選取數(shù)據(jù),或是采集、收集、存儲(chǔ)了大量無用的數(shù)據(jù)信息,或是采集、收集、存儲(chǔ)了大量不科學(xué)、不真實(shí)的數(shù)據(jù)信息,或是雖沒有采集、收集、存儲(chǔ)無用的、不科學(xué)、不真實(shí)的數(shù)據(jù)信息,但只是采集、收集、存儲(chǔ)了部分真實(shí)的數(shù)據(jù)信息,甚或在采集、收集、存儲(chǔ)數(shù)據(jù)信息的過程中完全剔除了有用信息、真實(shí)信息從而導(dǎo)致數(shù)據(jù)的誤差與失真。這種人為選擇性失真既包括采集者、收集者、存儲(chǔ)者自身的主動(dòng)選擇,即主體自身有傾向性的選擇,也包括采集者、收集者、存儲(chǔ)者自身的被動(dòng)選擇,即被上級授意對數(shù)據(jù)信息進(jìn)行了有針對性的選擇。二是人為操作性失真。無論是普通的數(shù)據(jù)上傳者,還是經(jīng)驗(yàn)豐富的數(shù)據(jù)管理人員,都有可能因操作不當(dāng)導(dǎo)致數(shù)據(jù)出現(xiàn)誤差與失真的情況。在海量數(shù)據(jù)的具體操作過程中,或是沒有嚴(yán)格按照規(guī)定要求操作,或是誤改影響系統(tǒng)正常運(yùn)行的有關(guān)參數(shù),或是誤刪系統(tǒng)中的重要文件,致使數(shù)據(jù)在傳遞的過程中與原始數(shù)據(jù)存在一定程度的出入,甚至相去甚遠(yuǎn)。特別是在數(shù)據(jù)操作人員的操作技術(shù)不熟練而又操作十分復(fù)雜的系統(tǒng)時(shí),數(shù)據(jù)誤差與失真的概率將大大增加,數(shù)據(jù)的完整性將大打折扣。三是非人為性失真,主要是指由于數(shù)據(jù)版本的變更而導(dǎo)致數(shù)據(jù)出現(xiàn)誤差和失真。任何數(shù)據(jù)的形成都不是一勞永逸的,隨著時(shí)空的轉(zhuǎn)換、政策的調(diào)整、技術(shù)的革新、人力和物力的投入,數(shù)據(jù)總會(huì)在原始版的基礎(chǔ)上出現(xiàn)各種升級版,出現(xiàn)數(shù)據(jù)的1.0版、2.0版、3.0版、4.0版……選擇什么樣的數(shù)據(jù)版本,就意味著失真的可能性將會(huì)有多大,版本的級別越高,失真的可能性就會(huì)越小,數(shù)據(jù)的真實(shí)性和可信度就會(huì)大大增強(qiáng)。只有最大限度地降低人為影響和干預(yù),提高數(shù)據(jù)操作人員的技術(shù)熟練度,區(qū)分不同的數(shù)據(jù)版本,方可降低數(shù)據(jù)在傳遞過程中失真的可能性。

三、數(shù)據(jù)分析結(jié)果的可信度風(fēng)險(xiǎn)

海量的大數(shù)據(jù)只有通過總結(jié)、分析和研究,才能對實(shí)際工作和生活、對經(jīng)濟(jì)社會(huì)發(fā)展起指導(dǎo)作用,而當(dāng)前大數(shù)據(jù)處理技術(shù)的快速發(fā)展又對提升數(shù)據(jù)計(jì)算的精確性和結(jié)論分析的正確性提供了強(qiáng)有力的技術(shù)支撐,于是,大數(shù)據(jù)分析成為一種炙手可熱的研究范式,大數(shù)據(jù)分析技術(shù)成為一種新興的技術(shù)類型。大數(shù)據(jù)分析技術(shù)是一種從復(fù)雜、混亂、海量、多樣的數(shù)據(jù)中挖掘有用信息、得出相關(guān)規(guī)律、預(yù)測變化趨勢的技術(shù),通過發(fā)現(xiàn)并保留相互有關(guān)聯(lián)的數(shù)據(jù)加以收集、總結(jié)、分析和研究,使其變成可資利用的有價(jià)值的數(shù)據(jù)信息。而在大數(shù)據(jù)分析過程中,有一個(gè)問題值得我們追問:究竟需要多少數(shù)據(jù)量才能支撐數(shù)據(jù)分析結(jié)果的有效性和可信度呢?一些研究者往往認(rèn)為自己分析和研究的數(shù)據(jù)是全數(shù)據(jù),力圖實(shí)現(xiàn)從傳統(tǒng)的調(diào)查統(tǒng)計(jì)學(xué)中的抽樣調(diào)查思維向大數(shù)據(jù)時(shí)代的全數(shù)據(jù)調(diào)查思維轉(zhuǎn)變。一種技術(shù)的變遷和躍進(jìn)無疑值得人們?nèi)W(xué)習(xí)和跟進(jìn),但蘇珊·朗格在《哲學(xué)新視野》中曾表達(dá)過這樣的憂慮:“某些觀念有時(shí)會(huì)以驚人的力量給知識狀況帶來巨大的沖擊。由于這些觀念能一下子解決許多問題,所以,它們似乎有希望解決所有基本問題,澄清所有不明了的疑點(diǎn)。每個(gè)人都想迅速地抓住它們,作為進(jìn)入某種新實(shí)證科學(xué)的法寶,作為可用來建構(gòu)一個(gè)綜合分析體系的概念軸心。這種‘宏大概念’突然流行起來,一時(shí)間把所有東西都擠到了一邊?!睂?shí)際上,在大數(shù)據(jù)時(shí)代背景下,盡管有大數(shù)據(jù)分析技術(shù)的支撐,任何研究者所接觸和所獲得的數(shù)據(jù)也很難包括全部數(shù)據(jù),那種追求全數(shù)據(jù)調(diào)查和分析的努力是徒勞的,因?yàn)槿珨?shù)據(jù)這一概念本身就沒有定量性的規(guī)定,全數(shù)據(jù)到底包括多少數(shù)據(jù)量是全數(shù)據(jù)概念界定與鑒定中需要注意、需要考慮的重要問題。如果熱衷于全數(shù)據(jù)調(diào)查與分析這種數(shù)據(jù)處理方式而放棄傳統(tǒng)抽樣調(diào)查方法的分析和運(yùn)用,往往在規(guī)律的掌握、趨勢的預(yù)測、政策的制定等方面衍生出許多問題。在實(shí)際運(yùn)用中,所謂的全數(shù)據(jù)分析可能會(huì)帶來許多似是而非的“規(guī)律”,反而不如傳統(tǒng)抽樣調(diào)查的分析更為可信。所謂的全數(shù)據(jù)分析往往也只是某些“專家”以及大數(shù)據(jù)的相關(guān)處理者按照自己的需要對超大的數(shù)據(jù)規(guī)模隨心所欲地進(jìn)行搭配、組合和篩選,經(jīng)過這種處理和篩選后再進(jìn)行分析與研究就可能形成真真假假的許多“規(guī)律”,使得數(shù)據(jù)分析和處理的結(jié)果具有很大的欺騙性。而普通大眾又很難判別分析結(jié)果及結(jié)論的真假性,在現(xiàn)實(shí)以及網(wǎng)絡(luò)傳播的過程中容易導(dǎo)致虛假信息的泛濫。比如在股票數(shù)據(jù)的分析與預(yù)測中,有些所謂的分析家會(huì)編造出一系列的股票分析預(yù)測法,并篩選出有利的數(shù)據(jù)來支持其分析預(yù)測模型,識別這種欺騙性需要具備深厚的理論功底和專業(yè)的業(yè)務(wù)知識,而這是一般的數(shù)據(jù)使用者很難做到的。因此,大數(shù)據(jù)分析結(jié)果的真假性、正確性和有效性期待依靠使用者的經(jīng)驗(yàn)與智慧去判斷那就犯了本末倒置的錯(cuò)誤。只有數(shù)據(jù)分析者自身本著求真求實(shí)的態(tài)度以及對數(shù)據(jù)分析技術(shù)、方法和手段的精準(zhǔn)掌握與運(yùn)用才能避免虛假信息和結(jié)論的泛濫,增強(qiáng)數(shù)據(jù)分析結(jié)果的可信度。

楊劉保,中共長春市委黨校哲學(xué)與文化教研部副教授,研究方向:哲學(xué)與社會(huì)發(fā)展。

責(zé)任編輯 解梅娟

TP393

10.13784/j.cnki.22-1299/d.2016.05.010

猜你喜歡
海量分析信息
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
隱蔽失效適航要求符合性驗(yàn)證分析
海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢分析
一個(gè)圖形所蘊(yùn)含的“海量”巧題
展會(huì)信息
基于文件系統(tǒng)的分布式海量空間數(shù)據(jù)高效存儲(chǔ)與組織研究
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
平和县| 连南| 陵川县| 灵石县| 屏边| 松潘县| 吉安市| 太谷县| 洪湖市| 青龙| 荣昌县| 德惠市| 重庆市| 南投县| 大宁县| 汤阴县| 东乡县| 新密市| 安丘市| 隆安县| 滨州市| 逊克县| 潜山县| 怀来县| 石泉县| 兴安县| 崇仁县| 兴安盟| 工布江达县| 化德县| 黄平县| 长春市| 永川市| 龙山县| 合阳县| 遂平县| 昭平县| 巴中市| 个旧市| 赤水市| 大足县|