夏茜
【摘 要】隨著科學技術的迅速發(fā)展,計算機信息技術在數(shù)據(jù)處理、存儲、分析和利用等環(huán)節(jié)中得到了越來越多的應用。計算機信息技術是在不斷地發(fā)展、成熟和完善的,大數(shù)據(jù)時代的到來就是一個很好的證明。文章從大數(shù)據(jù)的概述入手,闡述了大數(shù)據(jù)時代給計算機信息處理技術帶來的挑戰(zhàn)及應對策略,以期為大數(shù)據(jù)時代下計算機信息處理技術的發(fā)展提供參考。
【關鍵詞】大數(shù)據(jù);計算機;信息處理;機遇;挑戰(zhàn);發(fā)展
【中圖分類號】TP393 【文獻標識碼】A 【文章編號】1674-0688(2018)12-0138-02
1 大數(shù)據(jù)的內(nèi)涵和特點
1.1 大數(shù)據(jù)的內(nèi)涵
從字面上簡單地來說,大數(shù)據(jù)就是指大量的數(shù)據(jù)資源。而如果從學術上來說,當數(shù)據(jù)的容量在10 TB到1 PB之間時,就可以稱之為大數(shù)據(jù)。那么,什么是大數(shù)據(jù)時代呢?比如,當你在百度等搜索引擎中搜索了“按摩椅”這個詞語時,當你打開淘寶、網(wǎng)易考拉、京東等購物APP時,在他們的首頁就會給你推薦各種各樣按摩椅的品牌,這就是大數(shù)據(jù)時代。演員葛優(yōu)在電影《天下無賊》里有一句經(jīng)典臺詞:“21世紀什么最貴?人才!”此話不假。但是當大數(shù)據(jù)時代到來之后,我們可以發(fā)現(xiàn)1分鐘之內(nèi)推特上新發(fā)的數(shù)據(jù)量超過10萬,微博上某數(shù)據(jù)的瀏覽量超過1 000萬,這些龐大的數(shù)字都意味著“數(shù)據(jù)是新的石油,甚至它的價值高于石油?!?1世紀最貴的不僅僅只有人才,還有海量的數(shù)據(jù)。如何發(fā)揮數(shù)據(jù)的最大作用呢?這就是大數(shù)據(jù)時代數(shù)據(jù)專業(yè)人才所面臨的重要話題。大數(shù)據(jù)是這個時代的產(chǎn)物,大數(shù)據(jù)時代也是社會發(fā)展的必然,但是大數(shù)據(jù)時代的戰(zhàn)略意義并不是掌握這些龐大的數(shù)據(jù)信息,而是要用最專業(yè)、最先進的技術對大數(shù)據(jù)時代中海量的信息進行有效處理,提高數(shù)據(jù)的利用率,進而推進大數(shù)據(jù)時代的發(fā)展。
1.2 大數(shù)據(jù)的特點
大數(shù)據(jù)時代中數(shù)據(jù)信息具有以下特點:{1}數(shù)據(jù)量大。大數(shù)據(jù),顧名思義數(shù)據(jù)量是非常巨大的,大到已經(jīng)從TB級別一躍升到PB級別。在以往的計算機信息技術中,我們總是將TB看作計算機當中最大的單位,因為計算機內(nèi)部是二進制,它只能識別1和0,我們常人又都是習慣生活中的10進位的進位規(guī)律,所以計算機就被設定成2的10次方的進位,也就是說1 G=2×2×2×2×2×2×2×2×2×2,10個2相乘結果是1 024。而隨著數(shù)據(jù)的不斷增加,TB已經(jīng)不能滿足大數(shù)據(jù)時代中數(shù)據(jù)的存貯要求了,現(xiàn)階段已經(jīng)出現(xiàn)了PB,由此可見,大數(shù)據(jù)時代中的數(shù)據(jù)數(shù)量之大,令人震驚。{2}數(shù)據(jù)多樣化。大數(shù)據(jù)時代中的數(shù)據(jù)種類繁多。以微信這一即時通訊系統(tǒng)為例,在微信中進行的數(shù)據(jù)傳輸不僅僅只包括具體的文字,我們同時可以向照片、視頻、語音、地理位置等各種信息通過網(wǎng)絡即時傳輸給遠在千里、萬里的對方。由此可見,大數(shù)據(jù)時代下的數(shù)據(jù)種類已經(jīng)慢慢突破了局限性。{3}數(shù)據(jù)處理速度快。大數(shù)據(jù)時代中數(shù)據(jù)處理的速度特別快,只要利用網(wǎng)絡,數(shù)據(jù)傳輸?shù)膯挝辉缫褟谋忍?秒上升到兆比特/秒了。同樣還是以微信為例,無論是近在眼前還是遠在天邊,只要稍微操作下手機,我們就可以共看同一秒鐘的月亮。{4}信息有效率低。有效率低的主要原因是因為數(shù)量巨大,比如在長達1小時的網(wǎng)絡視頻中,其實真正有價值的片段少之又少,可能是整個視頻的1/10、1/100,視頻的利用率相對較低。{5}數(shù)據(jù)分析難度大。數(shù)據(jù)數(shù)量大、流速快、利用率低等特點決定著數(shù)據(jù)分析難度不斷加大,需要專業(yè)的人員和技術才能對其進行細致化的分析。
2 大數(shù)據(jù)時代計算機信息技術的發(fā)展現(xiàn)狀
信息處理技術是基于計算機的發(fā)展而產(chǎn)生的,信息處理技術中包括了信息的傳輸技術、信息的分析技術、信息的加工技術、信息的儲存技術等。信息處理技術已經(jīng)被應用到各行各業(yè)中,其中應用最廣的便是金融行業(yè)、教育行業(yè)、建筑行業(yè)等。在大數(shù)據(jù)時代中,對數(shù)據(jù)進行處理一方面能夠提高海量數(shù)據(jù)的利用率,另一方面簡化數(shù)據(jù),提高人們的生活水平。雖然大數(shù)據(jù)時代的到來是計算機信息處理技術發(fā)展的必然,但大數(shù)據(jù)的到來也給計算機信息處理技術帶來了諸多挑戰(zhàn),大數(shù)據(jù)時代的數(shù)據(jù)信息量十分巨大,信息的種類和形式也是多種多樣的,這些特點導致了大數(shù)據(jù)時代中數(shù)據(jù)處理的難度較大。
2.1 信息存儲技術上的挑戰(zhàn)
信息存儲問題是大數(shù)據(jù)時代計算機信息處理技術面臨的第一個挑戰(zhàn)。大數(shù)據(jù)時代信息數(shù)據(jù)的增長速度飛快,這對信息技術的存儲能力、信息數(shù)據(jù)的壓縮技術、網(wǎng)絡傳輸能力等都是巨大的挑戰(zhàn),大數(shù)據(jù)時代信息技術如果想繼續(xù)發(fā)展,就需要對存儲空間、方式進行全面地改革。
2.2 數(shù)據(jù)安全上的挑戰(zhàn)
網(wǎng)絡數(shù)據(jù)信息的安全問題是大數(shù)據(jù)時代計算機信息處理技術所面臨的第二個挑戰(zhàn)。正如上文提到的,在大數(shù)據(jù)時代中,數(shù)據(jù)的數(shù)量不僅日益增長,數(shù)據(jù)的流動量也越來越大。舉個例子來說,你在銀行申請信用卡留下的個人信息往往被各種各樣的資金擔保企業(yè)挖掘到,從你辦理信用卡的行為中他們分析出你有用錢的需求,隨即會打電話咨詢你是否需要個人貸款;再比如,你在某婦產(chǎn)醫(yī)院生孩子后留下的個人信息,往往會被各種母嬰店、兒童攝影店、早教中心挖掘到,從而每天會給你打各種各樣的電話。雖然這些行為并不是在網(wǎng)絡上展開的,但你個人信息的傳輸卻離不開網(wǎng)絡。另外,隨著淘寶、京東、唯品會等各種購物網(wǎng)站的興起,你在網(wǎng)絡上進行經(jīng)濟交易的同時,你的個人信息、銀行賬號甚至是密碼都暴露無遺。甚至,大數(shù)據(jù)時代中各種信息收集的專業(yè)人士通過對數(shù)據(jù)的盜取、分析,很容易導致國家和企業(yè)的機密泄露。由此可見,在大數(shù)據(jù)時代中,信息安全往往得到不到保證。
3 大數(shù)據(jù)時代應對挑戰(zhàn)的策略
針對大數(shù)據(jù)時代面臨的挑戰(zhàn),筆者提出兩點應對策略。
3.1 改革數(shù)據(jù)存儲系統(tǒng)
大數(shù)據(jù)時代的數(shù)據(jù)具有數(shù)量巨大的特點,由此可見存儲系統(tǒng)是大數(shù)據(jù)時代能否和諧發(fā)展的關鍵。而傳統(tǒng)的數(shù)據(jù)存儲系統(tǒng)無論是在性能、效率,還是投資利益、安全方面都遠遠不能滿足大數(shù)據(jù)時代海量數(shù)據(jù)的需求。為此,基于大數(shù)據(jù)的應用需求,現(xiàn)階段的存儲系統(tǒng)應該從兩個方面進行改革。第一,從數(shù)據(jù)的存儲量方面改革?!霸苾Υ妗笔谴髷?shù)據(jù)時代中一個炙手可熱的話題。與傳統(tǒng)存儲設備不同的是,云存儲并不是U盤,也不是硬盤,而是一個網(wǎng)絡存儲系統(tǒng),該系統(tǒng)的核心是存儲設備。在百度等搜索引擎中以“云儲存”為關鍵詞進行搜索,會出現(xiàn)無數(shù)與“云儲存”有關的信息,包括騰訊云存儲、百度云、阿里云……由此可見,云存儲已經(jīng)慢慢走進大數(shù)據(jù)時代了。只有基于“云儲存”概念對現(xiàn)階段的存儲系統(tǒng)進行改革和完善才能進一步保障大數(shù)據(jù)時代數(shù)據(jù)存儲量。第二,為了提供可靠的大數(shù)據(jù)存儲服務,現(xiàn)階段不僅要無限增大數(shù)據(jù)的存儲能力,更重要的是要引入冗余信息來提高存儲系統(tǒng)的容錯能力。其基本思想便是在系統(tǒng)中為每一個數(shù)據(jù)對象建立若干個相同的副本,把這些副本分散存儲在不同的節(jié)點上,當遇到某個數(shù)據(jù)損壞或失效而無法正常使用時,可通過訪問最近的存儲點來獲取與原件完全一致的數(shù)據(jù)備份。如此一來,只要數(shù)據(jù)對象中還有一個存貨部分,分布式存儲系統(tǒng)就能一直正常運行。
3.2 提高數(shù)據(jù)安全防范
首先,要加強個人控制。在任何情況下,網(wǎng)絡服務的經(jīng)營者、社交媒體都應該賦予消費者安全權,使得消費者有權知悉他們通過網(wǎng)絡收集自己的個人信息。網(wǎng)絡服務經(jīng)營者必須給消費者闡明收集消費者個人信息的種類、原因、用途及在何種條件下刪除數(shù)據(jù)或者刪除數(shù)據(jù)中消費者的身份信息。另外,網(wǎng)絡經(jīng)營者必須明明白白地告知消費者是否與第三方分享消費者的個人數(shù)據(jù)及分享的目的等。
其次,要從技術上提高信息的安全性。計算機信息處理技術中有這樣一個系統(tǒng),用戶根據(jù)自己的意愿通過其瀏覽器向網(wǎng)站發(fā)送“Do Not Track”信號。當用戶一旦選擇了“不同意”選項時,在任何情況下,網(wǎng)絡經(jīng)營者都不可以跟蹤用戶的瀏覽記錄。除了以上DNT信號外,還可以增強其他的隱私技術,比如加密工具的使用、政策工具的使用、過濾工具的使用及匿名工具的使用。
再次,給用戶建立在線刪除信息的鏈接。作為網(wǎng)絡信息的終端者,個人必須擁有刪除數(shù)據(jù)的權利。在現(xiàn)代網(wǎng)絡社會中,存在一個飽受爭議的名詞,即“人肉”。也就是利用現(xiàn)代信息技術,將傳統(tǒng)的網(wǎng)絡搜索轉(zhuǎn)變成人找人、人問人的關系型網(wǎng)絡社區(qū),這個過程可以用“一方呼應,八方支援”八個字來形容。換句話說,某個人的信息一旦在網(wǎng)上公開,傳播的速度和范圍是不可預估、不可控制的。而建立個人信息刪除鏈接,這是個人隱私權的一個重要保障。如果個人隱私明顯大于公共利益時,個人有權刪除數(shù)據(jù)從而保護自我。
總而言之,計算機信息技術的發(fā)展為對數(shù)據(jù)處理和分析帶來了巨大的變革。為此,我們要正視大數(shù)據(jù)時代背景下的計算機信息技術,既要善于借助機遇深入挖掘大數(shù)據(jù)這個大金礦,又要敢于正視挑戰(zhàn),加強信息技術的完善,繼而為社會的迅速發(fā)展提供強有力的信息技術保障。
參 考 文 獻
[1]馮偉.大數(shù)據(jù)時代面臨的信息安全機遇和挑戰(zhàn)[J].中國科技投資,2012(34):49-53.
[2]楊菂,薛建強.中國新一代信息技術產(chǎn)業(yè)發(fā)展背景與趨勢分析[J].遼寧行政學院學報,2013,15(3):94-96.
[3]劉儲寧.試述大數(shù)據(jù)時代面臨的信息安全機遇與挑戰(zhàn)[J].通訊世界,2017(5):51-52.