侯玉林
(安徽亳州新能源學(xué)校 安徽 亳州 236700)
人們的日常生活工作與電子信息處理技術(shù)息息相關(guān),大數(shù)據(jù)技術(shù)已經(jīng)逐漸成為人們對(duì)信息數(shù)據(jù)進(jìn)行挖掘的重要手段。 借助于大數(shù)據(jù)技術(shù),各行各業(yè)的發(fā)展腳步在不斷加快,其對(duì)于計(jì)算機(jī)信息技術(shù)的應(yīng)用水平也越來(lái)越高[1]。同時(shí)每一天都會(huì)產(chǎn)生大量的數(shù)據(jù),必須有相應(yīng)的信息處理技術(shù)來(lái)提供技術(shù)支持,才能夠更好地篩選其中的信息,將其中的價(jià)值提煉出來(lái)。 在當(dāng)前大數(shù)據(jù)時(shí)代的背景下,必須加強(qiáng)對(duì)于計(jì)算機(jī)信息技術(shù)這一方面的研究,從而更好地為各行各業(yè)提供幫助,促進(jìn)各行各業(yè)更好地發(fā)展。
電子信息技術(shù)是一種涉及電路設(shè)計(jì)、數(shù)字信號(hào)處理、通信網(wǎng)絡(luò)、集成電路等領(lǐng)域的綜合技術(shù),它的應(yīng)用已經(jīng)滲透到現(xiàn)代社會(huì)的方方面面。 根據(jù)當(dāng)前階段計(jì)算機(jī)信息技術(shù)發(fā)展的實(shí)際情況來(lái)看,可以將計(jì)算機(jī)電子信息技術(shù)分為三種類型,分別是信息系統(tǒng)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)以及檢索技術(shù)。 首先,針對(duì)信息系統(tǒng)技術(shù)而言,其以計(jì)算機(jī)作為各種技術(shù)的中心,數(shù)據(jù)庫(kù)以及通信網(wǎng)絡(luò)技術(shù)是實(shí)現(xiàn)信息處理的主要方式。 其次,數(shù)據(jù)庫(kù)技術(shù)的主要內(nèi)容是整理各種信息的順序,其不僅能夠集合相關(guān)信息,還能夠完成對(duì)于各種信息以及數(shù)據(jù)的儲(chǔ)存。 最后,檢索技術(shù)在使用時(shí),人們能夠非常方便地查詢各種信息[2]。 隨著我國(guó)科技水平不斷提高,電子信息技術(shù)也得到了快速發(fā)展和大范圍的應(yīng)用,大幅地提升了人們生活質(zhì)量。 可預(yù)見(jiàn)的是在未來(lái)的發(fā)展中,電子信息科技將向更加智能化、自動(dòng)化以及集成化方向發(fā)展。 同時(shí),電子信息科學(xué)技術(shù)還能夠與互聯(lián)網(wǎng)進(jìn)行有效結(jié)合,實(shí)現(xiàn)對(duì)各種資源的共享和利用,并且可以為人們提供更多便利服務(wù)。
大數(shù)據(jù)是指由巨型數(shù)據(jù)集組成,這些數(shù)據(jù)集必須借助計(jì)算機(jī)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、對(duì)比和分析才能得出客觀結(jié)果。目前大數(shù)據(jù)技術(shù)及應(yīng)用已經(jīng)滲透進(jìn)我們生活的各個(gè)方面,如自動(dòng)駕駛、網(wǎng)絡(luò)購(gòu)物、直播平臺(tái)等醫(yī)療衛(wèi)生、商業(yè)分析、國(guó)家安全、食品安全、金融安全等。 近十年以來(lái),大數(shù)據(jù)已經(jīng)作為國(guó)家重要的戰(zhàn)略資源,其實(shí)現(xiàn)了創(chuàng)新發(fā)展,在全社會(huì)形成了“用數(shù)據(jù)來(lái)說(shuō)話、用數(shù)據(jù)來(lái)管理、用數(shù)據(jù)來(lái)決策、用數(shù)據(jù)來(lái)創(chuàng)新”的文化氛圍與時(shí)代特征。
在當(dāng)前大數(shù)據(jù)時(shí)代的背景下,各行各業(yè)產(chǎn)生的數(shù)據(jù)量非常龐大,所以需要采集的數(shù)據(jù)量也在不斷變化,在這樣的情況下,必須有強(qiáng)大的電子信息處理技術(shù)和大數(shù)據(jù)處理技術(shù)提供支撐。
2.1.1 數(shù)據(jù)的采集技術(shù)
在以往的傳統(tǒng)模式當(dāng)中,只有一些社會(huì)中的企業(yè)對(duì)本行業(yè)內(nèi)的用戶采集數(shù)據(jù),在近些年來(lái),由于數(shù)據(jù)共享理念正在不斷地發(fā)展,所以數(shù)據(jù)采集的對(duì)象也越來(lái)越多樣化[3]。 雖然從數(shù)據(jù)本身來(lái)說(shuō)不會(huì)造假,但是在實(shí)際收集數(shù)據(jù)的過(guò)程中,難免會(huì)出現(xiàn)數(shù)據(jù)錯(cuò)誤的情況。 這主要是因?yàn)閿?shù)據(jù)的收集工作會(huì)涉及非常多的流程,而且在數(shù)據(jù)采集的過(guò)程中還會(huì)出現(xiàn)各種細(xì)節(jié)性的內(nèi)容,這都會(huì)直接影響到最終的數(shù)據(jù),甚至?xí)苯佑绊懙綌?shù)據(jù)的收集,這是當(dāng)前階段人們?cè)谑占瘮?shù)據(jù)時(shí)所面臨的主要問(wèn)題。
2.1.2 數(shù)據(jù)的存儲(chǔ)技術(shù)
當(dāng)前,很多企業(yè)更加傾向于選擇“云端”作為數(shù)據(jù)的存儲(chǔ)方式,例如亞馬遜、谷歌云、微軟以及阿里云都是非常常見(jiàn)的信息儲(chǔ)存工具,儲(chǔ)存數(shù)據(jù)的一個(gè)重要目的之一就是更好地處理各項(xiàng)數(shù)據(jù)。 因此,在數(shù)據(jù)處理的過(guò)程中,云計(jì)算或者其他類別的計(jì)算框架都能夠?qū)?shù)據(jù)處理與存儲(chǔ)相互融合,從而成為一個(gè)整體[4]。
2.1.3 計(jì)算與處理技術(shù)
根據(jù)當(dāng)前階段的實(shí)際情況來(lái)看,國(guó)內(nèi)的很多企業(yè)都開(kāi)始采取各種措施來(lái)開(kāi)發(fā)自身的云計(jì)算體系。 從一定程度上來(lái)說(shuō)。 云計(jì)算實(shí)際上是計(jì)算以及大數(shù)據(jù)轉(zhuǎn)移存儲(chǔ)的協(xié)同體,在處理分布式數(shù)據(jù)庫(kù)的過(guò)程中可以實(shí)現(xiàn)分布處理,而且當(dāng)前其正在朝著并行計(jì)算的方向發(fā)展。 由此可見(jiàn),其最大的優(yōu)勢(shì)是能夠及時(shí)地對(duì)各種類型大量的數(shù)據(jù)進(jìn)行處理,所以要能夠準(zhǔn)確地看待云計(jì)算技術(shù)與大數(shù)據(jù)技術(shù)之間緊密的關(guān)系[5]。 借助于云計(jì)算技術(shù),能夠深度挖掘大數(shù)據(jù)的價(jià)值,然后有針對(duì)性和目的性地進(jìn)行系統(tǒng)性判斷,從而為廣大的用戶推送更多準(zhǔn)確的信息,最終創(chuàng)造出更大的價(jià)值。 在這一過(guò)程中,還有不少的企業(yè)受限于自身技術(shù)方面的限制,缺乏開(kāi)發(fā)云計(jì)算的能力,這時(shí)他們就需要積極地尋求與高端企業(yè)之間進(jìn)行合作,共同合作和開(kāi)發(fā)云計(jì)算系統(tǒng),更好地利用大數(shù)據(jù),處理好大數(shù)據(jù)技術(shù)與云計(jì)算技術(shù)之間的關(guān)系。
從一定程度上來(lái)說(shuō),大數(shù)據(jù)實(shí)際上就是在信息獲取、存儲(chǔ)、管理以及分析的過(guò)程中,能夠超出傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,其主要具有四大特征,分別是海量的數(shù)據(jù)規(guī)模、價(jià)值密度低、數(shù)據(jù)流轉(zhuǎn)快以及數(shù)據(jù)類型多樣化。 在當(dāng)前多元化發(fā)展的時(shí)代背景下,大數(shù)據(jù)發(fā)揮著不可替代的作用。 大數(shù)據(jù)技術(shù)與應(yīng)用研究方向是將大數(shù)據(jù)分析挖掘與處理、移動(dòng)開(kāi)發(fā)與架構(gòu)、軟件開(kāi)發(fā)、云計(jì)算等前沿技術(shù)相結(jié)合的“互聯(lián)網(wǎng)+”前沿科技。 在這樣的背景下,加強(qiáng)對(duì)于大數(shù)據(jù)價(jià)值的分析和研究具有十分重要的意義,將會(huì)直接對(duì)整個(gè)社會(huì)的發(fā)展走向產(chǎn)生影響。
大數(shù)據(jù)技術(shù)通常包含:分布式存儲(chǔ)技術(shù)、分布式計(jì)算技術(shù)、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、可視化和報(bào)告技術(shù)、安全和隱私保護(hù)技術(shù)等。
2.2.1 大數(shù)據(jù)建模技術(shù)
在應(yīng)用大數(shù)據(jù)的過(guò)程中,通常采用流處理和批處理兩種方法進(jìn)行數(shù)據(jù)建模,其中,流處理具有比較快的數(shù)據(jù)處理速度,能夠幫助相應(yīng)的技術(shù)人員實(shí)時(shí)分析數(shù)據(jù)。 流處理這種方式在金融業(yè)當(dāng)中被廣泛運(yùn)用,這主要是因?yàn)榻鹑跇I(yè)發(fā)展的過(guò)程中需要大量的實(shí)時(shí)信息作為支撐,而采用流處理的方式,能夠?qū)蛻綦娮愚D(zhuǎn)賬的業(yè)務(wù)進(jìn)行快速處理,從而為用戶提供更加高質(zhì)量的金融服務(wù)。 針對(duì)批處理技術(shù)而言,其主要是整理和加工已經(jīng)處理過(guò)的各種信息,從而促使大量數(shù)據(jù)的儲(chǔ)存和利用率大幅提升,以便于其他各項(xiàng)工作的開(kāi)展。 由此可見(jiàn),這兩種建模方法都具有自身的優(yōu)勢(shì),能夠在最大程度上豐富電子信息處理技術(shù)系統(tǒng)。 在實(shí)際應(yīng)用的過(guò)程中,要將大批量數(shù)據(jù)資源應(yīng)用好,以此為基礎(chǔ)制定更多具有目標(biāo)性的技術(shù)解決方案,然后通過(guò)建模的方式,對(duì)這些數(shù)據(jù)內(nèi)部的價(jià)值進(jìn)行分析,最終為企業(yè)日后的正常發(fā)展創(chuàng)造更多的有利條件。
2.2.2 大數(shù)據(jù)的安全技術(shù)
隨著大數(shù)據(jù)技術(shù)的不斷應(yīng)用,大數(shù)據(jù)的安全問(wèn)題也逐漸開(kāi)始受到了人們的廣泛關(guān)注。 之前廣泛使用的等保1.0 體系,在時(shí)效性以及適用性等方面還需要不斷地進(jìn)行完善,在這一背景下,等保2.0 體系就出現(xiàn)了。 從大數(shù)據(jù)的安全性方面來(lái)說(shuō),其通常覆蓋兩個(gè)方面的內(nèi)容,首先是用戶方面,用戶在瀏覽商品的過(guò)程中,喜好被記錄,而且在發(fā)送信息的過(guò)程中自己的位置也很有可能會(huì)被暴露。 為了解決這一問(wèn)題,在利用大數(shù)據(jù)平臺(tái)時(shí),就需要謹(jǐn)慎處理其所擁有的各種權(quán)限。 其次就是如何在大數(shù)據(jù)開(kāi)發(fā)方面確保數(shù)據(jù)的安全性。 例如很多企業(yè)的數(shù)據(jù)在共享以及流通的過(guò)程中很容易泄露,還有一部分黑客也會(huì)攻擊企業(yè)的網(wǎng)絡(luò)來(lái)獲取各種數(shù)據(jù)信息。
在當(dāng)前大數(shù)據(jù)的時(shí)代背景下,分布式存儲(chǔ)技術(shù)的應(yīng)用是計(jì)算機(jī)處理技術(shù)的主要應(yīng)用領(lǐng)域,這一技術(shù)是在谷歌公司全球定位系統(tǒng)的基礎(chǔ)上建立的,廣泛應(yīng)用到了很多大型互聯(lián)網(wǎng)企業(yè)當(dāng)中。 這是隊(duì)列存儲(chǔ)概念的一個(gè)典型應(yīng)用。 其在存儲(chǔ)數(shù)據(jù)的過(guò)程中所采用的單位為列,所具有的優(yōu)勢(shì)在壓縮方面完全體現(xiàn)出來(lái),能夠促使信息技術(shù)循環(huán)的速度加快。 與此同時(shí),在具體應(yīng)用的過(guò)程中,其在高效應(yīng)用磁盤空間以及加載數(shù)據(jù)方面也具有無(wú)可比擬的優(yōu)勢(shì)。
當(dāng)前,人們更加關(guān)注遺傳算法。 遺傳算法,顧名思義,其主要的原理就是對(duì)生物界的進(jìn)化演化規(guī)律進(jìn)行模仿,最終達(dá)到能夠隨機(jī)化搜索的目標(biāo)。 而且在使用這一方法的過(guò)程中,還需要采用概率化的方法實(shí)現(xiàn)尋優(yōu),從而自動(dòng)地調(diào)整搜索的方向[6]。 在當(dāng)前階段,遺傳算法已經(jīng)得到了人們的廣泛運(yùn)用,其中最為典型的應(yīng)用是機(jī)器學(xué)習(xí)以及信號(hào)處理這些領(lǐng)域。 針對(duì)模擬神經(jīng)算法來(lái)說(shuō),其主要是對(duì)動(dòng)物的運(yùn)行神經(jīng)進(jìn)行模擬,在不斷模擬的過(guò)程中產(chǎn)生一些具體化的網(wǎng)絡(luò)行為,其最明顯的一個(gè)特點(diǎn)就是在處理信息的過(guò)程中可以實(shí)現(xiàn)分布式處理。
在當(dāng)前大數(shù)據(jù)的背景下,信息數(shù)據(jù)的挖掘也是電子信息處理技術(shù)的一個(gè)相當(dāng)重要的應(yīng)用領(lǐng)域,其以對(duì)網(wǎng)絡(luò)實(shí)施搜索作為基礎(chǔ),然后再分析和關(guān)聯(lián)。 在當(dāng)前階段,排序算法是互聯(lián)網(wǎng)信息搜索領(lǐng)域當(dāng)中熱度非常高的話題,其被很好地運(yùn)用在了大規(guī)模社會(huì)媒體信息量的短文特征搜索當(dāng)中,以便于能夠更好地對(duì)各種信息進(jìn)行處理。 結(jié)合當(dāng)前階段的實(shí)際情況來(lái)看,主要從三個(gè)領(lǐng)域來(lái)研究排序?qū)W習(xí)算法,分別是逐點(diǎn)、逐列和逐對(duì)。
在當(dāng)前大數(shù)據(jù)時(shí)代的背景下,數(shù)據(jù)的高效索引技術(shù)是熱點(diǎn)研究方向。 當(dāng)前谷歌公司的BIGTABLE 技術(shù)比較先進(jìn)的索引技術(shù),主要集中體現(xiàn)在以下兩個(gè)方面:第一,聚簇索引方式。 以索引順序作為指導(dǎo),存儲(chǔ)全部的數(shù)據(jù)結(jié)構(gòu);第二,互補(bǔ)式聚簇索引方式。 主要是運(yùn)用副本作為索引列,創(chuàng)建互為補(bǔ)充的索引表,其在具體使用的過(guò)程中,往往會(huì)與查詢結(jié)果相互配合以達(dá)到更好的效果。
數(shù)據(jù)感知與獲取技術(shù)是大數(shù)據(jù)時(shí)代背景下電子信息處理技術(shù)中非常重要的一個(gè)技術(shù)。 信息量非常龐大以及訪問(wèn)形式特殊是這一技術(shù)的明顯特征。 這一技術(shù)最主要的用途就是充分利用數(shù)據(jù),高質(zhì)量集成海量數(shù)據(jù)是最有價(jià)值的內(nèi)容,實(shí)現(xiàn)對(duì)于數(shù)據(jù)的整合和抽取。
為了確保計(jì)算機(jī)處理技術(shù)能夠更加符合實(shí)際情況,就可以通過(guò)模擬的方式來(lái)實(shí)現(xiàn)計(jì)算機(jī)輔助控制,從而確??刂菩Ч麡?biāo)準(zhǔn)和規(guī)范。 與此同時(shí),在運(yùn)用自動(dòng)化模擬運(yùn)行技術(shù)的過(guò)程中,還需要以計(jì)算機(jī)作為輔助,通過(guò)這種方式確保所設(shè)計(jì)的效果與預(yù)期高度相似,在這一過(guò)程中,需要對(duì)智能化技術(shù)進(jìn)行合理運(yùn)用,最終為企業(yè)的發(fā)展提供全新的動(dòng)力。 根據(jù)當(dāng)前階段的實(shí)際情況來(lái)看,計(jì)算機(jī)大數(shù)據(jù)分析工作當(dāng)中還存在著劃分不清的問(wèn)題,這就需要在確保網(wǎng)絡(luò)系統(tǒng)運(yùn)行效率的基礎(chǔ)上,深入地優(yōu)化整合子網(wǎng),然后結(jié)合自身的實(shí)際發(fā)展?fàn)顩r,使防護(hù)網(wǎng)絡(luò)的覆蓋面不斷地?cái)U(kuò)大。在此基礎(chǔ)上,還需要將電子電路系統(tǒng)與電子信息工程相互配合,確保信息資源在使用的過(guò)程中更加有效和安全。
應(yīng)用服務(wù)供應(yīng)商(application service provider,ASP)是當(dāng)前比較成熟的第三方專業(yè)管理平臺(tái),通過(guò)ASP 語(yǔ)言編制的計(jì)算機(jī)網(wǎng)絡(luò)服務(wù)管理系統(tǒng),能夠以板塊設(shè)置作為基礎(chǔ),合理劃分各種內(nèi)容。 對(duì)于使用者而言,他們?cè)诟鞣N論壇之間開(kāi)展討論,可以在這一平臺(tái)上學(xué)習(xí)技術(shù)操作視頻等內(nèi)容。 同時(shí)還可以多部門同時(shí)獲得豐富的項(xiàng)目信息,節(jié)省層層上報(bào)的時(shí)間,確保信息共享的效率得到提升[7]。 與此同時(shí),在全面信息化的過(guò)程中,全面信息管理工作也要求更高水平的安全管理,這時(shí)可以將安全監(jiān)管作為初步的安全保障工作,將一些不安全的服務(wù)請(qǐng)求以及非法用戶的侵入篩選出來(lái),然后根據(jù)實(shí)際的情況建立相應(yīng)的安全系統(tǒng),確保共享數(shù)據(jù)的安全性有所保障。
當(dāng)前,電子信息處理技術(shù)集成智能化已經(jīng)逐漸成為不可阻擋的趨勢(shì),不同技術(shù)之間的相互融合具有無(wú)可比擬的優(yōu)勢(shì),不僅能夠促使我國(guó)科技發(fā)展的進(jìn)程加快,同時(shí)還能夠?qū)⑸a(chǎn)技術(shù)之間存在的差距縮小,確保整體的設(shè)計(jì)更加準(zhǔn)確。 與此同時(shí),為了確保大數(shù)據(jù)分析處理工作具有更高的效率,在實(shí)際應(yīng)用的過(guò)程中還需要將計(jì)算機(jī)設(shè)備作為輔助設(shè)備使用,融合數(shù)據(jù)的收集、分析、整理以及應(yīng)用環(huán)節(jié),在最大程度上提升數(shù)據(jù)處理的效率[8]。 例如利用傳統(tǒng)的數(shù)據(jù)處理方式,每小時(shí)只能過(guò)濾掉1 000 條數(shù)據(jù),但是如果使用集成智能化處理方式,數(shù)據(jù)處理的效率能夠提升80%左右。
重要意義主要在以下幾個(gè)方面有所體現(xiàn)。 首先,大數(shù)據(jù)已經(jīng)不再僅僅是一些數(shù)據(jù),更是國(guó)家級(jí)別的重要戰(zhàn)略性資源,所以要想能夠提升國(guó)家的信息安全競(jìng)爭(zhēng)力,就必須加強(qiáng)對(duì)于大數(shù)據(jù)的研究。 其次,加強(qiáng)對(duì)于大數(shù)據(jù)方面的研究,能夠?yàn)槿藗兊娜粘I詈凸ぷ鲃?chuàng)造更多的便利,對(duì)我國(guó)未來(lái)經(jīng)濟(jì)發(fā)展及產(chǎn)業(yè)升級(jí)產(chǎn)生直接的影響。 最后,推動(dòng)科學(xué)思維革命也需要不斷地加強(qiáng)對(duì)大數(shù)據(jù)的研究。
大數(shù)據(jù)技術(shù)所擁有的發(fā)展機(jī)遇主要集中在以下幾個(gè)方面。 首先其具有非常明顯的產(chǎn)業(yè)價(jià)值,所以加強(qiáng)對(duì)于信息基礎(chǔ)的挖掘以及應(yīng)用非常重要。 其次,在當(dāng)前大數(shù)據(jù)時(shí)代的背景下,對(duì)于大數(shù)據(jù)本身而言面臨著非常多的風(fēng)險(xiǎn),其信息安全的要求也在不斷提升。
綜上所述,隨著社會(huì)的不斷發(fā)展,大數(shù)據(jù)時(shí)代對(duì)電子信息處理技術(shù)既帶來(lái)了機(jī)遇,同時(shí)又帶來(lái)了挑戰(zhàn)。 這同時(shí)也代表信息處理技術(shù)將會(huì)涉及更多的領(lǐng)域,對(duì)電子信息處理技術(shù)提出了更高的要求。 當(dāng)前電子信息處理技術(shù)還存在著較多的不足,在充分明確了大數(shù)據(jù)所面臨的發(fā)展機(jī)遇之后,必須對(duì)其面臨的挑戰(zhàn)產(chǎn)生正確的認(rèn)識(shí)。 需不斷深入地挖掘各種類型的數(shù)據(jù),采取各種措施不斷地進(jìn)行完善,提升信息安全等級(jí),實(shí)現(xiàn)電子信息處理技術(shù)又快又好地發(fā)展,為社會(huì)中更多的領(lǐng)域提供服務(wù)。