汪雅丹
(仙桃職業(yè)學(xué)院,湖北 仙桃 433000)
利用現(xiàn)代化計算機信息處理技術(shù)處理數(shù)據(jù),可使研究人員獲得隱藏在數(shù)據(jù)背后的一般性結(jié)論[1],這些結(jié)論的運用范圍十分廣泛,不僅能夠投入到科研領(lǐng)域,幫助科學(xué)家深化其研究內(nèi)涵,還能投入到制造領(lǐng)域,使產(chǎn)品設(shè)計師研發(fā)的產(chǎn)品更符合人們的需求。
大數(shù)據(jù)時代是指在充分獲取信息的情況下集中處理和分析各類數(shù)據(jù)信息[1],所獲取的信息可以是社會某個領(lǐng)域的數(shù)據(jù)集合,也可以是用戶在互聯(lián)網(wǎng)上產(chǎn)生的行為數(shù)據(jù),當(dāng)這些數(shù)據(jù)在計算機上進(jìn)行分析和統(tǒng)計時,技術(shù)人員便能夠獲得相關(guān)的結(jié)論,這些結(jié)論具有十分重要的作用和意義。一方面其能夠?qū)θ祟惖男袨榛蚣磳l(fā)生的事情進(jìn)行預(yù)測,一方面也有利于新技術(shù)的研發(fā)。例如人工智能技術(shù),是在對人類海量的行為數(shù)據(jù)進(jìn)行分析和處理的基礎(chǔ)上發(fā)展而來,通過將人們的言語習(xí)慣數(shù)據(jù)化,使人工智能機器獲得“與人交流”的能力。
計算機信息處理技術(shù)是指對系統(tǒng)中獲取的信息進(jìn)行分類和匹配[2],該技術(shù)與傳統(tǒng)的信息處理技術(shù)有很大的差異。第一,在處理信息速度上,當(dāng)代計算機信息處理速度需要與系統(tǒng)獲取信息的速度相匹配,實現(xiàn)即時即刻。第二,在處理信息數(shù)量上,傳統(tǒng)計算機信息處理技術(shù)要處理的信息數(shù)量有限,而當(dāng)代計算機信息處理技術(shù)面對的是龐大的用戶群,每個系統(tǒng)終端的用戶,每時每刻都在向系統(tǒng)傳輸著數(shù)據(jù),稱之為海量數(shù)據(jù)。大數(shù)據(jù)背景下,計算機技術(shù)實現(xiàn)對信息進(jìn)行快速處理,主要依靠的是信息傳輸與信息收集技術(shù)[3],其次是計算機對信息的存儲能力和計算機系統(tǒng)的網(wǎng)絡(luò)安全防護(hù)技術(shù)。
數(shù)據(jù)分析是計算機信息處理技術(shù)的基礎(chǔ)應(yīng)用類型之一,具體包含人類行為與情感分析、時域序列分析及相關(guān)回歸分析等[4],所得結(jié)論可運用到地理、購物、技術(shù)改進(jìn)等領(lǐng)域中。可視化運用指的是利用計算機對數(shù)據(jù)分析處理得出的結(jié)論構(gòu)建對應(yīng)特征的圖片、圖表等,使抽象的數(shù)據(jù)具象化,使數(shù)據(jù)內(nèi)隱藏的規(guī)律性表現(xiàn)得更加直觀,便于提高技術(shù)人員獲取信息結(jié)論的效率。
聚類與分類分析指的是在對舊有數(shù)據(jù)進(jìn)行歸納分類的基礎(chǔ)上得出新的數(shù)據(jù),以合理的結(jié)構(gòu)假設(shè)為依據(jù)預(yù)測用戶后來的行為,將可能出現(xiàn)的限制因素進(jìn)行歸類和分組處理[5]。由于該技術(shù)對數(shù)據(jù)分析的較為仔細(xì),得出的結(jié)論也較為系統(tǒng),因此,常用在大數(shù)據(jù)挖掘的相關(guān)運用中。關(guān)聯(lián)計算指的是在統(tǒng)計分析數(shù)據(jù)時尋找不同類型數(shù)據(jù)間可能存在的關(guān)聯(lián)性,該技術(shù)可以運用于人工智能領(lǐng)域,使搭載該技術(shù)的機器具備“學(xué)習(xí)”的能力,通過對人類行為不斷的模仿,使其內(nèi)在系統(tǒng)更加完善。當(dāng)前,計算機相關(guān)技術(shù)已開始朝著云計算的方向構(gòu)建,使計算機信息處理技術(shù)既要關(guān)注硬件設(shè)施建設(shè),也要加強網(wǎng)絡(luò)之間的連接。
網(wǎng)絡(luò)分部存儲基于GFS(擴展分布的文件系統(tǒng))[6]上發(fā)展起來,廣泛運用于我國的互聯(lián)網(wǎng)公司,如百度、騰訊等。網(wǎng)絡(luò)分布存儲技術(shù)與傳統(tǒng)的存儲技術(shù)相比,能夠?qū)崿F(xiàn)數(shù)據(jù)的壓索及加快其循環(huán)速度,對于提高數(shù)據(jù)處理與加工效率、開發(fā)磁盤的應(yīng)用空間及縮短目標(biāo)內(nèi)容搜索的時間方面具有十分重大的意義。此外,網(wǎng)絡(luò)分部存儲技術(shù)還可與深層網(wǎng)絡(luò)空間技術(shù)產(chǎn)生協(xié)同作用,使信息集合的規(guī)模較大、分布具有自身的特性、訪問途徑趨向復(fù)雜等,有利于提高集合與處理信息的速度。
技術(shù)人員從生物進(jìn)化中獲得靈感,結(jié)合現(xiàn)代計算機信息處理技術(shù)創(chuàng)造出遺傳算法。其本質(zhì)類屬于隨機搜索技術(shù),通過自動調(diào)整系統(tǒng)內(nèi)部的搜索方向[5],獲得相對應(yīng)的信息,遺傳算法廣泛運用于信號處理、設(shè)備的自我學(xué)習(xí)及工程項目的選址中。當(dāng)前,研究人員探索數(shù)據(jù)索引技術(shù)的重心在于聚簇與互補索引兩個部分,前者要結(jié)合索引順序,實現(xiàn)相關(guān)數(shù)據(jù)的存儲,后者需根據(jù)不同的副本制作成相對應(yīng)的索引序列,以此建立互補索引表。
數(shù)據(jù)挖掘技術(shù)的研究重心在于技術(shù)與實體間的關(guān)聯(lián)及網(wǎng)絡(luò)搜索[7],技術(shù)與實體間的關(guān)聯(lián)可以利用網(wǎng)絡(luò)搜索技術(shù)來實現(xiàn)。在使用網(wǎng)絡(luò)搜索技術(shù)的過程中,設(shè)計排序?qū)W習(xí)的相關(guān)算法是成功運用數(shù)據(jù)挖掘技術(shù)的關(guān)鍵,主要目的是為了提高海量數(shù)據(jù)信息的獲取與加工。因為社會媒體主要用短文本的方式呈現(xiàn)其獲取的關(guān)鍵資料,如何對這部分短文本進(jìn)行處理,如何提高短文本數(shù)據(jù)處理的速度等問題,加快了排序?qū)W習(xí)算法的誕生。通過逐列逐點逐對的計算,對社交媒體平臺產(chǎn)生的海量短文本信息進(jìn)行處理。
計算機信息處理技術(shù)需要先進(jìn)的計算機硬件設(shè)備作支撐,在某種程度上限制了計算機信息處理技術(shù)的推廣與普及,其功能因為受到硬件設(shè)備的限制而無法發(fā)揮全部作用。因此,計算機信息處理技術(shù)在大數(shù)據(jù)背景下的總體發(fā)展趨勢是突破硬件的枷鎖,使其向著云計算、智能化的方向發(fā)展。具體內(nèi)容:①云計算技術(shù)將大量的數(shù)據(jù)上傳到互聯(lián)網(wǎng)中,對計算機存儲、讀取等設(shè)備的要求較低,技術(shù)人員隨時都可在該技術(shù)承載的網(wǎng)站上直接查詢與傳輸數(shù)據(jù),實現(xiàn)多設(shè)備的聯(lián)動。②計算機信息處理技術(shù)在數(shù)據(jù)傳輸方面需要由較為封閉的傳輸方式轉(zhuǎn)向較為開放的傳輸方式,建立多項上傳渠道,分解單一計算機設(shè)備承擔(dān)的壓力。③雖然計算機信息處理技術(shù)已向著云計算的方向發(fā)展,但所有技術(shù)都要依靠實體硬件來實現(xiàn),因此,在計算機領(lǐng)域仍然要加強硬件設(shè)備與技術(shù)的建設(shè),提升整體運行性能,使其滿足當(dāng)前信息處理對硬件設(shè)施的各項要求。
探究大數(shù)據(jù)時代計算機信息處理技術(shù)。既是計算機行業(yè)使用的需要也是計算機信息處理技術(shù)的發(fā)展需求,海量的數(shù)據(jù)堆積促進(jìn)了計算機信息處理技術(shù)的發(fā)展,無論是處理速度還是處理質(zhì)量,都較之前有了明顯的飛躍。隨著大數(shù)據(jù)概念的廣泛普及,計算機信息處理技術(shù)的運用范圍也得到了進(jìn)一步擴大,其在人們生活的各個領(lǐng)域發(fā)揮著前所未有的作用。