米 淳 李 翔 許 星 付為民
(中國人民公安大學(xué) 網(wǎng)絡(luò)安全保衛(wèi)學(xué)院,北京 102623)
GPU(Graphic Processing Unit)是指圖形處理器,是顯卡的“心臟”。每個(gè)GPU內(nèi)部包含成百上千的多線程計(jì)算部件,可將大型計(jì)算任務(wù)分割成許多小份,同時(shí)處理這些分割的任務(wù)。在GPU上做合適的編程,就可以利用GPU高效快速處理海量數(shù)據(jù)。據(jù)計(jì)算行業(yè)調(diào)查,GPU浮點(diǎn)運(yùn)算運(yùn)算方面可以提供比CPU快百倍的并行計(jì)算性能,并且仍在快速增長。當(dāng)今五強(qiáng)計(jì)算機(jī)中的三臺均采用英偉達(dá)(NVIDIA)Tesla GPU動(dòng)力。
在超級計(jì)算機(jī)快速發(fā)展的今天,GPU已經(jīng)成為業(yè)界公認(rèn)地打造世界級超級計(jì)算機(jī)的關(guān)鍵技術(shù)。GPU的超強(qiáng)運(yùn)算能力是由其獨(dú)特的硬件結(jié)構(gòu)決定的,其特點(diǎn)是具有高并行結(jié)構(gòu)并且將更多的晶體管用于數(shù)據(jù)處理。
CUDA (Compute Unified Device Architecture), 是一種由NVIDIA推出的通用并行計(jì)算架構(gòu),該架構(gòu)使得GPU具有了強(qiáng)大的可編程性。CUDA提供了一個(gè)靈活的編程模型和類C語言以在GPU上實(shí)現(xiàn)并行數(shù)據(jù)算法,這是研究并行算法的一種新模型,它為模式識別、工業(yè)研究和向量計(jì)算等大規(guī)模并行計(jì)算問題開辟了一條全新的道路。
CUDA C相比C語言更加容易把握,其語法規(guī)則基本遵照C語言進(jìn)行了一些擴(kuò)充,這些特點(diǎn)使得CUDA具有一些明顯的功能:(1)線程按照兩個(gè)層次進(jìn)行組織,細(xì)粒度數(shù)據(jù)并行(線程級并行實(shí)現(xiàn))和粗粒度并行(任務(wù)并行實(shí)現(xiàn));(2)具有強(qiáng)大的可編程性,CUDA使用C編程語言提供了高性能計(jì)算的指導(dǎo)性開發(fā)能力,使開發(fā)者可以基于GPU的強(qiáng)大數(shù)據(jù)并行計(jì)算能力,建立一個(gè)更有效的計(jì)算方案。
目前信息安全越來越受到人們的重視,而這都是建立在安全協(xié)議和算法基礎(chǔ)之上。加密算法是信息安全的核心模塊。多種加密算法已經(jīng)被開發(fā),但越是安全的加密解密算法在復(fù)雜度上卻越加難于計(jì)算。所以,有很多的安全加密算法由于其復(fù)雜度過高和個(gè)人計(jì)算機(jī)的計(jì)算能力有限,無法實(shí)現(xiàn)快速的加密和解密,從而失去了實(shí)用性。
基于CUDA的GPU技術(shù)為這一問題提供完美的解決方案。AES高級加密標(biāo)準(zhǔn)在很大程度上取決于整數(shù)運(yùn)算。基于CUDA的GPU技術(shù)的整數(shù)處理能力對于實(shí)現(xiàn)AES加密解密的有效性已經(jīng)在一些實(shí)驗(yàn)中被證實(shí)。目前,AES在GPU上實(shí)現(xiàn)的速度最高可為CPU上實(shí)現(xiàn)速度的19.60倍。
在如今的信息時(shí)代,海量的數(shù)據(jù)信息爆炸性地增長,信息分析工作在面對如此繁雜的信息時(shí)就變得無所適從,因?yàn)檫@項(xiàng)工作往往需要進(jìn)行大規(guī)模復(fù)雜的數(shù)據(jù)運(yùn)算。
聚類是數(shù)據(jù)查找和數(shù)據(jù)挖掘領(lǐng)域的一項(xiàng)重要技術(shù),而K-means算法是聚類運(yùn)算中實(shí)現(xiàn)成本最低、達(dá)成速度最快、信息反饋?zhàn)罴皶r(shí)的一種常規(guī)算法。然而在面對紛繁蕪雜的海量數(shù)據(jù)時(shí),K-means算法表現(xiàn)出的性能卻不盡人意。
基于CUDA的GPU的可以在很大程度上優(yōu)化K-means算法。基于GPU的K-means算法的核心框架是將K-means算法中包含的數(shù)據(jù)分割開,將連續(xù)的、涉及大量計(jì)算的部分交給GPU處理,從而提高收斂速度和檢索性能。具體說,由于K-means算法每次計(jì)算的數(shù)據(jù)之間都是相互獨(dú)立的,相互間都不受彼此的影響,所以在此基礎(chǔ)上,雖然數(shù)據(jù)的使用和K個(gè)簇中心的更新過程要執(zhí)行很多次,但基于CUDA的GPU可以利用其大量并行處理數(shù)據(jù)的特點(diǎn),將其分割成獨(dú)立的內(nèi)核函數(shù),再通過高速并行計(jì)算核心處理數(shù)據(jù)。
如今的互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,在很多方面為人們提供便利,然而在互聯(lián)網(wǎng)上的資源良莠不齊,木馬、病毒等危害信息廣泛傳播,給網(wǎng)絡(luò)安全帶來了巨大的威脅。
解決計(jì)算機(jī)病毒的方法除了使用快速且昂貴的專用防火墻、殺毒軟件之外,使用廉價(jià)的一個(gè)折中的方案,那就是使用基于GPU的模式匹配算法進(jìn)行病毒特征的快速查殺??茖W(xué)家們已經(jīng)實(shí)現(xiàn)了一個(gè)高性能的基于GPU的病毒掃描庫。該系統(tǒng)采用GPU作為一個(gè)高速數(shù)據(jù)篩選器并行地從數(shù)以千計(jì)的數(shù)據(jù)對象中識別潛在的病毒特征,使得GPU已經(jīng)可以作為一種可行且高性能的網(wǎng)絡(luò)安全處理平臺。
作為大公司的生命線,數(shù)據(jù)庫的作用至關(guān)重要?,F(xiàn)階段,要想從海量復(fù)雜的數(shù)據(jù)庫中提取出有效的關(guān)聯(lián)信息仍然是一個(gè)計(jì)算機(jī)領(lǐng)域的世界性難題。由于數(shù)據(jù)庫中數(shù)據(jù)量日益龐大,盡管使用較好的搜索算法和數(shù)據(jù)結(jié)構(gòu),對數(shù)據(jù)庫的查詢,修改等操作速度仍然較慢。未來操作人員可以利用基于CUDA的GPU技術(shù),并行處理數(shù)據(jù)庫將使操作速度提高10倍以上,這樣數(shù)以億計(jì)的數(shù)據(jù)在幾秒鐘內(nèi)就會(huì)被反饋到用戶面前,從而使用戶能方便快捷準(zhǔn)確地從數(shù)據(jù)庫中獲取所需信息,提高了數(shù)據(jù)庫管理和使用效率。
本文介紹了圖形處理單元GPU結(jié)構(gòu)特點(diǎn)以及強(qiáng)大的計(jì)算能力,并提出了將基于CUDA的GPU技術(shù)應(yīng)用于快速處理海量數(shù)據(jù)的應(yīng)用構(gòu)想。隨著科學(xué)技術(shù)的進(jìn)步,新一代GPU將具備更加強(qiáng)大的計(jì)算能力和可編程性,GPU勢必會(huì)成為一個(gè)研究熱點(diǎn)和突破點(diǎn)。
[1]吳思華,柳有權(quán).基于圖形處理器(GPU)的通用計(jì)算[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2004,16[5]
[2]馮娜.基于GPU的檔案數(shù)據(jù)庫應(yīng)用研究[J]武漢理工大學(xué)學(xué)報(bào)2011.06
[3]蓋素麗.基于GPU的數(shù)字圖像并行處理方法[J].電子產(chǎn)品世界2009.(02)