国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GPU的生態(tài)環(huán)境遙感評價模型并行化研究

2017-06-05 15:08顧進鋒宋安捷鄭海寧朱德海
農(nóng)業(yè)機械學(xué)報 2017年5期
關(guān)鍵詞:磁盤柵格線程

李 林 顧進鋒 宋安捷 鄭海寧 曹 津 朱德海

(1.中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.謝菲爾德大學(xué)計算機學(xué)院, 謝菲爾德 S102TN)

基于GPU的生態(tài)環(huán)境遙感評價模型并行化研究

李 林1顧進鋒1宋安捷2鄭海寧1曹 津1朱德海1

(1.中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.謝菲爾德大學(xué)計算機學(xué)院, 謝菲爾德 S102TN)

通過基于GPU的生態(tài)環(huán)境遙感評價模型并行化研究,在深入分析CPU+GPU異構(gòu)通用計算平臺數(shù)據(jù)傳輸瓶頸的基礎(chǔ)上,設(shè)計了數(shù)據(jù)分片、異步傳輸?shù)腉PU圖像處理框架。在此基礎(chǔ)上,將碳固定量、草地退化指數(shù)和生態(tài)環(huán)境指數(shù)3個計算模型基于CUDA進行并行化實現(xiàn),并通過實驗驗證了該技術(shù)方法的有效性,隨著數(shù)據(jù)規(guī)模的變大,碳固定量計算模型的加速比達到了8.04倍,草地退化指數(shù)計算模型的加速比達到了12.21倍,生態(tài)環(huán)境指數(shù)計算模型的加速比達到了7.45倍。

生態(tài)環(huán)境評價; 遙感; 并行化處理; GPU; CUDA

引言

當(dāng)前生態(tài)環(huán)境問題愈加嚴峻,為了使相關(guān)部門及時發(fā)現(xiàn)問題并采取相應(yīng)措施,實時、準確且綜合地進行生態(tài)環(huán)境遙感評價具有重要意義[1-4]。隨著遙感衛(wèi)星傳感器技術(shù)的飛速發(fā)展,遙感數(shù)據(jù)體量的急劇增長,模型處理速度成為生態(tài)遙感評價的瓶頸[5-7]。近年來,隨著GPU設(shè)備的可編程[8]能力迅速提升,且應(yīng)用范圍不斷擴大,作為通用的高性能大規(guī)模并行處理器,GPU具有高密度運算、并行性高、相對體積較小且高性價比等特點,為遙感數(shù)據(jù)的處理加速提供了一個極具潛力的技術(shù)手段[9-11]。針對此問題,LIU等[12-13]提出一種數(shù)據(jù)塊劃分讀取機制,趙進等[14-16]提出基于GPU的遙感并行化處理,模型處理速度有了一些提高,但CPU與GPU之間PCI-E/AGP總線的帶寬遠低于顯存總線,仍然是生態(tài)遙感評價的瓶頸。

本文面向GPU的生態(tài)環(huán)境遙感評價模型并行化分析與研究,設(shè)計數(shù)據(jù)分片、異步傳輸?shù)腉PU圖像處理框架,避免過多訪問主機內(nèi)存來提高執(zhí)行效率,將碳固定量、草地退化指數(shù)和生態(tài)環(huán)境指數(shù)3個計算模型基于CUDA[17-22]進行并行化實現(xiàn),并通過實驗驗證該技術(shù)方法的有效性。

1 并行化處理框架設(shè)計

1.1 計算任務(wù)流程優(yōu)化策略

1.1.1 數(shù)據(jù)分割調(diào)度

數(shù)據(jù)塊劃分讀取機制,通常作為處理類似問題場景下的主流解決方案。首先,作為存放在外部存儲器中遙感影像和主機內(nèi)存之間的數(shù)據(jù)傳輸單位,將原始的遙感影像劃分為若干數(shù)量固定的數(shù)據(jù)塊(Block),如圖1所示,每個數(shù)據(jù)塊包含一定數(shù)量的柵格像元數(shù)據(jù)。該數(shù)據(jù)塊劃分機制,可以通過調(diào)整數(shù)據(jù)塊的大小來適配實際應(yīng)用中不同配置的軟硬件系統(tǒng)。

圖1 數(shù)據(jù)劃分——數(shù)據(jù)塊Fig.1 Data partitioning—data block

在大圖像處理中磁盤I/O仍是計算效率的主要瓶頸,按照上述劃分機制,還是不利于外部磁盤I/O次數(shù)的有效減少。該方案的弊端在于當(dāng)數(shù)據(jù)寫入到某一塊時,其寫入順序從塊的起始地址寫,將塊的第1行數(shù)據(jù)寫入,當(dāng)要進行接下來塊的第2行數(shù)據(jù)寫入時,數(shù)據(jù)塊中第1行和第2行存放位置不連續(xù),間隔通常為

s=IC

(1)

式中I——圖像寬度C——通道類型(32R圖像取4,16U和16S圖像取2,8U圖像取1)

在數(shù)據(jù)塊換行讀寫時必須先移動文件指針,讀取一塊需要移動3次文件指針。整幅圖像的讀寫需要移動至少Blocks×3(Blocks為數(shù)據(jù)塊數(shù))次文件指針,這樣的磁盤I/O次數(shù)非常大。本文對此提出一種改進型方案,如圖2所示。

圖2 改進后數(shù)據(jù)塊劃分方法Fig.2 Improved data block partition method

改進后的分塊方法由每次讀取源影像數(shù)據(jù)的像元行數(shù)來確定,可以通過設(shè)定內(nèi)存數(shù)據(jù)塊的大小間接獲得每次讀取的行數(shù)。數(shù)據(jù)塊的大小為

S=WHC

(2)

式中W、H——數(shù)據(jù)塊寬度和高度

可知每次要讀取的影像像元行數(shù)(R)為

R=WH/I

(3)

采用這種分塊方法既降低了程序的邏輯復(fù)雜度,又大大減少了磁盤I/O的次數(shù)。對比原來的分塊方法,運算效率大大提高,整個計算處理過程中的數(shù)據(jù)流模型如圖3所示。

圖3 遙感影像分割調(diào)度數(shù)據(jù)流模型Fig.3 Model of data flow for remote sensing image segmentation and scheduling

1.1.2 數(shù)據(jù)異步傳輸

通常應(yīng)用程序需要在I/O環(huán)節(jié)將數(shù)據(jù)由外部磁盤讀入內(nèi)存,再從內(nèi)存將數(shù)據(jù)復(fù)制到GPU設(shè)備顯存,之后才是GPU對數(shù)據(jù)進行并行處理,整個流程按照圖4所示時序進行。可以看出,在應(yīng)用程序執(zhí)行各設(shè)備之間的I/O過程中,GPU運算資源始終處于空閑狀態(tài);同理,在GPU執(zhí)行運算操作時,主機的運算資源也在閑置。

圖4 任務(wù)執(zhí)行時序圖Fig.4 Task execution timing diagram

邏輯上每一數(shù)據(jù)塊的處理過程都是相互獨立的,可以讓主機對數(shù)據(jù)塊的I/O和GPU設(shè)備對于數(shù)據(jù)塊的運算處理這兩個在邏輯上相互獨立的操作過程“并行”執(zhí)行。從GPU設(shè)備的運算執(zhí)行角度,這種策略可以稱為運算數(shù)據(jù)的“異步傳輸”。

這里引入緩存池(Buffer pool)的概念,即在主機內(nèi)存中申請一定容量的存儲空間,作為數(shù)據(jù)塊由外部磁盤到GPU設(shè)備顯存的中轉(zhuǎn)站,緩存池的大小通常由數(shù)據(jù)塊的大小來決定。在此基礎(chǔ)上,通過引入CPU的多線程機制來實現(xiàn)數(shù)據(jù)I/O和GPU數(shù)據(jù)運算的同步執(zhí)行:第1種線程負責(zé)主機內(nèi)存按塊同磁盤中的遙感影像數(shù)據(jù)進行I/O操作,將待處理數(shù)據(jù)讀入緩存池或?qū)⒕彺娉刂薪Y(jié)果數(shù)據(jù)寫回磁盤文件;第2種線程負責(zé)主機內(nèi)存與GPU顯存的I/O以及調(diào)用GPU執(zhí)行運算,將緩存池中數(shù)據(jù)塊復(fù)制到GPU顯存執(zhí)行運算或?qū)⑦\算結(jié)果寫回緩存池。其中,2種線程之間的通信和同步操作通過設(shè)置信號量以及資源鎖的方式來實現(xiàn)。通過這種異步傳輸、同步執(zhí)行的處理策略,在繼承了數(shù)據(jù)塊劃分思想的同時,還有效發(fā)揮了主機CPU強大的邏輯處理功能,提高了資源利用率和計算任務(wù)執(zhí)行效率。數(shù)據(jù)異步傳輸模型如圖5所示。

圖5 GPU數(shù)據(jù)異步傳輸模型Fig.5 Model of GPU data asynchronous transfer

通過上述異步傳輸-同步執(zhí)行的數(shù)據(jù)調(diào)度及運算執(zhí)行策略,實現(xiàn)了一種雙重并行的處理機制:在計算任務(wù)執(zhí)行過程中,從微觀層面上來看,GPU內(nèi)部同時啟動數(shù)百上千個獨立線程對其中的數(shù)據(jù)進行并行化運算處理;從更宏觀層來看,整個系統(tǒng)中設(shè)備及存儲器間的數(shù)據(jù)I/O操作和GPU運算處理操作也是同時進行的。從圖6可以看出,整個計算任務(wù)執(zhí)行過程中外部磁盤和主機內(nèi)存的I/O環(huán)節(jié)占據(jù)了整個過程中絕大部分的時間消耗,通過異步傳輸機制,內(nèi)存與GPU的I/O以及GPU運算這部分的時間消耗完全被覆蓋,相比原有方案中各環(huán)節(jié)完全順序執(zhí)行提升了可觀的時間效率。

圖6 任務(wù)異步執(zhí)行時序圖Fig.6 Task asynchronous execution sequence diagram

1.2 GPU處理框架實現(xiàn)

基于上述所提出的方案和優(yōu)化策略,本文實現(xiàn)的遙感柵格影像GPU并行處理編程框架如圖7所示。首先,對CUDA環(huán)境進行初始化并在內(nèi)存中開辟一組固定大小(根據(jù)主機內(nèi)存以及GPU設(shè)備顯存實際情況在程序中設(shè)定)的存儲空間作為數(shù)據(jù)塊緩存池(Buffer pool);然后創(chuàng)建2個線程,一個用于處理磁盤和內(nèi)存緩存池的數(shù)據(jù)I/O,稱作線程A,另一個負責(zé)將緩存池的數(shù)據(jù)同GPU設(shè)備顯存進行I/O操作并執(zhí)行GPU運算,稱作線程B。每一個數(shù)據(jù)塊緩存都包含3種狀態(tài),分別是Ready_to_read、Ready_to_write以及Ready_to_process,其中:Ready_to_read狀態(tài)表示該數(shù)據(jù)塊緩存可以進行新數(shù)據(jù)讀入,即可以從磁盤讀取一個數(shù)據(jù)塊到該緩存空間;Ready_to_write狀態(tài)表示該數(shù)據(jù)塊緩存中的數(shù)據(jù)可以寫回到磁盤文件中;Ready_to_process狀態(tài)表示該數(shù)據(jù)塊緩存中的數(shù)據(jù)已經(jīng)讀取完畢,可以放入GPU執(zhí)行運算處理。

通過在程序中設(shè)置Is_IO_Done和Is_Process_Done 2個全局變量來記錄并控制線程A和線程B的執(zhí)行狀態(tài):當(dāng)GPU運算執(zhí)行完畢且緩沖池中無等待處理的數(shù)據(jù)時,Is_Process_Done為真值,程序調(diào)用Pthread_join方法將線程B終結(jié);同理當(dāng)磁盤數(shù)據(jù)讀取完畢時,Is_IO_Done為真值,應(yīng)用程序?qū)⒄{(diào)用Pthread_join方法終結(jié)線程A。最后程序執(zhí)行Return結(jié)束運行。

圖7 遙感影像 GPU并行處理框架流程圖Fig.7 Flow chart of GPU parallel processing framework for remote sensing image

2 生態(tài)環(huán)境遙感評價模型GPU并行化

2.1 指標(biāo)數(shù)據(jù)提取GPU并行化

本文選取了碳固定量和草地退化指數(shù)2個指標(biāo)的估算模型進行分析,結(jié)合GPU通用計算軟硬件技術(shù)特性,針對上述2個模型分別進行并行化設(shè)計,并給出其實現(xiàn)方案。

2.1.1 碳固定量

碳固定量指標(biāo)估算模型由光合有效輻射和光合有效輻射吸收比例計算植被吸收的光合有效輻射指標(biāo);利用植被分類和溫度計算光能利用率指標(biāo);再由光合有效輻射和光能利用率,根據(jù)模型計算得到碳固定指標(biāo)。其中,光能利用率模型依據(jù)的原理是,植被凈第一性生產(chǎn)力主要由植被所能吸收的光合有效輻射(SAPAR)及其光能利用率(ε)2個變量來確定。

SNPP(x,t)=SAPAR(x,t)ε(x,t)

(4)

式中t——時間x——空間位置SAPAR(x,t)——像元x在t月份吸收的光合有效輻射

ε(x,t)——像元x在t月份實際光能利用率

中間計算環(huán)節(jié)中的植被吸收光合有效輻射(SAPAR)和實際光能利用率(ε),以及最終植被凈初級生產(chǎn)力(SNPP)的計算過程中,均以柵格像元值為基本數(shù)據(jù)表示和計算單位,并對之進行浮點乘積運算。每個像元的處理過程完全一致,且又相互獨立,非常適合GPU的細粒度數(shù)據(jù)并行計算。基于CUDA平臺語言編寫對應(yīng)由GPU執(zhí)行并行計算函數(shù),實現(xiàn)碳固定量指標(biāo)估算模型的GPU并行化處理。

2.1.2 草地退化指數(shù)

基于植被覆蓋度的草地退化指數(shù)的計算方法為:輸入評價時段DNVDI及參考時段DNVDI數(shù)據(jù),得到草地退化指數(shù)指標(biāo)數(shù)據(jù)

DGDI=(F-Fref)/Fref

(5)

式中F——草地覆蓋度Fref——參考年的草地覆蓋度

覆蓋度F的計算公式為

F=(DNDVI-DNDVI min)/(DNDVI max-DNDVI min)

(6)

草地覆蓋度F由該對應(yīng)時段的DNVDI數(shù)據(jù)計算得出,并對覆蓋度指標(biāo)做歸一化處理。其中DNVDI max和DNVDI min分別對應(yīng)該時段N柵格影像數(shù)據(jù)像元最大值和最小值。分別算出各自對應(yīng)點草地覆蓋度數(shù)據(jù)與草地退化指數(shù),均以柵格像元值為基本數(shù)據(jù)表示和計算單位,并對之進行浮點乘積運算。每個像元的處理過程完全一致,且又相互獨立,非常適合GPU的細粒度數(shù)據(jù)并行計算?;贑UDA平臺語言編寫對應(yīng)的由GPU執(zhí)行的并行計算函數(shù),實現(xiàn)草地退化指數(shù)指標(biāo)估算模型的GPU并行化處理。

2.2 生態(tài)環(huán)境健康指數(shù)計算GPU并行化

生態(tài)環(huán)境遙感評價的結(jié)果數(shù)據(jù)用生態(tài)環(huán)境健康指數(shù)(EEHI)表示。生態(tài)環(huán)境健康指數(shù)采用質(zhì)量指數(shù)法計算,即EEHI是所有經(jīng)標(biāo)準化處理后的二級指標(biāo)值的加權(quán)和,計算公式為

(7)

式中n——評價體系中指標(biāo)總數(shù)Ij——第j個指標(biāo)標(biāo)準化后的值Wj——第j個指標(biāo)的權(quán)重

由于指標(biāo)體系中的各項評價指標(biāo)的類型較為復(fù)雜,單位也有很大差異,直接進行加權(quán)處理是不合適的,也無實際意義,為了簡便、明確和易于計算,有必要進行各項指標(biāo)的標(biāo)準化,在對各指標(biāo)進行量綱統(tǒng)一時,對參評因子進行標(biāo)準化,取值設(shè)定在0~1之間。積極健康指標(biāo)因子和消極健康指標(biāo)因子的得分計算公式分別為

Aij=(Xij-Xj min)/(Xj max-Xj min)

(8)

Nij=(Xj max-Xij)/(Xj max-Xj min)

(9)

式中Xij——評價因素的指標(biāo)值Xj max、Xj min——指標(biāo)因子的最大值和最小值

生態(tài)評價指標(biāo)分為積極和消極兩種屬性,相應(yīng)的標(biāo)準化計算公式也有所不同,因此需要分別加權(quán)融合實現(xiàn)兩種指標(biāo)的標(biāo)準化核函數(shù),并通過在主程序中設(shè)置專門的枚舉型變量來決定調(diào)用對象?;贑UDA平臺語言編寫對應(yīng)由GPU執(zhí)行并行計算函數(shù),實現(xiàn)生態(tài)環(huán)境健康指數(shù)估算模型的GPU并行化處理。

2.3 并行模型整體實現(xiàn)

上述研究得出了生態(tài)環(huán)境遙感評價3個業(yè)務(wù)模型基于CUDA的GPU并行處理實現(xiàn)方案,結(jié)合遙感柵格影像GPU并行化處理基礎(chǔ)框架,可以得出并行計算模塊的整體架構(gòu),模塊功能界面如圖8所示。在視圖層,應(yīng)用.NET WPF技術(shù)實現(xiàn)UI界面,完成業(yè)務(wù)流程交互和基本的數(shù)據(jù)展示功能;在GPU并行計算模型具體實現(xiàn)中,GPU設(shè)備端數(shù)據(jù)處理模塊及線程管理均基于CUDA Toolkit實現(xiàn);基于遙感柵格數(shù)據(jù)通用處理庫GDAL實現(xiàn)柵格文件的創(chuàng)建、屬性設(shè)置、按塊像元讀寫和相關(guān)數(shù)值統(tǒng)計(像元最大值、最小值、均值等),CPU端線程管理采用Windows平臺下基于POSIX標(biāo)準的線程操作庫Pthread-w32,兩者共同構(gòu)成計算模塊的數(shù)據(jù)I/O及設(shè)備任務(wù)調(diào)度層。

圖8 GPU并行模型結(jié)構(gòu)Fig.8 GPU parallel model structure

3 實驗與結(jié)果分析

3.1 實驗環(huán)境

進行碳固定量、草地退化指數(shù)和生態(tài)環(huán)境健康指數(shù)3個改進業(yè)務(wù)計算模型的執(zhí)行分析,實驗數(shù)據(jù)按照包含遙感柵格影像數(shù)據(jù)分辨率和文件體積的不同,分為3個數(shù)據(jù)集:641×1 116(單幅3.5 MB)、7 691×7 831(單幅115 MB)、16 463×14 399(單幅315 MB)。

現(xiàn)今業(yè)界通用的并行加速比是一個度量并行處理性能的關(guān)鍵參數(shù),它可以直觀顯示出在并行機上利用并行算法求解實際問題所能獲得的好處。對于求解相同規(guī)模的同一應(yīng)用問題,并行算法的加速比可定義為

Sp=Ts/Tp

(10)

式中Ts——最優(yōu)串行算法在CPU上的運行時間

Tp——并行算法在GPU上的運行時間

Sp——算法并行化后獲得的加速比

因此,本系統(tǒng)應(yīng)用實驗將3個業(yè)務(wù)模型的原有程序和并行化程序在3個數(shù)據(jù)集上分別運行進行結(jié)果對比。實驗環(huán)境如表1所示。

表1 實驗環(huán)境Tab.1 Experiment environment

3.2 實驗結(jié)果

(1)碳固定量計算模型

每次輸入數(shù)據(jù)為4張單幅柵格影像數(shù)據(jù),實驗結(jié)果如圖9所示。

圖9 碳固定量模型 GPU并行加速實驗結(jié)果Fig.9 Experiment results of GPU parallelization of carbon fixation

(2)草地退化指數(shù)計算模型

每次輸入數(shù)據(jù)為2張單幅柵格影像數(shù)據(jù),實驗結(jié)果如圖10所示。

圖10 草地退化指數(shù) GPU并行加速實驗結(jié)果Fig.10 Experiment results of GPU parallelization of grassland degradation index

(3)生態(tài)環(huán)境健康指數(shù)計算模型

每次輸入數(shù)據(jù)為6張單幅柵格影像數(shù)據(jù)以及每個指標(biāo)的對應(yīng)權(quán)重序列,實驗結(jié)果如圖11所示。

圖11 生態(tài)環(huán)境健康指數(shù) GPU并行加速實驗結(jié)果Fig.11 Experiment results of GPU parallelization of ecological environment health index

3.3 結(jié)果分析

(1)3個業(yè)務(wù)模型執(zhí)行狀況的并行化加速在數(shù)據(jù)量較小的情況下效果不明顯,這是由于在數(shù)值計算復(fù)雜度不高的情況下,CPU憑借本身的計算能力可以應(yīng)對小數(shù)據(jù)量的處理任務(wù),此時并未發(fā)揮出GPU并行算法的優(yōu)勢,再加上數(shù)據(jù)I/O的時間消耗,并未在數(shù)據(jù)處理環(huán)節(jié)顯示出優(yōu)勢。

(2)在單次任務(wù)輸入文件增多的情況下,數(shù)據(jù)塊大小不變時,I/O次數(shù)必然增多,并且每次數(shù)據(jù)I/O均需要跨越多個文件,在此期間磁盤數(shù)據(jù)指針需反復(fù)跨越尋找定位數(shù)據(jù),總體增加了時間消耗,設(shè)備間I/O仍是制約效率提升的重要瓶頸。

(3)3個業(yè)務(wù)模型執(zhí)行狀況的并行化加速比隨著數(shù)據(jù)規(guī)模的變大而提升。同等數(shù)據(jù)量進行對比,草地退化指數(shù)計算模型算法的加速比最明顯,其次是碳固定量計算模型算法的加速比,然后是生態(tài)環(huán)境健康指數(shù)計算模型算法的加速比;與原有實驗方案進行效果對比,641×1 116(單幅3.5 MB)數(shù)據(jù)量下,加速比分別(順序依次為碳固定量計算模型、草地退化指數(shù)計算模型和生態(tài)環(huán)境健康指數(shù)計算模型,下同)達到了2.44倍、3.49倍和2.03倍;7 691×7 831(單幅115 MB)數(shù)據(jù)量下,加速比分別達到了5.83倍、8.81倍和4.96倍; 16 463×14 399(單幅315 MB)數(shù)據(jù)量下,加速比分別達到了8.04倍、12.21倍和7.45倍。

4 結(jié)束語

為了減少大圖像處理中磁盤I/O的次數(shù),改進了數(shù)據(jù)分割調(diào)度數(shù)據(jù)流方案。為了提高GPU影像并行處理速度,提出異步傳輸-同步執(zhí)行的數(shù)據(jù)調(diào)度及運算執(zhí)行策略,實現(xiàn)了一種雙重并行的處理機制。最后通過實驗與原有方案進行效果對比,新算法達到了7~12倍的加速比。該方法有效提高了遙感數(shù)據(jù)的處理速度,為實時、準確且綜合地進行生態(tài)環(huán)境遙感評價提供了強有力的技術(shù)支持,方便相關(guān)部門及時發(fā)現(xiàn)問題并采取相應(yīng)措施,具有實際應(yīng)用價值。

1 張永瀚, 孫瑞志, 李林,等. 生態(tài)環(huán)境遙感評價模型庫系統(tǒng)平臺構(gòu)建研究[J/OL]. 農(nóng)業(yè)機械學(xué)報, 2015, 46(增刊):267-273. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=2015S043&flag=1. DOI:10.6041/j.issn.1000-1298.2015.S0.043. ZHANG Yonghan, SUN Ruizhi, LI Lin, et al. Research of remote sensing evaluation model library platform of ecological environment[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015,46(Supp.):267-273. (in Chinese)

2 ZHANG Y, WANG J, GONG W, et al. Eco-environmental quality evaluation and dynamic ecological patterns for Songhua River watershed in Harbin Section, China[J]. Nature Environment & Pollution Technology, 2014, 13(4):725-730.

3 XU M, ZHU Y, Lü H, et al. Eco-environmental quality evaluation of Huaibei Plain[J]. Proceedings of the International Association of Hydrological Sciences,2015, 368:436-441.

4 史舟, 梁宗正, 楊媛媛,等. 農(nóng)業(yè)遙感研究現(xiàn)狀與展望[J/OL]. 農(nóng)業(yè)機械學(xué)報, 2015, 46(2):247-260. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150237&flag=1. DOI:10.6041/j.issn.1000-1298.2015.02.037. SHI Zhou, LIANG Zongzheng, YANG Yuanyuan, et al. Status and prospect of agricultural remote sensing[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015, 46(2):247-260. (in Chinese)

5 尚松浩, 蔣磊, 楊雨亭. 基于遙感的農(nóng)業(yè)用水效率評價方法研究進展[J/OL]. 農(nóng)業(yè)機械學(xué)報, 2015, 46(10):81-92. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20151013&flag=1. DOI:10.6041/j.issn.1000-1298.2015.10.013. SHANG Songhao, JIANG Lei, YANG Yuting. Review of remote sensing-based assessment method for irrigation and crop water use efficiency[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015, 46(10):81-92. (in Chinese)

6 韓鵬鵬, 黃進良, 李仁東,等. 基于面向?qū)ο蟮目犹吝b感監(jiān)測與動態(tài)分析[J/OL]. 農(nóng)業(yè)機械學(xué)報, 2015, 46(1):272-277.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150138&flag=1. DOI:10.6041/j.issn.1000-1298.2015.01.038. HAN Pengpeng, HUANG Jinliang, LI Rendong, et al. Remote sensing monitoring and dynamic analysis of ponds based on object-oriented rules[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015, 46(1):272-277. (in Chinese)

7 楊寧, 張榮標(biāo), 張永春,等. 基于微生物生態(tài)效益的土壤肥力綜合評價模型[J/OL]. 農(nóng)業(yè)機械學(xué)報, 2013, 44(5):108-112.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20130520&flag=1. DOI:10.6041/j.issn.1000-1298.2013.05.020. YANG Ning, ZHANG Rongbiao, ZHANG Yongchun, et al. Soil fertility synthesis evaluation model based on ecological benefit of microorganism[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2013, 44(5):108-112. (in Chinese)

8 劉旭春, 李德龍, 劉津, 等. 基于可編程 GPU 的遙感影像快速處理研究[J]. 測繪通報, 2013(6): 22-26. LIU Xuchun, LI Delong, LIU Jin, et al. The study of fast processing of remote sensing images based on programmable graphics process unit[J]. Bulletin of Surveying and Mapping, 2013(6): 22-26.(in Chinese)

9 袁濤, 馬艷, 劉定生. GPU 在遙感圖像處理中的應(yīng)用綜述[J]. 遙感信息, 2012,27(6): 110-117. YUAN Tao, MA Yan, LIU Dingsheng. Review of GPU applications in remote sensing image processing[J]. Remote Sensing Information, 2012,27(6): 110-117.(in Chinese)

10 陳超, 陳彬, 孟劍萍. 基于GPU大規(guī)模遙感圖像的幾何校正[J]. 指揮信息系統(tǒng)與技術(shù), 2012, 3(1): 76-80. CHEN Chao, CHEN Bin, MENG Jianping. Geometric correction of remote sensing image based on graphic processing unit[J].Command Information System and Technology, 2012, 3(1): 76-80.(in Chinese)

11 周海芳, 趙進. 基于GPU的遙感圖像配準并行程序設(shè)計與存儲優(yōu)化[J]. 計算機研究與發(fā)展, 2012, 49(增刊1):281-286. ZHOU Haifang, ZHAO Jin. Parallel programming design and storage optimization of remote sensing image registration based on GPU[J].Journal of Computer Research and Development, 2012, 49(Supp.1):281-286.(in Chinese)

12 LIU Y, CHEN B, YU H, et al. Applying GPU and POSIX thread technologies in massive remote sensing image data processing[C]∥2011 19th International Conference on Geoinformatics, 2011:1-6.

13 CHRISTOPHE E, MICHEL J, INGLADA J. Remote sensing processing: from multicore to GPU[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2011, 4(3):643-652.

14 趙進. 基于GPU的遙感圖像并行處理算法及其優(yōu)化技術(shù)研究[D]. 長沙:國防科學(xué)技術(shù)大學(xué), 2011. ZHAO Jin. Study of remote sensing image parallel processing algorithms based on GPU and optimization techniques[D].Changsha:National University of Defense Technology,2011.(in Chinese)

15 LIU P, YUAN T, MA Y, et al. Parallel processing of massive remote sensing images in a GPU architecture[J]. Computing & Informatics, 2014, 33(1):197-217.

16 徐如林, 周海芳, 姜晶菲. 基于GPU的遙感圖像IHS小波融合并行算法設(shè)計與實現(xiàn)[J]. 計算機工程與科學(xué), 2012, 34(8):135-141. XU Rulin, ZHOU Haifang, JIANG Jingfei. Design and implementation of a parallel algorithm of the IHS- and wavelet-based image fusion for remote sensing based on GPU[J].Computer Engineering & Science, 2012, 34(8):135-141.(in Chinese)

17 NVIDIA. Nvidia cuda programming guide: Version 3.2[CP]. NVIDIA Corporation, 2010.

18 ABOUALI M, TIMMERMANS J, CASTILLO J E, et al. A high performance GPU implementation of surface energy balance system (SEBS) based on CUDA-C[J]. Environmental Modelling & Software, 2013, 41(3):134-138.

19 DAWSON L, STEWART I. Improving ant colony optimization performance on the GPU using CUDA[C]∥IEEE Congress Evolutionary Computation, 2013:1901-1908.

20 郭一漢. 基于CUDA的實時圖像拼接技術(shù)研究[D]. 長沙:國防科學(xué)技術(shù)大學(xué), 2011. GUO Yihan. Real-time image mosaic based on CUDA[D].Changsha: National University of Defense Technology, 2011.(in Chinese)

21 姚平. CUDA平臺上的CPU/GPU異步計算模式[D]. 合肥:中國科學(xué)技術(shù)大學(xué), 2010.

22 趙春江. 農(nóng)業(yè)遙感研究與應(yīng)用進展[J/OL]. 農(nóng)業(yè)機械學(xué)報, 2014, 45(12):277-293. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20141241&flag=1. DOI:10.6041/j.issn.1000-1298.2014.12.041. ZHAO Chunjiang. Advances of research and application in remote sensing for agriculture[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2014, 45(12):277-293.(in Chinese)

Parallelization on Model of Ecological Environment Remote Sensing Evaluation Based on GPU

LI Lin1GU Jinfeng1SONG Anjie2ZHENG Haining1CAO Jin1ZHU Dehai1
(1.CollegeofInformationandElectricalEngineering,ChinaAgriculturalUniversity,Beijing100083,China2.DepartmentofComputerScience,UniversityofSheffield,SheffieldS102TN,UK)

In order to solve the problem of the model’s slowly processing speed of ecological environment remote sensing evaluation currently, a framework about GPU image processing was designed with data partitioning and scheduling asynchronous transmission which was based on the in-depth analysis about the data transmission bottleneck of heterogeneous CPU+GPU general computing platform. It included the carbon fixed quantity and grassland degradation index, whose intrinsic parallelism met the GPU computing features. For the above models, it was put forward based on CUDA parallel implementation. The core link of indexes for evaluation of ecological environment of remote sensing data standardization and weighted fusion of CUDA parallel module were implemented. Finally, the effectiveness of technical methods was verified through experiments, as the scale of data became larger, the parallel execution speed of three business models became faster, the speedup ratio of the fixed amount of carbon achieved a 8.04 times execution rate lift; the speedup ratio of the index of grassland degradation achieved a 12.21 times execution rate lift; and the speedup ratio of the index of ecological environment achieved a 7.45 times execution rate lift. At the same time, the speedup ratio was decreased as the number of input data files increased, equipment between I/O was still the main factor which restricted the running efficiency of the algorithm.

ecological environment evaluation; remote sensing; parallel processing; GPU; CUDA

2016-08-31

2016-10-19

國家自然科學(xué)基金項目(31471762)

李林(1963—),女,教授,博士生導(dǎo)師,主要從事軟件工程和軟件自動化研究,E-mail: lilincau@126.com

朱德海(1962—),男,教授,博士生導(dǎo)師,主要從事3S技術(shù)及其在農(nóng)業(yè)和國土資源中的應(yīng)用研究,E-mail: zhudehai@cau.edu.cn

10.6041/j.issn.1000-1298.2017.05.016

S2

A

1000-1298(2017)05-0135-07

猜你喜歡
磁盤柵格線程
葉臘石聚合成型及其旋轉(zhuǎn)磁盤的制作方法
基于鄰域柵格篩選的點云邊緣點提取方法*
基于C#線程實驗探究
它的好 它的壞 詳解動態(tài)磁盤
基于A*算法在蜂巢柵格地圖中的路徑規(guī)劃研究
基于國產(chǎn)化環(huán)境的線程池模型研究與實現(xiàn)
解決Windows磁盤簽名沖突
線程池調(diào)度對服務(wù)器性能影響的研究*
Windows系統(tǒng)下動態(tài)磁盤卷的分析與研究
不同剖面形狀的柵格壁對柵格翼氣動特性的影響