陳胤燃 羅建文
1 清華大學(xué) 醫(yī)學(xué)院生物醫(yī)學(xué)工程系 (北京 100084)
2 清華大學(xué) 生物醫(yī)學(xué)影像研究中心 (北京 100084)
醫(yī)學(xué)超聲成像和CT(X 射線斷層成像)、MRI(磁共振成像)、核醫(yī)學(xué)成像并稱(chēng)為現(xiàn)代醫(yī)學(xué)四大成像方式。超聲成像具有無(wú)創(chuàng)、無(wú)痛、無(wú)電離輻射、時(shí)間分辨率高、便攜性高等特點(diǎn)。超聲成像的應(yīng)用領(lǐng)域十分廣泛,B 模式超聲成像可以觀察組織的生理解剖結(jié)構(gòu),如心血管成像、腹部成像等;超聲血流成像可以觀察血管內(nèi)的血流情況;超聲彈性成像可以觀察組織的力學(xué)屬性,如乳房、肝臟、甲狀腺、血管部位的彈性變化等。
醫(yī)學(xué)超聲成像已經(jīng)有幾十年的發(fā)展歷史。近些年來(lái),一些新的先進(jìn)成像方法不斷被提出,例如平面波復(fù)合成像、合成孔徑成像等用以提高圖像質(zhì)量或者實(shí)現(xiàn)超聲超高速成像的方法[1];壓縮彈性成像、聲輻射力脈沖成像、剪切波成像等彈性成像方法,定性或定量地獲得組織彈性模量的信息[2]。這些新方法的提出可以在一定程度上擴(kuò)大醫(yī)學(xué)超聲成像的應(yīng)用范圍,提供給醫(yī)生和研究者們更多和體內(nèi)組織的信息,幫助各種相關(guān)疾病的診斷。
上述的先進(jìn)成像方法和傳統(tǒng)的成像方法相比具有優(yōu)勢(shì),但它們都存在著一個(gè)共同的問(wèn)題——極大的數(shù)據(jù)量和計(jì)算量。超聲成像的最大優(yōu)勢(shì)之一就是極佳的時(shí)間分辨率,這些先進(jìn)成像方法同樣應(yīng)該滿(mǎn)足超聲成像對(duì)時(shí)間分辨率的要求,甚至達(dá)到超高速成像的要求。要讓這些先進(jìn)成像方法實(shí)現(xiàn)實(shí)時(shí)成像,就需要計(jì)算能力更加強(qiáng)大的處理器設(shè)備。近些年來(lái),圖形處理器(Graphics Processing Unit,GPU)在大規(guī)模數(shù)據(jù)計(jì)算中展現(xiàn)出強(qiáng)大的性能,GPU 高度的可并行性和強(qiáng)大的數(shù)值計(jì)算能力使其成為實(shí)現(xiàn)醫(yī)學(xué)超聲先進(jìn)成像方法實(shí)時(shí)成像的有力工具之一。
GPU 是一種專(zhuān)門(mén)用于在個(gè)人計(jì)算機(jī)、工作站、游戲機(jī)和一些移動(dòng)終端等電子設(shè)備上負(fù)責(zé)圖形計(jì)算、顯示的微處理器。目前主流的計(jì)算機(jī)中負(fù)責(zé)計(jì)算的處理器是中央處理器(CPU)和圖形處理器GPU,其中GPU 只負(fù)責(zé)圖形的渲染、顯示等工作,除此之外的大部分運(yùn)算工作都交給CPU。近些年來(lái),隨著科學(xué)技術(shù)的不斷發(fā)展,許多研究領(lǐng)域出現(xiàn)了“數(shù)據(jù)井噴”的情況,如航天航空、全球氣候預(yù)報(bào)、生命科學(xué)等,數(shù)據(jù)規(guī)模已經(jīng)達(dá)到了TB(240Byte)甚至是PB(250Byte)量級(jí)[3]。不斷增加的數(shù)據(jù)量和對(duì)處理器計(jì)算能力要求的不斷提高,促使GPU 從純粹的圖形處理器逐漸向通用計(jì)算領(lǐng)域發(fā)展。
圖1. CPU 和GPU 抽象硬件結(jié)構(gòu)模型
和CPU 相比,GPU 的計(jì)算能力和存儲(chǔ)帶寬具有明顯的優(yōu)勢(shì),圖1 是CPU 和GPU 的抽象硬件結(jié)構(gòu)模型圖,從圖中可以看出,作為一種通用的處理器,CPU 需要兼顧不同計(jì)算任務(wù)的需要,因此在硬件構(gòu)成方面需要有較大的緩存和復(fù)雜的邏輯控制單元,而用于計(jì)算的核通常只有1 至8 個(gè)(常見(jiàn)的如雙核、四核處理器等)。GPU 和CPU 相比,減小了復(fù)雜的邏輯控制單元和緩存空間,取而代之的是更多的計(jì)算核心,如NVIDIA公司的Tesla K80c GPU 具有4992 個(gè)計(jì)算核,最高單精度浮點(diǎn)性能達(dá)到8.74 TFlops,和CPU 相比更適合對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行并行計(jì)算。
自1999 年由NVIDIA 公司發(fā)明第一款GPU問(wèn)世以來(lái),GPU 的發(fā)展就一直保持著很高的速度。近幾年來(lái),GPU 的性能幾乎每一年都可以翻倍,這個(gè)速度大大超過(guò)了CPU 發(fā)展所遵照的摩爾定律(每18 至24 個(gè)月性能翻倍),目前主流GPU 的單精度浮點(diǎn)計(jì)算能力已經(jīng)達(dá)到了同時(shí)期CPU 的10倍左右,外部存儲(chǔ)器帶寬則可以達(dá)到5 倍左右[4]。
目前編程控制GPU 進(jìn)行運(yùn)算的工具主要是開(kāi)放語(yǔ)言運(yùn)算(Open Computing Language,OpenCL)和NVIDIA 公司推出的統(tǒng)一計(jì)算設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA)。
OpenCL 是第一個(gè)面向異構(gòu)系統(tǒng)通用目的的并行編程的開(kāi)放式、免費(fèi)標(biāo)準(zhǔn),也是一個(gè)統(tǒng)一的編程環(huán)境,便于軟件開(kāi)發(fā)人員為高性能計(jì)算服務(wù)器、桌面計(jì)算系統(tǒng)、手持設(shè)備編寫(xiě)高效輕便的代碼,而且廣泛適用于多核CPU、GPU、Cell類(lèi)型架構(gòu)以及數(shù)字信號(hào)處理器(digital signal processing,DSP)等其他并行處理器,在游戲、娛樂(lè)、科研、醫(yī)療等各種領(lǐng)域都有廣闊的發(fā)展前景。
2007 年,NVIDIA 公 司 推 出 了CUDA。CUDA 是一種將GPU 作為數(shù)據(jù)并行計(jì)算設(shè)備的軟硬件體系,開(kāi)發(fā)人員可以從C 語(yǔ)言比較平穩(wěn)地過(guò)渡到CUDA 編程中,比較容易實(shí)現(xiàn)基于GPU的通用計(jì)算。與以往的GPU 相比,支持CUDA的GPU 在硬件架構(gòu)上有顯著的改進(jìn),一是采用了統(tǒng)一處理架構(gòu),可以更有效地利用過(guò)去分布在頂點(diǎn)渲染器和像素渲染器的計(jì)算資源;二是引入了片內(nèi)共享存儲(chǔ)器,支持隨機(jī)寫(xiě)入和線程間通信[3]。
超聲超高速成像是近年來(lái)醫(yī)學(xué)超聲成像的研究熱點(diǎn)之一[5,6],平面波成像是實(shí)現(xiàn)超高速成像的最常用方法,由于只需一次發(fā)射/接收即可獲得一幅二維圖像,平面波成像的理論最高成像幀頻可以達(dá)到幾千甚至上萬(wàn)幀/秒。
通過(guò)多角度相干復(fù)合,平面波成像可以在保證圖像質(zhì)量的前提下,大幅度提高成像幀頻,實(shí)現(xiàn)超聲超高速成像。由于發(fā)射和接收模式的改變,波束合成器單位時(shí)間內(nèi)需要處理的數(shù)據(jù)量也相應(yīng)地大幅度增加,現(xiàn)有的基于現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)等設(shè)備的波束合成器的計(jì)算能力無(wú)法滿(mǎn)足超高速成像的要求[7]。近些年來(lái),基于GPU 的超聲超高速波束合成器研究成為了超高速成像的研究熱點(diǎn)之一。
GPU 在超聲超高速成像中主要應(yīng)用于波束合成環(huán)節(jié)。超聲波束合成主要有頻率域基于傅里葉變換的波束合成方法和時(shí)間域的延時(shí)-疊加波束合成方法,GPU 應(yīng)用基本集中于基于時(shí)間域的延時(shí)-疊加方法。延時(shí)-疊加波束合成包括延時(shí)值計(jì)算和通道數(shù)據(jù)疊加兩個(gè)環(huán)節(jié),延時(shí)值計(jì)算是根據(jù)要合成像素點(diǎn)的位置,結(jié)合聲波發(fā)射和接收的模式,計(jì)算出該點(diǎn)的發(fā)射延時(shí)和接收延時(shí),根據(jù)延時(shí)值在射頻數(shù)據(jù)的對(duì)應(yīng)通道中找到來(lái)自于該像素點(diǎn)的回波信號(hào);疊加是在找到不同通道中來(lái)自于同一個(gè)像素點(diǎn)的回波信號(hào)后,對(duì)所有的信號(hào)進(jìn)行加權(quán)疊加(也叫加權(quán)變跡)。施加的窗函數(shù)可以是固定的,如矩形窗、漢寧窗、漢明窗等,也可以是通過(guò)最小方差算法計(jì)算出的自適應(yīng)窗函數(shù)。延時(shí)-疊加方法中每一個(gè)像素點(diǎn)的計(jì)算都是獨(dú)立的,具有高度的并行性,因此可以通過(guò)GPU 的并行計(jì)算功能實(shí)現(xiàn),和傳統(tǒng)的串行方法相比大幅度提高合成速度[7]。
在超聲波束合成的GPU 應(yīng)用中,Elnokrashy等人將GPU 應(yīng)用于四維超聲體數(shù)據(jù)的重建和渲染,在保證圖像重建質(zhì)量的條件下達(dá)到了實(shí)時(shí)的要求[8]。Romero 等人使用GPU 并行計(jì)算加速合成孔徑成像的波束合成,和CPU 合成器相比實(shí)現(xiàn)了超過(guò)一個(gè)數(shù)量級(jí)的加速倍數(shù)[9]。
將GPU 應(yīng)用于超聲超高速成像,重點(diǎn)在于線程的任務(wù)分配和數(shù)據(jù)存儲(chǔ)策略的優(yōu)化。通常的做法是分配GPU 中的一條線程負(fù)責(zé)一個(gè)像素點(diǎn)的計(jì)算,一個(gè)線程塊負(fù)責(zé)一個(gè)通道的數(shù)據(jù)處理;數(shù)據(jù)存儲(chǔ)策略方面,受制于GPU 中共享存儲(chǔ)器和寄存器大小的限制,大量的數(shù)據(jù)主要存儲(chǔ)于全局存儲(chǔ)器中,共享存儲(chǔ)器和寄存器只用于存放少量的需要重復(fù)計(jì)算和讀寫(xiě)的數(shù)據(jù)。在具體應(yīng)用方面,Hou 等人提出用基于GPU 的稀疏矩陣波束合成方法來(lái)加速相控陣球面波成像的波束合成,和傳統(tǒng)的方法在CPU 上實(shí)現(xiàn)的結(jié)果相比,提速明顯[10]。Yu 等人利用多塊GPU 分工合作,分別計(jì)算平面波復(fù)合成像和合成孔徑成像,在一定的成像深度和波束合成參數(shù)下,成像幀頻可以達(dá)到5000 幀/秒[7,11]。圖2 是GPU 波束合成器的系統(tǒng)框圖,從圖中可以看出多個(gè)GPU 并行計(jì)算取代了傳統(tǒng)的波束合成器,其中多塊GPU 用于合成不同偏轉(zhuǎn)角度下的平面波圖像,一塊GPU 用于多角度相干復(fù)合操作[7]。更多的GPU 應(yīng)用于超聲波束合成的應(yīng)用研究可以參考[12~21]。
圖2. 基于GPU 的超聲波束合成器系統(tǒng)框圖[7]
上述的GPU 在超聲波束合成中的應(yīng)用都是采用固定的變跡系數(shù)(即固定的接收窗函數(shù)),為了提高波束合成的圖像質(zhì)量,Babak 和Ali 提出了最小方差波束合成方法,最小方差方法通過(guò)自適應(yīng)地計(jì)算接收變跡系數(shù),抑制旁瓣的水平,在保持軸向分辨率的前提下,提高橫向分辨率[22]。由于自適應(yīng)計(jì)算過(guò)程計(jì)算復(fù)雜,因此該方法很難達(dá)到實(shí)時(shí)成像的要求。為了實(shí)現(xiàn)自適應(yīng)波束合成的實(shí)時(shí)實(shí)現(xiàn),Yu 等人用多塊GPU 并行計(jì)算,通過(guò)合理的線程分配和存儲(chǔ)策略?xún)?yōu)化,在一定的自適應(yīng)參數(shù)條件下,能夠?qū)崿F(xiàn)該波束合成方法的實(shí)時(shí)成像[23,24]。
生物組織的彈性信息在疾病診斷中具有重要的參考價(jià)值。因此,20 多年來(lái),彈性成像得到快速發(fā)展[25]。其中,壓縮彈性成像首先獲取壓縮前后的兩幅超聲圖像,在壓縮前的圖像中選定多個(gè)二維分布(不同掃描線、不同深度)的搜索數(shù)據(jù)窗,每一個(gè)搜索數(shù)據(jù)窗對(duì)應(yīng)于壓縮后圖像中的一個(gè)搜索范圍,通過(guò)不同的算法,如零相位、互相關(guān)等,計(jì)算出該搜索窗口所對(duì)應(yīng)的點(diǎn)經(jīng)過(guò)壓縮之后的位移(軸、橫向位移),并在壓縮前圖像中通過(guò)添加偽彩的形式表示出組織位移,再進(jìn)行應(yīng)變分布的計(jì)算或彈性模量的重建等。與壓縮彈性成像一樣,其他彈性成像方法也都涉及組織位移的估計(jì),其算法具有多重的可并行性,如不同的數(shù)據(jù)窗在搜索范圍內(nèi)的搜索過(guò)程是相互獨(dú)立的,一段數(shù)據(jù)窗在搜索范圍內(nèi)和不同數(shù)據(jù)段進(jìn)行互相關(guān)計(jì)算的過(guò)程也是相互獨(dú)立的等。因此,可以將彈性成像的計(jì)算任務(wù)并行地劃分給GPU 中的不同線程塊和不同線程,進(jìn)行并行計(jì)算,加速?gòu)椥猿上竦挠?jì)算速度。
在目前的研究中,GPU 主要被應(yīng)用于超聲彈性成像中計(jì)算量最大的環(huán)節(jié)——位移估計(jì)。Deshmukh 等人利用GPU 加速動(dòng)態(tài)編程超聲彈性成像算法,和傳統(tǒng)方法相比加速27 至20 倍[26];Yang 等人利用CPU 和GPU 的混合編程,將數(shù)據(jù)量大且可并行的部分交給GPU 進(jìn)行加速運(yùn)算,實(shí)現(xiàn)了基于互相關(guān)算法的軸向位移和應(yīng)變的估計(jì),幀頻滿(mǎn)足了實(shí)時(shí)成像的要求[27];Rosenzweig等人將GPU 并行計(jì)算應(yīng)用于加速聲輻射力脈沖成像(ARFI)中的兩個(gè)算法,即三次樣條插值和Loupas 二維自相關(guān)位移估計(jì),和單個(gè)CPU 的計(jì)算能力相比,實(shí)現(xiàn)了40 倍左右的加速效果[28];Tan 和Wang 通過(guò)對(duì)傳統(tǒng)超聲彈性成像位移算法的研究以及結(jié)合聲輻射力位移的特點(diǎn),提出了一種適合于GPU 加速的快速組織位移估計(jì)新算法,該算法在保持和常用算法相似的效果的前提下,速度提高了近100 倍[29]。Lü 等人利用GPU 實(shí)現(xiàn)了零相位算法的位移估計(jì)和最小平方算法的應(yīng)變估計(jì),和CPU 計(jì)算相比提速20 倍左右[30]。
在利用GPU 加速歸一化互相關(guān)(NCC)算法的應(yīng)用中,Hou 等人在諧波運(yùn)動(dòng)估計(jì)成像中,用GPU 加速一維NCC 算法,在離體肝臟實(shí)驗(yàn)中,和傳統(tǒng)的基于CPU 的方法相比提速顯著,從數(shù)據(jù)采集到位移圖顯示的幀頻最高達(dá)到15 幀/秒[10]。Grondin 和Konofagou 等人在心臟內(nèi)心肌彈性成像中也運(yùn)用了GPU 進(jìn)行算法加速[31]。Montagnon等人使用一維搜索窗,分別對(duì)比了多核CPU、GPU 和單核CPU 的加速效果,采用GPU 時(shí)的幀頻可以達(dá)到80 至173 幀/秒[32]。Deshmukh 等人同樣采用一維的搜索窗口進(jìn)行NCC 算法位移估計(jì),幀頻最高可達(dá)到78 幀/秒,在他們的工作中應(yīng)用了電磁跟蹤系統(tǒng)來(lái)定位超聲探頭的位置,獲得比徒手操作更加穩(wěn)定的圖像質(zhì)量,該工作還與達(dá)芬奇手術(shù)機(jī)器人配合,探索了實(shí)時(shí)彈性成像在手術(shù)中的應(yīng)用[33];Idzenga 等人采用GPU 加速基于二維搜索窗口的NCC 算法,二維搜索窗相比一維的計(jì)算量更大,他們的工作在保證和傳統(tǒng)方法相比沒(méi)有損失圖像質(zhì)量的情況下,實(shí)現(xiàn)了數(shù)百倍的加速比,幀頻為9 幀/秒左右[34,35]。圖3 給出了一種基于GPU 并行計(jì)算的2 維位移估計(jì)算法,從圖中可以看出在主機(jī)端,壓縮前的圖像被分割成若干有重疊的數(shù)據(jù)塊,壓縮后的圖像中則對(duì)應(yīng)地找出了這些數(shù)據(jù)塊的搜索范圍,在GPU 中這些數(shù)據(jù)塊和各自的搜索范圍被并行地分配到不同的線程中進(jìn)行二維位移的估計(jì),最后再將兩個(gè)維度的位移結(jié)果返回至主機(jī)端中[34]。更多的GPU應(yīng)用于超聲彈性成像的應(yīng)用研究可以參考[36~44]。
圖3. 二維位移估計(jì)算法并行化計(jì)算圖示[34]
血流成像是醫(yī)學(xué)超聲成像中的重要部分,包括頻譜多普勒和彩色血流成像兩種。在頻譜多普勒成像中,Wang 等人利用CUDA 編程GPU 加速,一條線的脈沖多普勒計(jì)算時(shí)間僅為7.6 us,和CPU 相比提速92 倍[45]。在彩色血流成像中,F(xiàn)an等人利用GPU 加速,在一定的參數(shù)下達(dá)到了300 幀/秒左右的幀頻[46];Chang 和Li 等人利用GPU加速彩色多普勒成像,幀頻達(dá)到160 幀/秒[47,48]。另外,Yiu 和Yu 提出用超高速平面波成像和彩色編碼散斑成像結(jié)合用于血管分叉處復(fù)雜血流的成像,并用GPU 加速該方法,提供了一種比彩色血流成像更形象化的血流成像方法[49]。更多的GPU應(yīng)用于超聲彈性成像的應(yīng)用研究可以參考[50,51]。
在目前的應(yīng)用中,大部分醫(yī)學(xué)超聲設(shè)備的信 號(hào)處理器是現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、數(shù)字信號(hào)處理器(DSP)及專(zhuān)門(mén)設(shè)計(jì)的電子設(shè)備等[7]。這些設(shè)備的性能尚無(wú)法達(dá)到超高速成像等先進(jìn)超聲成像方法實(shí)時(shí)成像的要求。GPU 作為計(jì)算能力更強(qiáng)的處理器,憑借其高度的并行性和強(qiáng)大的數(shù)值計(jì)算能力,在超高速成像等先進(jìn)超聲成像的實(shí)時(shí)實(shí)現(xiàn)中發(fā)揮了重要的作用。但GPU 和其他的處理器相比,功耗更大且數(shù)據(jù)傳輸帶寬有限、存儲(chǔ)空間也有一定的限制。Yu 等人通過(guò)對(duì)多種處理器組合在超聲合成孔徑成像中的計(jì)算能力、效率功耗比、價(jià)格等參數(shù)的比較,認(rèn)為GPU 具有作為下一代超聲設(shè)備信號(hào)處理器的潛能,但只單獨(dú)利用GPU 是不夠的,在從前端數(shù)據(jù)采集到中間數(shù)據(jù)處理、最后顯示和儲(chǔ)存的完整流程中,還需要和FPGA、CPU 等設(shè)備的結(jié)合才能夠發(fā)揮出最佳的系統(tǒng)性能[52]。
目前GPU 已經(jīng)在超聲成像的多個(gè)研究方向中有了初步的或者是較為成熟的應(yīng)用,GPU 的高度可并行性和強(qiáng)大的數(shù)值計(jì)算能力也在一定程度上符合一些先進(jìn)超聲成像方法的實(shí)時(shí)要求。但較高的功耗、有限的內(nèi)部存儲(chǔ)空間、主機(jī)和GPU 之間的數(shù)據(jù)傳輸帶寬等因素目前也限制了GPU 成為新一代醫(yī)學(xué)超聲設(shè)備的處理核心。隨著技術(shù)的不斷發(fā)展,GPU 在超聲成像中的進(jìn)一步應(yīng)用是值得期待的。
[1] MONTALDO G, TANTER M, BERCOFF J, et al. Coherent plane-wave compounding for very high frame rate ultrasonography and transient elastography [J]. Ultrasonics, Ferroelectrics and Frequency Control, IEEE Transactions on, 2009, 56(3): 489-506.
[2] OPHIR J, C SPEDES I, PONNEKANTI H, et al. Elastography: A Quantitative Method for Imaging the Elasticity of Biological Tissues [J]. Ultrasonic Imaging, 1991, 13(2): 111-34.
[3] COOK S. CUDA Programming: A Developer's Guide to Parallel Computing with GPUs [M]. Newnes, 2012.
[4] KIRK D B, WEN-MEI W H. Programming massively parallel processors: a hands-on approach [M]. Newnes, 2012.
[5] 何瓊,羅建文. 超高速超聲成像的研究進(jìn)展 [J]. 中國(guó)醫(yī)學(xué)影像技術(shù), 2014, 8):
[6] TANTER M, FINK M. Ultrafast imaging in biomedical ultrasound [J]. Ultrasonics, Ferroelectrics and Frequency Control, IEEE Transactions on, 2014, 61(1): 102-19.
[7] YIU B Y, TSANG I K, YU A C. GPU-based beamformer: fast realization of plane wave compounding and synthetic aperture imaging [J]. IEEE transactions on ultrasonics, ferroelectrics, and frequency control, 2011, 58(8): 1698-705.
[8] ELNOKRASHY A F, ELMALKY A, HOSNY T M, et al. GPU-based reconstruction and display for 4D ultrasound data; proceedings of the Ultrasonics Symposium (IUS), 2009 IEEE International, F, 2009 [C]. IEEE.
[9] MARTI, X, N-ARGUEDAS C J, et al. An ultrasonic imaging system based on a new SAFT approach and a GPU beamformer [J]. Ultrasonics, Ferroelectrics and Frequency Control, IEEE Transactions on, 2012, 59(7): 1402-12.
[10] HOU G, PROVOST J, GRONDIN J, et al. Sparse matrix beamforming and image reconstruction for real-time 2D HIFU monitoring using Harmonic Motion Imaging for Focused Ultrasound (HMIFU) with in vitro validation [J]. IEEE transactions on medical imaging, 2014,
[11] YIU B Y S, TSANG I K H, YU A C H. Real-time GPU-based software beamformer designed for advanced imaging methods research; proceedings of the Ultrasonics Symposium (IUS), 2010 IEEE, F 11-14 Oct. 2010, 2010 [C].
[12] 夏春蘭, 石丹, 劉東權(quán). 基于 CUDA 的超聲 B 模式成像 [J]. 計(jì)算機(jī)應(yīng)用研究, 2011, 28(6): 2011-5.
[13] NILSEN C C, HAFIZOVIC I. Digital beamforming using a GPU; proceedings of the Acoustics, Speech and Signal Processing, 2009 ICASSP 2009 IEEE International Conference on, F 19-24 April 2009, 2009 [C].
[14] LIM S, KWON K, SHIN B-S. GPU-based interactive visualization framework for ultrasound datasets [J]. Computer Animation and Virtual Worlds, 2009, 20(1): 11-23.
文獻(xiàn)[15]~[52]略。