李一鵬 賈世宇 潘振寬 王吉強(qiáng) 李 冰
(青島大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院 山東 青島 266000)
數(shù)控仿真對(duì)數(shù)控加工有著重要的意義。數(shù)控仿真通過(guò)在虛擬環(huán)境中使用數(shù)控加工程序模擬加工過(guò)程來(lái)驗(yàn)證其正確性,避免因數(shù)控加工程序錯(cuò)誤而導(dǎo)致的工件質(zhì)量下降和資源浪費(fèi)。
現(xiàn)代數(shù)控仿真一般使用基于空間分割的方法來(lái)表示工件模型實(shí)體,其中由Hook[1]提出的Dexel方法廣泛地應(yīng)用于國(guó)內(nèi)外商業(yè)軟件和仿真系統(tǒng)中?;贒exel的仿真方法的主要問(wèn)題在于表示幾乎平行于Dexel方向的部分實(shí)體時(shí)精度較差,存在難以避免的階梯化現(xiàn)象與信息丟失的問(wèn)題。其改進(jìn)版本三向Dexel方法則可以在保留其簡(jiǎn)單布爾操作以及較小空間占用優(yōu)點(diǎn)的同時(shí)增加建模的精度。三向Dexel方法在數(shù)控仿真中應(yīng)用的主要問(wèn)題在于復(fù)雜的表面重構(gòu)過(guò)程。目前主流的做法是利用三向Dexel模型與體素(Voxel)模型的相似性,將三向Dexel模型轉(zhuǎn)換成體素模型,再使用成熟的體素模型表面重構(gòu)算法進(jìn)行表面重構(gòu)[2]。于珊[3]通過(guò)使用GPU加速的移動(dòng)立方體(Marching Cube)[4-5]方法進(jìn)行表面重構(gòu)提高了數(shù)控仿真的速度。Peng等[6]提出的基于輪廓的表面重構(gòu)方法及Ren等[7]提出的基于網(wǎng)格的表面重構(gòu)方法相比于將三向Dexel模型轉(zhuǎn)換為體素模型,其算法復(fù)雜度較高,時(shí)間消耗較大,且難以使用并行技術(shù)進(jìn)行加速。Jachym等[8]通過(guò)使用OptiX光線追蹤引擎來(lái)獲取更具真實(shí)感的重構(gòu)表面,但難以實(shí)現(xiàn)流暢的實(shí)時(shí)仿真。Inui等[9]提出的四面柱(Quad Pillars)算法擁有較高的并行度和執(zhí)行效率,但是僅適用于單向Dexel模型的表面重構(gòu)。
相比于移動(dòng)立方體方法,雙輪廓(Dual Contouring,DC)[10]方法通過(guò)使用厄米特?cái)?shù)據(jù)(Hermite data,物體表面點(diǎn)及其法線數(shù)據(jù))計(jì)算特征點(diǎn),可以還原由于采樣問(wèn)題丟失的特征(如尖銳棱角特征)。雙輪廓法在數(shù)控仿真中應(yīng)用的主要限制在于其高昂的計(jì)算開銷,在CPU端進(jìn)行的雙輪廓法往往難以滿足數(shù)控仿真對(duì)于實(shí)時(shí)性的要求,因此目前該方法還未在數(shù)控仿真中有所應(yīng)用。
針對(duì)上述問(wèn)題,本文提出一種并行化的基于三向Dexel的數(shù)控仿真方法,通過(guò)使用三向Dexel建模方法提高仿真精度,采用雙輪廓方法進(jìn)行表面重構(gòu),并通過(guò)運(yùn)用并行加速技術(shù)提高計(jì)算速度。相較于現(xiàn)存的數(shù)控仿真方法,在仿真的精度相同時(shí),本文方法使用的GPU加速的雙輪廓算法能夠更準(zhǔn)確地還原出數(shù)控加工工件的尖銳棱、角特征,為實(shí)際加工提供更加準(zhǔn)確的仿真結(jié)果。同時(shí)通過(guò)應(yīng)用多線程加速和GPU加速技術(shù),使得中等配置(參考配置見仿真結(jié)果部分)的計(jì)算機(jī)也能實(shí)現(xiàn)流暢、準(zhǔn)確的仿真,降低了對(duì)計(jì)算機(jī)硬件的要求。
數(shù)控仿真方法的結(jié)構(gòu)如圖1所示。數(shù)控仿真程序在CPU端、GPU端有不同的分工。仿真程序從存儲(chǔ)工程文件中讀取信息后,在CPU端根據(jù)胚料信息進(jìn)行實(shí)體建模,根據(jù)刀具參數(shù)計(jì)算每行NC代碼控制下刀具所掃過(guò)的空間體(下簡(jiǎn)稱為掃掠體);將工件實(shí)體與掃掠體進(jìn)行相減操作;將所得三向Dexel模型轉(zhuǎn)換成適合進(jìn)行表面重構(gòu)的結(jié)構(gòu)后發(fā)送到GPU端;由GPU對(duì)表面進(jìn)行重構(gòu),并對(duì)重構(gòu)所得多邊形表面進(jìn)行圖形渲染。如此重復(fù)上述過(guò)程,直至NC代碼讀取完畢。
圖1 數(shù)控仿真方法示意圖
數(shù)控仿真使用實(shí)體間的布爾減運(yùn)算來(lái)描述數(shù)控加工中刀具切削工件的過(guò)程,為此需要對(duì)工件和刀具進(jìn)行實(shí)體建模。單向與三向Dexel模型示意圖如圖2所示。單向Dexel模型通過(guò)記錄一組平行且等距的光線在實(shí)體內(nèi)部的部分來(lái)表示實(shí)體,這種方式會(huì)造成如圖2(a)所示的信息丟失。三向Dexel模型則通過(guò)如圖2(b)所示的方式,在三個(gè)相互垂直的方向進(jìn)行取樣來(lái)減少信息丟失,從而提高仿真精度。三向Dexel模型的結(jié)構(gòu)由三組單向Dexel模型組成。
圖2 單向Dexel與三向Dexel模型示意圖
2.1.1單向Dexel模型的建模
單向Dexel模型在其XY平面上,沿X軸、Y軸正方向以仿真精度P為間隔分布著向Z軸正向發(fā)射的光線。每條光線與實(shí)體相交的交點(diǎn)都被保存下來(lái),每?jī)蓚€(gè)交點(diǎn)之間的線段代表著光線在實(shí)體內(nèi)部的部分,稱為一個(gè)Dexel。構(gòu)成Dexel的兩個(gè)交點(diǎn)中距離XY平面距離較遠(yuǎn)的為Dexel的上端點(diǎn),較近的為下端點(diǎn)。同一條光線上的Dexel端點(diǎn)依據(jù)距離發(fā)射點(diǎn)的距離按升序排列形成的鏈狀結(jié)構(gòu)稱為Dexel鏈。這些Dexel鏈可以構(gòu)成一個(gè)二維的網(wǎng)格(Grid)結(jié)構(gòu)。假定網(wǎng)格結(jié)構(gòu)沿X軸、Y軸方向分為nX、nY份,則該Dexel模型的分辨率為nX×nY,空間復(fù)雜度為O(nX×nY)。
為了壓縮Dexel模型所需的儲(chǔ)存空間,在記錄端點(diǎn)位置信息時(shí)僅記錄端點(diǎn)到XY平面的距離。需要獲取端點(diǎn)的確切坐標(biāo)時(shí),依據(jù)當(dāng)前Dexel鏈在二維網(wǎng)格中的位置進(jìn)行計(jì)算即可。坐標(biāo)為(i,j)的Dexel鏈上端點(diǎn)的坐標(biāo)(x,y,z)為:
x=OX+P×iy=OY+P×jz=OZ+dZ
(1)
式中:{OX,OY,OZ}為單向Dexel坐標(biāo)系中的原點(diǎn);P為仿真精度;dZ為端點(diǎn)到XY平面的距離。
2.1.2三向Dexel模型的建模
三向Dexel模型的結(jié)構(gòu)由三個(gè)相互垂直方向的單向Dexel模型疊加得到。由于數(shù)控加工的仿真過(guò)程中僅包含布爾減運(yùn)算,仿真中可能發(fā)生布爾運(yùn)算的范圍可以限定在工件胚料的包圍盒中。建模時(shí)選擇在胚料包圍盒的X、Y、Z方向分別建立編號(hào)為0、1、2的三組單向Dexel模型。第i組單向Dexel模型的局部坐標(biāo)系{O,eX,eY,eZ}為:
O=BmineX=e(i+1)mod3eY=e(i+2)mod3eZ=ei
(2)
式中:O為單向Dexel模型局部坐標(biāo)系的原點(diǎn);eX、eY、eZ為單向Dexel模型局部坐標(biāo)系X、Y、Z軸的單位向量;Bmin為胚料包圍盒的最小點(diǎn);e0、e1、e2為胚料包圍盒坐標(biāo)系的X、Y、Z軸單位向量。
三向Dexel模型的分辨率NX×NY×NZ為:
NX=ceil[(Bmax.x-Bmin.x)/P]NY=ceil[(Bmax.y-Bmin.y)/P]NZ=ceil[(Bmax.z-Bmin.z)/P]
(3)
式中:Bmax為胚料包圍盒的最大點(diǎn);P為仿真精度。
2.1.3三向Dexel模型的布爾運(yùn)算
文獻(xiàn)[11]詳細(xì)描述了三向Dexel的并、交、差布爾運(yùn)算,數(shù)控仿真中主要用到的為三向Dexel的減運(yùn)算。三向Dexel模型之間進(jìn)行布爾運(yùn)算時(shí),對(duì)雙方X、Y、Z方向的單向Dexel模型分別進(jìn)行布爾運(yùn)算,即為相對(duì)應(yīng)光線上Dexel的減運(yùn)算。數(shù)控仿真中運(yùn)算根據(jù)刀具Dexel和工件Dexel的相對(duì)位置關(guān)系,共有圖3所示的6種情況。
圖3 Dexel間的相減運(yùn)算
(1) 刀具Dexel與工件Dexel沒有任何相交,不需要修改工件Dexel。
(2) 與情況1相同,不需要修改工件Dexel。
(3) 工件Dexel的下端點(diǎn)到刀具Dexel上端點(diǎn)之間的部分被切除。
(4) 刀具Dexel的下端點(diǎn)到工件Dexel的上端點(diǎn)之間的部分被切除。
(5) 工件Dexel被完全刪除。
(6) 刀具Dexel的下端點(diǎn)到上端點(diǎn)之間的部分被切除,工件Dexel分裂成兩個(gè)Dexel。
可以看出,相減產(chǎn)生的新Dexel端點(diǎn)的位置為相應(yīng)刀具Dexel端點(diǎn)的位置,法線與該刀具Dexel端點(diǎn)法線方向相反。
刀具掃掠體的生成有兩種方法:第一種為近似的方法[12],根據(jù)操作的軌跡位置、刀軸角度信息以一定的間距進(jìn)行插值計(jì)算,將掃掠體離散為多個(gè)刀具實(shí)體;第二種方法為精確的方法[13-14],通過(guò)刀具輪廓線和操作起止點(diǎn)信息精確地計(jì)算刀具的掃掠體。精確計(jì)算的主要優(yōu)勢(shì)在于精度高于前者,劣勢(shì)在于計(jì)算需要更多時(shí)間。因此本文選擇近似的構(gòu)造方法,以仿真精度P的一半為間隔插值生成刀具實(shí)例,將這些實(shí)例的集合作為當(dāng)前操作所生成掃掠體的近似。
工件與刀具的減運(yùn)算首先需要生成刀具實(shí)例的三向Dexel模型。為了減少建模的運(yùn)算量,在三向Dexel模型的局部坐標(biāo)系中生成該實(shí)例的包圍盒,僅在該范圍內(nèi)進(jìn)行模型生成。之后從工件三向Dexel模型中減去所生成的模型。其多線程加速運(yùn)作機(jī)制如圖4所示。假定共有i個(gè)輔助線程,將其分別編號(hào)為1,2,…,n,創(chuàng)建輔助線程的主線程也作為0號(hào)線程參與運(yùn)算,則第i號(hào)線程負(fù)責(zé)每個(gè)刀具實(shí)例包圍盒內(nèi)第k(n+1)+i條Dexel鏈的構(gòu)建與對(duì)應(yīng)工件Dexel鏈的相減運(yùn)算。
圖4 布爾減運(yùn)算的并行運(yùn)作機(jī)制
三向Dexel模型不適用于可視化,為了獲取適合圖形設(shè)備渲染的多邊形表面,需要對(duì)實(shí)體進(jìn)行表面重構(gòu)。本文方法在表面重構(gòu)時(shí),在CPU端將三向Dexel模型轉(zhuǎn)化為厄米特?cái)?shù)據(jù),并在GPU上進(jìn)行八叉樹的構(gòu)建、特征點(diǎn)的計(jì)算、八叉樹的化簡(jiǎn),以及重構(gòu)表面的提取。
如圖5所示,由于三向Dexel模型的采樣精度有限,直接使用表面重構(gòu)算法(如移動(dòng)立方體算法,以下簡(jiǎn)稱MC算法)進(jìn)行表面重構(gòu)會(huì)產(chǎn)生如圖5(c)所示的特征丟失。雙輪廓(簡(jiǎn)稱DC)算法則可以通過(guò)使用由三向Dexel模型提取而來(lái)的厄米特?cái)?shù)據(jù),通過(guò)計(jì)算每個(gè)體素內(nèi)部的特征點(diǎn)(圖5(d)中的白色點(diǎn))來(lái)還原其丟失特征。表面重構(gòu)算法的步驟如下:
(1) 在CPU中將三向Dexel數(shù)據(jù)轉(zhuǎn)換為適合構(gòu)建八叉樹的數(shù)據(jù),并將數(shù)據(jù)送入GPU;
(2) 在GPU上生成能夠完全容納網(wǎng)格數(shù)據(jù)的最小八叉樹;
(3) 并行處理每個(gè)葉子節(jié)點(diǎn),對(duì)其特征點(diǎn)進(jìn)行計(jì)算;
(4) 對(duì)八叉樹進(jìn)行化簡(jiǎn),并提取重構(gòu)表面。
圖5 移動(dòng)立方體與雙輪廓表面重構(gòu)
2.3.1網(wǎng)格信息與赫米特?cái)?shù)據(jù)的提取
八叉樹的建立需要包含完整三向Dexel模型的網(wǎng)格信息,因此需要建立與三向Dexel模型同等分辨率的網(wǎng)格,網(wǎng)格格點(diǎn)及厄米特點(diǎn)的數(shù)據(jù)結(jié)構(gòu)如圖6所示。為了節(jié)省顯存,格點(diǎn)數(shù)據(jù)中不保存完整的厄米特點(diǎn)數(shù)據(jù),只保存索引值。索引數(shù)組的0、1、2號(hào)元素分別代表格點(diǎn)X、Y、Z方向的厄米特點(diǎn)。厄米特點(diǎn)的數(shù)據(jù)單獨(dú)封裝,以一維數(shù)組的形式傳遞給GPU。格點(diǎn)信息的提取通過(guò)遍歷三向Dexel模型中的Dexel完成,如圖7所示。首先為每個(gè)Dexel的端點(diǎn)分配索引值,并將其所經(jīng)過(guò)的格點(diǎn)均設(shè)置為內(nèi)部格點(diǎn),在最靠近Dexel上下端點(diǎn)的內(nèi)部格點(diǎn)處記錄對(duì)應(yīng)Dexel端點(diǎn)的索引值。
圖6 格點(diǎn)與厄米特點(diǎn)的數(shù)據(jù)結(jié)構(gòu)示意圖
圖7 從三向Dexel模型中提取網(wǎng)格信息
2.3.2八叉樹的建立
雙輪廓法結(jié)合自適應(yīng)精度八叉樹可以簡(jiǎn)化生成的表面,有效減少表面包含三角形的數(shù)量,提高渲染速度。本文使用的在GPU端運(yùn)行的并行八叉樹生成算法[15]能夠在節(jié)約顯存的同時(shí)提升算法的運(yùn)行效率,可以極大縮短八叉樹構(gòu)建時(shí)間。所構(gòu)建八叉樹的最大深度由傳入網(wǎng)格數(shù)據(jù)的尺寸決定,大小為能夠完全容納網(wǎng)格的最小八叉樹。由于GPU并不支持動(dòng)態(tài)內(nèi)存分配,每層節(jié)點(diǎn)所需要的存儲(chǔ)空間需要提前分配。該方法首先構(gòu)造葉子節(jié)點(diǎn),并從底層向上依次進(jìn)行八叉樹的構(gòu)造。若一個(gè)葉子節(jié)點(diǎn)為非空葉節(jié)點(diǎn)(8個(gè)角點(diǎn)中既包含內(nèi)部格點(diǎn)又包含外部格點(diǎn)的葉節(jié)點(diǎn)),則構(gòu)建一個(gè)新的節(jié)點(diǎn),使用原子計(jì)數(shù)器對(duì)其進(jìn)行編號(hào)并使用查詢表來(lái)存儲(chǔ)子節(jié)點(diǎn)與父節(jié)點(diǎn)之間的關(guān)系。在建立八叉樹的過(guò)程中需要統(tǒng)計(jì)構(gòu)建葉節(jié)點(diǎn)數(shù)量,用于為后續(xù)步驟會(huì)用到的二次誤差方程數(shù)據(jù)分配存儲(chǔ)空間。八叉樹構(gòu)建完成后,使用構(gòu)建的八叉樹來(lái)進(jìn)行特征點(diǎn)的計(jì)算和八叉樹的簡(jiǎn)化。
2.3.3特征點(diǎn)的計(jì)算
雙輪廓法中特征點(diǎn)的計(jì)算是通過(guò)求解葉節(jié)點(diǎn)的二次誤差方程(Quadratic Error Function,QEF) 得到的。QEF的定義如下:
(4)
式中:pi、ni代表著該葉子節(jié)點(diǎn)所對(duì)應(yīng)體素邊上厄米特點(diǎn)的位置與法線,可以通過(guò)查詢?cè)擉w素8個(gè)角點(diǎn)對(duì)應(yīng)格點(diǎn)的索引數(shù)組得到。將式(4)轉(zhuǎn)化為矩陣形式并展開為:
E[x]=xTATAx-2xTATb+bTb
(5)
式中:矩陣A代表著體素邊上厄米特點(diǎn)的法線ni;向量b的第i個(gè)分量為nipi,求解方程最小值所得的x即是該體素的特征點(diǎn)。方程的具體解法參照文獻(xiàn)[7]。為了方便后續(xù)八叉樹的簡(jiǎn)化及多邊形表面的提取,由體素構(gòu)造出的QEF及其計(jì)算結(jié)果被單獨(dú)封裝在QEF類中,存儲(chǔ)于事先分配好的存儲(chǔ)空間中并由原子計(jì)數(shù)器為其分配索引值。構(gòu)建完成后,在八叉樹節(jié)點(diǎn)中記錄其QEF的索引值以建立對(duì)應(yīng)關(guān)系。所有葉節(jié)點(diǎn)的特征點(diǎn)計(jì)算完成后,對(duì)八叉樹進(jìn)行簡(jiǎn)化。
2.3.4八叉樹的化簡(jiǎn)與重構(gòu)表面的提取
對(duì)八叉樹進(jìn)行化簡(jiǎn)的目標(biāo)是使用更少的三角形來(lái)表示重構(gòu)表面的平緩區(qū)域,在保持圖形特征不改變的前提下減少渲染三角形的總量,以降低圖形設(shè)備的負(fù)擔(dān)。首先將同屬于一父節(jié)點(diǎn)的8個(gè)葉節(jié)點(diǎn)的QEF中各項(xiàng)相加,若計(jì)算相加所得QEF解得的誤差值小于一給定閾值,則可以對(duì)這些葉節(jié)點(diǎn)進(jìn)行化簡(jiǎn)?;?jiǎn)后將葉節(jié)點(diǎn)的特征點(diǎn)修改為父節(jié)點(diǎn)的特征點(diǎn),并將父節(jié)點(diǎn)標(biāo)記為偽葉子節(jié)點(diǎn),如此往復(fù)由底向上逐層進(jìn)行化簡(jiǎn)。
化簡(jiǎn)完成后遍歷八叉樹的每個(gè)葉節(jié)點(diǎn),對(duì)其進(jìn)行表面提取。將每個(gè)葉節(jié)點(diǎn)的特征點(diǎn)提取到數(shù)組中,使用原子計(jì)數(shù)器為其分配索引值。最后根據(jù)葉節(jié)點(diǎn)之間的拓?fù)潢P(guān)系設(shè)置索引,完成多邊形表面的提取。
數(shù)控仿真系統(tǒng)軟件使用C++編寫CPU端程序,使用OpenCL編寫GPU端程序,使用OpenGL進(jìn)行圖形渲染,運(yùn)行硬件環(huán)境為Intel Core i7-3770 四核CPU,12 GB內(nèi)存,2 GB顯存的NVIDIA GeForce GTX 660 Ti顯卡。
仿真實(shí)驗(yàn)1測(cè)試不同建模方法的仿真效果,如圖8所示,其中:(a)、(c)為使用單向Dexel建模方法,(b)、(d)為使用三向Dexel建模方法??梢钥闯?,應(yīng)用三向Dexel建模方法后消除了使用單向Dexel建模方法時(shí)的階梯化問(wèn)題。
圖8 不同建模方法的仿真效果對(duì)比
仿真實(shí)驗(yàn)2為雙輪廓法對(duì)特征修復(fù)的驗(yàn)證,圖9、圖10分別為該方法對(duì)雕像模型和葉輪模型丟失特征的修復(fù)效果。圖9(a)、圖10(a)為使用三向四面柱(Tri-Quadpillars,簡(jiǎn)稱TQ,將文獻(xiàn)[9]中的算法擴(kuò)展到三維得到)算法進(jìn)行表面重構(gòu)得到的結(jié)果圖;圖9(b)、圖10(b)為使用雙輪廓法進(jìn)行表面重構(gòu)得到的結(jié)果圖??梢钥闯?,使用雙輪廓法后,由特征丟失導(dǎo)致的毛刺、鋸齒問(wèn)題得到了修復(fù),同時(shí)能夠更好地保存尖銳棱角等信息。
圖9 雙輪廓法對(duì)雕像模型丟失特征的修復(fù)效果
圖10 雙輪廓法對(duì)葉輪模型丟失特征的修復(fù)效果
仿真實(shí)驗(yàn)3測(cè)試仿真方法加速前后的運(yùn)行效率。表1為仿真實(shí)驗(yàn)3中所使用的實(shí)驗(yàn)對(duì)象,實(shí)驗(yàn)共使用兩組數(shù)控加工程序:第1組為雕像的加工,第2組為葉輪的加工。
表1 仿真所用實(shí)驗(yàn)對(duì)象
表2所示為多線程加速前后表面重構(gòu)的平均時(shí)間??梢钥闯?,多線程加速比單線程雙輪廓法表面重構(gòu)快232%~289%。由于雙輪廓算法中八叉樹構(gòu)建所耗費(fèi)的時(shí)間在算法總耗時(shí)中占比最大,且該部分并行化程度較高,多線程加速能夠獲得較高的加速比,但由于雙輪廓算法本身時(shí)間開銷較大,僅在CPU端進(jìn)行加速仍然難以滿足實(shí)時(shí)仿真的要求。
表2 多線程加速前后表面重構(gòu)平均時(shí)間
表3展示了GPU加速前后表面重構(gòu)平均時(shí)間。可以看出GPU加速比CPU下多線程加速雙輪廓法表面重構(gòu)快5~15倍。完全在GPU端進(jìn)行的雙輪廓算法在重構(gòu)對(duì)象分辨率升高時(shí),因網(wǎng)格數(shù)據(jù)與厄米特?cái)?shù)據(jù)的增大而增加了GPU的讀寫壓力,造成了加速比的下降,但仍然能滿足實(shí)時(shí)仿真的要求。
表3 GPU加速前后表面重構(gòu)平均時(shí)間
本文實(shí)現(xiàn)了一種并行化的基于三向Dexel的數(shù)控仿真方法。采用三向Dexel建模方法提升仿真的精度,使用雙輪廓法來(lái)獲取更加真實(shí)的重構(gòu)表面。該方法的創(chuàng)新之處在于其通過(guò)雙輪廓算法修復(fù)因表面特征丟失造成的毛刺、鋸齒問(wèn)題,并通過(guò)將多線程加速、GPU加速與雙輪廓算法結(jié)合起來(lái),使得表面重構(gòu)的速度相對(duì)于多線程的實(shí)現(xiàn)提升了5~15倍,能夠在滿足仿真實(shí)時(shí)性要求的前提下,修復(fù)由于三向Dexel模型采樣問(wèn)題造成的特征丟失,從而提高仿真的真實(shí)度。