羅年猛,黃如金,朱 林
(華中科技大學(xué)國(guó)家CAD支撐軟件工程技術(shù)研究中心,湖北 武漢430074)
隨著企業(yè)信息化應(yīng)用的不斷深入,人們需要在文字工程數(shù)據(jù)中增加圖形符號(hào)。這些工程數(shù)據(jù)有以下特點(diǎn):(1)文字和圖形混排形成一個(gè)整體,不能分開存儲(chǔ),如圖1中工序內(nèi)容里的粗糙度符號(hào);(2)工程數(shù)據(jù)可能含有多個(gè)屬性值,如圖1中工序內(nèi)容含有藍(lán)色和紅色的文字。(3)多段文字組合表達(dá)工程語(yǔ)義,如圖1中工序內(nèi)容里的尺寸公差。
Figure 1 Content of process圖1 工序內(nèi)容
目前,在圖形和文字混合的工程數(shù)據(jù)中,圖形主要通過(guò)圖片或轉(zhuǎn)義字符轉(zhuǎn)換成文本數(shù)據(jù)兩種方式來(lái)存儲(chǔ)與表達(dá)。圖片的存儲(chǔ)表達(dá)方式,不便于修改圖形及相關(guān)屬性。通過(guò)轉(zhuǎn)義字符轉(zhuǎn)換成文本數(shù)據(jù)的存儲(chǔ)表達(dá)形式,也存在以下不足:(1)當(dāng)圖形類型增多時(shí),轉(zhuǎn)義字符增多,不便于表達(dá)管理;(2)復(fù)雜的自定義圖形很難用轉(zhuǎn)義符來(lái)表達(dá);(3)因轉(zhuǎn)義被隱藏的圖形很難修改其屬性;(4)圖形通過(guò)轉(zhuǎn)義字符表達(dá),缺少必要的工程語(yǔ)義信息,不利于工程數(shù)據(jù)的快速提取。例如,AutoCAD中尺寸公差用“^”、“/”等轉(zhuǎn)義符將上下偏差堆疊在一起;而形位公差卻采用“%%v”等轉(zhuǎn)義符分開形位符號(hào)和基準(zhǔn)等[1]。
因此,為解決以上問(wèn)題,本文針對(duì)含有圖形和文字的工程數(shù)據(jù)特點(diǎn),提出了一種基于XML的工程語(yǔ)義表達(dá)模型,并給出了表達(dá)模型的實(shí)現(xiàn)框架。它既不僅能表達(dá)各種自定義的圖形,還能與其他文本信息統(tǒng)一集成,給工程數(shù)據(jù)的顯示以及工程語(yǔ)義的提取帶來(lái)了方便,為基于工程語(yǔ)義搜索[2]創(chuàng)造了條件。
我們先來(lái)分析圖1中的工程數(shù)據(jù),它包含圖形工程數(shù)據(jù),而且也包含文本信息。首先將其根據(jù)工程語(yǔ)義進(jìn)行拆分,然后根據(jù)文字和圖形各自的屬性進(jìn)行拆分,拆分后如圖2所示。
Figure 2 Analysis of engineering data圖2 工程數(shù)據(jù)分析
工程數(shù)據(jù)根據(jù)其表達(dá)最終可由文字、直線、圓和曲線等基本元素構(gòu)成。這些基本元素好比語(yǔ)言學(xué)的漢字或者單詞,若干文字、直線、圓和曲線等基本元素組合在一起,在一定的工程背景下能共同表達(dá)有意義的語(yǔ)義。為實(shí)現(xiàn)工程數(shù)據(jù)(特別是圖形和文字混合的工程數(shù)據(jù))能基于獨(dú)立的工程語(yǔ)義表達(dá)模型存儲(chǔ),為下一步研究基于工程語(yǔ)義的檢索技術(shù)[3],實(shí)現(xiàn)知識(shí)推理打下基礎(chǔ),在此,引入語(yǔ)義元、工程語(yǔ)義和最小工程語(yǔ)義等概念來(lái)表達(dá)工程數(shù)據(jù)。相關(guān)概念的定義和介紹如下。
定義1 語(yǔ)義元SE(Semantic Entity)指用于表達(dá)工程數(shù)據(jù)的最基本的元素,如文字、直線、圓、弧、B樣條曲線和坐標(biāo)等。
語(yǔ)義元可分為文字和圖形等。每類語(yǔ)義元都有屬于自己的屬性。比如,文字語(yǔ)義元有字體名稱、字體大小、粗體、斜體、字符集和文字顏色等屬性,圖形類語(yǔ)義元,如直線,有線型名稱、線型寬度和線型顏色等屬性。每類語(yǔ)義元的屬性部分是該類特有的,部分屬性是相同的,比如語(yǔ)義元的顏色。
語(yǔ)義元只有在一定的工程背景下才能表達(dá)有意義的語(yǔ)義。如圖2中的“13.5”、“0”和“-0.1”按照一定格式組合在一起才能表達(dá)尺寸公差,否則只是基本文字元素。
定義2 工程語(yǔ)義ES(Engineering Semantics)指在一定工程背景下,若干語(yǔ)義元所表達(dá)的有意義的語(yǔ)義。
工程語(yǔ)義還可拆分成若干更小的工程語(yǔ)義和其它若干語(yǔ)義元組成,而更小的工程語(yǔ)義具有表達(dá)相互獨(dú)立、語(yǔ)義間具有上下文聯(lián)系的特點(diǎn)。好比文章的句子可以由很多詞組和剩下的字組成。
如圖2中“工序內(nèi)容”這一工程語(yǔ)義由“尺寸公差”、“粗糙度”和若干文字語(yǔ)義元共同表達(dá)。
定義3 最小工程語(yǔ)義MES(Minimum Engineering Semantics)指那些表達(dá)格式標(biāo)準(zhǔn)固定,不能拆分成更小的工程語(yǔ)義,只能拆分成語(yǔ)義元的工程語(yǔ)義,好比語(yǔ)言學(xué)的詞組或者短語(yǔ)。
如圖2中的尺寸公差、粗糙度等都是最小工程語(yǔ)義,因再對(duì)其拆分,只能得到文字語(yǔ)義元或直線語(yǔ)義元。
所以根據(jù)工程數(shù)據(jù)的表達(dá),工程數(shù)據(jù)由若干表達(dá)相互獨(dú)立且具有上下文聯(lián)系的有意義的工程語(yǔ)義組成,如圖3所示。
為了滿足企業(yè)信息化的應(yīng)用需求,以便表達(dá)和提取文字和圖形混合的工程數(shù)據(jù),工程數(shù)據(jù)應(yīng)包含管理屬性數(shù)據(jù)、文字屬性數(shù)據(jù)、圖形屬性數(shù)據(jù)、拓展屬性數(shù)據(jù)和工程數(shù)據(jù)內(nèi)容等。為了方便分析,我們首先對(duì)最小工程語(yǔ)義(MES)進(jìn)行建模[4,5]。
最小工程語(yǔ)義的模型定義為:MES=〈MDS,PDS,CDS〉,其中,
(1)MDS(Management Data Set)是 MES的管理屬性的數(shù)據(jù)集合,包含工程語(yǔ)義的名稱、唯一標(biāo)識(shí)符、上級(jí)工程語(yǔ)義的名稱、上級(jí)工程語(yǔ)義的唯一標(biāo)識(shí)符、文件的全路徑和版本號(hào)等管理屬性。
(2)PDS(Property Data Set)是確定 MES外觀的數(shù)據(jù)集合,PDS=〈SDS,TDS,GDS,EDS〉。
Figure 3 Classification of engineering data圖3 工程數(shù)據(jù)分類
①SDS(Space Data Set)是確定 MES的空間位置的屬性數(shù)據(jù)集合,包含空間區(qū)域中左下角坐標(biāo)、空間區(qū)域的右上角坐標(biāo)、空間分布的對(duì)齊方式、首行縮進(jìn)、左縮進(jìn)、右縮進(jìn)和對(duì)正方式、欄寬度、行間距和段落間距等屬性數(shù)據(jù)。坐標(biāo)可以是絕對(duì)坐標(biāo)系或者相對(duì)坐標(biāo)系的值。若為絕對(duì)坐標(biāo)系的值,則空間位置不變,若為相對(duì)坐標(biāo)系的值,空間位置由工程語(yǔ)義確定。
②TDS(Text Data Set)是確定MES的文字外觀的屬性集合,包含字體名稱、字體高度、字體顏色、粗體、斜體、上劃線、下劃線、字符集、追蹤、寬度因子等跟文字有關(guān)的屬性。
③GDS(Graphic Data Set)是確定 MES的圖形外觀的屬性集合,含有線型、線寬、顏色和圖層等跟圖形有關(guān)的屬性。
④EDS(Expand Data Set)是 MES的拓展屬性數(shù)據(jù)集合,含有環(huán)境、光亮度、加亮、反射和透明度等跟渲染有關(guān)的屬性和工程材料、質(zhì)量、質(zhì)量單位、慣性、慣性單位、體積、體積單位、表面積和表面積單位等跟力學(xué)分析有關(guān)的屬性等等。
(3)CDS(Content Data Set)是確定 MES內(nèi)容的語(yǔ)義元數(shù)據(jù)集合,含有文字、直線、圓、弧和B樣條曲線等語(yǔ)義元。語(yǔ)義元都是參數(shù)化表達(dá),由語(yǔ)義元名稱、定義外觀的PDS和定義形狀的基本參數(shù)序列表達(dá)。
①語(yǔ)義元的PDS與工程語(yǔ)義的PDS具有繼承性。比如語(yǔ)義有一顏色屬性為“紅色”,那么語(yǔ)義元的默認(rèn)顏色為“紅色”,若語(yǔ)義元想顯示為“綠色”,只需將語(yǔ)義元的PDS顏色屬性定為“綠色”。這樣可保證個(gè)別語(yǔ)義元PDS屬性的差異性。
②基本參數(shù)序列間采用“;”隔開。比如文字只需“左下角坐標(biāo)”和“文字內(nèi)容”兩個(gè)參數(shù),則可只定義其位置和形狀,兩個(gè)參數(shù)用分號(hào)隔開為“左下角坐標(biāo);文字內(nèi)容”。
由于MES是表現(xiàn)格式,是標(biāo)準(zhǔn)的,所以為了能夠進(jìn)一步簡(jiǎn)化數(shù)據(jù)量,MES內(nèi)容的確定也可由一系列的參數(shù)確定。比如表面粗糙度,可以由粗糙度類型及相關(guān)標(biāo)準(zhǔn)參數(shù)等參數(shù)序列確定。
在定義了MES表達(dá)模型之后,我們很容易得到工程數(shù)據(jù)中工程語(yǔ)義表達(dá)模型。
工程語(yǔ)義模型定義:ES=〈MESDS〉,其中,
(1)ES(Engineering Semantics)是工程語(yǔ)義;
(2)MESDS(Minimum Engineering Semantics Data Set)是最小工程語(yǔ)義組合而成的具有工程語(yǔ)義的數(shù)據(jù)集合,MESDS= {MES1,MES2,…,MESn};
因此,工程數(shù)據(jù)的分類可如圖3所示。
XML作為數(shù)據(jù)描述工具,不僅能夠完整清晰地表達(dá)產(chǎn)品結(jié)構(gòu)和信息內(nèi)容,還具有開放性、擴(kuò)展性、自描述性和異構(gòu)性等特點(diǎn),能實(shí)現(xiàn)網(wǎng)絡(luò)環(huán)境下的工程數(shù)據(jù)的集成和共享。所以,工程語(yǔ)義的表達(dá)模型通過(guò)XML語(yǔ)言來(lái)表達(dá)實(shí)現(xiàn),建立模型到XML的映射關(guān)系[6,7]。
為了更好地利用瀏覽器、產(chǎn)品生命周期管理PLM(Product Lifecycle Management)軟件等對(duì)XML工程數(shù)據(jù)提供支持,需要建立XML的文檔結(jié)構(gòu)規(guī)范。XML Schema采用XML語(yǔ)法,比DTD(Document Type Definition)具有更強(qiáng)的描述能力、擴(kuò)展能力和處理維護(hù)能力。所以,采用XML Schema語(yǔ)言分別對(duì)數(shù)據(jù)類型、工程語(yǔ)義的屬性、語(yǔ)義元和工程語(yǔ)義內(nèi)容數(shù)據(jù)集合等建立XML Schema庫(kù)。
數(shù)據(jù)類型、工程語(yǔ)義的屬性和語(yǔ)義元采用XML Schema的simple Type和complex Type元素進(jìn)行定義,這樣可用Type屬性重復(fù)引用這些類型[8]。下面以工程語(yǔ)義內(nèi)容數(shù)據(jù)集合的XML Schema規(guī)范為例說(shuō)明,如圖4所示。
Figure 4 XML schema specification of engineering semantics圖4 工程語(yǔ)義XML Schema規(guī)范
工程語(yǔ)義表達(dá)模型的實(shí)現(xiàn)框架包括文字?jǐn)?shù)據(jù)和圖形數(shù)據(jù)的輸入/修改/查詢界面、工程數(shù)據(jù)顯示界面、編譯器(XML接口組件和XML Schema規(guī)范)和數(shù)據(jù)庫(kù)四部分,如圖5所示。
Figure 5 Model framework圖5 模型實(shí)現(xiàn)框架
輸入/修改/查詢界面方便用戶按照模型的格式輸入、修改和查詢相關(guān)的工程數(shù)據(jù),同時(shí)能根據(jù)事件響應(yīng)XML接口組件;顯示界面接收XML接口組件傳送過(guò)來(lái)的數(shù)據(jù),直觀顯示工程數(shù)據(jù);編譯器主要由XML接口組件和XML Schema庫(kù)組成,XML接口組件包括工程數(shù)據(jù)接收、判斷、修改、排版計(jì)算、查詢、存儲(chǔ)和輸出等接口,XML Schema庫(kù)為工程數(shù)據(jù)格式的判斷標(biāo)準(zhǔn);數(shù)據(jù)庫(kù)存儲(chǔ)的工程數(shù)據(jù)是基于表達(dá)模型建立的,有利于PLM的集成和共享。中,并取得了很好的效果。下面以天喻CAPP工藝卡片的應(yīng)用為例進(jìn)行說(shuō)明。要在CAPP工藝卡片中顯示如圖1所示的工程數(shù)據(jù),需要打開如圖6所示的二維表文字輸入界面,此界面是一個(gè)所見即所得的界面,可以直接輸入文字和特殊圖形,可以直接修改輸入的文字的屬性,如字型、大小和顏色等。而想輸入特殊圖形需要打開相應(yīng)的圖形輸入界面,如圖7的尺寸公差輸入界面和圖8的粗糙度輸入界面。保存文字和圖形混合的工程數(shù)據(jù)時(shí),還需要經(jīng)過(guò)編譯器按照表達(dá)模型規(guī)則編譯后,才能夠保存到數(shù)據(jù)庫(kù)中。圖9為工程數(shù)據(jù)內(nèi)容經(jīng)編譯器解析后的XML數(shù)據(jù),它將被存儲(chǔ)到數(shù)據(jù)庫(kù)中,以便PLM集成管理。
Figure 6 Text input interface of two-dimensional table圖6 二維表文字輸入界面
該表達(dá)模型已應(yīng)用到天喻CAD和天喻CAPP
Figure 7 Input interface of dimensional tolerances圖7 尺寸公差輸入界面
Figure 8 Input interface of roughness symbol圖8 粗糙度符號(hào)輸入界面
Figure 9 XML data圖9 XML數(shù)據(jù)
本文在分析含有圖形和文字的工程數(shù)據(jù)的特點(diǎn)后,提出了一種基于XML的工程語(yǔ)義表達(dá)模型,并給出了表達(dá)模型的實(shí)現(xiàn)框架,它不僅能表達(dá)各種自定義的圖形工程數(shù)據(jù),而且還能與其他文本信息統(tǒng)一集成表達(dá)。該表達(dá)模型應(yīng)用在CAD和CAPP等軟件中,取得了很好的效果,為進(jìn)一步研究解析后的XML工程數(shù)據(jù)的查詢檢索方法,實(shí)現(xiàn)知識(shí)推理做好了鋪墊。
[1] Cheng Jing.AutoCAD engineering drawings and secondary development of technology[M].1st edition.Beijing:National Defense Industry Press,2008.(in Chinese)
[2] Przybylinski S.CAD and analysis:Who’s on first?[C]∥Proc of PLM Market &Industry Forum,2012:1.
[3] Gong Jiao-teng.The status,bottlenecks and trends analysis of network information retrieval technology[J].Journal of Information,2004,23(5):75-77.(in Chinese)
[4] Dong Min-qin,Zhu Lin.CAPP card modeling in graphic environment[J].Mechanical Engineer,2006(10):49-51.(in Chinese)
[5] Chen Lei,Pan Xiang,Ye Xiu-zi,et al.Ontology-based product knowledge representation and retrieval[J].Journal of Zhejiang University(Engineering Science),2008,42(12):2037-2042.(in Chinese)
[6] Pan Shun,Jin Yuan-ping,Ouyang Ye.Semantic mapping from structured data to XML data[J].Journal of Southeast University(Natural Science Edition),2002,32(3):1-4.(in Chi-nese)
[7] Chen Wan-ling,Chen Zhuo-ning,Bin Hong-zan,et al.The expression of process planning information and its application based on XML[J].Journal of Huazhong University of Science and Technology(Nature Science Edition),2006,34(3):46-49.(in Chinese)
[8] Hunter D,Rafter J,F(xiàn)awcett J,et al.Beginning XML[M].4th edition.Wu Wen-guo,translation.Beijing:Tsinghua U-niversity Press,2009.(in Chinese)
附中文參考文獻(xiàn):
[1] 程靜.AutoCAD工程繪圖及二次開發(fā)技術(shù)[M].第1版.北京:國(guó)防工業(yè)出版社,2008.
[3] 龔蛟騰.網(wǎng)絡(luò)信息檢索技術(shù)現(xiàn)狀、瓶頸及趨勢(shì)分析[J].情報(bào)雜志,2004,23(5):75-77.
[4] 董敏欽,朱林.基于圖形環(huán)境的工藝卡片建模研究[J].機(jī)械工程師,2006(10):49-51.
[5] 陳磊,潘翔,葉修梓,等.基于本體的產(chǎn)品知識(shí)表達(dá)和檢索技術(shù)研究[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2008,42(12):2037-2042.
[6] 潘順,金遠(yuǎn)平,歐陽(yáng)曄.結(jié)構(gòu)化數(shù)據(jù)到XML數(shù)據(jù)的語(yǔ)義映射[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,32(3):1-4.
[7] 陳萬(wàn)領(lǐng),陳卓寧,賓鴻贊,等.基于XML的工藝信息表達(dá)方法研究與實(shí)踐[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,34(3):46-49.
[8] 亨特,拉夫特,福思特,等.XML入門經(jīng)典[M].第4版.吳文國(guó)譯.北京:清華大學(xué)出版社,2009.