国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向云計(jì)算的制造業(yè)設(shè)計(jì)服務(wù)資源集聚方案設(shè)計(jì)

2015-03-15 08:39:00
新技術(shù)新工藝 2015年2期
關(guān)鍵詞:數(shù)據(jù)存儲(chǔ)

黨 杰

(西安醫(yī)學(xué)院,陜西 西安 710021)

面向云計(jì)算的制造業(yè)設(shè)計(jì)服務(wù)資源集聚方案設(shè)計(jì)

黨杰

(西安醫(yī)學(xué)院,陜西 西安 710021)

摘要:通過(guò)分析研究,構(gòu)建了數(shù)據(jù)來(lái)源層、數(shù)據(jù)存儲(chǔ)層與數(shù)據(jù)匹配層三層模式,通過(guò)網(wǎng)頁(yè)分類算法、海量數(shù)據(jù)存儲(chǔ)算法和語(yǔ)義匹配算法等實(shí)現(xiàn)對(duì)設(shè)計(jì)服務(wù)信息的搜集、處理和分析,大大提高了制造服務(wù)類企業(yè)的設(shè)計(jì)效率。

關(guān)鍵詞:資源集聚;網(wǎng)頁(yè)分類;數(shù)據(jù)存儲(chǔ);語(yǔ)義匹配

1設(shè)計(jì)服務(wù)資源及資源集聚方案的提出

設(shè)計(jì)資源是指在對(duì)產(chǎn)品的設(shè)計(jì)開(kāi)發(fā)中,通過(guò)設(shè)計(jì)工具、設(shè)計(jì)場(chǎng)地、設(shè)計(jì)物資、設(shè)計(jì)人員、信息資源和服務(wù)資源等組成的一切可用實(shí)體,如設(shè)計(jì)工具中所包括的CAE、有限元分析軟件、CAPP等;設(shè)計(jì)人員中包括的設(shè)計(jì)專家、技術(shù)專家、管理專家等;信息資源中包括的設(shè)計(jì)標(biāo)準(zhǔn)、專利、數(shù)據(jù)庫(kù)、3D 模型等,都被納入到設(shè)計(jì)服務(wù)資源中。針對(duì)大量的設(shè)計(jì)服務(wù)資源,如何將海量的信息進(jìn)行集聚,再通過(guò)云計(jì)算平臺(tái)進(jìn)行存儲(chǔ),最后通過(guò)云計(jì)算平臺(tái)定向地發(fā)送給設(shè)計(jì)資源的需求者,成為該方案設(shè)計(jì)的重點(diǎn)。通過(guò)采用服務(wù)資源智能匹配的方法對(duì)雙方的需求和服務(wù)進(jìn)行自動(dòng)的匹配,并向該平臺(tái)的提供商給予相應(yīng)的服務(wù)費(fèi)用。

2服務(wù)智能集聚算法

大量的設(shè)計(jì)服務(wù)資源存在于互聯(lián)網(wǎng)當(dāng)中,對(duì)設(shè)計(jì)服務(wù)本體的構(gòu)建需要大量的實(shí)例、關(guān)系描述、定義描述等。通過(guò)采用自動(dòng)和半自動(dòng)的方式對(duì)服務(wù)本體進(jìn)行構(gòu)建,可大量減少人工分類帶來(lái)的問(wèn)題,對(duì)此,本文針對(duì)服務(wù)本體的構(gòu)建,提出智能聚集方法,并以數(shù)據(jù)來(lái)源中半結(jié)構(gòu)化數(shù)據(jù)為例,實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)信息的自動(dòng)的獲取。其具體的步驟為:首先,對(duì)互聯(lián)網(wǎng)中存在的設(shè)計(jì)服務(wù)資源進(jìn)行搜集和初步分類,從而得到關(guān)于設(shè)計(jì)服務(wù)信息的網(wǎng)頁(yè),包含XML、RDF等格式在內(nèi)的各種數(shù)據(jù)網(wǎng)頁(yè)信息;其次,對(duì)搜集到的數(shù)據(jù)進(jìn)行關(guān)系和概念的抽取,并映射成各種不同的服務(wù)本體,與知識(shí)專家?guī)熘械姆?wù)本體比較。

2.1網(wǎng)頁(yè)分塊

網(wǎng)頁(yè)結(jié)構(gòu)可分為不同的模塊,每個(gè)模塊都可用一個(gè)特定的Dom樹(shù)對(duì)其進(jìn)行表示,也可以看成是特定的API。通過(guò)不同的樹(shù)節(jié)點(diǎn)所構(gòu)成的根節(jié)點(diǎn),由此形成了主網(wǎng)頁(yè)。每個(gè)節(jié)點(diǎn) node 則為一個(gè)塊,用 DomNode 表示網(wǎng)頁(yè)節(jié)點(diǎn)。具體包括對(duì)其中的節(jié)點(diǎn)進(jìn)行判斷,查看其是否為容器類節(jié)點(diǎn),如為容器類節(jié)點(diǎn)則繼續(xù)追蹤,則探測(cè)其是否為文本類數(shù)據(jù),當(dāng)探測(cè)該節(jié)點(diǎn)為文本數(shù)據(jù)時(shí),對(duì)該文本塊的父節(jié)點(diǎn)塊進(jìn)行記錄,并探測(cè)下一個(gè)含有文本數(shù)據(jù)的區(qū)域。清理指定節(jié)點(diǎn)內(nèi)的無(wú)效節(jié)點(diǎn)并查看該節(jié)點(diǎn)是否有效的核心代碼為:

protected boolean cleanUpDomNode(DomNode element) {

if(element==null){

returnfalse;

}

Listlist=element.getChildNodes();

intlinkTextLength=0;

booleanflag=false;

if(list!=null){

for (DomNode node : list) {

if(checkTextType(node)){

continue;

} else

if (checkRemoveType(node)) {

node.remove();

flag = true;

} else

if (node instanceof HtmlAnchor) {

String temp = node.asText();

temp = encoder.encodeHtml(temp);

intlength=Chinese.chineseLength(temp.trim());

if (length > 0) {

linkTextLength += length

2.2節(jié)點(diǎn)與表格相似度計(jì)算

2.2.1節(jié)點(diǎn)相似度計(jì)算

對(duì)節(jié)點(diǎn)相似度的計(jì)算本身就是對(duì)DomNode屬性值進(jìn)行比較。對(duì)DomNode屬性的描述則包括node.properties(bgcolour,font,width,height)(節(jié)點(diǎn)屬性) 、node.tagname (標(biāo)簽名稱)、 node.text (標(biāo)簽內(nèi)容)、 Node.depth( 標(biāo)簽深度)。因此,根節(jié)點(diǎn)的相似度有下述關(guān)系:

(1)

式中,sim(n1,n2)是n1、n2兩者之間的相似度,即這兩者之間在屬性加權(quán)和內(nèi)容方面的相似度,n1和n2為非根節(jié)點(diǎn);w1是該標(biāo)簽在整個(gè)網(wǎng)頁(yè)當(dāng)中的權(quán)重系數(shù)。

因此,可以得到n1和n2所對(duì)應(yīng)的子節(jié)點(diǎn)的相似度的計(jì)算公式:

sim(T1,T2)=max(sim(n1,n2)+w2sim(parent(n1),parent(n2))

(2)

式中,T1、T2分別是n1和n2所對(duì)應(yīng)的子節(jié)點(diǎn),n1和n2的標(biāo)簽名和深度是相同的;parent(n1)是n1最終的父節(jié)點(diǎn);w2是節(jié)點(diǎn)受到結(jié)構(gòu)影響的權(quán)重系數(shù)。

2.2.2表格相似度計(jì)算

表格節(jié)點(diǎn)的相似度的計(jì)算則采用二維矩陣的方式,并分別用Rowi、Coli表示該矩陣的行向量和列向量,則有表格的二維矩陣:

(3)

由此可計(jì)算得出其行和列的相似度,分別為:

(4)

(5)

當(dāng)sim(Colk,Colk+1)=1時(shí),表示該列內(nèi)容相同;同理,當(dāng)sim(Rowk,Rowk+1)=1時(shí),表示該行中的內(nèi)容相同。

2.2.3概念和關(guān)系的提取

在完成上述的相似度之后,當(dāng)表格的行和列的相似度都大于某個(gè)設(shè)定的值后,則認(rèn)為兩表格具有相似度,對(duì)此,接下來(lái)則是對(duì)其中內(nèi)容和關(guān)系提取。

1)在設(shè)計(jì)中,對(duì)產(chǎn)品的屬性通常是被排列在表頭,其屬性值的不同,則通常表示其不同的網(wǎng)頁(yè)內(nèi)容。因此,要實(shí)現(xiàn)對(duì)概念的提取,需對(duì)該網(wǎng)頁(yè)中的前d行的相似度進(jìn)行計(jì)算,如果其行相似度<平均相似度,則直接轉(zhuǎn)向第3步。

2)若行相似度>行平均相似度,并且在d+1行中都為文本的內(nèi)容,則定義d=d+1,重復(fù)對(duì)步驟1進(jìn)行搜索,當(dāng)時(shí)d=m-1,則認(rèn)定該表格當(dāng)中其包含著一個(gè)實(shí)例,由此轉(zhuǎn)向第3步。

3)提取前d行當(dāng)中單元格的內(nèi)容,并對(duì)單元格當(dāng)中存在的重復(fù)的部分或者是常用的工程單位符號(hào)刪除,以此得到該產(chǎn)品的術(shù)語(yǔ)概念的集合。

上述步驟的開(kāi)展都是結(jié)合其不同關(guān)系的前提下進(jìn)行的。若B、A為相同概念,則定義B和A為同義概念;若B、A為層次關(guān)系,則定義B為父概念,A為子概念。

2.2.4語(yǔ)義的比較與表達(dá)

通過(guò)對(duì)關(guān)系的提取,需要對(duì)所提取的內(nèi)容進(jìn)行比較和語(yǔ)義的表達(dá)。其中的比較則與系統(tǒng)中的知識(shí)庫(kù)進(jìn)行比較,從而判斷其是否屬于該類型,并通過(guò)一定的語(yǔ)義將其表達(dá)出來(lái)。因此,需要對(duì)其中的規(guī)則進(jìn)行定義。

定義規(guī)則1:表格當(dāng)中的數(shù)據(jù)所描述的相關(guān)的設(shè)計(jì)資源映射到設(shè)計(jì)資源領(lǐng)域本體描述中的類。

定義規(guī)則2:概念映射為該類的屬性,并對(duì)應(yīng)到相應(yīng)的OWL描述語(yǔ)言之中。

定義規(guī)則3:表格當(dāng)中的約束映射主要為本體中的約束關(guān)系,在方法當(dāng)中對(duì)約束關(guān)系的提取則對(duì)應(yīng)著相應(yīng)的Datate property 的值域 f:range。

定義規(guī)則 4:概念間的關(guān)系與本體關(guān)系通過(guò) partof進(jìn)行表達(dá)。

2.3實(shí)例驗(yàn)證

以發(fā)動(dòng)機(jī)的詳細(xì)數(shù)據(jù)為例,通過(guò)在搜狐網(wǎng)和鳳凰網(wǎng)上兩類不同汽車(chē)的發(fā)動(dòng)機(jī)參數(shù)表格的數(shù)據(jù)的抽取,得到如表1和表2所示的數(shù)據(jù)。

表1 搜狐網(wǎng)汽車(chē)發(fā)動(dòng)機(jī)數(shù)據(jù)

表2 鳳凰網(wǎng)汽車(chē)發(fā)動(dòng)機(jī)數(shù)據(jù)

由此,通過(guò)上述算法的抽取,可以得出發(fā)動(dòng)機(jī)本體的形成過(guò)程,在該實(shí)例中包括發(fā)動(dòng)機(jī)排量、最大馬力、最大功率和最大扭矩等。

3海量數(shù)據(jù)存儲(chǔ)方案

云計(jì)算平臺(tái)下的數(shù)據(jù)集聚涉及大量數(shù)據(jù)信息,如何對(duì)海量的信息進(jìn)行處理成為該方案構(gòu)建的重點(diǎn)。當(dāng)前針對(duì)海量數(shù)據(jù)的處理有很多,如美國(guó)谷歌公司的GFS。本文結(jié)合方案的需求,將平臺(tái)數(shù)據(jù)的處理和存儲(chǔ)通過(guò)采用GFS的開(kāi)源實(shí)現(xiàn)Hadoop框架,并在這基礎(chǔ)之上借助Mapreduce模式,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)和信息的處理。同時(shí),為將相關(guān)的數(shù)據(jù)存儲(chǔ)或者是部署到具體的計(jì)算節(jié)點(diǎn)上,采用HDFS系統(tǒng)及分布式數(shù)據(jù)庫(kù)HBase,從而構(gòu)成了該方案的數(shù)據(jù)處理和存儲(chǔ),具體如圖1所示。

圖1 基于云計(jì)算平臺(tái)的設(shè)計(jì)服務(wù)集存儲(chǔ)方案

4語(yǔ)音智能匹配算法

4.1算法設(shè)計(jì)

設(shè)計(jì)服務(wù)中,如何讓客戶精確地檢索到所需要的內(nèi)容,成為該方案實(shí)現(xiàn)的關(guān)鍵。對(duì)此,本文提出智能語(yǔ)義匹配算法,具體如圖2所示。

圖2 智能語(yǔ)義匹配

1)對(duì)資源本體進(jìn)行描述。假設(shè)設(shè)計(jì)資源本體為一個(gè)多元組合的集SO={N,R,A,C,X,I,L},其中,N表示為類的集合;R表示概念關(guān)系集;A表示概念的屬性集;C表示約束集;X表示特殊集合;I表示實(shí)例或者是個(gè)體;L表示對(duì)象間邏輯關(guān)系的規(guī)定集。

2)資源向量語(yǔ)義分析。定義SV={R1,R2,…,Rn}為資源向量,其中,Ri表示第i類資源的對(duì)應(yīng)的分向量,并且其同時(shí)滿足IBoxI=N∪R∪A∪C∪X。定義P={A1,A2,…,Am}為資源描述中心向量,并且有P∈Ri,Ai則表示權(quán)重比較大的屬性。定義Q={T1,T2,…,Tm}為語(yǔ)義查詢向量,通過(guò)采用屬性的權(quán)重和分詞法對(duì)查詢的語(yǔ)句進(jìn)行分解,其中Ti的則為查詢特征向量。根據(jù)抽取算法,按照其權(quán)重的大小進(jìn)行順序排列。定義W={W1,W2,W3,…,Wm}為查詢?cè)~重要性的權(quán)重向量。

3)向量的匹配算法。

ifAi=Ti,則權(quán)重系數(shù)Ki=1。

ifTi滿足Ai,則Ki=Km<1。

ifTi包含Ai,則Ki=Kc<1。

ifTi與Ai為完全分離,則Ki=0。

4)資源候選集的獲取。對(duì)候選集的獲得采用向量距離計(jì)算公式:

(6)

通過(guò)對(duì)閥值的確定,當(dāng)計(jì)算出的向量的值在大于該閥值的情況下,則將其定義到符合的目標(biāo)查詢向量當(dāng)中。該候選查詢集用D表示。

5)最優(yōu)集的獲取。通過(guò)上述候選查詢集,以滿足質(zhì)量Q、數(shù)量N、成本C、時(shí)間T構(gòu)成得到的最優(yōu)函數(shù)找到查詢結(jié)果最優(yōu)的集合。

4.2算例實(shí)證

通過(guò)需求方的需求請(qǐng)求,如“能夠進(jìn)行發(fā)動(dòng)機(jī)仿真分析CAE,包括連桿強(qiáng)度分析、曲軸孔扭曲的分析,連桿系統(tǒng)的機(jī)構(gòu)模擬、機(jī)體模態(tài)分析,并起能提供在線使用CAE分析工具”的要求。在資源庫(kù)中,通過(guò)其對(duì)CAE性能屬性的描述、CAE本體實(shí)例庫(kù)、匹配算法以及最優(yōu)解算法,可得到其最終有這方面的功能的廠商={TW,JP}。

5結(jié)語(yǔ)

基于云計(jì)算平臺(tái)下, 通過(guò)對(duì)設(shè)計(jì)服務(wù)資源方案的設(shè)計(jì),解決了對(duì)信息的集聚、存儲(chǔ)和其中的語(yǔ)義的匹配,從而使得用戶通過(guò)搜索可到精確的設(shè)計(jì)服務(wù)資源的信息,對(duì)提高制造設(shè)計(jì)效率起到了促進(jìn)的作用,具有很大的實(shí)用性。

參考文獻(xiàn)

[1] 羅俊海,肖志輝,仲昌平.信息物理系統(tǒng)的發(fā)展趨勢(shì)分析[J].電信科學(xué),2012(2):127-132.

[2] 孫玉豹.關(guān)于某型履帶車(chē)輛制動(dòng)器的有限元分析與研究[J].新技術(shù)新工藝,2013(7):56-58.

[3] 陳東,范帥.基于Maxwell的盤(pán)式制動(dòng)器輔助電磁制動(dòng)裝置的有限元分析[J].新技術(shù)新工藝,2013(9) :32-35.

責(zé)任編輯鄭練

Manufacturing Design of Service Resource Gathering Scheme Designed for the Cloud

DANG Jie

(Xi′an Medical University, Xi′an 710021, China)

Abstract:The paper built the data source layer, data storage layer and data layer, three layer model, and through the Webpage classification algorithm, mass data storage algorithm and semantic matching algorithm, realized the collection, processing and analysis of information service, which greatly improved the design efficiency of manufacturing service enterprises.

Key words:resource gathering, page classification, data storage, semantic matching

收稿日期:2015-01-05

作者簡(jiǎn)介:黨杰(1971-),男,大學(xué)本科,工程師,主要從事信息控制及強(qiáng)弱電控制管理等方面的研究。

中圖分類號(hào):TP 391.72

文獻(xiàn)標(biāo)志碼:A

猜你喜歡
數(shù)據(jù)存儲(chǔ)
簡(jiǎn)單的數(shù)據(jù)修復(fù)
大數(shù)據(jù)時(shí)代檔案信息建設(shè)的認(rèn)識(shí)和實(shí)踐
淺談電力大數(shù)據(jù)平臺(tái)關(guān)鍵技術(shù)研究與應(yīng)用
開(kāi)源數(shù)據(jù)庫(kù)數(shù)據(jù)存儲(chǔ)的實(shí)現(xiàn)路徑分析
基于Android開(kāi)發(fā)的APP數(shù)據(jù)存儲(chǔ)研究
哈希算法在物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)中的應(yīng)用
空難事故跨媒體信息采集與檢索方法的研究
基于STM32的AD采集與SD卡數(shù)據(jù)存儲(chǔ)
淺談信息系統(tǒng)工程和POJO模型組件開(kāi)發(fā)
基于MongoDB的調(diào)查決策系統(tǒng)數(shù)據(jù)存儲(chǔ)方案設(shè)計(jì)
南溪县| 洮南市| 普格县| 西乡县| 阳新县| 濮阳县| 乌拉特中旗| 南宫市| 班戈县| 靖江市| 西充县| 张家港市| 阿坝| 云和县| 从化市| 尚义县| 长垣县| 甘肃省| 和政县| 和平区| 太仆寺旗| 勃利县| 泰兴市| 句容市| 清水河县| 葫芦岛市| 齐齐哈尔市| 蓬莱市| 石楼县| 革吉县| 松阳县| 都江堰市| 霞浦县| 金昌市| 姜堰市| 毕节市| 和顺县| 屏南县| 祁门县| 杨浦区| 上犹县|