劉清建,王太勇,王 濤,支勁章,劉振忠
(天津大學天津市先進制造技術(shù)與裝備重點實驗室,天津 300072)
嵌入式數(shù)控系統(tǒng)的結(jié)構(gòu)可靠性分析
劉清建,王太勇,王 濤,支勁章,劉振忠
(天津大學天津市先進制造技術(shù)與裝備重點實驗室,天津 300072)
當前對數(shù)控系統(tǒng)可靠性研究主要是一種滯后的可靠性研究,是對于成熟產(chǎn)品使用中出現(xiàn)的故障的研究,側(cè)重于系統(tǒng)維修方面,而很少從可靠性工程的角度來研究.為此,對處于可靠性工程早期階段的嵌入式數(shù)控系統(tǒng)的結(jié)構(gòu)可靠性進行了分析和建模,給出基于實時操作系統(tǒng)(RTOS)平臺的嵌入式數(shù)控系統(tǒng)層次化模塊結(jié)構(gòu)圖,在對數(shù)控系統(tǒng)功能和實際開發(fā)過程分析的基礎上,對傳統(tǒng)的Littlewood模型進行了改進,得到了改進的Littlewood模型,即Improved-Littlewood模型,并將模型用于一個嵌入式數(shù)控系統(tǒng)的結(jié)構(gòu)可靠性設計階段,給出了模型中各種參數(shù)矩陣的確定方法,最后得到系統(tǒng)的結(jié)構(gòu)失效密度模型和可靠度模型,驗證了方法的可行性.
數(shù)控系統(tǒng);可靠性;Littlewood模型;失效密度
在嵌入式數(shù)控系統(tǒng)的可靠性設計中,系統(tǒng)的結(jié)構(gòu)設計在整個系統(tǒng)設計的可靠性工程中占有很重要的地位.特別是在當前的系統(tǒng)設計中,由于軟件規(guī)模的龐大,為整個系統(tǒng)的開發(fā)設計一個很好的結(jié)構(gòu)對以后可靠性工程各個階段的開發(fā)和測試都非常有益.軟件結(jié)構(gòu)可靠性的研究已成為當前軟件可靠性研究的一個熱點[1-2].
當前,數(shù)控系統(tǒng)可靠性的研究主要有2個特點.
(1)對現(xiàn)有數(shù)控系統(tǒng)可靠性的研究,通過實驗數(shù)據(jù)和統(tǒng)計分析,得出數(shù)控系統(tǒng)可靠性指標的估計值,找出系統(tǒng)故障的易發(fā)模塊和可靠性的薄弱環(huán)節(jié).其不足是:①由于數(shù)控系統(tǒng)的多樣性決定實驗有其局限性,它只是粗略地把系統(tǒng)分成幾個故障模塊,偏重于系統(tǒng)維修方面的考慮[3-5];②這是一種滯后的可靠性研究,是對設計出來的成熟產(chǎn)品在實際使用過程中出現(xiàn)的故障的研究,更是對數(shù)控系統(tǒng)可靠性的評價[6].
(2)從數(shù)控系統(tǒng)的設計上來研究可靠性,當前的研究主要集中在將數(shù)控系統(tǒng)當作1個計算機系統(tǒng)來設計,特別是在數(shù)控系統(tǒng)的軟件系統(tǒng)設計上,注重軟件工程的應用、編程語言的選擇和操作系統(tǒng)的選用.其不足是:①對系統(tǒng)功能的考慮甚少,并局限于簡單的串聯(lián)、并聯(lián)和冗余結(jié)構(gòu),而缺少對結(jié)構(gòu)的深入分析[7];②很少從可靠性工程的角度來研究數(shù)控系統(tǒng)的可靠性,缺少對數(shù)控系統(tǒng)內(nèi)部不同模塊間可靠性對比的分析,從而不能有效地指導整個系統(tǒng)可靠性設計資源的分配[8-9].
基于上述分析,筆者在參考現(xiàn)有軟件結(jié)構(gòu)可靠性研究成果的基礎上,根據(jù)嵌入式數(shù)控軟件系統(tǒng)軟件的特點和系統(tǒng)實際的開發(fā)過程,設計出一個有效的系統(tǒng)結(jié)構(gòu)可靠性模型.
圖1所示為嵌入式數(shù)控軟件系統(tǒng)的層次化體系結(jié)構(gòu).整個系統(tǒng)共分為3個層次:應用層、實時操作系統(tǒng)層和驅(qū)動層[10-11].在應用層中,主要是面向數(shù)控系統(tǒng)的功能應用,規(guī)劃出若干個應用功能模塊,統(tǒng)一由實時操作系統(tǒng)進行調(diào)度,在一定的時序配合下完成數(shù)控系統(tǒng)的各種功能.處于整個嵌入式數(shù)控軟件系統(tǒng)最底層的是驅(qū)動層,驅(qū)動層的作用主要包括:①完成對硬件模塊的初始化;②對硬件進行封裝,使上層應用軟件通過調(diào)用相應的驅(qū)動程序?qū)崿F(xiàn)對底層硬件的操作和外圍設備的控制.由圖1可以看出,整個軟件系統(tǒng)的控制核心是RTOS,應用層中各個功能模塊中的任務由RTOS進行統(tǒng)一調(diào)度,驅(qū)動層中的各個功能模塊主要為應用層提供服務,受應用層中各個功能模塊的調(diào)用,進而完成整個嵌入式數(shù)控系統(tǒng)的運行.
圖1 嵌入式數(shù)控軟件系統(tǒng)的層次化結(jié)構(gòu)Fig.1 Layered structure of embedded CNC software system
Littlewood軟件系統(tǒng)結(jié)構(gòu)可靠性模型是最早提出且非常通用的軟件結(jié)構(gòu)可靠性模型.它認為整個軟件系統(tǒng)由一定數(shù)目的功能模塊組成,程序的運行其實就是按照一定的順序在不同的功能模塊間轉(zhuǎn)換和運行于不同的功能模塊上.用pij表示程序運行從模塊i轉(zhuǎn)移到模塊j的概率,運行于每個模塊上的時間服從一個概率分布Fij( t),其平均值可表示為mij.顯而易見,F(xiàn)ij( t)一般由模塊i和模塊j共同決定[12].
系統(tǒng)存在兩種可能的失效形式:①模塊本身的失效,當模塊i被執(zhí)行時,它的失效服從失效密度為iλ的泊松過程;②程序從模塊i轉(zhuǎn)換到模塊j上執(zhí)行的過程中出現(xiàn)失效,也可以稱為接口失效或調(diào)用失效,在Littlewood 模型中,認為這種失效過程也服從泊松分布,用ijv表示失效發(fā)生的密度.
用()N t表示(0,]t時間內(nèi)系統(tǒng)發(fā)生的總的故障數(shù),那么這些故障數(shù)將是各個模塊本身故障和模塊間接口故障數(shù)的總和.對于()N t的基于泊松分布的近似是在假設軟件系統(tǒng)的故障頻率很低的情況下進行的,也就是說在兩次系統(tǒng)失效之間已經(jīng)進行了很多次的程序運行轉(zhuǎn)換,因此,整個系統(tǒng)的失效密度為
式中:ia表示模塊i的運行時間占整個系統(tǒng)運行時間的比率;ijb表示程序運行從模塊i轉(zhuǎn)換到模塊j的頻率.
但有一定的不足:①式(2)、式(3)分別給出了ia和ijb的計算方法,但由于公式中的其他參數(shù)確定起來都比較困難,因此,不易得出ia和ijb的值;②模型主要還是側(cè)重于從測試的角度來研究整個系統(tǒng)的可靠性,從軟件系統(tǒng)可靠性設計工程來看,將其直接應用在軟件概要設計的結(jié)構(gòu)可靠性設計階段有一定困難,必須做出一定的改進.
3.1 基于功能分析的Littlewood模型改進方法研究
在嵌入式數(shù)控軟件系統(tǒng)的可靠性設計中,對于系統(tǒng)結(jié)構(gòu)和功能模塊的確定一般是從對整個系統(tǒng)的功能分析入手,處于不同層次的系統(tǒng)不同功能模塊組成的不同有序功能集合代表了系統(tǒng)的不同功能.
圖1中,應用層的各個功能模塊由嵌入式實時操作系統(tǒng)進行統(tǒng)一調(diào)度,而驅(qū)動層主要受應用層的調(diào)度,為應用層的各個功能模塊提供服務,一般不與實時操作系統(tǒng)產(chǎn)生直接的聯(lián)系.很顯然,處于不同層次的各個功能模塊對整個系統(tǒng)可靠性的影響有著明顯的不同.同時,應用層中各個功能模塊之間一般不發(fā)生直接調(diào)用,而是應用層的各個功能模塊在RTOS的調(diào)度下,以一定的順序運行,如圖2所示.當系統(tǒng)執(zhí)行1個功能時,控制數(shù)據(jù)流不斷地在不同的應用層模塊AP與RTOS之間流動,在整個功能的運行中,驅(qū)動層模塊DP好比軟件系統(tǒng)的執(zhí)行器,受到AP模塊的調(diào)度,然而在應用層內(nèi)部和驅(qū)動層內(nèi)部則不發(fā)生模塊間的直接調(diào)用.
圖2 嵌入式數(shù)控軟件系統(tǒng)的功能實現(xiàn)示意Fig.2 Function implementation schematic diagram of embedded CNC software system
由上述分析可知,嵌入式數(shù)控系統(tǒng)的運行有著很強的規(guī)律性,在實際系統(tǒng)中模塊之間存在著調(diào)用關(guān)系的數(shù)量是有限和不復雜的.基于此,以系統(tǒng)的功能應用為出發(fā)點,對Littlewood軟件系統(tǒng)結(jié)構(gòu)可靠性模型進行更實用的改進,從系統(tǒng)功能的角度來研究整個軟件系統(tǒng)的結(jié)構(gòu)可靠性模型,可以得到整個軟件系統(tǒng)的失效密度模型為
式中:λsys為系統(tǒng)的失效密度;λfuni為系統(tǒng)運行的第i個功能的失效密度;kfuni為系統(tǒng)第i個功能的運行時間占整個系統(tǒng)時間的比例,且為系統(tǒng)運行的總功能數(shù).
3.2 系統(tǒng)單一功能失效密度模型的確定
由圖2可知,數(shù)控系統(tǒng)的功能實現(xiàn)是通過嵌入式實時操作系統(tǒng)對應用層調(diào)度、應用層對驅(qū)動層調(diào)度兩個層次來實現(xiàn)的.因此,當數(shù)控系統(tǒng)在執(zhí)行某個功能時,它發(fā)生失效的可能條件可概括為:相關(guān)的應用層模塊失效、相關(guān)的驅(qū)動層模塊失效和RTOS的調(diào)度失效.因此嵌入式數(shù)控軟件系統(tǒng)單一功能的失效密度可以表示為
式中:λAPi表示與功能i相關(guān)的應用層模塊的失效密度和;λDPi表示與功能i相關(guān)的驅(qū)動層模塊的失效密度和;λDispatchi表示與功能i相關(guān)的執(zhí)行過程中所有調(diào)度的失效密度和.
下面是各個分量的確定.式中:λALayj表示應用層中第j個模塊的失效密度;當應用層的軟件模塊j未被用于功能i的執(zhí)行時,xij=0,當應用層的軟件模塊j被用于功能i的執(zhí)行時,xij=1;nA表示應用層模塊的總數(shù)量.
式中:λDLayj表示驅(qū)動層中第j個模塊的失效密度;當驅(qū)動層的軟件模塊j未被用于功能i的執(zhí)行時,yij=0,當驅(qū)動層的軟件模塊j被用于功能i的執(zhí)行時,yij=1;nD表示驅(qū)動層模塊的總數(shù)量.
式中λRTOS表示嵌入式實時操作系統(tǒng)的運行調(diào)度失效密度.
3.3 改進的Littlewood數(shù)學模型的建立
從圖2可以看出,嵌入式數(shù)控軟件系統(tǒng)的控制數(shù)據(jù)流從一個應用層模塊APx轉(zhuǎn)換到另一個應用層模塊APy都必須經(jīng)過1次RTOS的調(diào)用,因此,對于1個功能的實現(xiàn)過程,RTOS的調(diào)用次數(shù)為相關(guān)應用層模塊的總數(shù)和減1.
綜合式(4)~式(8)可得
設應用層系數(shù)矩陣為模型.
改進模型的主要特點有:
(1)該模型適合基于嵌入式實時操作系統(tǒng)的系統(tǒng)結(jié)構(gòu)可靠性的分析和研究;
(2)與Littlewood模型相比,改進的模型更加注重軟件結(jié)構(gòu)的分層結(jié)構(gòu)分析,而且模型的計算形式更有利于從功能分析的角度對系統(tǒng)的失效和可靠性進行研究;
(3)與Littlewood模型相比,Improved-Littlewood模型更容易應用,同時系數(shù)矩陣M、N、K的確定更容易.
4.1 TDNCL4數(shù)控系統(tǒng)層次化結(jié)構(gòu)簡介
如圖3所示,TDNCL4為本課題組自主研發(fā)的嵌入式實時操作數(shù)控系統(tǒng),其結(jié)構(gòu)設計主要參考圖1的嵌入式數(shù)控軟件系統(tǒng)的層次化結(jié)構(gòu)模型,共分為操作系統(tǒng)層、應用層和驅(qū)動層3個層次.在操作系統(tǒng)層,TDNC-OS作為系統(tǒng)的調(diào)度核心,是一個嵌入式實時操作系統(tǒng)內(nèi)核;在應用層、驅(qū)動層分別由基于功能劃分的模塊組成.各模塊間的調(diào)用關(guān)系與前面描述的相似,程序控制流在應用層不同模塊間的轉(zhuǎn)換依靠TDNC-OS進行調(diào)度,TDNC-OS與驅(qū)動層各軟件模塊無直接聯(lián)系,驅(qū)動層的各軟件模塊受到應用層軟件模塊的調(diào)度,它們之間的聯(lián)系方式是直接的函數(shù)調(diào)用.
圖3 TDNCL4數(shù)控系統(tǒng)層次化結(jié)構(gòu)示意Fig.3 Layered structure diagram of TDNCL4
4.2 TDNCL4系統(tǒng)功能分析及系數(shù)矩陣X和Y的確定
根據(jù)TDNCL4數(shù)控軟件系統(tǒng)的功能運行特點,分析系統(tǒng)每個功能的實現(xiàn)過程與應用層和驅(qū)動層模塊的關(guān)系,得到表1和表2.表1統(tǒng)計了每個數(shù)控系統(tǒng)功能實現(xiàn)過程中用到的應用層軟件模塊,表2統(tǒng)計了每個數(shù)控系統(tǒng)功能實現(xiàn)過程中用到的驅(qū)動層軟件模塊.進而確定系數(shù)矩陣X和Y.
表1 TDNCL4的各個功能包含的應用層軟件模塊Tab.1 Application layer software modules included in various functions of TDNCL4
表2 TDNCL4的各個功能包含的驅(qū)動層軟件模塊Tab.2 Drive layer software modules included in various functions of TDNCL4
4.3 系統(tǒng)功能利用率向量K的確定
式(4)中的funik決定了funiλ對整個系統(tǒng)失效密度λsys的影響程度,因此,可認為kfuni是λfuni的權(quán)重,利用率向量K是各個功能失效密度對整個系統(tǒng)失效密度影響的權(quán)重向量.
故采用特征向量法,先將n個評價指標關(guān)于某個評價目標的重要程度按表3所列的比例標度做兩兩比較判斷獲得矩陣A,求出系統(tǒng)最大實數(shù)特征值對應的特征向量,將特征向量做歸一化處理,便得權(quán)重向量K[13].
表3 評價指標相對重要性關(guān)系Tab.3 Relationship of relative importance based on evaluation index
則計算得A的最大實數(shù)特征值為
對應的特征向量為
將W進行歸一化處理得
4.4 系統(tǒng)失效密度和可靠度模型的建立
經(jīng)過上面的分析和計算,可以得到TDNCL4數(shù)控軟件系統(tǒng)的失效密度模型(見式(15)),則整個系統(tǒng)的可靠度為
B可以稱為Q的失效密度影響因子系數(shù)矩陣.則系統(tǒng)的可靠度也可表示為
數(shù)控系統(tǒng)的可靠性受到各種因素和方面的影響,對于其可靠性的研究也是各有側(cè)重,本文主要側(cè)重于概要設計階段.首先分析了Littlewood結(jié)構(gòu)可靠性模型的特點,指出其應用于數(shù)控系統(tǒng)結(jié)構(gòu)可靠性的不足.根據(jù)嵌入式數(shù)控系統(tǒng)的功能和結(jié)構(gòu)特點,對Littlewood模型進行改進,獲得了Improved-Littlewood模型.并將其應用于對實際的數(shù)控系統(tǒng)結(jié)構(gòu)可靠性設計階段,給出獲取各個參數(shù)的方法,并最終獲得系統(tǒng)整體失效模型.從而使設計人員在設計初期就對系統(tǒng)的可能失效因素有清醒的認識,并為在詳細設計階段對某些模塊采取特別的關(guān)注提供參考.
[1] GoSeva-Popstojanova K,Trivedi K S. Architecture-based approaches to software reliability prediction[J]. Computers & Mathematics with Applications,2003,46(7):1023-1036.
[2] Wang Wen-Li,Pan Dai,Chen Mei-Hwa. Architecturebased software reliability modeling[J]. Journal of Systems and Software,2006,79(1):132-146.
[3] Abrah?o S,Poels Geert. Experimental evaluation of an object-oriented function point measurement procedure[J]. Information and Software Technology,2007,49(4):366-380.
[4] Wattanapongskorn Naruemon,Coit D W. Fault-toler-ant embedded system design and optimization considering reliability estimation uncertainty[J]. Reliability Engineering and System Safety,2007,92(4):395-407.
[5] Bucchiarone A,Muccini H,Pelliccione P. Architecting fault-tolerant component-based system[J]. Electronic Notes in Theoretical Computer Science,2007,168:77-90.
[6] Huang Chin-Yu. Performance analysis of software reliability growth models with testing-effort and changepoint[J]. Journal of Systems and Software,2005,76(2):181-194.
[7] .Das K,Lashkari R S,Sengupta S. Machine reliability and preventive maintenance planning for cellular manufacturing systems[J]. European Journal of Operational Research,2007,183(1):162-180.
[8] 于 捷,賈亞洲. 數(shù)控車床故障模式影響與致命性分析[J]. 哈爾濱工業(yè)大學學報,2005,37(12):491-494. Yu Jie,Jia Yazhou. Failure mode effect and criticality analysis on certain serial CNC lathes[J]. Journal of Harbin Institute of Technology,2005,37(12):491-494(in Chinese).
[9] El-Sebakhy E A. Software reliability identificationusing functional networks:A comparative study[J]. Expert Systems with Applications,2009,36(2):4013-4020.
[10] Cus F,Milfelner M,Balic J. An intelligent system formonitoring and optimization of ball-end milling process[J]. Journal of Materials Processing Technology,2006,175(1/2/3):90-97.
[11] Wattanapongskorn Naruemon,Levitan S P. Reliability optimization models for embedded systems with multiple applications[J]. IEEE Transactions on Reliability,2004,53(3):406-410.
[12] Go eva-Popstojanova K,Trivedi K S. Architecture-based approach to reliability assessment of software systems [J]. Performance Evaluation,2001,45 (2/3):179-204.
[13] Gharbi A,KennéJ P,Beit M. Optimal safety stocks and preventive maintenance periods in unreliable manufacturing systems[J]. International Journal of Production Economics,2007,107(2):422-434.
Structure Reliability Analysis of Embedded CNC System
LIU Qing-jian,WANG Tai-yong,WANG Tao,ZHI Jing-zhang,LIU Zhen-zhong
(Tianjin Key Laboratory of Advanced Manufacturing Technologies and Equipments,Tianjin University,Tianjin 300072,China)
Current research on the reliability of computerized numerical control (CNC) systems is mainly focusing on the breakdown in matured products and system maintenance,while there has been little interest in the CNC system reliability from the perspective of reliability engineering. Therefore,structure reliability analysis and modeling of embedded CNC system,which are in the early phase of the reliability engineering cycle,have been conducted,and the hierarchical module chart of the system based on real time operation system(RTOS)has been put forward. The improved-Littlewood model has been proposed on the basis of analysis of the functions and real development process of the CNC system and applied to the structure reliability analysis of an embedded CNC system. Methods to determine the variant parameter matrixes have been given,and the model of failure density structure and the reliability model of the system have been obtained,which verifies the feasibility of the proposed model.
computerized numerical control system;reliability;Littlewood model;failure density
R338.8
A
0493-2137(2010)02-0149-07
2008-11-27;
2009-06-09.
國家高技術(shù)研究發(fā)展計劃(863計劃)資助項目(2007AA042005);天津市科技發(fā)展計劃資助項目(08ZCKFGX02300);國家科技重大專項(2009ZX04014-101).
劉清建(1984— ),男,博士研究生.
王太勇,tywang@vip.chntdnc.oom.