劉應(yīng)波,王 鋒,2,季凱帆,鄧 輝,梁 波,戴 偉
(1.云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500;2.中國科學(xué)院國家天文臺/云南天文臺,云南 昆明 650011)
科學(xué)工作流一直是虛擬天文臺[1]技術(shù)的重要組成部分和研究熱點(diǎn)。作為一個(gè)面向科學(xué)試驗(yàn),以科學(xué)業(yè)務(wù)流程為主導(dǎo)的應(yīng)用軟件,科學(xué)工作流系統(tǒng)可以使科研工作者忽略計(jì)算機(jī)底層復(fù)雜的技術(shù)細(xì)節(jié),從抽象層次[2]上進(jìn)行交流和協(xié)作,從而提高工作效率。當(dāng)前的部分科學(xué)工作流系統(tǒng),例如Kepler[3]、Taverna[4]等,具有廣泛的實(shí)用性和高度的抽象性。這些系統(tǒng)雖然應(yīng)用廣泛、功能豐富,但系統(tǒng)較為龐大,一般是獨(dú)立使用在某一領(lǐng)域。
流程建模是科學(xué)工作流系統(tǒng)的一個(gè)重要環(huán)節(jié),它使用業(yè)務(wù)流程建模語言(或稱業(yè)務(wù)流程描述語言)描述業(yè)務(wù)流程。最常見的建模方法有基于有向無環(huán)圖(Directed Acyclic Graphs,DAG)和有向環(huán)圖(Directed Cyclic Graph,DCG)方法。采用DCG的工作流系統(tǒng)如Triana[5]和Kepler,除此之外其它大多數(shù)工作流系統(tǒng)[6]使用DAG,Taverna、DAGMan[7]系統(tǒng)是他們中的典型代表。
通過對這些系統(tǒng)建模語言的分析,不難發(fā)現(xiàn)在當(dāng)前的虛擬天文臺技術(shù)平臺下直接整合或利用它們是非常困難的。一方面是因?yàn)榭茖W(xué)工作流的建模語言沒有標(biāo)準(zhǔn),二是各個(gè)科學(xué)工作流系統(tǒng)各成體系,結(jié)構(gòu)龐大,必須在通信交換、協(xié)議轉(zhuǎn)換以及交互等方面進(jìn)行大量的改造與整合,才有可能將這些系統(tǒng)應(yīng)用于天文領(lǐng)域。顯然,讓一個(gè)天文學(xué)家直接應(yīng)用復(fù)雜的科學(xué)工作流框架編寫科學(xué)工作流程序是不可能的。
為了有效地推動科學(xué)工作流技術(shù)的發(fā)展,促進(jìn)其在天文信息領(lǐng)域的應(yīng)用,特別是工作流高度抽象化和流程化思想,構(gòu)建一個(gè)“輕量級”的工作流系統(tǒng)是非常必要的。輕量級科學(xué)工作流系統(tǒng)旨在滿足一般的天文應(yīng)用,能獨(dú)立使用并且能夠比較靈活地與其他系統(tǒng)平臺集成。這樣的科學(xué)工作流系統(tǒng)具有如下特征:(1)功能能夠滿足領(lǐng)域內(nèi)使用;(2)不追求普遍適用性;(3)以數(shù)據(jù)驅(qū)動為主。實(shí)現(xiàn)的首要步驟是對業(yè)務(wù)流程進(jìn)行描述,即對業(yè)務(wù)進(jìn)行流程建模。圖1說明了工作流的主要流程,其中建模環(huán)節(jié)采用何種描述方式對工作流系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)有很大影響。
圖1 科學(xué)工作流系統(tǒng)框圖Fig.1 The block diagram of the Scientific Workflow System
Tristan Glatard等對工作流描述語言的研究做了比較詳細(xì)的分析和分類[8];Zhijie Guan討論了工作流建模和工作流語言的很多細(xì)節(jié),并研究了Petri-Net建模方法[6];Ketan Maheshwari[9]研究了用腳本如何對工作流流程進(jìn)行描述;Timothy McPhillips等歸納了設(shè)計(jì)工作流時(shí)應(yīng)該注意的一些事項(xiàng),并使用了一種面向集合的工作流設(shè)計(jì)方法[10];Gubala Tomasz等[11]應(yīng)用抽象和具體的概念描述工作流;Yang Ping等[12]使用層次狀態(tài)機(jī)對工作流進(jìn)行建模和分析;Johan Montagnat等[13]使用陣列編程的方式分析和設(shè)計(jì)工作流,同時(shí)討論了數(shù)據(jù)流和控制流的協(xié)作。
文中設(shè)計(jì)了一個(gè)面向“輕量級”工作流的描述語言SPDL(Scientific-Process Description Language),在定義上與Tom Oinn等[4,14]使用的Sucfl表現(xiàn)數(shù)據(jù)流的方法有相近之處,涉及的端口(ports)和連接(links)元素語義受到了Taverna流程描述語言Scufl的啟發(fā)[15]。Scufl具有很強(qiáng)的流程表達(dá)能力,在建模時(shí)考慮了數(shù)據(jù)流和控制流的不同,但因?yàn)槠鋸?fù)雜性,不適合作為“輕量級”工作流系統(tǒng)的建模語言。SPDL的設(shè)計(jì)目的是以數(shù)據(jù)驅(qū)動為主導(dǎo),能夠符合“輕量級”的特點(diǎn),不追求復(fù)雜和通用的表達(dá)能力。文中討論的工作流表現(xiàn)形式也不同于Ustun Yildiz等討論的模式[16],主要側(cè)重于在工作流建模時(shí),工作流語言表達(dá)時(shí)呈現(xiàn)的固定表現(xiàn)方式。
圖2是一個(gè)完整的抽象單工作流示例。任何一個(gè)業(yè)務(wù)流程都可以高度抽象為圖中的O,它包含輸入、處理和輸出3個(gè)最基礎(chǔ)的部件,E是O各個(gè)部件擴(kuò)展細(xì)化后的具體工作流。綜合來說,O和E都是從用戶的角度[17]理解工作流,它是工作流的直觀展示。圖2中的C則是從計(jì)算機(jī)角度理解工作流,它描述了具體工作流E內(nèi)部部件之間的關(guān)系。
從用戶角度和計(jì)算機(jī)角度理解工作流的不同點(diǎn)在于:用戶需要一個(gè)抽象的流程表現(xiàn)方式,不關(guān)注具體實(shí)現(xiàn);而計(jì)算機(jī)需要了解工作流各個(gè)部件的關(guān)系,負(fù)責(zé)轉(zhuǎn)換和映射用戶的流程需求。所以對用戶來說,他們更關(guān)注工作流的易用性,而對工作流系統(tǒng)來說,它則關(guān)注如何高效地解釋翻譯用戶設(shè)計(jì)的流程。下文主要從計(jì)算機(jī)角度分析流程的內(nèi)部結(jié)構(gòu)關(guān)系,在表達(dá)這些關(guān)系時(shí)更關(guān)注用戶對工作流的思考方式。
圖2 單工作流內(nèi)部結(jié)構(gòu)示意圖Fig.2 The block diagram of the internal structure of a single workflow
整個(gè)工作流業(yè)務(wù)流程(圖2)用W表示,W-Boundary代表工作流的應(yīng)用界限。W具有輸入端口WI1,此輸入端口是其它工作流或應(yīng)用系統(tǒng)與當(dāng)前工作流交互的接口,可以把WI1看成是數(shù)據(jù)的抽象化表示,實(shí)際中他們可能是大型文本數(shù)據(jù),也可能是高分辨率圖像。輸出端口WO1、WO2和WO3是當(dāng)前工作流W與其它工作流或應(yīng)用系統(tǒng)交互的接口。接口功能類似輸入端口,二者區(qū)別在于數(shù)據(jù)的流動方向。輸入端口只用于數(shù)據(jù)輸入,而輸出端口只用于數(shù)據(jù)輸出,一般不能混用。InputDataX1和InputDataX2被抽象為工作流內(nèi)部的數(shù)據(jù)輸入通道,他們被用于數(shù)據(jù)傳輸。其中,InputDataX1不對輸入數(shù)據(jù)進(jìn)行加工處理,代表一個(gè)虛擬數(shù)據(jù)連接通道;InputDataX2用于數(shù)據(jù)生成。InputDataX1是一個(gè)單端數(shù)據(jù)輸入(X1I1)和單端輸出(X1O1)的虛擬數(shù)據(jù)接收器,而InputDataX2是一個(gè)零端輸入單端輸出(X2O1)的數(shù)據(jù)發(fā)生器。ProcessingP是一個(gè)過程處理單元,它是一個(gè)能夠獨(dú)立完成實(shí)驗(yàn)過程處理的可執(zhí)行單元,實(shí)際應(yīng)用中它代表處理數(shù)據(jù)的一個(gè)活動,例如對高分辨率天文圖像重建。ProcessingP會對數(shù)據(jù)進(jìn)行加工,其接收數(shù)據(jù)端口PI1和PI2用于接收原始數(shù)據(jù),處理后的數(shù)據(jù)(PO1)是PI1和PI2共同被某種算法作用后的結(jié)果,此時(shí)的數(shù)據(jù)已經(jīng)全部或部分失去了PI1和PI2數(shù)據(jù)本身的原始特性。另外,為了數(shù)據(jù)溯源的需要,工作流系統(tǒng)會對經(jīng)過執(zhí)行單元處理的數(shù)據(jù)附加一些元信息。
按照工作流系統(tǒng)解析工作流的過程,建模過程可以分為3個(gè)階段:預(yù)處理階段、處理階段和處理后階段。
預(yù)處理階段:系統(tǒng)獲取數(shù)據(jù)時(shí)的速度往往和數(shù)據(jù)處理速度不匹配,工作流提交后,系統(tǒng)首先根據(jù)工作流輸入端口對數(shù)據(jù)的需求情況提前獲取所需數(shù)據(jù)并進(jìn)行一些必要的前期處理。例如在本地獲取高數(shù)量級(G Bytes級或T Bytes級甚至更高)數(shù)據(jù),然后將這些數(shù)據(jù)傳送到異地的高性能計(jì)算中心進(jìn)行處理,在數(shù)據(jù)處理完成后,又重新獲取處理后的數(shù)據(jù)。在這個(gè)過程中,原始、中間和結(jié)果數(shù)據(jù)的傳輸都是任務(wù)處理的瓶頸。因此,為了提高數(shù)據(jù)處理效率,必須在處理階段開始前,獲取的原始數(shù)據(jù)先被傳送到計(jì)算中心的某個(gè)存儲池中,為工作流的執(zhí)行準(zhǔn)備條件。
處理階段:在這個(gè)階段,工作流系統(tǒng)利用輸入端口的數(shù)據(jù)(例如PI1和PI2端口的數(shù)據(jù))完成對特定任務(wù)的處理。這個(gè)過程主要完成的任務(wù)是把本地或遠(yuǎn)程的某個(gè)計(jì)算服務(wù)封裝成可執(zhí)行單元實(shí)體供工作流系統(tǒng)調(diào)用。被調(diào)用的可執(zhí)行單元可能是一個(gè)標(biāo)準(zhǔn)的Web Service,也可能是一個(gè)批處理作業(yè)。另外,這個(gè)階段也是數(shù)據(jù)溯源[18]的重要環(huán)節(jié),不但需要處理數(shù)據(jù),還需要對處理過程進(jìn)行記錄,并附加一些處理操作的元信息。因此,數(shù)據(jù)經(jīng)過該階段處理后與流入這個(gè)階段中處理單元的輸入數(shù)據(jù)有了較大的區(qū)別。
處理后階段:在這個(gè)階段意味著數(shù)據(jù)處理過程的結(jié)束,工作流的輸入數(shù)據(jù)已經(jīng)完成了多個(gè)類似ProcessingP的處理。用戶可以提取所關(guān)心的數(shù)據(jù),也可以通過查看結(jié)果驗(yàn)證數(shù)據(jù)的正確性,并決定是否直接獲取數(shù)據(jù)還是將數(shù)據(jù)作為其他工作流或應(yīng)用系統(tǒng)的輸入數(shù)據(jù)。
圖2中的工作流W可以使用管道的方式進(jìn)行描述。在描述前首先定義如表1的操作。
表1 管道方式的操作描述Table 1 Description of the pipe-based operations
圖2的流程可以用如下式子表示:
熟悉計(jì)算機(jī)技術(shù)的研究人員比較容易理解(1)的流程描述方式。(1)中使用Entity:port的方式與計(jì)算機(jī)中IP:port的方式來標(biāo)識一個(gè)唯一應(yīng)用非常相似;可以用管道的方式表示,這種表示在Unix類型系統(tǒng)中比較常見,它表示的意思是把A的輸出流通過管道定位到B的輸入流。這種流程描述方式的優(yōu)點(diǎn)是簡單、直觀,但該方式不能描述功能較復(fù)雜的流程,也不利于計(jì)算機(jī)工作者與科研工作者的交流協(xié)作。
工作流領(lǐng)域已經(jīng)存在多種基于XML的業(yè)務(wù)流程描述語言,例如XPDL①XML Process Definition Language.http://www.simonstl.com/projects/xpdl/、YAWL②Yet Another Workflow Language.http://www.yawlfoundation.org/、WS-CDL③Web Services Choreography Description Language.http://www.zhaoxiangpeng.com/about/papers/cdlspec_cn/、WSFL④Web Services Flow Language.http://xml.coverpages.org/wsfl.html等等,但這些業(yè)務(wù)流程描述語言對輕量級科學(xué)工作流系統(tǒng)來說過于繁雜。為了減少輕量級工作流系統(tǒng)實(shí)現(xiàn)的工作量和符合“輕量級”系統(tǒng)的需要,通常選用這些語言中的一個(gè)或幾個(gè)子集描述具體的業(yè)務(wù)流程。但更好的方式是直接使用XML語言定義的較高層次的描述語言,因此自定義一套基于XML的輕量級流程描述語言是非常必要的。
通過對圖2的分析,可以用圖3中的抽象框圖表示其關(guān)鍵部件。對上述部件的具體解釋如表2。
圖3 抽象后的工作流部件Fig.3 Key workflow components
表2 定義描述流程的核心關(guān)鍵字Table2 Keywords for defining a workflow
為了說明圖3部件之間的關(guān)系,并針對一般天文科學(xué)工作流的需要,具體定義一個(gè)描述工作流業(yè)務(wù)流程的工作流描述語言SPDL,定義方式可以直接使用XML,也可以在基于XML業(yè)務(wù)流程描述語言的基礎(chǔ)上進(jìn)行定義。采用前者進(jìn)行定義,這樣可以讓語言具有較強(qiáng)的可維護(hù)性和可擴(kuò)展性。
工作流最終呈現(xiàn)給用戶的表現(xiàn)形式是圖2中用戶U部分的表示形式,對于C部分的內(nèi)部結(jié)構(gòu)一般是工作流引擎進(jìn)行解釋和翻譯的中間過程。故在表現(xiàn)方式上應(yīng)該以用戶為中心,對U部分進(jìn)行描述。
使用SPDL對工作流中比較關(guān)鍵的部件進(jìn)行描述包括如下幾個(gè)方面:
(1)描述工作流:定義一個(gè)頂層容器,比如命名為Workflow:
(2)描述端口:該工作流有1個(gè)輸入端口和3個(gè)輸出端口。一般來說,如圖2中U部分,InputDataX2有一個(gè)輸出端口X2O1;ProcessingP有兩個(gè)輸入端口和一個(gè)輸出端口PO1。在數(shù)據(jù)描述上,沒有對數(shù)據(jù)進(jìn)行處理的單元(InputDataX1、OutputDataY1、OutputDataY2和Output DataY3)不需要明確定義。這種結(jié)構(gòu)可表示如下:
(3)描述處理單元:由于 InputData和 Processing都對數(shù)據(jù)進(jìn)行了操作,所以可以把它列入Execution Unit內(nèi)。
(4)描述數(shù)據(jù)流向:有了數(shù)據(jù)的來源(source)和數(shù)據(jù)的流向(destination)以及如何處理數(shù)據(jù),就可以定義一個(gè)元素<links>限定數(shù)據(jù)的流向,從而在各個(gè)部件之間建立關(guān)系:
通過上述步驟就可以完成對圖2的主體描述,對于更為復(fù)雜的流程,該語言可以通過擴(kuò)展一些額外的描述關(guān)鍵字增強(qiáng)語言的描述能力。
基于XML方式自定義的工作流語言,在進(jìn)行建模時(shí)需要注意圖4中一些不正確和不規(guī)范的業(yè)務(wù)流程表現(xiàn)形式。這些不正確形式產(chǎn)生的原因在于上述描述語言把工作流端口和執(zhí)行單元端口進(jìn)行了一致性處理,這種一致性導(dǎo)致在建立流程描述時(shí),處理端口數(shù)據(jù)的不確定性。所以,用戶直接用XML語言進(jìn)行流程描述時(shí)需要注意如下一些不規(guī)范的工作流表現(xiàn)形式,它們會導(dǎo)致工作流不能正確解釋執(zhí)行。圖4中除(a)外其它都是不嚴(yán)格的,在實(shí)際描述中是不被允許的或者不正確的表現(xiàn)形式。
圖4 不正確的流程表現(xiàn)形式Fig.4 Incorrect workflow representation forms.(a)is the correct one
(a)執(zhí)行單元的任何輸入端口懸空。懸空的端口(例如(a)中的PI1)是一個(gè)可選端口,數(shù)據(jù)有默認(rèn)值。這種表現(xiàn)形式雖然看似不正確,但是實(shí)際上是一個(gè)可運(yùn)行的工作流。
(b)必選數(shù)據(jù)端口無實(shí)際數(shù)據(jù)輸入。對于(b)中的PI2,必須等待數(shù)據(jù)輸入。在這種情況下,如果沒有數(shù)據(jù)輸入,整個(gè)流程便無法進(jìn)行,所以該表現(xiàn)形式被視為錯(cuò)誤的流程連接。
(c)工作流輸入端口直接連接至可執(zhí)行單元的輸出端口。該表現(xiàn)形式下,任何輸入端口的輸入數(shù)據(jù)經(jīng)過外部直接連接至執(zhí)行單元的輸出端口,這是不正確的表現(xiàn)形式。
(d)任何輸出端口連接至實(shí)體(工作流、可執(zhí)行單元)的輸入端口。在單工作流界限內(nèi),任何輸出端口(執(zhí)行單元或者工作流的輸出端口)不能直接連接到任何實(shí)體的數(shù)據(jù)輸入端口,這樣的情況會導(dǎo)致死鎖。
(e)可執(zhí)行單元的輸入端口和輸出端口之間的直接數(shù)據(jù)連接。在可執(zhí)行單元中,數(shù)據(jù)的流通只能在可執(zhí)行單元的內(nèi)部進(jìn)行。直接在輸入端口和輸出端口外部建立數(shù)據(jù)流向?qū)儆诓徽_的表現(xiàn)形式。
(f)可執(zhí)行單元的輸出端口懸空。這是一種不符合規(guī)范但是可以滿足工作流執(zhí)行的情況,但這種表現(xiàn)形式實(shí)際上沒有任何意義,因?yàn)闊o法獲取執(zhí)行結(jié)果。
針對上述表現(xiàn)形式,在使用自定義工作流描述語言對業(yè)務(wù)流程進(jìn)行建模時(shí),可以采用如下3種方法最大限度地避免上述不規(guī)范的表現(xiàn)形式:
(1)設(shè)計(jì)一個(gè)圖形用戶界面(Graphical User Interface,GUI)管理業(yè)務(wù)流程描述語言。在工作流進(jìn)行建模時(shí),通過界面提示,用戶可以避免出現(xiàn)不規(guī)范的流程描述。目前許多工作流系統(tǒng)都有與業(yè)務(wù)流程描述語言相對應(yīng)的GUI管理界面,工作流系統(tǒng)使用者可以很方便地對描述語言進(jìn)行操作。
(2)為工作流描述語言制定相對完整的圖表(Schema)規(guī)范,該方式能夠有效驗(yàn)證工作流流程。同時(shí),這種規(guī)范對系統(tǒng)外的研究人員理解工作流語言有很大幫助。
(3)在運(yùn)行工作流系統(tǒng)前,工作流引擎應(yīng)該對工作流運(yùn)行時(shí)的連接情況進(jìn)行完整性檢查,這種完整性檢查不是冗余,而是系統(tǒng)性檢驗(yàn),也是保證工作流被計(jì)算機(jī)解釋后整個(gè)工作流是否可執(zhí)行的有效手段。檢查的內(nèi)容包括工作流內(nèi)所有元件和通路是否符合定義的語言規(guī)范,物理連接是否可以連通,語言中的可執(zhí)行單元在物理上是否存在等等。
通用工作流系統(tǒng)的建模描述語言具有很大的覆蓋面,但針對天文應(yīng)用這一專用領(lǐng)域,利用這些語言進(jìn)行系統(tǒng)設(shè)計(jì)會增加設(shè)計(jì)難度,從而限制系統(tǒng)的應(yīng)用與推廣,在天文領(lǐng)域內(nèi)構(gòu)建一個(gè)與工作流系統(tǒng)相匹配的簡潔、實(shí)用的描述語言是非常必要的。SPDL語言具有較高層次的抽象能力和流程表達(dá)能力,能夠描述領(lǐng)域內(nèi)粗粒度的科學(xué)實(shí)驗(yàn)活動,滿足天文輕量級的工作流系統(tǒng)對數(shù)據(jù)流描述的需要。透明的工作流結(jié)構(gòu)也有助于工作流研究人員優(yōu)化流程細(xì)節(jié),提高建模效率。
本文提出的SPDL語言對天文輕量級科學(xué)工作流抽象示例的描述結(jié)果顯示了該語言具有較強(qiáng)的抽象表達(dá)能力,語言本身和設(shè)計(jì)思想比較適合輕量級工作流系統(tǒng)的需求。在SPDL建模中的各種不規(guī)范表現(xiàn)形式雖然普遍存在于基于XML的流程描述語言中,但通過GUI界面規(guī)范用戶建模過程,對這些表現(xiàn)形式進(jìn)行約束,就可以有效屏蔽文中討論的幾種不規(guī)范形式。對最終用戶而言,這種屏蔽方式有助于提高語言的易用性和友好性,但是對工作流描述語言的研究人員和工作流引擎設(shè)計(jì)人員來說,應(yīng)該非常關(guān)注這些表現(xiàn)形式,從技術(shù)上提供相應(yīng)的解決措施。
本文實(shí)現(xiàn)了在抽象層面對輕量級科學(xué)工作流的描述,下一步的工作就是把SPDL應(yīng)用到具體的天文應(yīng)用實(shí)例中,建立對應(yīng)的可執(zhí)行單元映射庫,擴(kuò)展能夠描述天文領(lǐng)域特征特點(diǎn)的關(guān)鍵字,增強(qiáng)其實(shí)用性,從而為廣大天文工作者服務(wù)。
致謝:在論文寫作過程中得到國家天文臺趙永恒研究員、崔辰州副研究員、云南天文臺劉忠研究員和許駿研究員的多次指導(dǎo)與建議,在此表示忠心的感謝!
[1]崔辰州,趙永恒.中國虛擬天文臺研發(fā)策略與重點(diǎn) [J].天文研究與技術(shù)——國家天文臺臺刊,2004,1(3):203-209.Cui Chenzhou,Zhao Yongheng.Research and development strategy and focuses of Chinese virtual observatory [J].Astronomical Research & Technology——Publications of National Astronomical Observatories of China,2004,1(3):203-209.
[2]Bowers S,Ludascher B.Actor-oriented design of scientific workflows [J].Computer and Information Science,2005,0225673(S52):369-384.
[3]Ludascher Bertram,Altintas Ilkay,Berkley Chad,et al.Scientific workflow management and the kepler system:research articles[J].Concurrency and Computation:Practice & Experience,2006,18(10):1039-1065.
[4]Hull Duncan,Wolstencroft Katy,Stevens Robert,et al.Taverna:a tool for building and running workflows of services[J].Nucleic Acids Research,2006,34(2):W729-W732.
[5]Churches David,Gombas Gabor,Harrison Andrew,et al.Programming scientific and distributed workflow with triana services:research articles[J].Concurrency and Computation:Practice&Experience,2006,18(10):1021-1037.
[6]Guan Zhijie,Hernandez Francisco,Bangalore Purushotham,et al.Grid-flow:a grid-enabled scientific workflow system with a petri net-based interface [J].Concurrency and Computation:Practice and Experience,2006,18(10):1115-1140.
[7]Team Condor.Dagman(Directed Acyclic Graph Manager) [EB/OL].[2011-12-18].http://research.cs.wisc.edu/condor/dagman/.
[8]Glatard Tristan,Montagnat Johan,Bolze Raphael,et al.On scientific workfkow representation languages [R].City:laboratoire d'informatique signaux et systémes de sophia-antipolis,2009.
[9]Maheshwari Ketan,Montagnat Johan.Scientific workflow development using both visual and script-based representation[C]//SERVICES'10 proceedings of the2010 6th world congress on services.China:IEEE computer society,2010:328 -335.
[10]Mcphillips Timothy,Bowers Shawn,Zinn Daniel,et al.Scientific workflow design for mere mortals[J].Future Generation Computer Systems,2009,25(5):541-551.
[11]Gubala Tomasz,Harezlak Daniel,Bubak Marian,et al.Constructing Abstract Workflows of Applications with Workflow Composition Tool[C]//Bubak M,Unger S.Constructing abstract workflows of applications with workflow composition tool.Proceedings of cracow'06 grid workshop.Krakow:ACC cyfronet AGH,2006:25-30.
[12]Yang Ping,Yang Zijiang,Lu Shiyong.Formal modeling and analysis of scientific workflows using hierarchical state machines[C]//E-SCIENCE'07 proceedings of the third IEEE international conference on e-science and grid computing.China:IEEE computer society,2007:619 -626.
[13]Montagnat Johan,Isnard Benjamin,Glatard Tristan,et al.A data-driven workflow language for grids based on array programming principles[C]//Proceedings of the 4th workshop on workflows in support of large-scale science.New York:ACM New York,2009:1 -10.
[14]Oinn Tom,Greenwood Mark,Addis Matthew,et al.Taverna:lessons in creating a workflow environment for the life sciences:research articles[J].Concurrency and Computation:Practice& Experience,2006,18(10):1067-1100.
[15]Oinn Tom,Addis Matthew,F(xiàn)erris Justin,et al.Delivering web sservice coordination capability to users[C]//Proceedings of the 13th international world wide web conference on alternate track papers& posters.New York:ACM New York,2004:438-439.
[16]Yildiz Ustun,Guabtni Adnene,Ngu Anne H H.Towards scientific workflow patterns[C]//Proceedings of the 4th workshop on workflows in support of large-scale science.Oregon:ACM,2009:1-10.
[17]Biton Olivier,Davidson Susan B,Khanna Sanjeev,et al.Optimizing user views for workflows[C]//ICDT'09 Proceedings of the 12th international conference on database theory.New York:ACM New York,2009:310-323.
[18]Simmhan Yogesh L,Plale Beth,Gannon Dennis.A survey of data provenance in e-science [J].SIGMOD Record,2005,34(3):31-36.
[19]Shawn Bowers,Ludascher Bertram,Bowers Shawn,et al.Enabling scientific workflow reuse through structured composition of dataflow and control-flow [C]//Proceedings of the ICDE workshop on workflow and data flow for scientific applications SciFlow.China:IEEE Computer Society,2006.