吳亞鋒,,2
(1.南京航空航天大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,南京 211106;2.上海第二工業(yè)大學(xué) 計算機與信息工程學(xué)院,上海 201209)
隨著業(yè)務(wù)流程管理技術(shù)的不斷發(fā)展,企業(yè)應(yīng)用的各類信息管理系統(tǒng)越來越多,如人力資源管理系統(tǒng)、供應(yīng)鏈管理系統(tǒng)、企業(yè)資源計劃系統(tǒng)等。記錄企業(yè)運行的數(shù)據(jù)信息以事件日志的形式保存在這些信息管理系統(tǒng)中[1],這些保存下來的數(shù)據(jù)信息蘊藏著企業(yè)運行的具體執(zhí)行過程,具有重大的商業(yè)價值。如何利用好保存下來的數(shù)據(jù)信息,是企業(yè)面臨的重要問題。
關(guān)于業(yè)務(wù)流程間距離的計算問題,即業(yè)務(wù)流程相似度的計算,一直是企業(yè)界和學(xué)術(shù)界共同關(guān)心的熱點問題。但現(xiàn)有流程相似度計算方法多數(shù)僅考慮流程模型本身所蘊含的信息,忽視了保存在信息系統(tǒng)中事件日志的重要作用。針對該問題,本文基于信息管理系統(tǒng)保存的事件日志提取活動軌跡,利用文獻[2]提出的變遷緊鄰關(guān)系,通過遍歷事件日志中的活動軌跡尋找兩兩活動之間存在的緊鄰活動關(guān)系,利用此關(guān)系的組合構(gòu)造鄰接矩陣,并將其結(jié)合事件日志中案例軌跡發(fā)生的總次數(shù)得到概率鄰接矩陣,最后以矩陣間的距離表示業(yè)務(wù)流程間的距離。
現(xiàn)有的業(yè)務(wù)流程相似度計算方法都是從業(yè)務(wù)流程模型本身出發(fā),主要可以分為3類:1)文本內(nèi)容相似度計算;2)流程模型結(jié)構(gòu)相似度計算;3)流程行為相似度計算。
文本內(nèi)容相似度計算主要從節(jié)點的語法、語義、屬性、類型和節(jié)點上下文進行計算[3-5],這類方法計算簡單、快捷,只需計算節(jié)點對應(yīng)標簽文本的相似度。然而,當流程模型的結(jié)構(gòu)發(fā)生改變影響流程間相似度時,該類方法卻無法捕獲,因此,其準確性不高。
現(xiàn)有流程結(jié)構(gòu)相似度計算方法大多通過計算流程拓撲結(jié)構(gòu)的相似度,基于圖編輯距離[6]或樹編輯距離[7]計算流程結(jié)構(gòu)相似度。首先通過某種編輯距離來計算流程拓撲結(jié)構(gòu)的相似度;然后使用流程拓撲結(jié)構(gòu)的相似度表示流程結(jié)構(gòu)相似度。流程模型的拓撲結(jié)構(gòu)反映了不同業(yè)務(wù)邏輯單元之間的邏輯關(guān)系,如順序、選擇、并行和循環(huán)等。
關(guān)于流程行為相似度的計算,早期的方法主要集中于流程等價方面,如軌跡等價[8]、互模擬等價[9]。然而這些方法只能得到等價與非等價結(jié)果,無法求出流程行為相似度的具體數(shù)值,因此,在大多數(shù)實際應(yīng)用中是無效的?,F(xiàn)有計算結(jié)果較好的流程行為相似度計算方法有變遷緊鄰關(guān)系法、行為輪廓法、主變遷序列法和因果足跡法。
文獻[2]提出了一種稱為變遷緊鄰關(guān)系(Transition Adjacent Relation,TAR)算法的流程相似性度量方法。該方法以Petri網(wǎng)為建模基礎(chǔ),通過計算流程變遷之間的兩兩緊鄰關(guān)系來構(gòu)造TAR集合,最后以2個TAR集合之間的Jaccard系數(shù)表示2個流程的相似度。文獻[10]在TAR算法的基礎(chǔ)上提出TAR++算法,其在具有緊鄰關(guān)系的任務(wù)之間增加一個重要性系數(shù),再使用帶重要性系數(shù)的任務(wù)緊鄰關(guān)系集合的相似度表示流程行為的相似度。
文獻[11-12]提出了一種稱為行為輪廓(Behavioral Profile,BP)算法的流程行為相似性計算方法,其對TAR中的緊鄰關(guān)系進行擴充,允許將流程變遷之間的非緊鄰關(guān)系定義為一種弱關(guān)系,從而將變遷關(guān)系細化,具體包含嚴格順序關(guān)系、交錯順序關(guān)系和互斥關(guān)系等。但是該方法無法有效處理不可見任務(wù),也不能區(qū)分循環(huán)結(jié)構(gòu)和并發(fā)結(jié)構(gòu)。
文獻[13]提出一種稱為主變遷序列(Principal Transition Sequence,PTS)算法的流程行為相似性度量方法,該方法給出了主變遷序列的概念,通過3種不同的主變遷序列表示3種不同的邏輯結(jié)構(gòu)。使用這3種主變遷序列來表示流程模型的行為,2個序列的相似度為這2個序列的最長公共子序列長度和這2個序列中最長序列長度的比值,最后將不同類型的序列相似度加權(quán)求和所得值作為流程的相似度。但是該方法不能有效處理循環(huán)結(jié)構(gòu),同時也破壞了流程模型的語義完整性。文獻[14]在PTS算法的基礎(chǔ)上提出了PTS++算法,通過定義完整觸發(fā)序列表示流程行為,基于A*算法結(jié)合剪枝策略實現(xiàn)觸發(fā)序列集合間的映射,進而完成流程行為相似度的計算。
文獻[15]提出一種稱為因果足跡(Causal Footprint,CF)算法的流程行為相似度計算方法。該方法使用模型中的活動、路由、前向連接鏈、后向連接鏈等將流程模型表示為一個向量,并利用2個向量間的夾角余弦值表示2個流程間的相似度。但該方法無法有效區(qū)分AND、XOR等路由結(jié)構(gòu),且計算效率較低。
本文首先介紹有關(guān)事件日志的基本概念,給出從事件日志的執(zhí)行案例軌跡中構(gòu)造鄰接矩陣的方法;然后借鑒矩陣論中矩陣范數(shù)的概念定義流程間距離,證明所定義的流程間距離滿足距離度量的2個特性;最后將文獻[2]中使用的業(yè)務(wù)流程實例模型利用事件日志產(chǎn)生工具(Process Log Generator,PLG)[16]生成人工事件日志,通過對比實驗證明本文所提方法的有效區(qū)分性,同時利用真實事件日志數(shù)據(jù)集對其時間性能進行分析。
目前事件日志的數(shù)據(jù)源多種多樣,如數(shù)據(jù)庫、文本文件、消息日志、事務(wù)日志等。這些保存下來的事件日志信息為科學(xué)研究和企業(yè)生產(chǎn)實踐提供了大量的數(shù)據(jù)來源。從信息系統(tǒng)的角度來看,事件日志反映了業(yè)務(wù)流程在實際運行中的真實執(zhí)行情況。事件日志具有時間戳、成本、資源和活動等相關(guān)信息。
表1是一個關(guān)于網(wǎng)上購物的索賠申請?zhí)幚磉^程,每個索賠申請對應(yīng)于一個案例。事件可能與某些活動有關(guān),其中活動指register request、check ticket、reject等。由表1可以看出:1)案例是由事件組成的,且每個事件僅屬于一個案例;2)案例中的事件是有序的;3)事件具有屬性,典型的屬性包括活動、時間戳、成本和資源等。
表1 網(wǎng)上購物索賠申請?zhí)幚磉^程
定義1(事件、屬性) 設(shè)E為事件空間,即所有可能的事件標識的集合。事件可以由不同的屬性來表示。設(shè)AN為屬性名的集合。對于任意的事件e∈E和屬性名n∈AN,#n(e)是事件e的屬性n的值。
例:表1中一個事件(事件ID為110)有一個與活動#activity(e)=(register request)相對應(yīng)的時間戳#time(e)=(2015-12-22 10∶19∶16),被一個特定的人#person(e)=(Pete)所執(zhí)行,有相關(guān)的成本#cost(e)=(50)等。
定義2(分類器) 對任意的事件e∈E,e是事件的名稱,將e稱為事件的分類器。
定義3(軌跡) 軌跡t是事件e的一個有限序列。
定義4(案例) 設(shè)C為案例空間,即所有可能的案例標識符的集合。每一個案例都有一個強制性的屬性——軌跡。
例:表1中案例1的軌跡為{110,111,112,113,114},案例2的軌跡為{200,201,202,203,204}。
如果使用事件的活動名稱來表示事件,那么e=#activity(e)。
定義5(事件日志) 事件日志是案例的集合。
例:表1表示的事件日志為{案例1,案例2,…}。
定義6(簡單軌跡) 簡單軌跡t被定義為活動的有限序列。
例:表1中案例1對應(yīng)的簡單軌跡t1為{register request,examine thoroughly,check ticket,decide,reject request}。
定義7(簡單事件日志) 令A(yù)為活動名稱的集合。簡單軌跡t被定義為一個活動的序列,即t∈A*。簡單事件日志L被定義為A上軌跡的一個多集。
例:表1對應(yīng)的簡單事件日志為L={register request,examine thoroughly,check ticket,decide,reject request},{register request,check ticket,examine casually,decide,pay compensation},…},其中一個簡單軌跡t={register request,examine thoroughly,check ticket,decide,reject request}。
定義8(從事件日志提取簡單事件日志) 設(shè)L是定義5中定義的事件日志,假設(shè)存在一個分類器,e是事件的名稱,則使用這個分類器可以將L中的案例序列轉(zhuǎn)換成活動名稱序列。
事件日志的來源和格式多種多樣,有關(guān)事件日志的更多知識可以參考文獻[17]。
事件日志中保存著業(yè)務(wù)流程運行過程產(chǎn)生的豐富信息,反映流程的特征。然而,在業(yè)務(wù)流程的實際運行過程中可能會出現(xiàn)流程執(zhí)行異常或日志記錄錯誤的情況,日志數(shù)據(jù)中往往存在一些噪聲,因此,如何對保存在事件日志中的信息進行有效的提取與分析是本文需要解決的關(guān)鍵問題之一?,F(xiàn)有研究已經(jīng)證實噪聲的特點是發(fā)生概率低。因此,本文利用噪聲的這一特點首先對事件日志進行預(yù)處理,刪除發(fā)生率小于給定閾值的案例軌跡,然后再進行鄰接矩陣的構(gòu)造。以文獻[1]中使用的2個簡單事件日志為例,詳細介紹緊鄰活動關(guān)系和活動鄰接矩陣的構(gòu)造。
表2所示的簡單事件日志中共有5個不同的活動、6個案例軌跡,例如有2個案例的簡單軌跡為
表2 簡單事件日志數(shù)據(jù)表L1
表3 簡單事件日志數(shù)據(jù)表L2
由于事件日志中可能存在噪聲,因此在構(gòu)造鄰接矩陣之前需要對簡單事件日志進行預(yù)處理,即刪除案例軌跡的發(fā)生率小于給定閾值的軌跡,從而降低噪聲對計算結(jié)果的影響。事件日志的預(yù)處理包括以下2個部分:1)求出2個事件日志中相同活動的比例;2)求出事件日志中每條軌跡所占的比率。
表4 預(yù)處理后的簡單事件日志數(shù)據(jù)表L2
鄰接矩陣構(gòu)造是根據(jù)事件日志中的活動緊鄰關(guān)系進行的。因此,在介紹鄰接矩陣構(gòu)造之前,首先給出緊鄰活動與鄰接矩陣的定義。
定義11(緊鄰活動) 設(shè)L為簡單事件日志,A為活動集合,活動a,b∈A,a、b是緊鄰活動當且僅當簡單事件日志L中存在有簡單軌跡t=t1,t2,…,tn,使得ti=a,ti+1=b,其中i∈{1,2,…,n-1}。
例:表2所示的案例1中緊鄰活動關(guān)系有a1a2、a2a3、a3a4。
定義12(鄰接矩陣) 以緊鄰活動在事件日志的所有簡單軌跡中出現(xiàn)次數(shù)的總和作為元素的矩陣稱為鄰接矩陣(Adjacent Matrix,AM)。
對于任意給定的事件日志,可以按照如下方法為其構(gòu)造鄰接矩陣:對于一個包含有N個不同活動的事件日志,首先初始化一個N×N的方陣,其中,N表示事件日志中不同類型活動的數(shù)量,例如表2所示的事件日志中共包含有5個不同的活動a1、a2、a3、a4、a5,因此,表2所示的事件日志對應(yīng)于一個5×5的鄰接矩陣。對于事件日志中的任意2個活動ai和aj,依次遍歷事件日志中的每條軌跡,求出活動ai和aj在簡單事件日志中所有簡單軌跡中緊鄰出現(xiàn)的總次數(shù),假設(shè)為n,,那么在鄰接矩陣中AM(i,j)所對應(yīng)的位置填入n,即AM(i,j)=n,如果活動ai和aj沒有作為緊鄰活動在簡單事件日志中出現(xiàn)過,則鄰接矩陣的相應(yīng)位置填入0。為了表示簡單,本文對于鄰接矩陣中0元素的所在位置留有空白表示。
將表2和表4中的事件日志進行鄰接矩陣的構(gòu)造,所求出的鄰接矩陣如圖1和圖2所示。
圖1 L1預(yù)處理后所對應(yīng)的鄰接矩陣
圖2 L2預(yù)處理后所對應(yīng)的鄰接矩陣
定義13(概率鄰接矩陣) 由鄰接矩陣中的每個元素除以事件日志中案例軌跡的總數(shù)所得到的矩陣,稱為概率鄰接矩陣。
圖3 L1預(yù)處理后所對應(yīng)的概率鄰接矩陣
圖4 L2預(yù)處理后所對應(yīng)的概率鄰接矩陣
流程間距離的計算分為定性分析和定量計算,所謂定性分析就是對2個事件日志中的活動集合求取相同活動率,若所求的相同活動率較小,則說明所對應(yīng)的流程間距離較大;若所求的相同活動率較大,則說明所對應(yīng)的流程間距離較小。所謂流程間距離的定量計算就是指利用一種數(shù)值化的方法來度量流程間距離的具體大小。
定義14(同維概率鄰接矩陣) 設(shè)L1和L2為2個事件日志,A1和A2為對應(yīng)事件日志L1和L2的活動集合,AM1和AM2為事件日志L1和L2所對應(yīng)的概率鄰接矩陣,NAM1和NAM2表示同維概率鄰接矩陣,其維數(shù)m=|A1∪A2|,假設(shè)A1∪A2={a1,a2,…,am},則NAM1(i,j)和NAM2(i,j)可以進行如下的定義:
根據(jù)定義14所給的同維概率鄰接矩陣的定義,可以給出表2和表4所示的事件日志L1和L2所對應(yīng)的同維概率鄰接矩陣,分別如圖5和圖4所示(簡單事件日志L2的同維概率鄰接矩陣同圖4)。
圖5 簡單事件日志L1的同維概率鄰接矩陣
在矩陣論中,矩陣間距離的度量可以使用矩陣范數(shù)進行表示,因此,本文給出流程間距離的定義。
定義15(流程間距離) 設(shè)Li、Lj為任意2個事件日志,NAMi、NAMj為其對應(yīng)的同維概率鄰接矩陣,事件日志Li、Lj所對應(yīng)的流程間距離D(Li,Lj)定義如下:
D(Li,Lj)=tr[(NAMi-NAMj)×(NAMi-NAMj)T]
定理1任意給定3個簡單事件日志L1、L2和L3,流程間距離D滿足以下性質(zhì):
1)非負性:D(L1,L2)≥0,當且僅當L1=L2成立時,有D(L1,L2)=0。
2)對稱性:D(L1,L2)=D(L2,L1)。
3)三角不等式:D(L1,L2)≤D(L1,L3)+D(L3,L2)。
證明:
1)由流程間距離的定義可知D(L1,L2)≥0,若D(L1,L2)=0,則說明NAM1-NAM2是零矩陣,從而得NAM1=NAM2,即L1=L2,反之亦然。
2)由事件日志L1和L2的流程間距離的定義可得:
D(L1,L2)=
tr[(NAM1-NAM2)×(NAM1-NAM2)T]=
tr[(NAM2-NAM1)×(NAM2-NAM1)T]=
D(L2,L1)
3)由事件日志L1和L2的流程間距離的定義可得:
D(L1,L2)=
tr[(NAM1-NAM2)×(NAM1-NAM2)T]=
NAM3(i,j)-NAM2(i,j)}2≤
tr[(NAM1-NAM3)×(NAM1-NAM3)T]+
tr[(NAM3-NAM2)×(NAM3-NAM2)T]=
D(L1,L3)+D(L3,L2)
證畢。
本節(jié)首先使用人工生成的事件日志進行對比實驗,對本文方法進行可行性驗證,然后,利用真實事件日志數(shù)據(jù)集對本文方法的執(zhí)行效率進行實驗分析。本文實驗環(huán)境為:Inter(R) Core(TM)i5-6420P CPU @2.80 GHz 8 GB內(nèi)存。實驗程序使用Java語言編寫,JDK版本為1.7.0,運行在64位Windows7系統(tǒng)上。
首先使用事件日志產(chǎn)生工具(PLG)進行人工事件日志的生成。本文使用文獻[2]所給的4個流程模型進行人工事件日志的生成,所用流程模型如圖6所示。
圖6 流程模型實例
使用PLG分別執(zhí)行圖1所示的4個業(yè)務(wù)流程模型,每個業(yè)務(wù)流程模型執(zhí)行50次,即使得生成的4個人工事件日志為分別包含50條案例軌跡的簡單事件日志,所生成的4個事件日志分別為:{25,25};{25,25};{20,30};{15,15,5,5,5,5}。
本文所構(gòu)造的鄰接矩陣和文獻[2]使用的TAR集合都是通過活動鄰接關(guān)系構(gòu)造的,但是TAR算法僅考慮了變遷之間的緊鄰關(guān)系,屬于流程模型的局部行為特征,因而不能有效地識別出非自主選擇結(jié)構(gòu),同時也無法區(qū)分流程模型中存在的循環(huán)結(jié)構(gòu)和順序結(jié)構(gòu)。且TAR算法僅考慮了流程模型本身所蘊含的信息,而忽視了保存在信息系統(tǒng)中事件日志的有效應(yīng)用。因此,將本文方法與TAR方法進行比較,從而證明本文方法能夠更好地區(qū)分選擇結(jié)構(gòu)和并行結(jié)構(gòu),同時可以發(fā)現(xiàn)不可見任務(wù)。
由圖7可知,流程模型N2和N3的距離為0,則說明流程模型N2和N3應(yīng)該相同,但筆者發(fā)現(xiàn)模型N2為選擇分支結(jié)構(gòu),流程模型N3為并行分支結(jié)構(gòu),這兩個流程模型并不相同,但是它們的執(zhí)行軌跡相同,形成的TAR集合也相同。因此,說明TAR不能有效地區(qū)分選擇分支結(jié)構(gòu)和并行分支結(jié)構(gòu)。
圖7 基于TAR算法的流程間距離
由圖8可知,流程模型N2和N3的距離為0.06,則說明流程模型N2和N3是不相同的,這說明即使2個流程模型的執(zhí)行軌跡相同,但其對應(yīng)的流程模型仍有可能是不同的。因此,基于鄰接矩陣的流程間距離計算方法可以有效地區(qū)分選擇分支結(jié)構(gòu)和并行分支結(jié)構(gòu)。同時,筆者發(fā)現(xiàn)流程N1和N4的距離只有0.04,相較TAR算法求出的0.5小很多,這是因為不可見任務(wù)在真實的執(zhí)行過程中出現(xiàn)的次數(shù)較少,因此,可以在預(yù)處理階段設(shè)置一個較大的閾值將其過濾掉。如果軌跡發(fā)生率的閾值設(shè)置的大一點,則N1和N4的距離為0,會把不可見任務(wù)當成噪聲去掉。
圖8 基于鄰接矩陣的流程間距離
影響本文方法執(zhí)行效率的2個關(guān)鍵因素分別是事件日志中每條案例軌跡的長度以及事件日志中案例軌跡的個數(shù)。因此,本節(jié)分別從這2個因素對流程間距離計算所花時間進行驗證。本節(jié)實驗所使用的數(shù)據(jù)來自https://data.4tu.nl保存的真實數(shù)據(jù)集,從中選擇了4類事件日志數(shù)據(jù),分別是:Hospital Log,Sepsis Cases,Road Traffic和BPIC 2012。所挑選的事件日志具體細節(jié)如表5所示。
表5 事件日志數(shù)據(jù)集
從所選的4個事件日志中,分別將每個事件日志形成新的4類事件日志,形成的事件日志中的案例軌跡數(shù)分別為5、10、15和20。每類中的軌跡長度從5增加到20。筆者觀察在軌跡數(shù)一定的情況下,隨著軌跡長度的增加,計算所花時間的變化情況。
圖9中的每條曲線表示,在軌跡數(shù)一定的情況下,隨著軌跡長度的增加,計算所花的時間也隨之增加。增加的幅度和事件日志的案例軌跡數(shù)有關(guān),事件日志的案例軌跡數(shù)越大,增加的幅度也越大。例如當軌跡數(shù)為20時,隨著軌跡長度從5增加到20,計算所花時間由92.1 ms增加到了780.4 ms,增加的幅度分別為200.4%、201.4%和209.8%。在圖9所示的不同曲線之間,筆者發(fā)現(xiàn)在軌跡長度一定的情況下,事件日志中的案例軌跡數(shù)越大,計算所需的時間也就越多。
圖9 實驗結(jié)果
現(xiàn)有的流程間距離計算方法大多從流程模型本身入手,而忽略了流程模型實際執(zhí)行產(chǎn)生的事件日志。本文依據(jù)流程模型實際執(zhí)行產(chǎn)生的事件日志來計算流程間距離,通過挖掘流程執(zhí)行產(chǎn)生的案例軌跡中包含的活動緊鄰關(guān)系構(gòu)造活動鄰接矩陣,同時使用矩陣論中矩陣范數(shù)的定義表示矩陣間的距離,利用所求得的矩陣間距離來定義流程間距離,并證明所定義的流程間距離滿足距離度量的性質(zhì)。實驗結(jié)果表明,本文算法具有有效區(qū)分性,并且計算效率較高。下一步將提升鄰接矩陣構(gòu)造算法的效率,并設(shè)計更合理的預(yù)處理參數(shù)閾值。
[1] AALST W M P V D,SCHONENBERG M H,SONG M.Time prediction based on process mining[J].Information Systems,2011,36(2):450-475.
[2] ZHA H,WANG J,WEN L,et al.A workflow net similarity measure based on transition adjacency relations[J].Computers in Industry,2010,61(5):463-471.
[3] AKKIRAJU R,IVAN A.Discovering business process similarities:an empirical study with SAP best practice business processes[C]//Proceedings of ICSOC’10.San Francisco,USA:[s.n.],2010:515-526.
[4] YAN Z,DIJKMAN R,GREFEN P.Fast business process similarity search with feature-based similarity estima-tion[C]//Proceedings of OTM’10.Berlin,Germany:Springer,2010:60-77.
[5] 宋有美,李建波,和天玥,等.基于節(jié)點相似性的容遲網(wǎng)絡(luò)概率路由算法[J].計算機工程,2016,42(9):63-70.
[6] DIJKMAN R,DUMAS M.Graph matching algorithms for business process model similarity search[C]//Proceedings of BPM’09.Berlin,Germany:Springer,2009:835-842.
[7] KUNZE M,WESKE M.M.Metric trees for efficient similarity search in large process model repositories[C]//Proceedings of BPM’10.Berlin,Germany:Springer,2010:535-546.
[8] POMELLO L,ROZENBERG G,SIMONE C.A survey of equivalence notions for net based systems[M]//ROZENBERG G.Advances in Petri Nets.Berlin,Germany:Springer,1992:410-472.
[9] GLABBEEK R J V,WEIJLAND W P.Branching time and abstraction in bisimulation semantics(extended abstract)[J].Journal of the ACM,1991,43(3):555-600.
[10] 殷 明,聞立杰,王建民,等.基于變遷緊鄰關(guān)系重要性的流程相似性算法[J].計算機集成制造系統(tǒng),2015,21(2):344-358.
[11] WEIDLICH M,MENDLING J,WESKE M.Efficient consistency measurement based on behavioural profiles of process models[J].IEEE Transactions on Software Engineering,2011,37(3):410-429.
[12] WEIDLICH M,POLYVYANYY A,MENDLING J,et al.Efficient computation of causal behavioural profiles using structural decomposition[M]//LILIUS J,PENCZEK W.Applications and Theory of Petri Nets.Berlin,Germany:Springer,2010:77-685.
[13] WANG J,HE T,WEN L,et al.A behavioral similarity measure between labeled petri nets based on principal transition sequences[C]//Proceedings of OTM’10.Berlin,Germany:Springer,2010:394-401.
[14] 董子禾,聞立杰,黃浩未,等.基于觸發(fā)序列集合的過程模型行為相似性算法[J].軟件學(xué)報,2015,26(3):449-459.
[15] DIJKMAN R,DUMAS M,DONGEN B V,et al.Similarity of business process models:metrics and evaluation[J].Information Systems,2011,36(2):498-516.
[16] BURATTIN A,SPERDUTI A.PLG:a framework for the generation of business process models and their execution logs[C]//Proceedings of BPM’10.Berlin,Germany:Springer,2011:214-219.
[17] WIL V D A.Process mining:data science in action[M].Berlin,Germany:Springer,2016.