付高財(cái),夏杰,金超
(武漢理工大學(xué)機(jī)電工程學(xué)院,武漢430070)
近年來,隨著流程管理概念的提出,企業(yè)的管理模式正逐漸向流程導(dǎo)向型轉(zhuǎn)變,流程管理成為企業(yè)發(fā)展的重要驅(qū)動(dòng)力之一。其本質(zhì)是構(gòu)建出高效且符合業(yè)務(wù)邏輯的流程,來提高組織業(yè)務(wù)效率[1]。
在實(shí)現(xiàn)流程快速準(zhǔn)確推薦的方法上,國內(nèi)外已有不少研究成果。文獻(xiàn)[2]建立了JTangaWFR工作流推薦系統(tǒng),提出一種基于圖距離計(jì)算方法的流程推薦方法,該方法通過尋找參考流程和流程模式上游子圖的最大公共子圖和最小公共超圖的圖距離進(jìn)行相似度計(jì)算。文獻(xiàn)[3]提出一種基于流程規(guī)整矩陣的流程推薦方法,該方法通過計(jì)算流程規(guī)整路徑距離獲得滿足流程匹配度要求的候選流程最終通過候選流程的匹配層次分解產(chǎn)生推薦路徑。文獻(xiàn)[4]提出了一種互聯(lián)網(wǎng)環(huán)境下面向最終用戶編程的計(jì)算業(yè)務(wù)與結(jié)構(gòu)相似度的方法,用來解決業(yè)務(wù)流程推薦的準(zhǔn)確性。
上述文獻(xiàn)對(duì)于流程推薦技術(shù)的研究的重點(diǎn)在于為流程建模人員提供一個(gè)合理有效的流程,然而流程的管理、運(yùn)作,其核心是以人為本。針對(duì)的特定對(duì)象不僅是制定流程規(guī)則的企業(yè)高層管理人員,還包括廣大中層管理人員和基層普通員工。從普通員工的角度來說,在選擇流程模板時(shí),會(huì)遇到如下問題:①普通員工需要從公司制定的繁多流程模板中選出合適的流程;②對(duì)于新員工進(jìn)行人工選擇流程時(shí),由于業(yè)務(wù)邏輯的不熟悉,存在選錯(cuò)流程模板和選擇困難等問題。這些問題都造成了流程的不確定性和精準(zhǔn)度不高,并且耗時(shí)長(zhǎng)。面對(duì)業(yè)務(wù)流程繁多且復(fù)雜的公司而言,對(duì)于基層的普通員工或新入職員工來說,在選擇流程模板時(shí),若工作流系統(tǒng)可以自動(dòng)根據(jù)文檔特征推送出合適流程,可以減少人工的出錯(cuò)率。從工程項(xiàng)目的方面來說,一個(gè)工程項(xiàng)目有眾多的文件,并且這些文件對(duì)應(yīng)著不同的工作流。當(dāng)項(xiàng)目文檔進(jìn)入PDM的工作流系統(tǒng)時(shí),就不需要人工去選擇不同的流程模板,系統(tǒng)會(huì)自動(dòng)推薦與工作文檔相對(duì)應(yīng)的流程,提高工作效率。
因此,為了提高業(yè)務(wù)流程的工作效率和準(zhǔn)確性,針對(duì)企業(yè)的業(yè)務(wù)復(fù)雜度和新員工不熟悉業(yè)務(wù)的情況下,在工作流管理理論的基礎(chǔ)上,分別對(duì)業(yè)務(wù)流程所涉及的特征和工作文檔的特征進(jìn)行結(jié)構(gòu)建模與提取,提出一種基于特征信息的相似度算法,在工作流的管理中進(jìn)行流程推薦,來實(shí)現(xiàn)業(yè)務(wù)流程的智能選擇功能。
工作流是為了完成某項(xiàng)任務(wù),按照一定順序動(dòng)態(tài)完成一系列工作的過程,能夠有效地反映該項(xiàng)任務(wù)的業(yè)務(wù)邏輯。文獻(xiàn)[5]指出,每一項(xiàng)工作都有一個(gè)過程,在其工作過程中可以分解為各個(gè)工作步驟,每個(gè)工作步驟完成若干個(gè)操作。各個(gè)工作步驟之間,根據(jù)所要完成的任務(wù)性質(zhì),有一定的先后順序,并指明工作步驟的啟動(dòng)和終止條件、所要完成的工作任務(wù)、完成任務(wù)的人員以及完成任務(wù)的先后順序。
工作流管理系統(tǒng)(Workflow Management System,WMS)是指在計(jì)算機(jī)環(huán)境下,運(yùn)行在工作流引擎上用戶定義、執(zhí)行和控制管理工作流運(yùn)行的一套系統(tǒng),與工作流執(zhí)行者進(jìn)行交互,推進(jìn)工作流實(shí)例的執(zhí)行,監(jiān)控工作流的運(yùn)行狀態(tài),并進(jìn)行有效管理[6]。
工作流管理系統(tǒng)不僅要提供工作流程定義工具,把企業(yè)的業(yè)務(wù)流程轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別的格式,還需要對(duì)工作流程運(yùn)行的狀態(tài)進(jìn)行監(jiān)控,對(duì)流程運(yùn)行中的活動(dòng)進(jìn)行管理和調(diào)度。將應(yīng)用邏輯與過程邏輯分離,在不修改具體功能的情況下,通過修改過程模型改變系統(tǒng)功能,完成對(duì)生產(chǎn)運(yùn)作部分過程或是全過程的集成管理,可有效地把人、信息和應(yīng)用工具合理組織在一起,發(fā)揮系統(tǒng)的最大功效。
一般情況下,活動(dòng)是指流程執(zhí)行過程中可被工作調(diào)度的最小工作單元,要求有人或機(jī)器參與[7]?;顒?dòng)節(jié)點(diǎn)的基本特征屬性有很多,如名稱、描述、用戶、期限、啟動(dòng)條件,等等。在研究某鐵路電氣有限公司的業(yè)務(wù)流程的基礎(chǔ)上,以公司流程庫為數(shù)據(jù)集,使用特征提取的方式,將整個(gè)數(shù)據(jù)集所具有的特征提取并呈現(xiàn),構(gòu)建所需的特征結(jié)構(gòu)模型,如圖1所示。
定義:工作流程由若干個(gè)節(jié)點(diǎn)構(gòu)成,節(jié)點(diǎn)由若干特征組成,形式化定義為:WF=
其中:Name(名稱):表示流程在該節(jié)點(diǎn)所要執(zhí)行的任務(wù)類別,如設(shè)計(jì)、校驗(yàn)、審核等。
User(用戶):指訪問或操作計(jì)算機(jī)信息系統(tǒng)中數(shù)據(jù)、界面、客戶端頁面菜單等資源實(shí)體的主體。
Condition(條件):為了對(duì)工作流活動(dòng)執(zhí)行情況以及活動(dòng)路徑進(jìn)行控制,在工作流過程模型設(shè)計(jì)中為節(jié)點(diǎn)和連接弧增加相應(yīng)的控制條件。
Deadline(限制):限制是個(gè)時(shí)間段,表示流程開始后,這個(gè)節(jié)點(diǎn)的活動(dòng)必須在這個(gè)時(shí)間段內(nèi)完成。
Description(描述):對(duì)業(yè)務(wù)流程內(nèi)容的表達(dá),如:企業(yè)的NPAINO20180604流程是用于公司申請(qǐng)外購件物料代碼,QJDNO20180608流程是用于公司員工請(qǐng)假。
圖1 業(yè)務(wù)流程特征結(jié)構(gòu)模型
流程特征模型主要提取節(jié)點(diǎn)對(duì)象的特征屬性,具有以下幾個(gè)特點(diǎn):
(1)與傳統(tǒng)工作流模型不同,不考慮活動(dòng)間的控制順序,主要對(duì)流程節(jié)點(diǎn)進(jìn)行細(xì)分,更能清晰表明各流程需要完成的活動(dòng)項(xiàng);
(2)特征結(jié)構(gòu)層次清晰。業(yè)務(wù)流程庫中存在大量的數(shù)據(jù)屬性,節(jié)點(diǎn)的特征項(xiàng)較多,主要提取活動(dòng)的名稱,完成活動(dòng)的用戶角色、限制條件(或是需要完成的作業(yè))等重要項(xiàng)。以實(shí)際應(yīng)用的企業(yè)流程為主,在此模型基礎(chǔ)上,可以擴(kuò)充節(jié)點(diǎn)的特征屬性。
特征結(jié)構(gòu)模型建立后,將結(jié)構(gòu)模型用XML(Exten?sible Markup Language,可擴(kuò)展的標(biāo)記語言)來表示。XML即是運(yùn)用標(biāo)記的方式來描述結(jié)構(gòu)化數(shù)據(jù)的純文本格式語言,其優(yōu)勢(shì)有:①使結(jié)構(gòu)模型存儲(chǔ)方式多樣化,查詢與搜索的效率顯著提高;②無論何種工作流系統(tǒng),都可以通過通用的交換格式進(jìn)行轉(zhuǎn)換。考慮到XML文件的特殊性,從活動(dòng)的特征屬性對(duì)模型文檔進(jìn)行量化[8]。
將XML文檔中的每個(gè)節(jié)點(diǎn)的結(jié)構(gòu)單元看作一個(gè)向量b={b1,b2,...,bm}(bm示流程節(jié)點(diǎn)的特征),這樣整個(gè)XML文檔則被量化為一組向量,以一個(gè)矩陣來表示即B={B1,B2,...,Bn}(其中Bn為工作流程中的各活動(dòng)節(jié)點(diǎn))。
工作文檔是指即將進(jìn)入到PDM系統(tǒng)中需要工作流進(jìn)行管理的文檔。文檔的表示模型由特征詞來建立,常用的表示文檔特征的模型有:布爾邏輯模型(Boolean Model,BM),向量空間模型(Vector Space Mod?el,VSM)[9]。由于文檔的多異性,采用向量空間模型對(duì)文檔的特征建立模型,從文檔中提取的特征詞(特征項(xiàng))組成余弦空間的一個(gè)向量,每一個(gè)特征項(xiàng)對(duì)應(yīng)一個(gè)特征權(quán)重,以此表示特征詞在文檔中的重要程度。形式化定義為:d={d1,d2,...,dk} ,其中 dk(k=1,2,3,…)分別表示文檔的特征屬性。
構(gòu)建文檔特征模型的步驟:
(1)基于頻繁項(xiàng)的特征屬性的提取:工作文檔特征項(xiàng)遵循文本聚類的方法,文本聚類是分析未知類別的文本文檔,提取出能表現(xiàn)出主題特征的標(biāo)志,例如特征詞集等,利用頻繁項(xiàng)算法,把符合算法的頻繁項(xiàng)呈現(xiàn)給用戶[10]。在基于頻繁項(xiàng)的Apriori算法的基礎(chǔ)上,采用逐步頻繁特征詞語集,同時(shí)壓縮尋找范圍[11]來提取工作文檔的特征屬性。采用Apriori算法的原因:①針對(duì)中小企業(yè)的工作文檔,需要考慮的項(xiàng)集數(shù)不多,數(shù)據(jù)集小,遍歷搜索空間??;②算法可靠,信息檢索目的性明確,更為精準(zhǔn)達(dá)到用戶的目標(biāo)。具體做法是:首先找出頻繁1-項(xiàng)集,記為L(zhǎng)1;然后利用L1來產(chǎn)生候選項(xiàng)集C2,對(duì)C2中的項(xiàng)進(jìn)行判定挖掘出L2,即頻繁2-項(xiàng)集;不斷如此循環(huán)下去直到無法發(fā)現(xiàn)更多的頻繁k-項(xiàng)集為止[12]。
根據(jù)步驟(1),對(duì)某鐵路電氣公司的大量項(xiàng)目文檔的各特征屬性和組織結(jié)構(gòu)進(jìn)行研究,根據(jù)頻繁項(xiàng)算法,為了方便計(jì)算,選取前5項(xiàng)的工作文檔特征屬性與流程關(guān)聯(lián),即工作文檔的特征屬性=<類別,文檔名稱,文檔所屬部門,持續(xù)時(shí)間,文檔描述>。
(2)屬性映射:建立工作文檔信息與流程活動(dòng)的特征屬性映射關(guān)系。按照屬性映射關(guān)系[13],映射關(guān)系如圖2。將所提取的工作文檔特征信息傳遞給流程庫,同時(shí)在工作文檔和流程活動(dòng)對(duì)象間創(chuàng)建鏈接對(duì)象,并將信息存入到工作流管理數(shù)據(jù)庫中,在工作流管理系統(tǒng)中注冊(cè)信息文件。
圖2 工作文檔與業(yè)務(wù)流程文檔特征屬性映射關(guān)系
特征項(xiàng)之間的相似程度與它們所包含的信息有關(guān):如果兩個(gè)特征所共同擁有的信息越多,它們?cè)较嗨?;反之,它們的相似度就越小。本文將特征?xiàng)集都表示成了向量空間的形式,因此基于特征的相似度計(jì)算實(shí)質(zhì)就是計(jì)算每?jī)蓚€(gè)特征向量間夾角的余弦值。
定義:假設(shè)工作文檔特征集合d={d1,d2,...,dk}和業(yè)務(wù)流程的節(jié)點(diǎn)特征集合為b={b1,b2,...,bm} ,其中bk和dm代表特征項(xiàng),為了方便配比,選取特征項(xiàng)的時(shí)候,應(yīng)使得m=k,選擇m個(gè)屬性作為比較條件,wbi和wdi為第i個(gè)特征項(xiàng)在流程文檔和工作文檔的權(quán)重系數(shù),記文檔和節(jié)點(diǎn)間的特征相似度為Sim(b ,d ),即:
同時(shí),若要計(jì)算文檔與文檔間的特征相似度:
則業(yè)務(wù)流程與工作文檔間的相似度為各節(jié)點(diǎn)與文檔特征相似度的加權(quán)和:
文檔間進(jìn)行相似度量時(shí),所選擇的各特征屬性所起的作用是不同的,在計(jì)算兩個(gè)產(chǎn)品相似度時(shí)使用重要的特征屬性對(duì)結(jié)果影響較大,而次要的特征屬性對(duì)結(jié)果影響較小,得出的結(jié)果才能更加客觀地反映特征信息的相似程度。
權(quán)重計(jì)算的方法有很多,如層次分析法、DelPhi法、墑權(quán)法、標(biāo)準(zhǔn)差法等。層次分析法[14]就是在建立有序遞階的屬性系統(tǒng)基礎(chǔ)上,通過對(duì)特征屬性之間的相互配對(duì)比較,得到特征中各指標(biāo)的優(yōu)劣評(píng)判,并利用這種評(píng)判結(jié)果來綜合計(jì)算各特征屬性的權(quán)重系數(shù)。確定步驟如下:
(1)抽取部分特征屬性樣本,根據(jù)矩陣標(biāo)度及其定度表,得到特征屬性的判斷矩陣;
(2)計(jì)算判斷矩陣的最大特征向量跟特征矩陣,進(jìn)行一致性檢驗(yàn),若通過,進(jìn)入下一步;反之,調(diào)整矩陣重新計(jì)算;
(3)通過的矩陣進(jìn)行歸一化處理,即可得到權(quán)重指標(biāo)系數(shù)。
根據(jù)對(duì)公司業(yè)務(wù)邏輯和業(yè)務(wù)實(shí)際情況進(jìn)行分析,提出以下流程智能推送模式:
(1)通過對(duì)業(yè)務(wù)流程中各活動(dòng)和工作文檔進(jìn)行預(yù)處理,提取特征項(xiàng)并建立結(jié)構(gòu)化模型;然后以關(guān)聯(lián)的特征項(xiàng)進(jìn)行相似度匹配分析,即計(jì)算Sim(B ,d),將相似度超過某閾值的業(yè)務(wù)流程推送給用戶。
(2)以待流轉(zhuǎn)的工作文檔作為參照對(duì)象,分別與某流程中已存在的項(xiàng)目文檔的特征屬性進(jìn)行匹配,即計(jì)算Sim(d ,d'),若在該流程中相似度高的文檔較少,則提示用戶在推送的流程范圍內(nèi)是否選擇正確。
具體實(shí)現(xiàn)流程推薦技術(shù)的框圖如圖3:
圖3 流程推薦技術(shù)流程圖
以某鐵路電氣公司的工作流管理系統(tǒng)為研究對(duì)象,重點(diǎn)研究了工作文檔在進(jìn)入系統(tǒng)時(shí)選擇流程模板的功能。在對(duì)工作流管理系統(tǒng)的研究過程中,引入業(yè)務(wù)流程管理的思想,即在保證流程定義、流程實(shí)例化與流程監(jiān)控等功能實(shí)現(xiàn)的前提下,通過對(duì)系統(tǒng)進(jìn)行二次開發(fā),如圖4所示,為普通員工自動(dòng)選擇流程模板。
圖4 工作流管理模塊
對(duì)工作文檔的特征進(jìn)行了提取時(shí),為了保證推薦出最佳的流程,合理利用有效資源,提取5個(gè)重要的特征屬性項(xiàng),如圖5所示。普通員工不熟悉公司的相關(guān)流程,但是熟悉負(fù)責(zé)的技術(shù)文檔。我們針對(duì)這一現(xiàn)象,進(jìn)行了工作文檔的特征提取,系統(tǒng)會(huì)自動(dòng)識(shí)別到創(chuàng)建者和文檔名稱,普通員工只需要選擇所屬部門、文檔類型和持續(xù)時(shí)間,對(duì)文檔進(jìn)行相應(yīng)的描述即可。
在運(yùn)行工作流程實(shí)例前時(shí),系統(tǒng)會(huì)根據(jù)之前的工作文檔,自動(dòng)識(shí)別到該工作文檔所對(duì)應(yīng)的工作流程模板,如圖6所示。在新建流程實(shí)例時(shí),我們可以在節(jié)點(diǎn)列表中查看流程的節(jié)點(diǎn),也能查看到流程圖和具體的任務(wù)列表。
本文在分析業(yè)務(wù)流程和項(xiàng)目文檔的屬性基礎(chǔ)上,提出了一種基于特征屬性的流程推薦方法。該方法是對(duì)業(yè)務(wù)流程以及工作文檔的特征屬性進(jìn)行提取與分析,建立相應(yīng)的矩陣空間模型,通過計(jì)算特征向量間的余弦,進(jìn)而得到特征屬性相匹配的流程。同時(shí)在PDM系統(tǒng)的基礎(chǔ)上,運(yùn)用流程推送技術(shù)開發(fā)業(yè)務(wù)流程推薦模塊,當(dāng)工作文檔進(jìn)入到系統(tǒng)中,可以自動(dòng)匹配特征屬性相似性較高的流程,提高流程選擇的準(zhǔn)確性和效率性。該技術(shù)對(duì)于業(yè)務(wù)流程復(fù)雜且繁多的企業(yè)來說,有很大的實(shí)用價(jià)值。未來工作將圍繞如何提高該方法的效率以及完善特征模型展開研究。
圖5 工作文檔特征提取
圖6 新建流程實(shí)例