李春生,郎 敏,張可佳,周云霞
(東北石油大學 計算機信息與技術學院,黑龍江 大慶 163318)
基于多級框架的不確定知識推理方法研究
李春生,郎 敏,張可佳,周云霞
(東北石油大學 計算機信息與技術學院,黑龍江 大慶 163318)
在知識推理應用于智能化方法的過程中,為解決知識并發(fā)性匹配及可用性等問題,設計了一種多級框架下的不確定性推理方法。該方法通過采用規(guī)則-知識衍生方式、構建產生式模型和設計多級框架結構以有效提高推理精度和準確率,通過引入槽值符合率及隸屬度作為確信因子以及實現(xiàn)知識的并發(fā)性匹配,選定正向推理作為知識推理方式,應用論據累計的Bayes方法消解知識匹配沖突。選用并發(fā)異常樣本對所提出方法的準確率和并發(fā)推理能力進行驗證實驗。實驗結果表明,該算法在準確率和并發(fā)推理能力方面具有較大提升,達到了知識結構設計合理、知識抽象化程度明顯提高的目的,滿足了復雜工業(yè)生產等領域對多并發(fā)推理的精細化要求。油井生產動態(tài)預警應用的實際測試分析表明,所提出的UnMF方法較大程度上提高了預警的準確性,降低了生產異常情況的發(fā)生,對穩(wěn)定高效工業(yè)生產具有重要的意義。
框架系統(tǒng);不確定性推理;FC規(guī)則閉包;反射技術;生產預警
知識推理作為生物信息學的重要理論成果,經過數十年發(fā)展,已經廣泛應用于工業(yè)生產輔助決策、信息預警及工程監(jiān)測各領域,并發(fā)揮著極大的作用,如CM-BOSS系統(tǒng)、PCRC生產預警監(jiān)測系統(tǒng)等[1]。由于信息化的普及,對輔助決策和分析的精細化程度逐步提高,伴隨知識體系的不斷完善,于是合理設計領域輔助決策知識庫結構,提供切實可用的輔助分析方案成為提高智能化應用準確率和有效性的關鍵[2]。不確定推理的提出以框架形式設計多層次知識結構,以置信度和確信因子為基礎實施多向并發(fā)同步推理,突破確定性推理的瓶頸,解決工程領域內知識結構繁冗,復雜度高,并發(fā)處理困難等問題,使多決策樹及并行計算的可行性和高效性更有意義[3]。
領域決策者和專家的經驗及思維方式對于智能化應用至關重要[4]。雖然通過不確定性推理的手段可以很好地進行多因素并發(fā)分析,較好地解決相關領域內的故障認定、風險評價、措施優(yōu)選等問題[5],但是依舊存在以下缺陷:決策性知識具有片段性,基于產生式規(guī)則的不確定推理無法描述知識簇或規(guī)則集合的涵蓋關系,降低了推理結果的可靠性[6];知識描述缺乏抽象性描述,復用性差,導致推理過程運算冗余較大,響應時間較長;工程預警、異常診斷等推理存在故障并發(fā)、復合異常等情況,傾向性和置信度計算不夠準確[7]。
針對上述問題研究基于多級框架的不確定推理方法(UnMF),定義FC規(guī)則閉包,采用規(guī)則-知識衍生方式,構建產生式模型,并設計多級框架結構,引入槽值符合率[8]及隸屬度作為確信因子,完成不確定性知識庫模型(UnM)設計;選定正向推理作為知識推理方式,提出反射定位推理算法,應用論據累計的Bayes方法[9]消解知識匹配沖突,完成基于UnM的UnMF的研究,同時為該方法的確信因子計算提出一套較為科學的算法,以此達到合理設計知識體系結構、提高知識抽象化描述、實現(xiàn)多并發(fā)推理精細化分析的目的。
專家組對于領域內與事務相關的知識界定和分類較為準確,知識的結構具有一定通用性。將知識的表達轉化為抽象的邏輯表示形式是實現(xiàn)高效推理的基礎。
規(guī)則是知識依據相同算法聚類抽象形成的閉包,由規(guī)則主體RC和擴展集RE組成,其中RC算法實體由D-Ag算法庫提供。
以n位專家組成的專家組,領域內存在某事務W,給出與W相關的規(guī)則閉包的一般表述形式為:R={RC,RE|pre(RC)?null}。
1.1規(guī)則主體結構
定義規(guī)則導向函數T(n),給出規(guī)則主體RC的一般表述形式為:
RC={ID,Desc,T(Frame),T(An),T(Value),
T(Model),Ot|T(n)?null}
(1)
其中,Desc表示該規(guī)則的自然語言描述;規(guī)則門類T(Frame)包括環(huán)切型和值切型;T(An)表示規(guī)則映射算法實體;權值T(Value)表示該規(guī)則的隸屬程度,反應該規(guī)則滿足結論的程度;Ot表示規(guī)則結論。
其中,ID反應規(guī)則唯一性,標準表達結構如下:
ID=Str(time)+Str(T_Frame)+str(T_An)
(2)
1.2規(guī)則擴展集結構
規(guī)則的擴展集RE由描述支持規(guī)則推理和擬合運算的參數集合構成。參數集以數據實例形式存儲,并以鏈表形式反應參數間關系。
擴展集包括必備線性因素和非必備線性因素。定義規(guī)則導向函數F(n),給出其一般表示形式:
RE={ID,F(kind),F(order),F(Value),
F(desc),bz}
(3)
其中,ID與RC存在唯一映射關系;F(kind)標注擴展類型,反應擴展集遞推方法;F(order)表示擴展集的指針序列;F(Value)表示規(guī)則槽值;F(desc)表示規(guī)則的自然語言描述。
在一個規(guī)則內,RC與RE的對應關系可描述為:
(4)
其中,U(RE|n)表示n(n>1)維RE子集;對應關系表達式滿足T(RCn)=U(RE|n)。
運算復雜度如下:
(5)
其中,U(RE|i)=exp(T2(RCn))+Min(T(RCn)),所以運算復雜度可表示為:
(6)
1.3知識的表達方式
知識作為規(guī)則的實例化,除繼承FC規(guī)則閉包的全部元素外,包括事務類型Wk,框架對象Fr及用于計算槽值隸屬度的G,給出知識的一般表示形式:
K=R⊕{Wk,Fr,G|pre(k)?null}
(7)
其中,Wk包括反應事務發(fā)生類型及發(fā)生定級;Fr反應該知識所隸屬框架對象;G用于計算框架匹配程度及規(guī)則滿意度,用以進一步計算該知識滿足推理后事件的概率。
UnM采用多級框架-產生式結構??蚣芟到y(tǒng)反應業(yè)務分類情況,產生式系統(tǒng)直接參與知識推理過程。
2.1基于規(guī)則-知識的產生式系統(tǒng)(RK-PS系統(tǒng))結構
RK-PS系統(tǒng)借鑒面向對象的設計思想,即規(guī)則是知識的抽象化表述,知識是規(guī)則的實例。知識將繼承所隸屬規(guī)則的全部屬性和行為。產生式系統(tǒng)由算法庫、基于FC閉包結構的規(guī)則庫和FC結構衍生知識庫三部分組成。其結構如圖1所示。
圖1 產生式系統(tǒng)結構
其中,算法庫用于存儲各類擬合曲線、函數及算法集合,具體包括線性回歸函數,普朗克曲線,高斯方程等;規(guī)則庫采用FC規(guī)則閉包描述單體規(guī)則,并由一組數據實體(數據表)描述;知識庫結構繼承FC規(guī)則閉包,由規(guī)則庫提供知識實例。實例化步驟描述如下:
Step1:選擇規(guī)則R',創(chuàng)建R'的知識實例K';
Step2:加載算法庫D-Ag索引,獲取算法實體;
Step3:有效化知識實例K'(過程賦值);
Step4:建立K'擴展集及映射關系。
完成實例化后,知識實例K'稱為片段知識或不完全知識。由多組知識實例組成的知識集稱為描述型知識。
2.2多級框架結構設計
多級框架由多個單體框架構成。單體框架反應領域內與事務相關的推理描述;基本邏輯結構由槽集Kn、社會性關系Cm及行為信息U(f)組成。給出一般描述形式:
F={Kn,Cm,count(K)}⊕U(f)
(8)
槽集Kn由多個槽構成。單體槽由知識K、槽值Kv、默認槽值Kv'和槽值域Km?{0,1}組成,知識由RK-PS知識庫提供,反應不同斜面的傾向度。
行為信息,也稱守護程序,表示在槽值未指定時指向的修改動作,通常以WHEN CHANGED形式記錄。
多級框架結構的級聯(lián)關系由單體框架的社會性關系Cm描述。Cm反應框架本體與其他框架的子父類情況,標識其在多級框架的位置。定義單體框架Fm,其社會性關系Cm的一般表述形式如下:
Cm={son_Fm,P_Fm,Is_End,F_Level}
(9)
其中,son_Fm表示Fm的子框架,定義標記變量sfn,則反映Fm在多級框架的位置標記方式如下:Son_Frame={begin-sf1-sf2-…-sfn-end}
(10)
P_Fm表示Fm的父類框架,用于校驗子框架son_Fm的表述完整性,由于多級框架采用1-N映射,所以count(P_Fm)=1。
Is_End反應框架終結情況,也是區(qū)分框架實體行為發(fā)生標準。當Is_End=0,則繼續(xù)索引子框架;當Is_End=1,執(zhí)行守護程序WC。
F_Level描述框架的級別位置。F_Level與框架遍歷算法的復雜度o(n)的關系如下:
o(n)=eF_Level-n
(11)
由此可知,通常情況下,F(xiàn)_Level≤4;同時,對于高階高級框架系統(tǒng)可以采用經驗分解法(EMD)或聚類算法拆解,降低其計算復雜度。
不確定性推理方法以UnM知識庫為基礎,引入隸屬度和槽值作為確信因子,采用正向推理方式,分析高幅變化數據,對可能框架實施推理并計算最優(yōu)解。主要推理算法如下所述:
Begin:遞歸多級框架的一級框架(父類框架);
Step1:獲取高幅變化數據實例,遞歸多級框架;
Step2:開始遍歷分析終結節(jié)點框架Fz;
Step3:遍歷框架Fz內槽集T,分析知識前件;
Step4:根據衍生規(guī)則,反向定位父類規(guī)則集R;
Step5:搜索規(guī)則內算法集,通過反射推理方法定位匹配算法;
Step6:通過匹配算法計算,判斷規(guī)則R的符合程度;
Step7:返回知識匹配權重,返回Step3,逐一分析槽集T內的各項知識符合率,計算框架滿意度;
Step8:框架滿意度高于框架閾值,判定W發(fā)生;
Step9:返回Step2;
Result:給出所有超過閾值的框架U(Fz),分析其并發(fā)原因。
最終,返回域U(Fz)即為框架的匹配結果。其中,通過反射推理方法定位匹配算法是實現(xiàn)觸發(fā)式運算實體主動運算的關鍵。
3.1反射推理方法
擬合算法或函數是規(guī)則R前件條件匹配計算的主體內容。通過規(guī)則R內描述的擬合算法,在算法庫中搜索算法實體并實施條件匹配,是知識推理的關鍵步驟。反射推理方法是實現(xiàn)這一關鍵步驟的核心技術。
反射推理方法的作用對象是元數據,本質是一種定位、捕獲和使用元數據的方法。元數據由算法庫內算法實體構成。支持反射推理的組件由輸入接口、定位模塊、反射執(zhí)行模型和校驗模塊組成。
對各組件的行為說明如下。
(1)信息接收:接收目標元數據信息。
(2)定位搜索:搜索并定位目標算法。
(3)反射執(zhí)行:創(chuàng)建反射對象并執(zhí)行目標算法。
(4)加載校驗:勘誤及反饋。
以規(guī)則前件的條件匹配過程為例,反射推理具體執(zhí)行步驟如下:
Begin:基于算法描述獲取目標算法;
Step1:分析并獲取算法的類型信息及參數定義;
Step2:動態(tài)創(chuàng)建反射對象Rf;
Step3:索引內搜索并定位目標算法實體P;
Step4:創(chuàng)建實例P',賦值Rf;
Step5:校驗Rf,執(zhí)行P';
End:返回計算結果。
最終返回結果將作為規(guī)則R的置信度,反射推理方法的知識推理過程存在并發(fā)沖突及不確定性界定問題。并發(fā)沖突可采用論據累積的貝葉斯方法解決[10-11],不確定性界定可通過確信因子計算判定。
3.2論據累積的貝葉斯方法
定義知識k的事實論據pH,隸屬概率G(k),權值V(k→r),建立三者聯(lián)系,如式(12)所示。
pH=G(k)?V(k→r)
(12)
其中,r表示知識k的隸屬規(guī)則。
定義事件E,H分別表示不同知識闡述的事實,H表示假設,事件關系為OR,重寫貝葉斯公式,如下:
p(H|E)=
(13)
其中,p(H)為事件H發(fā)生的先驗概率;p(E|H)為事件H發(fā)生后的論據E概率;p(H)是事件H不發(fā)生的先驗概率;p(E|H)是事件H不發(fā)生時論據E的概率。
由貝葉斯方法衍生,累計計算事實論據E下的非單一假設H1-Hi的發(fā)生概率;或給定多事實論據E1-En,反向推廣假設H的發(fā)生概率。
假設事實H1-Hi、E1-En相互獨立且完備,則H1-Hi|E的情況描述如下:
(14)
H1-Hi|En的情況描述如下:
p(Hi|E1E2…En)=
(15)
由于所有組合條件的概率計算難度較大,所以忽略微小論據差異,并假設條件獨立。式(16)描述了論據累計的貝葉斯方法。
p(Hi|E1E2…En)=
(16)
3.3確信因子計算方法
確信因子通過計算實現(xiàn)不同框架內不確定性界定。設框架內知識集Kf={kf1,kf2,…,kfn},知識可簡化表達如下:
kfn=
框架的槽值符合率包括可信度計算(正度量)及不可信計算(逆度量),假定原始符合率范圍為[0,1]。設貝葉斯結果p'=p(H|E),定義確信因子槽值正度量函數MB(p'),逆度量函數MD(p'),則通過先驗條件概率計算的槽值公式如下所示:
(18)
(19)
將MB(p'),MD(p')綜合為確信因子{cf},如下:
(20)
因此,{cf}可以表達知識的槽值符合率。研究多知識觸發(fā)的{cf},最終給出包含知識全集的框架滿意度:
(21)
3.4校驗算法
在獲取不確定性多級框架滿意度后,需要校驗其可信度。設定單體框架誤差精度λ0,依據距離偏移誤差公式得:
ψps=F(Tps)-λ0×dkps
(22)
其中,ψps表示在槽值點Tps,預期結果F(Tps)與實際值dkps的偏移差。
計算平均誤差率及最大誤差率:
(23)
(24)
以UnMF為基礎,設計措施作業(yè)后生產模型,通過分析計算油田施工后生產數據及相關作業(yè)歷史數據,結合油藏地質學理論知識和生產經驗,獲取并發(fā)性油井生產異常,應用在大慶油田某采油廠地質大隊、作業(yè)大隊等相關單位。
為了縮小地質師和作業(yè)工程師的初次界定范圍,規(guī)避客觀環(huán)境影響,通過與油藏學家及上游生產信息系統(tǒng)(PCEDM)設計師的反復交流和推敲,建立聚驅區(qū)塊生產異常知識庫。知識庫主要實體結構和實例說明如圖2所示。
圖2 知識庫實體結構
4.1參數設置
基于頻域特征,選擇井壁結垢生產異常作為框架實例。井壁結垢指由于聚合物在井壁粘連導致結垢阻塞[12],隸屬于油井(一級框架),井下故障(二級故障),損耗性異常。
框架推理特征選用日產液量,日產油量,含水、動液面(或沉沒度)[13];敏感特征選用油壓、注入濃度、采聚濃度和套管半徑。部分異常界定標準如表1所示。
4.2框架實例描述
根據地質師對南三及薩東區(qū)塊經驗,給出井壁結垢框架表達結構,定義tgbj和bh分別代表該井在完鉆記錄中的套管半徑和厚度;定義槽值隸屬度總和S=100;定義環(huán)比下降70%為異常閾值[14];重點分析注入壓差波動率。
4.3知識表達
定義KM2表示井壁結垢框架,框架內槽可用KM2C1-KM2C6表示。將KM2框架內的知識歸結為表2所示規(guī)則。給出知識傾向度:
U(c)=
(25)
表1 油井生產異常界定標準
表2 規(guī)則及知識表達實例
4.4實驗結果對比
為進行并發(fā)測試,同時選用注入過量異常作為并發(fā)測試條件。給出結垢周期內產量擬合實驗離散點分布,如圖3所示。
圖3 產油量離散點分布圖
篩選某采油廠南三區(qū)西部區(qū)塊108口油井異常井,計算所有井的框架隸屬程度。定義隸屬程度閾值為55%。給出與真實情況的對比及與常規(guī)方法的數據對比分析,如表3所示。
表3 多方法診斷結果數據對比
由表3可得到以下結論:
(1)傳統(tǒng)方法的并發(fā)誤差率較大,處理單異常診斷同樣存在誤差,對于復雜因素的分析能力較差。
(2)UnMF處理并發(fā)時發(fā)生一例誤判,經分析后發(fā)現(xiàn)該井屬于長關井。
(3)真實現(xiàn)場分析過程準確率較高,但成本消耗高,實時性較差。
以UnMF方法為基礎開發(fā)的故障診斷及預警系統(tǒng):三次采油開發(fā)輔助分析系統(tǒng)已經正常工作,因其對專家意見的深度合理分析,較好的自適應性和相對簡單的應用過程受到了應用單位的好評。
為解決知識推理的并發(fā)性問題,提出一種基于多級框架的不確定性推理方法。以FC規(guī)則閉包為基礎,借鑒面向對象設計思想,采用規(guī)則-知識衍生方式構建產生式系統(tǒng),設計多級框架結構,引入多元因子參與置信度計算,完成不確定性知識庫設計;以反射推理方法為基礎實現(xiàn)正向不確定性推理,應用論據累計的Bayes方法和確信因子算法消解并發(fā)沖突,同時提出一種校驗算法驗證推理置信度。最終將該方法用在油田預警過程中,提高了油田預警準確率30%以上,達到了提高知識抽象化程度、實現(xiàn)并發(fā)計算并大幅提升推理速度的目的。
[1] 張可佳.基于混合智能的聚驅區(qū)塊生產動態(tài)預警方法研究[D].大慶:東北石油大學,2016.
[2] 劉立坤.海量文件系統(tǒng)元數據查詢方法與技術[D].北京:清華大學,2011.
[3] Negnevitsky M.人工智能智能系統(tǒng)指南[M].北京:機械工業(yè)出版社,2012.
[4] 吳信東,謝 飛,黃詠明,等.帶通配符One-Off條件的序列模式挖掘[J].軟件學報,2013,24(8):1804-1815.
[5] Lautre N K,Manna A.A study on fault diagnosis and maintenance of CNC-WEDM based on binary relational analysis and expert system[J].International Journal of Advanced Manufacturing Technology,2006,29(5):490-498.
[6] 葛林濤,徐桂瓊.基于模糊C均值聚類有效性的協(xié)同過濾算法[J].計算機技術與發(fā)展,2016,26(1):22-26.
[7] 楊一鳴,潘 嶸,潘嘉林,等.時間序列分類問題的算法比較[J].計算機學報,2007,30(8):1259-1265.
[8] 孫 昊,李盼池.基于量子粒子群優(yōu)化的油水井措施方案優(yōu)選[J].計算機技術與發(fā)展,2016,26(9):78-82.
[9] 王 虎,丁世飛.序列模式挖掘研究與發(fā)展[J].計算機科學,2009,36(12):14-17.
[10] Bi Zhongwei,Zhang Ming,Jin Feng,et al.Study on the prior information quantity and fusion technology applied in inference of rock mechanics parameters with Bayes method[J].Journal of the China Railway Society,2011,33(2):96-100.
[11] Costa P C G D,Laskey K B,Laskey K J.PR-OWL:a Bayesian ontology language for the semantic web[M]//Uncertainty reasoning for the semantic web I.Berlin:Springer,2008:88-107.
[12] 李春生,蘇曉偉,魏 軍,等.基于支持向量機的抽油機井功圖識別研究[J].計算機技術與發(fā)展,2014,24(8):215-218.
[13] 伍曉林,楚艷蘋.大慶原油中酸性及含氮組分對界面張力的影響[J].石油學報:石油加工,2013,29(4):681-686.
[14] 李春生,魏 軍,王 博,等.油田生產動態(tài)預警模型研究[J].計算機技術與發(fā)展,2013,23(4):245-248.
ResearchonMethodofUncertainKnowledgeReasoningBasedonMultilevelFramework
LI Chun-sheng,LANG Min,ZHANG Ke-jia,ZHOU Yun-xia
(College of Computer and Information Technology,Northeast Petroleum University,Daqing 163318,China)
In the process of knowledge reasoning applied to the intelligent method,in order to solve the problem of concurrency matching of knowledge and usability,a method of uncertainty reasoning under multi-level framework is designed.With introduction of rule-knowledge derivation,establishment of the production model and design of multi-level frame structure,its precision and accuracy of reasoning is improved effectively;introducing slot value coincidence rate and membership degree as confirmation factor as well as knowledge concurrency matching,the forward-based reasoning is adopted as knowledge reasoning and the Bayes method applied to eliminate conflict in knowledge matching.Experiments on its accuracy and concurrent reasoning have been conducted with some concurrent abnormal samples,which show that its accuracy and concurrent reasoning is promoted greatly,achieving the purpose for reasonable design of knowledge structure and significant improvement in knowledge abstraction,meeting the refinement requirements of complex industrial production in the field of multi concurrent reasoning.The analysis on results of practical testing early dynamic warning for oil well production show that the proposed UnMF method has improved accuracy of early warning,which can reduce the occurrence of abnormal production and therefore is of great significance for stable and efficient industrial production.
frame system;RUU;FC rule closure;reflection technology;productive warning
2016-09-19
2017-01-05 < class="emphasis_bold">網絡出版時間
時間:2017-07-19
黑龍江省自然科學基金面上項目(F2015020);黑龍江省教育科學技術研究項目(12511010);黑龍江大慶市指導性項目(zd-2016-010);黑龍江省高教學會2016年教育科研課題(16Q117)
李春生(1960-),男,博士,教授,博士生導師,研究方向為人工智能及其應用、模式識別與人工智能。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170719.1108.012.html
TP312
A
1673-629X(2017)11-0052-06
10.3969/j.issn.1673-629X.2017.11.011