胡星辰 申映華 吳克宇 程光權(quán) 劉忠
摘 要:模糊規(guī)則模型廣泛應(yīng)用于許多領(lǐng)域,而現(xiàn)有的模糊規(guī)則模型主要使用基于數(shù)值形式的性能評(píng)估指標(biāo),忽略了對(duì)于模糊集合本身的評(píng)價(jià),因此提出了一種模糊規(guī)則模型性能評(píng)估的新方法。該方法可以有效地評(píng)估模糊規(guī)則模型輸出結(jié)果的非數(shù)值(粒度)性質(zhì)。不同于通常使用的數(shù)值型性能指標(biāo)(比如均方誤差(MSE)),該方法通過(guò)信息粒的特征來(lái)表征模型輸出的粒度結(jié)果的質(zhì)量,并將該指標(biāo)使用在模糊模型的性能優(yōu)化中。信息粒性能采用(數(shù)據(jù)的)覆蓋率和(信息粒自身的)特異性?xún)蓚€(gè)基本指標(biāo)得以量化,并通過(guò)使用粒子群優(yōu)化實(shí)現(xiàn)了粒度輸出質(zhì)量(表示為覆蓋率和特異性的乘積)的最大化。此外,該方法還優(yōu)化了模糊聚類(lèi)形成的信息粒的分布。實(shí)驗(yàn)結(jié)果表明該指標(biāo)對(duì)于模糊規(guī)則模型性能評(píng)估的有效性。
關(guān)鍵詞:模糊規(guī)則模型;粒計(jì)算;覆蓋率;特異性;優(yōu)化;模糊聚類(lèi)
中圖分類(lèi)號(hào): TP391
文獻(xiàn)標(biāo)志碼:A
Evaluation method of granular performance indexes for fuzzy rulebased models
HU Xingchen1*, SHEN Yinghua2, WU Keyu1, CHENG Guangquan1, LIU Zhong1
1.Science and Technology on Information Systems Engineering Laboratory, College of Systems Engineering, National University of Defense Technology, Changsha Hunan 410073, China;
2.Department of Electrical and Computer Engineering, University of Alberta, EdmontonT6R 2V4 AB, Canada
Abstract:
Fuzzy rulebased models are widely used in many fields. The existing performance indexes for the models are mainly numeric, which ignore the characteristic of fuzzy sets in the models. Aiming at the problem, a new method of evaluating the performance of fuzzy rulebased models was proposed, to effectively evaluate the nonnumeric (granular) nature of results formed by the fuzzy models. In this method, different from the commonly used numeric performance indexes (such as Mean Squared Error (MSE)), the characteristics of information granules were used to represent the quality of granular results output by the model and this proposed index was applied for the performance optimization of the fuzzy model. The performance of information granule was quantified by two basic indexes, coverage rate (of data) and specificity (of information granule itself), and the maximization of the output quality of granularity (expressed as the product of coverage rate and specificity) was realized with the use of particle swarm optimization. Moreover, the distribution of information granules formed through fuzzy clustering was optimized. The experimental results show the effectiveness of the proposed method on the performance evaluation of fuzzy rulebased models
Key words:
fuzzy rulebased model; granular computing; coverage rate; specificity; optimization; fuzzy clustering
0?引言
粒計(jì)算[1]是一種模擬人類(lèi)層次模糊認(rèn)知方式的智能方法,通過(guò)把復(fù)雜問(wèn)題抽象、劃分,從而更好地分析和解決問(wèn)題。作為粒計(jì)算中常見(jiàn)的一類(lèi)方法,模糊規(guī)則模型是在模糊理論下,使用模糊規(guī)則來(lái)描述系統(tǒng)輸入和輸出之間復(fù)雜的非線性關(guān)系并實(shí)現(xiàn)推理的方法[2]。模糊規(guī)則模型被認(rèn)為是一種用于處理信息粒的且具有良好結(jié)構(gòu)的框架,在此框架下能在一個(gè)系統(tǒng)中同時(shí)處理數(shù)值信息粒和語(yǔ)義信息粒。一般地,針對(duì)回歸問(wèn)題的模糊規(guī)則模型一般由數(shù)值型性能指標(biāo)(本文以“數(shù)值型性能指標(biāo)”指代均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)、平均絕對(duì)誤差(Mean Absolute Error, MAE)、R平方(Rsquared)等這一類(lèi)計(jì)算數(shù)值精度的評(píng)價(jià)指標(biāo))加以評(píng)價(jià)。這意味著,盡管模糊集是整個(gè)模型最為重要的組成部分,但最終模糊規(guī)則模型的輸出仍是數(shù)值的,并需要以此才能進(jìn)行模型性能的評(píng)估。因此,對(duì)于這類(lèi)模型,模糊集的優(yōu)勢(shì)則無(wú)法充分體現(xiàn)出來(lái)。特別是,在某些情況下,模糊規(guī)則模型的數(shù)值性能表現(xiàn)可能低于其他的一些數(shù)值模型,如神經(jīng)網(wǎng)絡(luò)等,這是因?yàn)樵u(píng)估方法并沒(méi)有足夠公平地衡量模糊集的其他特性是導(dǎo)致該現(xiàn)象的重要因素。模糊集構(gòu)成模型的典型案例是曼達(dá)尼(Mamdani)模糊規(guī)則模型[3-4]。該模型以規(guī)則的形式出現(xiàn),其條件和結(jié)論部分分別由輸入和輸出空間中定義的模糊集描述。根據(jù)規(guī)則的結(jié)構(gòu),這種模糊規(guī)則模型表現(xiàn)出顯著的可解釋性,參見(jiàn)文獻(xiàn)[5-6],其模型的設(shè)計(jì)、評(píng)估和分析方案的研究[7-9]也取得了一定進(jìn)展。研究中發(fā)現(xiàn),以數(shù)值型性能指標(biāo)的模型性能評(píng)價(jià)方式只能反映回歸模型的數(shù)值精度,而不能反映出模型的可解釋性和模型輸出的語(yǔ)義內(nèi)涵,因此成為這一評(píng)價(jià)方式的主要缺陷。近年來(lái),特別是在人們普遍認(rèn)識(shí)到智能系統(tǒng)需要以人為中心的重要性的背景下,人們?cè)絹?lái)越關(guān)注粒計(jì)算理論[10-15]并用于系統(tǒng)建模。模糊集作為粒計(jì)算中信息粒的一種重要的形式被廣泛地關(guān)注和研究。模糊建模的主要目標(biāo)不僅是模型的準(zhǔn)確性,而且還需要具有可解釋性和語(yǔ)義導(dǎo)向的透明度。而作為模糊規(guī)則模型的直接輸出,數(shù)值型性能指標(biāo)(如MSE)不能直接用于評(píng)價(jià)模糊集輸出的性能,而模糊集由于去模糊化過(guò)程中的信息損失,也不應(yīng)該簡(jiǎn)單地通過(guò)去模糊化形成的數(shù)值結(jié)果用數(shù)值型性能指標(biāo)進(jìn)行評(píng)價(jià)。這就迫切地需要一種基于粒計(jì)算理論的視角進(jìn)行信息粒的性能評(píng)估。
本文主要聚焦于Mamdani類(lèi)型的模糊規(guī)則模型,首先,研究了如何在數(shù)值數(shù)據(jù)的基礎(chǔ)上構(gòu)建模糊規(guī)則模型,并基于合理的粒度原理(principle of justifiable granularity)[16]設(shè)計(jì)了一個(gè)新的模糊規(guī)則模型性能的粒度評(píng)估指標(biāo);然后,討論了以最大化該性能指標(biāo)為目標(biāo)的模型優(yōu)化方式。本文提供了一種評(píng)估模糊模型的新方法,即通過(guò)更加符合信息粒特征的視角,從模糊集合對(duì)于目標(biāo)信息的涵蓋程度和模糊集合本身的涵蓋范圍兩個(gè)維度對(duì)模糊集合進(jìn)行性能評(píng)估,從而一方面不失對(duì)于模型準(zhǔn)確性的評(píng)價(jià),同時(shí)兼顧了模型的可解釋性和語(yǔ)義內(nèi)涵。
1?基于合理的粒度原則設(shè)計(jì)模糊規(guī)則模型
模糊集被用以表示規(guī)則的條件和結(jié)論部分的信息粒,在模糊規(guī)則模型中起著關(guān)鍵作用。就設(shè)計(jì)而言,模糊集的獲取主要有兩個(gè)途徑:專(zhuān)家經(jīng)驗(yàn)驅(qū)動(dòng)和數(shù)據(jù)知識(shí)驅(qū)動(dòng)。雖然模糊集可以通過(guò)專(zhuān)家經(jīng)驗(yàn)確定(在低維輸入空間的情況下是可行的),但是在高維輸入空間的情況下,數(shù)據(jù)驅(qū)動(dòng)的建模方法更為有效。本文中的模糊規(guī)則模型旨在描述數(shù)據(jù)在輸入空間和輸出空間之間的非線性映射關(guān)系。該模型通常在監(jiān)督學(xué)習(xí)的模式下基于N對(duì)輸入輸出數(shù)據(jù)(xk, targetk)進(jìn)行建模,其中k=1,2,…,N,輸入xk位于輸入空間Rn中,而輸出targetk在輸出空間R中。該模型的規(guī)則結(jié)構(gòu)描述如下:
Rulei: If x isAithenyisBi; i=1, 2, …, c(1)
其中:x是模型的輸入,y是模糊規(guī)則的輸出,Ai 和Bi是分別用于描述輸入和輸出的隸屬度函數(shù)(模糊集)。
一種較為合適和常用的構(gòu)建模糊規(guī)則中模糊集合的方法是使用模糊聚類(lèi),例如模糊C均值(Fuzzy CMeans, FCM)等相關(guān)方法[17-19]已廣泛應(yīng)用于分析輸入和輸出空間,利用聚合提取能夠語(yǔ)義化描述數(shù)據(jù)特征的信息粒,從而構(gòu)建模糊規(guī)則模型。這種方法的優(yōu)勢(shì)在于能夠極大地提高數(shù)據(jù)到規(guī)則建模的可解釋性,為人與模型的交互提供基礎(chǔ)。通過(guò)對(duì)輸入輸出聯(lián)合空間中數(shù)據(jù)的聚類(lèi),可以得到輸入數(shù)據(jù)的聚類(lèi)中心集合{v1, v2, …, vc},以及輸出數(shù)據(jù)的聚類(lèi)中心集合{w1, w2, …, wc}。得到的聚類(lèi)中心形成隸屬度函數(shù),從而建立模糊規(guī)則。模型中的規(guī)則數(shù)量與聚類(lèi)中心的數(shù)量c相同。規(guī)則中的模糊集Ai和Bi由下列隸屬度函數(shù)描述:
Ai(xk)=1∑cj=1‖xk-vi‖‖xk-vj‖2/(m-1)(2)
Bi(yk)=1∑cj=1yk-wiyk-wj2/(m-1)(3)
對(duì)于任意輸入xk,輸出的模糊集B計(jì)算如下:
B(ykxk)=∑ci=1A(xk)Bi(yk) (4)
基于FCM的模糊規(guī)則模型的另一個(gè)優(yōu)點(diǎn)在于非常簡(jiǎn)單和直接。聚類(lèi)中心和模糊集幾乎是自動(dòng)形成的,一旦構(gòu)造了模糊集并指定了去模糊化機(jī)制,就可以認(rèn)為建模過(guò)程已經(jīng)完成。模糊模型可能的優(yōu)化則與FCM方法的主要參數(shù)相關(guān)聯(lián),即聚類(lèi)中心的數(shù)量c和模糊化系數(shù)m。一般認(rèn)為:較大數(shù)量的聚類(lèi)中心意味著更高的模型準(zhǔn)確性,但出于計(jì)算復(fù)雜度的考慮,聚類(lèi)中心的數(shù)量不應(yīng)該太高。模糊化系數(shù)m(m>1)可用于調(diào)節(jié)形成規(guī)則之間的適當(dāng)水平的相互作用: 雖然模糊化系數(shù)m的常用值是2,但該系數(shù)的調(diào)節(jié)有助于模型性能的進(jìn)一步的優(yōu)化; 當(dāng)模糊化系數(shù)值接近1時(shí),隸屬度函數(shù)類(lèi)似于特征函數(shù),在模型方面意味著輸入空間中的各個(gè)區(qū)域相對(duì)獨(dú)立地獲得輸出。隨著模糊化系數(shù)值的增加,規(guī)則傾向于更明顯的相互作用并可能有助于改進(jìn)輸出。
為了強(qiáng)調(diào)對(duì)于xk的輸出,這里將輸出簡(jiǎn)寫(xiě)為Bk。常見(jiàn)性能指標(biāo)以RMSE形式表示:
V=1N∑Nk=1(targetk-Dec(Bk))2(5)
其中Dec(B)表示產(chǎn)生單個(gè)數(shù)值的B的去模糊化運(yùn)算。通常Dec(B)可以考慮任何去模糊化方法,如重心法、最大隸屬度法、模態(tài)值法等,參見(jiàn)文獻(xiàn)[20-21]。然而,所有這些方法的共同特征是:通過(guò)去模糊化得到單個(gè)數(shù)值,因此,去模糊化使得模糊集B信息損失,所傳達(dá)的整體信息也在很大程度上被忽略且未被使用, 需要設(shè)計(jì)一種更加合理的評(píng)價(jià)指標(biāo)。
2?粒度評(píng)價(jià)指標(biāo)及其優(yōu)化
在本章中,重點(diǎn)考慮了模糊模型輸出的粒度特征,設(shè)計(jì)并提出了一個(gè)粒度評(píng)價(jià)指標(biāo),并在此基礎(chǔ)上設(shè)計(jì)了模糊規(guī)則模型的優(yōu)化方法。
2.1?模糊規(guī)則模型性能的量化評(píng)估
為了更加合理地量化模糊集B形成的特征因素,本文采用一種更加有益的量化方法,即粒度的評(píng)估方法,用于衡量模糊集的信息粒輸出。在合理的粒度原理的指導(dǎo)下,文獻(xiàn)中常用覆蓋率(coverage)和特異性(specificity)這兩個(gè)標(biāo)準(zhǔn)來(lái)評(píng)估信息粒的性能[16,22],本文以此為參照來(lái)設(shè)計(jì)模糊集輸出的評(píng)估指標(biāo):
覆蓋率?通過(guò)計(jì)算隸屬度B(targetk)來(lái)表示目標(biāo)targetk在多少程度上被模糊集B覆蓋。隸屬度越高,則覆蓋率越高,說(shuō)明該數(shù)值樣本被模糊集輸出覆蓋的程度越好。覆蓋率性能指標(biāo)能夠充分包含數(shù)值型評(píng)價(jià)指標(biāo)對(duì)于模型誤差的描述,同時(shí)避免了模糊集的信息損失。
特異性?用于計(jì)算該模糊集的獨(dú)特性,是否表現(xiàn)出清晰明確的語(yǔ)義。模型輸出的特異性越高說(shuō)明模糊集的語(yǔ)義越明確。特異性性能指標(biāo)能夠描述模糊集的語(yǔ)義廣度(范圍),從而充分反映模糊集的語(yǔ)義性能,這一點(diǎn)是數(shù)值型評(píng)價(jià)指標(biāo)所不具備的能力。
評(píng)估指標(biāo)的詳細(xì)計(jì)算方法如下:
cov(targetk)=B(targetk|xk)(6)
本文中覆蓋率的意義對(duì)應(yīng)于數(shù)值樣本在模糊集中的隸屬度,而模糊集B的特異性描述的是模糊集的“尺寸”。為便于解釋?zhuān)疚氖紫瓤紤]區(qū)間形式的信息粒[a, b],如圖1(a)所示,其特異性為1-(b-a)/range,其中range=ymax-ymin,ymax和ymin為輸出空間的極值。信息粒的區(qū)間越小,特異性越大。如果a=b,信息粒退化為一個(gè)數(shù)值點(diǎn),其特異性也最大(最大值為1);如果信息粒覆蓋整個(gè)輸出空間,其特異性則最?。ㄗ钚≈禐?)。對(duì)于模糊集,利用截集(αcut)進(jìn)行特異性的計(jì)算,如圖1(b)所示,即:
sp(Bk)=∫αmax01-h(α)rangedα(7)
h(α)=max{y| B-1(y)=α}-
min{y| B-1(y)=α}(8)
其中αmax是最大隸屬度。在實(shí)際運(yùn)算中,式(7)中的積分項(xiàng)可以采用離散化的計(jì)算方法。對(duì)于多峰的隸屬度函數(shù),考慮將多個(gè)截集長(zhǎng)度求和的方法進(jìn)行計(jì)算,如圖1(c)所示,即:
h(α)=length(Ω1) + length(Ω2)+
…+ length(Ωn)(9)
圖2展現(xiàn)了一個(gè)評(píng)估模糊集覆蓋率和特異性的案例。其中曲線表示模糊集,黑點(diǎn)表示目標(biāo)輸出數(shù)據(jù)。
整體的覆蓋率和特異性性能通過(guò)計(jì)算所有數(shù)據(jù)點(diǎn)對(duì)應(yīng)性能指標(biāo)的平均值得到,即:
cov=1N∑Nk=1cov(targetk)(10)
sp=1N∑Nk=1sp(Bk)(11)
為了評(píng)估信息粒(模糊集)輸出的整體質(zhì)量,本文采用覆蓋率和特異性乘積作為全局指標(biāo)。因此,信息粒B的整體性能指標(biāo)如下:
Q=cov·sp(12)
2.2?模糊規(guī)則模型的優(yōu)化
聚類(lèi)能夠揭示數(shù)據(jù)結(jié)構(gòu),然而模糊規(guī)則模型旨在刻畫(huà)輸入和輸出的內(nèi)在關(guān)系?;贔CM的模糊規(guī)則建模雖然可以通過(guò)調(diào)整參數(shù)c和m優(yōu)化模型,但是這樣的調(diào)整也存在一定的片面性。聚類(lèi)過(guò)程是無(wú)方向的,因此不能完全支持有向的模糊規(guī)則建模。此外,F(xiàn)CM對(duì)于聚類(lèi)中心分布的平均效應(yīng)是不可避免的,這意味著模糊規(guī)則建模的輸出范圍可能會(huì)減小,從而產(chǎn)生一些額外的誤差。因此,本文采用了一種通過(guò)移動(dòng)調(diào)整輸入和輸出空間聚類(lèi)中心vi和wi位置的優(yōu)化方法提高模糊規(guī)則模型的性能。
基于群體智能的啟發(fā)式算法可以有效處理復(fù)雜目標(biāo)函數(shù)和大范圍搜索空間的問(wèn)題,非常適合本研究問(wèn)題。其中,粒子群優(yōu)化(Particle Swarm Optimization, PSO)算法[23]由于其良好的效率和可用性,被應(yīng)用于許多類(lèi)似研究[11,24]中。在PSO中,粒子模仿群體活動(dòng)特征在搜索空間中搜索最優(yōu)解。粒子運(yùn)動(dòng)的速度取決于其自身和群整體的經(jīng)驗(yàn)。而速度決定粒子在下一步搜索中的位置。在每個(gè)搜索步驟t,使用以下兩個(gè)公式連續(xù)更新第i個(gè)粒子的速度u和位置l。
ut+1i=ωut+1i+δr1·(pbest-lti)+βr2·(gbest-lti)(13)
lt+1i=lti+ut+1i(14)
其中:pbest表示第i個(gè)粒子目前最優(yōu)的位置;gbest表示所有粒子中的最優(yōu)位置;ω是慣性權(quán)重因子;δ和β分別是個(gè)體認(rèn)知和群體社會(huì)常數(shù);r1和r2是在[0, 1]區(qū)間中均勻分布的隨機(jī)向量,以保證粒子搜索的隨機(jī)性。
優(yōu)化過(guò)程中,將輸入空間和輸出空間的聚類(lèi)中心組合成粒子l,使其在數(shù)據(jù)空間中的每個(gè)特征維度上進(jìn)行移動(dòng)調(diào)整,從而使得目標(biāo)函數(shù)Q達(dá)到最大。為了增加聚類(lèi)中心的適應(yīng)度,這里將每個(gè)維度的搜索空間進(jìn)行適當(dāng)?shù)姆糯螅碵minj(1-γ), maxj (1+γ)],其中γ是一個(gè)正值的擴(kuò)張系數(shù),minj和maxj表示第j維特征上的最大和最小值。
3?實(shí)驗(yàn)與結(jié)果
本章通過(guò)實(shí)驗(yàn)展現(xiàn)了所提優(yōu)化方案的性能,并將獲得的結(jié)果與僅通過(guò)使用FCM方法構(gòu)建的模糊模型獲得的結(jié)果進(jìn)行對(duì)比。在本文中,PSO優(yōu)化參數(shù)設(shè)置如下:種群大小設(shè)置為100,最大迭代次數(shù)設(shè)置為600。多次實(shí)驗(yàn)表明,這樣的參數(shù)設(shè)置足以實(shí)現(xiàn)優(yōu)化過(guò)程的收斂,并且超出這些值不會(huì)導(dǎo)致性能的明顯改善。擴(kuò)張系數(shù)的值設(shè)定為0.5, 慣性權(quán)重因子設(shè)定為1.1,而個(gè)體認(rèn)知和群體社會(huì)常數(shù)的值均等于1.49,這些參數(shù)值的選擇與文獻(xiàn)[25]中一致。
3.1?人工數(shù)據(jù)實(shí)驗(yàn)
本文采用一個(gè)常用的兩輸入非線性函數(shù)[26]:
y=(1+x-0.51+x-12)2(15)
其中:x1和x2是兩個(gè)獨(dú)立分布在笛卡爾積[1, 5]×[1, 5]上的變量。在其中隨機(jī)抽取900(30×30) 組數(shù)據(jù),并劃分為70%的訓(xùn)練樣本和30%的測(cè)試樣本。模糊系數(shù)m設(shè)置為3個(gè)具有典型性的值1.05, 2.0, 3.0。
圖3顯示的是目標(biāo)函數(shù)值Q在優(yōu)化前后的變化,圖4繪制的是不同數(shù)量的聚類(lèi)中心生成的模型得到的覆蓋率和特異性的平均值。兩個(gè)圖中圓形表示聚類(lèi)中心優(yōu)化前的結(jié)果,而菱形則表示優(yōu)化后的結(jié)果。最淺的顏色表示聚類(lèi)中心數(shù)量為2建立的模糊規(guī)則模型(擁有2條模糊規(guī)則),最深的顏色表示聚類(lèi)中心數(shù)量為10建立的模糊規(guī)則模型(擁有10條模糊規(guī)則)。
從實(shí)驗(yàn)結(jié)果中可以看出,通常Q值隨著聚類(lèi)中心的數(shù)量增加而減小??赡艿脑蚍治鋈缦拢弘S著聚類(lèi)中心數(shù)量的增加,Ai和Bi的隸屬度值減小,則Ai和Bi的乘積也減小,因此覆蓋率隨之下降。同時(shí),當(dāng)聚類(lèi)中心數(shù)量增加時(shí),因?yàn)檩斎牒洼敵龅碾`屬函數(shù)越來(lái)越具體,隸屬度函數(shù)B的形狀尺寸縮小,因此,特異性的值增加??傮w而言,覆蓋性對(duì)性能指標(biāo)Q的影響比特異性更強(qiáng),因此Q值隨著聚類(lèi)數(shù)量的增加而減小。聚類(lèi)中心優(yōu)化后,當(dāng)模糊化系數(shù)較?。ㄈ?.05)時(shí),Q值最大。在這種情況下,覆蓋率比特異性有更明顯的提高,這是由這種隸屬度函數(shù)的特征決定的。隸屬度通常從接近0變?yōu)榻咏?,并且聚類(lèi)中心的修改可能會(huì)移動(dòng)隸屬度函數(shù)中心的位置或合并其中一些隸屬度函數(shù),因此很容易將一些目標(biāo)數(shù)據(jù)對(duì)應(yīng)的隸屬度從接近0提高到接近1,使得優(yōu)化后的覆蓋率顯著改善。然而,當(dāng)模糊化系數(shù)較高(比如3.0)時(shí),目標(biāo)數(shù)據(jù)附近的隸屬度較為接近,通過(guò)優(yōu)化對(duì)于隸屬度的改變較少,因此覆蓋率的提高相對(duì)有限??傊捎诟采w率對(duì)總體性能指標(biāo)Q的影響更大,當(dāng)模糊化系數(shù)較小時(shí),模型性能提高的幅度較大。
圖5繪制了聚類(lèi)中心在數(shù)據(jù)空間中優(yōu)化前后的位置變化, 從圖5中可以看出,聚類(lèi)中心在優(yōu)化前后有著明顯的變化。一些調(diào)整后的聚類(lèi)中心彼此靠近甚至趨于重疊。該結(jié)果與上面的結(jié)論一致,即可以通過(guò)重疊聚類(lèi)中心和聚合隸屬函數(shù)來(lái)提高覆蓋率。這一現(xiàn)象支持了在建模過(guò)程中減少聚類(lèi)中心及模糊規(guī)則數(shù)量的可能性,并借以消除一些冗余的規(guī)則。
為進(jìn)一步展示本文中的優(yōu)化方法對(duì)于模糊規(guī)則模型的模糊集輸出的影響,本文選取輸入x1=2.79, x2=3.07為例,繪制了當(dāng)m設(shè)置為2時(shí)的模糊集(隸屬度函數(shù))如圖6所示。如圖所示,目標(biāo)數(shù)據(jù)附近的隸屬度明顯增加,即通過(guò)隸屬度函數(shù)幾何形狀的改變可以獲得更高的隸屬度,
從而可以提高覆蓋率。同時(shí),通過(guò)降低遠(yuǎn)離目標(biāo)數(shù)據(jù)的隸屬度值,有助于提高模糊集的特異性值。
3.2?真實(shí)數(shù)據(jù)實(shí)驗(yàn)
本節(jié)中,本文選取了幾組公開(kāi)的具有實(shí)際背景的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),數(shù)據(jù)集的描述如表1所示,其中Airfoil SelfNoise(以下簡(jiǎn)寫(xiě)為Airfoil)、White wine Quality(以下簡(jiǎn)寫(xiě)為White wine)、Concrete Strength數(shù)據(jù)均來(lái)源于UCI machine learning repository(https://archive.ics.uci.edu/ml/),PM10數(shù)據(jù)來(lái)源于CMU StatLib library(http://lib.stat.cmu.edu/datasets/)。
表格(有表名)
表2中整理了聚類(lèi)中心區(qū)間為[2, 10]的模糊規(guī)則模型優(yōu)化前后的性能指標(biāo)Q。總體上,模型性能的改進(jìn)趨勢(shì)與上一部分的實(shí)驗(yàn)結(jié)果類(lèi)似。一般來(lái)說(shuō),當(dāng)聚類(lèi)中心數(shù)量為2~5時(shí)粒度模糊模型的性能較好,
因?yàn)楫?dāng)聚類(lèi)中心數(shù)量較多時(shí),雖然每個(gè)規(guī)則的隸屬度函數(shù)更加具體但能夠覆蓋的目標(biāo)數(shù)據(jù)也更少,反之亦然。特別地,當(dāng)聚類(lèi)中心的數(shù)量較少時(shí),由于隸屬度函數(shù)范圍較大,覆蓋率的平均值也較高。此外,聚類(lèi)中心也影響特異性的大小,聚類(lèi)中心數(shù)量越少,其隸屬度的特異性就越低。通常覆蓋率對(duì)于整體性能Q的影響更大,因此聚類(lèi)中心的數(shù)量不宜過(guò)多。同時(shí)模糊系數(shù)也影響模糊集的隸屬度函數(shù)形狀,當(dāng)m值很小時(shí),大多數(shù)隸屬度集中于0和1附近,目標(biāo)數(shù)據(jù)附近的隸屬度幾乎為1,因此其覆蓋率也比較高。相反,當(dāng)m值很大時(shí)(m=3),產(chǎn)生的尖峰形狀的隸屬度函數(shù),使得目標(biāo)數(shù)據(jù)附近的隸屬度函數(shù)較低,從而得到較低的總體覆蓋率。通過(guò)模糊規(guī)則模型的優(yōu)化,當(dāng)m=1.05時(shí),覆蓋率指數(shù)顯著增大;相反,當(dāng)m=3時(shí),特異性指數(shù)也有很大提高。總之,通過(guò)改變輸出的隸屬函數(shù)的幾何形狀粒度模糊模型的性能在優(yōu)化后得到了顯著改善。此外通過(guò)修改聚類(lèi)中心的數(shù)量和模糊系數(shù)可以獲得更高的模型性能。
4?結(jié)語(yǔ)
本文提出了一種評(píng)估模糊規(guī)則模型性能的新方法,評(píng)估指標(biāo)為模糊模型的粒度輸出的覆蓋率和特異性,以及由這兩個(gè)性能指標(biāo)乘積形成的復(fù)合指數(shù),并使用所提出的性能指標(biāo)來(lái)優(yōu)化模型。由該復(fù)合指數(shù)引導(dǎo)的模糊模型的設(shè)計(jì)能夠充分反映模糊模型的粒度輸出特征,明顯優(yōu)于一般的數(shù)值評(píng)價(jià)指標(biāo),并有效地實(shí)現(xiàn)模糊規(guī)則模型的優(yōu)化。之后的研究需要進(jìn)一步探討覆蓋率和特異性?xún)煞N指標(biāo)的相互關(guān)系,以及研究更多類(lèi)型的信息粒模型。
參考文獻(xiàn) (References)
[1]PEDRYCZ W. Granular Computing: Analysis and Design of Intelligent Systems[M]. [S. l.]: CRC Press, 2016: 1-6.
[2]ZADEH L A. Fuzzy logic—a personal perspective[J]. Fuzzy Sets and Systems, 2015, 281: 4-20.
[3]MAMDANI E H. Application of fuzzy logic to approximate reasoning using linguistic synthesis[C]// Proceedings of the 6th International Symposium on MultipleValued Logic. Washington, DC: IEEE Computer Society, 1976: 196-202.
[4]ADNAN M R H M, SARKHEYLI A, ZAIN A M, et al. Fuzzy logic for modeling machining process: a review[J]. Artificial Intelligence Review, 2015, 43(3): 345-379.
[5]TPNICKA M, BURDA M, TPNICKOV??L. Fuzzy rule base ensemble generated from data by linguistic associations mining[J]. Fuzzy Sets and Systems, 2016, 285: 140-161.
[6]MANDAL S, JAYARAM B. SISO fuzzy relational inference systems based on fuzzy implications are universal approximators[J]. Fuzzy Sets and Systems, 2015, 277: 1-21.
[7]FAZZOLARI M, ALCALA R, NOJIMA Y, et al. A review of the application of multiobjective evolutionary fuzzy systems: current status and further directions[J]. IEEE Transactions on Fuzzy Systems, 2013, 21(1): 45-65.
[8]WANG D, ZENG X, KEANE J A. A simplified structure evolving method for Mamdani fuzzy system identification and its application to highdimensional problems[J]. Information Sciences, 2013, 220: 110-123.
[9]STPNICKA M, DE BAETS B. Implicationbased models of monotone fuzzy rule bases[J]. Fuzzy Sets and Systems, 2013, 232: 134-155.
[10]PEDRYCZ W, SKOWRON A, KREINOVICH V. Handbook of Granular Computing[M]. New York: John Wiley & Sons, 2008: 97-140.
[11]HU X, PEDRYCZ W, WANG X. Granular fuzzy rulebased models: a study in a comprehensive evaluation and construction of fuzzy models[J]. IEEE Transactions on Fuzzy Systems, 2017, 25(5): 1342-1355.
[12]王國(guó)胤, 李帥, 楊潔. 知識(shí)與數(shù)據(jù)雙向驅(qū)動(dòng)的多粒度認(rèn)知計(jì)算[J]. 西北大學(xué)學(xué)報(bào)(自然科學(xué)版), 2018, 48(4): 488-500.(WANG G Y, LI S, YANG J. A multigranularity cognitive computing model bidirectionally driven by knowledge and data[J]. Journal of Northwest University (Natural Science Edition), 2018, 48(4): 488-500.)
[13]徐怡, 肖鵬. 容差關(guān)系多粒度粗糙集中近似集動(dòng)態(tài)更新方法[J]. 計(jì)算機(jī)應(yīng)用, 2019,39(5): 1247-1251.(XU Y, XIAO P. Dynamic updating method of approximations in multigranulation rough sets based on tolerance relation[J]. Journal of Computer Applications, 2019, 39(5): 1247-1251.)
[14]苗奪謙, 徐菲菲, 姚一豫, 等. 粒計(jì)算的集合論描述[J]. 計(jì)算機(jī)學(xué)報(bào), 2012, 35(2): 351-363.(MIAO D Q, XU F F, YAO Y Y, et al. Settheoretic formulation of granular computing[J]. Chinese Journal of Computers, 2012, 35(2): 351-363.)
[15]HU X, PEDRYCZ W, WANG D. Fuzzy rulebased models with randomized development mechanisms[J]. Fuzzy Sets and Systems, 2019, 361: 71-87.
[16]PEDRYCZ W. The principle of justifiable granularity and an optimization of information granularity allocation as fundamentals of granular computing[J]. Journal of Information Processing Systems, 2011, 7(3): 397-412.
[17]BEZDEK J C, EHRLICH R, FULL W. FCM: the fuzzy cmeans clustering algorithm[J]. Computers & Geosciences, 1984, 10(2/3): 191-203.
[18]HU X, PEDRYCZ W, WU G, et al. Data reconstruction with information granules: an augmented method of fuzzy clustering[J]. Applied Soft Computing, 2017, 55: 523-532.
[19]SHEN Y, PEDRYCZ W, WANG X. Clustering homogeneous granular data: formation and evaluation[J]. IEEE Transactions on Cybernetics, 2018, 49(4): 1-12.
[20]LEE C C. Fuzzy logic in control systems: fuzzy logic controller II[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1990, 20(2): 419-435.
[21]ROSS T J. Fuzzy Logic with Engineering Applications[M]. New York: John Wiley & Sons, 2005: 63-94.
[22]PEDRYCZ W, WANG X. Designing fuzzy sets with the use of the parametric principle of justifiable granularity[J]. IEEE Transactions on Fuzzy Systems, 2016, 24(2): 489-496.
[23]KENNEDY J. Particle swarm optimization[C]// Encyclopedia of Machine Learning. New York: Springer, 2010: 760-766.
[24]HU X, PEDRYCZ W, WANG X. From fuzzy rulebased models to their granular generalizations[J]. KnowledgeBased Systems, 2017, 124: 133-143.
[25]TRELEA I C. The particle swarm optimization algorithm: convergence analysis and parameter selection[J]. Information Processing Letters, 2003, 85(6): 317-325.
[26]PARK H S, PEDRYCZ W, OH S K. Granular neural networks and their development through contextbased clustering and adjustable dimensionality of receptive fields[J]. IEEE Transactions on Neural Networks, 2009, 20(10): 1604-1616.
HU Xingchen, born in 1989, Ph. D., lecturer. His research interests include computational intelligence, granular computing, knowledge discovery, data mining, evolutionary optimization.
SHEN Yinghua, born in 1992, Ph. D. candidate. His research interests include computational intelligence, collaborative clustering, granular computing, decision making.
WU Keyu, born in 1990, Ph. D., lecturer. His research interests include reinforcement learning, stochastic dynamic programming, data mining.
CHENG Guangquan, born in 1981, Ph. D., associate professor. His research interests include complex network, decisionmaking support.
LIU Zhong, born in 1968, Ph. D., professor. His research interests include command and control systems, information systems, artificial intelligence.