国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種改進(jìn)的模糊連接點(diǎn)聚類算法*

2018-07-05 11:50:22孫明珊蘇一丹
關(guān)鍵詞:測(cè)試數(shù)據(jù)集上復(fù)雜度

孫明珊,覃 華,蘇一丹

(廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院,廣西 南寧 530004)

1 引言

模糊聚類是一類建立在模糊數(shù)學(xué)基礎(chǔ)上的數(shù)據(jù)挖掘方法[1],其中較為經(jīng)典的是模糊C均值聚類算法FCM(Fuzzy C-means)[2],它把聚類問(wèn)題轉(zhuǎn)化為對(duì)一個(gè)最優(yōu)化問(wèn)題的求解從而實(shí)現(xiàn)對(duì)數(shù)據(jù)集的模糊劃分,目前FCM已被廣泛應(yīng)用于電力系統(tǒng)[3]、環(huán)境科學(xué)[4]、空間圖像處理[5]、醫(yī)療[6]、電子與信息工程[7,8]等領(lǐng)域。FCM聚類前需要先確定簇的數(shù)目,但很多實(shí)際工程問(wèn)題中,聚類前并不知道數(shù)據(jù)集中簇的個(gè)數(shù),為解決此問(wèn)題,文獻(xiàn)[9,10]用粒子群PSO(Particle Swarm Optimization)產(chǎn)生初始聚類中心,獲取簇的數(shù)目,最后再用FCM進(jìn)行聚類,但PSO本質(zhì)上屬于隨機(jī)搜索算法,每次運(yùn)算得到的簇?cái)?shù)目不盡相同,影響了FCM聚類的可靠性和準(zhǔn)確性。為了解決FCM在自動(dòng)模糊聚類上遇到的難題,Nasibov等人[11 - 15]另辟蹊徑,提出一種新的自動(dòng)模糊聚類算法—模糊連接點(diǎn)FJP(Fuzzy Joint Points)聚類算法,它的基本思想是:對(duì)于給定的數(shù)據(jù)集X,先用距離公式計(jì)算X的模糊相似度矩陣T,再用最大-最小合成法為T構(gòu)造一個(gè)傳遞閉包(Transitive Closure)矩陣T*,最后在T*上用alpha掃描子算法(alpha-scan)進(jìn)行聚類劃分。FJP算法在聚類時(shí)之所以不需要事先知道簇的數(shù)目,是因?yàn)閭鬟f閉包T*具有傳遞性,描述樣本數(shù)據(jù)間是否存在關(guān)聯(lián),存在關(guān)聯(lián)的樣本數(shù)據(jù)在FJP算法中稱為模糊連接點(diǎn),F(xiàn)JP算法利用T*的傳遞性判斷兩個(gè)樣本數(shù)據(jù)是否屬于同一簇。FJP算法有兩個(gè)問(wèn)題:首先,因其采用循環(huán)遍歷相似度矩陣計(jì)算傳遞閉包,時(shí)間復(fù)雜度是O(n3),所以處理大數(shù)據(jù)集時(shí)計(jì)算時(shí)間較長(zhǎng);其次,它的相似度矩陣由歐氏距離獲得,在此基礎(chǔ)上獲得的傳遞閉包會(huì)存在數(shù)據(jù)間關(guān)聯(lián)、依賴失真的問(wèn)題,從而影響FJP算法簇?cái)?shù)目的正確性和聚類的精度[16]。

文獻(xiàn)[17]研究了一種最優(yōu)傳遞閉包生成算法,它采用基于核函數(shù)的橋元素填充法生成傳遞閉包,傳遞閉包失真度小,且時(shí)間復(fù)雜度只有O(n2)。本文提出用該理論為FJP算法生成傳遞閉包,改進(jìn)FJP算法的計(jì)算效率和聚類精度,從而形成一種改進(jìn)的模糊連接點(diǎn)聚類IFJP(Improved Fuzzy Joint Point)算法,所提算法的基本思想是:先用組合核函數(shù)生成數(shù)據(jù)集的模糊相似度矩陣,并用大頂堆存儲(chǔ),初始時(shí)傳遞閉包矩陣為空;然后遍歷傳遞閉包矩陣的空元素,取出堆頂中的橋元素填充到傳遞閉包相應(yīng)的空元素位置上,直至傳遞閉包中所有空元素被橋元素填充完畢。用此方法生成傳遞閉包的計(jì)算時(shí)間復(fù)雜度是O(n2),優(yōu)于傳統(tǒng)FJP算法的O(n3)。測(cè)試數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文所提算法在平均聚類準(zhǔn)確度上較FJP-2008算法[14]提高26.7%,較FJP-2016算法[15]提高25.1%;在平均計(jì)算效率上,本文算法較FJP-2008算法提高44.5%,較FJP-2016算法提高35.5%,說(shuō)明了本文用基于核函數(shù)的橋元素填充法改進(jìn)FJP算法的思路是可行的、有效的。

2 用橋元素填充法生成傳遞閉包

原FJP算法不斷遍歷掃描相似度矩陣T中的每個(gè)元素,并對(duì)每個(gè)元素進(jìn)行最大-最小值合成運(yùn)算,更新相似度矩陣,直至矩陣各個(gè)元素不再變化即得其傳遞閉包T*。為避免不斷遍歷導(dǎo)致計(jì)算時(shí)間長(zhǎng)的問(wèn)題,本文采用橋元素填充法生成傳遞閉包,對(duì)于給定數(shù)據(jù)集X的模糊相似度矩陣T,用大頂堆數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)T,依次遍歷堆頂?shù)臉蛟?,并把它填充到T*的空元素位置上,同時(shí)也避免了原FJP算法中多次最大-最小值合成運(yùn)算,提高了計(jì)算效率。本文所用的傳遞閉包生成子算法如下:

輸入:數(shù)據(jù)集X={x1,x2,x3,…,xn},X的模糊相似度矩陣T。

輸出:T的傳遞包T*。

Step1初始化一個(gè)n×n的空矩陣T*。

Step2為T構(gòu)建大頂堆H。

Step3使得T*(i,i)=1,1≤i≤n。

Step4當(dāng)T*中還存在空元素時(shí),取H中的堆頂元素T(u,v),1≤u≤n且1≤v≤n。

Step4.1若T*(u,v)為空,則T(u,v)為橋元素,I={j|T*(u,j) ≠null}且I″={i|T*(i,v) ≠null},使T*(s,t)=T*(t,s)=T(u,v),s∈I且t∈I〃。

Step4.2刪除H的堆頂元素,用文獻(xiàn)[18]的算法重新排序堆H,產(chǎn)生新的堆頂元素。

上述子算法的一些關(guān)鍵細(xì)節(jié)說(shuō)明如下。

2.1 橋元素填充傳閉包規(guī)則

令P是一個(gè)n1×n1的模糊矩陣,Q是一個(gè)n2×n2的模糊矩陣,E是一個(gè)(n1+n2)×(n1+n2)的模糊矩陣,讓P和Q成為模糊矩陣E左上角和右下角的子矩陣。如式(1)中,b為橋元素,其中0≤b≤min(min(P),min(Q))。若P和Q均是模糊等價(jià)矩陣,則填入橋元素構(gòu)成的矩陣E,因仍然滿足每個(gè)元素均大于或等于與自身同行同列元素對(duì)中較小值序列的最大值,故也是模糊等價(jià)矩陣。由Step 4知,當(dāng)前T*中已填充的元素通過(guò)行列置換構(gòu)成對(duì)角分塊矩陣,兩個(gè)對(duì)角分塊矩陣均是模糊等價(jià)矩陣。當(dāng)前堆頂元素小于T*中所有已填充元素,因此可作為T*已填充元素的橋元素。又因?yàn)榫哂凶畲?最小傳遞性的模糊矩陣即為模糊等價(jià)矩陣,則通過(guò)橋元素的添加進(jìn)行模糊等價(jià)矩陣擴(kuò)展,所得矩陣仍然是模糊等價(jià)矩陣。

(1)

用橋元素填充傳遞閉包的規(guī)則為:獲得堆頂元素在T的行列數(shù)為u、v,I由T*中與堆頂元素同行元素的列下標(biāo)組成,I″由T*中與堆頂元素同列元素的行下標(biāo)組成,若T*中第u行v列不為空,則該堆頂元素不能稱為橋元素,否則依次將I和I″中元素組成行列對(duì)在T*相應(yīng)位置進(jìn)行填充。

2.2 傳遞閉包生成子算法的計(jì)算時(shí)間復(fù)雜度

Step 4步驟是整個(gè)傳遞閉包生成子算法的核心,是一個(gè)循環(huán)嵌套結(jié)構(gòu),它的作用是遍歷T*中的空元素,并從大頂堆H中取出堆頂橋元素填充到T*空元素位置上;如果數(shù)據(jù)集X有n個(gè)數(shù)據(jù)樣本,則傳遞閉包T*中元素總數(shù)為n×n個(gè),遍歷T*中空元素的計(jì)算時(shí)間復(fù)雜度為O(n2)。Step 4的內(nèi)部主要有Step 4.1和Step 4.2計(jì)算步驟,其中Step 4.1的計(jì)算時(shí)間復(fù)雜度是一個(gè)常量O(1),而Step 4.2堆排序的計(jì)算時(shí)間復(fù)雜度也是一個(gè)常量O(1)[18],故整個(gè)傳遞閉包生成子算法的計(jì)算時(shí)間復(fù)雜度為O(n2),較原FJP算法的傳遞閉包子算法的計(jì)算復(fù)雜度O(n3)有明顯改善。所以,本文采用橋元素填充法生成傳遞閉包有利于提高整個(gè)FJP算法的計(jì)算效率,更適用于處理大數(shù)據(jù)集。

3 改進(jìn)的FJP算法流程

本文所提的IFJP算法流程如下:

輸入:數(shù)據(jù)集X={x1,x2,x3,…,xn}。

輸出:聚類劃分{C1,C2,C3,…,Ck}。

Step1參數(shù)初始化,劃分水平初始值α0=max(T*)。

Step2計(jì)算模糊相似度矩陣T。

Step3調(diào)用第2節(jié)子算法生成傳遞閉包T*。

Step4用T*計(jì)算α劃分水平的間距△α。

(2)

Step5當(dāng)α0>0時(shí),α0=α0-△α:

Step5.1S=X;k=1。

Step5.2對(duì)任意元素xi∈S,依次取S中其余所有元素xj,形成數(shù)據(jù)集Ck={xj∈S|T*(i,j)≥α0},S=SCk。

Step5.3若S非空,則k=k+1并轉(zhuǎn)至Step 5.2;否則,轉(zhuǎn)至Step 5.4。

Step5.4得劃分?jǐn)?shù)據(jù)集{C1,C2,C3,…,Ck}和劃分簇?cái)?shù)目k。

Step6出現(xiàn)次數(shù)最多且劃分水平最小的k為劃分簇?cái)?shù),返回結(jié)果{C1,C2,C3,…,Ck}。

上述子算法的一些關(guān)鍵細(xì)節(jié)說(shuō)明如下。

3.1 數(shù)據(jù)樣本劃分水平的設(shè)置

模糊聚類理論中,已知相似度矩陣T的傳遞閉包T*,對(duì)給定的α劃分水平,若T*(i,j)≥α,則認(rèn)為樣本xi和xj可劃分在同一簇內(nèi)。當(dāng)α=1時(shí),表示所有數(shù)據(jù)樣本各自獨(dú)立成一簇;而當(dāng)α=0時(shí),表示所有數(shù)據(jù)樣本只分為一類。為避免遍歷過(guò)多的劃分水平,本文把劃分水平從值域[min(T*),max(T*)],每間隔△α制作一個(gè)分割點(diǎn),得到一組劃分水平{α1,α2,…,αi,…,αz}。將T*在z個(gè)不同的劃分水平下分別聚類,根據(jù)z個(gè)聚類結(jié)果找出出現(xiàn)次數(shù)最多的簇?cái)?shù)目并記為v,將v所對(duì)應(yīng)的劃分水平的最小值記為αmin。T*在αmin劃分水平下的聚類結(jié)果即為最佳聚類結(jié)果,所獲得的簇記為{C1,C2,C3,…,Ck}。

3.2 模糊相似度矩陣的計(jì)算

數(shù)據(jù)樣本集X記為X={x1,x2,x3,…,xn},其中n為數(shù)據(jù)樣本的總數(shù);xi∈Rm,m為樣本的維度。

數(shù)據(jù)集X的模糊相似度矩陣T是一個(gè)n×n的矩陣,矩陣中的元素T(i,j)表示樣本xi和xj的相似程度,常用歐氏距離函數(shù)來(lái)計(jì)算T(i,j)。為提高對(duì)復(fù)雜特征數(shù)據(jù)相似性的判別能力,本文采用文獻(xiàn)[19]支持向量機(jī)高斯核、線性核的組合核函數(shù)來(lái)計(jì)算T(i,j),得到數(shù)據(jù)樣本集X的模糊相似度矩陣T。所用的高斯核函數(shù)為:

(3)

所用的線性核函數(shù)為:

(4)

其中,d(xi,xj)為xi和xj的歐氏距離,dmax為各數(shù)據(jù)樣本間歐氏距離的最大值。由此構(gòu)建X的模糊相似度矩陣T為:

T(i,j)=(1-γ)·K1(xi,xj)+γ·K2(xi,xj)

(5)

其中,γ為核函數(shù)組合系數(shù),用文獻(xiàn)[19]的半定規(guī)劃法計(jì)算。采用核函數(shù)計(jì)算模糊相似度矩陣,有利于提高FJP算法對(duì)非線性數(shù)據(jù)特征的辨識(shí)能力,從而有利于減少傳遞閉包失真[16]。

4 數(shù)值實(shí)驗(yàn)

實(shí)驗(yàn)環(huán)境:CPU為Intel(R) Core(TM) i5-4200M,主頻2.50 GHz,內(nèi)存4 GB;操作系統(tǒng)Windows 8.1-64 bit,用Matlab (R2016a)實(shí)現(xiàn)算法。表1是測(cè)試數(shù)據(jù)集列表,前兩個(gè)是UCI數(shù)據(jù)集,后三個(gè)是人工數(shù)據(jù)集。

Table 1 Datasets in experiments表1 測(cè)試數(shù)據(jù)集列表

五個(gè)測(cè)試數(shù)據(jù)集所用的核函數(shù)參數(shù)如表2示,其中σ是高斯核函數(shù)的寬度,γ是高斯核與線性核的組合系數(shù)。參數(shù)σ和γ用文獻(xiàn)[19]的方法確定。

Table 2 Parameters chosen in kernel functions表2 核函數(shù)的參數(shù)列表

將本文IFJP算法與FJP-2008算法、FJP-2016算法作比較,其中FJP-2008算法采用固定的alpha值作為劃分水平,F(xiàn)JP-2016算法采用動(dòng)態(tài)的alpha值作為劃分水平。用純度(Purity)和標(biāo)準(zhǔn)化互信息NMI(Normalized Mutual Information)兩個(gè)指標(biāo)評(píng)價(jià)各算法的聚類效果[20]。純度(Purity)指標(biāo)的定義:令X的正確聚類簇為Ω={W1,W2,…,Wk},純度計(jì)算公式如下:

(6)

純度值越高,表示算法的聚類準(zhǔn)確率越高。NMI指標(biāo)的計(jì)算方法如下:

(7)

(8)

(9)

NMI值在[0,1],值越大表明算法的聚類效果越好。

表3是五個(gè)測(cè)試數(shù)據(jù)集上四種算法聚類結(jié)果的比較。根據(jù)表3,計(jì)算各算法在五個(gè)測(cè)試數(shù)據(jù)集上Purity指標(biāo)的平均值,IFJP算法是82.3%,F(xiàn)JP-2008算法是55.6%,F(xiàn)JP-2016算法是57.2%。因此,在Purity指標(biāo)平均值上,IFJP算法比FJP-2008算法高出26.7%,比FJP-2016算法高出25.1%;而FJP-2016算法僅比FJP-2008算法高出1.6%,兩者的聚類準(zhǔn)確度相差不大。Purity指標(biāo)上的實(shí)驗(yàn)結(jié)果表明:傳統(tǒng)FJP算法因傳遞閉包失真,包含了較多錯(cuò)誤的關(guān)聯(lián)信息,造成聚類準(zhǔn)確度不高,F(xiàn)JP-2016算法雖然采用了動(dòng)態(tài)alpha值劃分水平但對(duì)改進(jìn)聚類效果不明顯,而本文采用基于核函數(shù)的橋元素填充法計(jì)算傳遞閉包,聚類準(zhǔn)確度均明顯優(yōu)于FJP-2008算法和FJP-2016算法。所以,基于核函數(shù)的橋元素填充法生成傳遞閉包有效地降低了傳遞閉包的失真度。根據(jù)表3,計(jì)算各算法在五個(gè)測(cè)試數(shù)據(jù)集上NMI指標(biāo)的平均值,IFJP算法是82.5%,F(xiàn)JP-2008算法是21.1%,F(xiàn)JP-2016算法是25.1%,由此可知,IFJP的聚類效果比FJP-2008算法和FJP-2016算法高出1倍以上,本文提出的算法使得聚類效果顯著提升。同理,計(jì)算FCM算法Purity指標(biāo)的平均值是79.9%,NMI指標(biāo)的平均值是48.3%,兩指標(biāo)平均值均優(yōu)于FJP-2008算法和FJP-2016算法的。這說(shuō)明傳統(tǒng)的FJP算法雖然引入傳遞閉包實(shí)現(xiàn)了自動(dòng)模糊聚類,但因傳統(tǒng)FJP算法的傳遞閉包計(jì)算方式存在缺陷,導(dǎo)致FJP聚類效果差于FCM,而本文采用基于核函數(shù)的橋元素傳遞閉包計(jì)算方法后,傳遞閉包中的關(guān)聯(lián)信息更準(zhǔn)確,聚類精度提高,故Purity、NMI指標(biāo)均優(yōu)于FCM的。綜合上述實(shí)驗(yàn)結(jié)果分析,本文采用基于核函數(shù)的橋元素填充法計(jì)算傳遞閉包,有效地提高了FJP算法的聚類準(zhǔn)確度,本文改進(jìn)FJP算法聚類效果的思路是有效的、可行的。

Table 3 Comparison of clustering results among the four algorithms表3 四種算法聚類結(jié)果的比較

在表1的五個(gè)測(cè)試數(shù)據(jù)集中,Lineblobs是一個(gè)二維的數(shù)據(jù)集,并且其平面圖形的輪廓較其它測(cè)試集規(guī)整,容易從其聚類圖中觀察聚類效果的好壞,故本文選擇Lineblobs數(shù)據(jù)集制作聚類效果平面圖,如圖1示。從圖1可看出,三種FJP算法引入傳遞閉包后,利用傳遞閉包中的數(shù)據(jù)關(guān)聯(lián)信息較好識(shí)別出扭轉(zhuǎn)型曲線,但FJP-2008算法和FJP-2016算法因存在傳遞閉包失真問(wèn)題,造成此數(shù)據(jù)集的三個(gè)簇僅識(shí)別出兩個(gè),而本文改進(jìn)傳遞閉包計(jì)算方式后,有效降低了傳遞閉包失真,提高了傳遞閉包中數(shù)據(jù)關(guān)聯(lián)信息的準(zhǔn)確度,本文算法準(zhǔn)確地識(shí)別出數(shù)據(jù)集的三個(gè)簇,取得了較好的自動(dòng)聚類效果。因此,本文用橋元素填充法改進(jìn)FJP算法聚類效果是有效的。

表4是四種算法在五個(gè)測(cè)試數(shù)據(jù)集上計(jì)算時(shí)間的比較,時(shí)間單位為秒(s)。在小型數(shù)據(jù)集上,例如Iris和Glass,三種FJP聚類算法的計(jì)算時(shí)間相當(dāng),但在其它三個(gè)大數(shù)據(jù)集上,本文的IFJP算法計(jì)算效率均優(yōu)于FJP-2008算法和FJP-2016算法的。傳統(tǒng)的FJP算法計(jì)算傳遞閉包時(shí),需要反復(fù)掃描模糊相似度矩陣,所以生成傳遞閉包的計(jì)算時(shí)間較長(zhǎng),而本文采用橋元素填充操作取代原FJP算法的反復(fù)矩陣掃描操作,簡(jiǎn)單而高效,提高了FJP算法的計(jì)算效率,實(shí)驗(yàn)結(jié)果說(shuō)明本文改進(jìn)FJP算法的思路是有效的。

Table 4 Comparison of computing time of the three algorithms表4 三種算法計(jì)算時(shí)間的比較

對(duì)五個(gè)測(cè)試數(shù)據(jù)集進(jìn)行復(fù)制,分別產(chǎn)生2倍(2×)、4倍(4×)、8倍(8×)、16倍(16×)的大型數(shù)據(jù)集,IFJP、FJP-2008、FJP-2016三種FJP算法在這些大型數(shù)據(jù)集上的計(jì)算時(shí)間隨數(shù)據(jù)集規(guī)模變化的趨勢(shì)如圖1示。由圖1可知:三種FJP算法的計(jì)算復(fù)雜度均具有多項(xiàng)式時(shí)間特性,前面的理論分析中曾指出:傳統(tǒng)FJP算法的計(jì)算復(fù)雜度是O(n3),本文所提IFJP算法的計(jì)算復(fù)雜度是O(n2),均為多項(xiàng)式的時(shí)間復(fù)雜度,理論分析與實(shí)驗(yàn)結(jié)果符合。當(dāng)數(shù)據(jù)集呈指數(shù)級(jí)(2n)增長(zhǎng)時(shí),本文算法的時(shí)間增加幅度明顯小于傳統(tǒng)FJP算法的,并且數(shù)據(jù)集規(guī)模越大,本文算法的計(jì)算效率優(yōu)勢(shì)越明顯。圖2的實(shí)驗(yàn)結(jié)果再次驗(yàn)證了本文橋元素填充法生成傳遞閉包的計(jì)算時(shí)間復(fù)雜度優(yōu)于傳統(tǒng)FJP算法的循環(huán)遍歷相似度矩陣的最大-最小模糊關(guān)系合成閉包法。

Figure 1 Running time vs.data set cardinality of three FJP algorithms圖1 三種FJP算法計(jì)算時(shí)間隨數(shù)據(jù)集規(guī)模變化的趨勢(shì)

綜合上述實(shí)驗(yàn)結(jié)果分析可知:本文采用橋元素填充法計(jì)算FJP算法的傳遞閉包,有效地提高了FJP算法的計(jì)算效率和聚類精度,本文改進(jìn)FJP算法的思路是有效的、可行的。

圖2是在五個(gè)測(cè)試數(shù)據(jù)集上,α劃分水平與簇?cái)?shù)目之間的關(guān)系,它反映了FJP算法的聚類特性。從圖2可看出,當(dāng)劃分水平從1逐次減少時(shí),簇的數(shù)目也逐漸減少并趨向穩(wěn)定,從中可找出正確的簇?cái)?shù)目。

以Lineblobs數(shù)據(jù)集為例,當(dāng)劃分水平α=1時(shí),簇?cái)?shù)目與樣本個(gè)數(shù)相當(dāng);減少α水平,聚類產(chǎn)生的簇?cái)?shù)目也隨之減少。當(dāng)α劃分水平小于0.808 3時(shí),簇?cái)?shù)目維持1不變,剔除簇?cái)?shù)為1的結(jié)果,出現(xiàn)劃分次數(shù)最多的簇?cái)?shù)為3,再取所有劃分結(jié)果為3個(gè)簇的α劃分水平中最小值作為αmin,以αmin對(duì)應(yīng)的聚類結(jié)果此作為IFJP算法的最終聚類結(jié)果。

Figure 2 Relationship between α and the cluster number on datasets圖2 各數(shù)據(jù)集上α劃分水平與簇?cái)?shù)目的關(guān)系

5 結(jié)束語(yǔ)

傳統(tǒng)FJP算法生成的傳遞閉包存在失真問(wèn)題,導(dǎo)致傳遞閉包中包含較多錯(cuò)誤的關(guān)聯(lián)信息,造成算法計(jì)算時(shí)間復(fù)雜度較高且聚類效果不理想。本文提出基于核函數(shù)的橋元素填充法計(jì)算傳遞閉包,能有效地提高傳遞閉包的計(jì)算效率,并且降低傳遞閉包的失真,提高聚類效果。在UCI數(shù)據(jù)集和人工數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,本文算法的計(jì)算效率和聚類效果均優(yōu)于傳統(tǒng)FJP算法的,本文改進(jìn)FJP算法的思路是有效的、可行的。

[1] Zadeh L.Fuzzy sets[J].Information and Control,1965,8(3):338-353.

[2] Bezdek J C.Numberical taxonomy with fuzzy sets[J].Journal of Mathematical Biology,1974,1(1):57-71.

[3] Zhao Jin-shuai, Qiu Xiao-yan,Ma Jing-man,et al.Multi-objective optimization method of microgrid based on fuzzy clustering analysis and model recognition[J].Power System Technology,2016,40(8):2316-2323.(in Chinese)

[4] Xu Heng-peng,Li Yue,Shi Guo-liang,et al.The fitting component selection model of PM2.5 based on fuzzy clustering[J].China Environmental Science,2016,36(1):12-17.(in Chinese)

[5] Li Yang,Pang Yong-jie,Sheng Ming-wei.Side-scan sonar image segmentation via fuzzy clustering with spatial constrains[J].Journal of Image and Graphics,2015,20(7):865-870.(in Chinese)

[6] Haldar N A H,Khan F A,Ali A,et al.Arrhythmia classification using Mahalanobis distance based improved Fuzzy C-means clustering for mobile health monitoring systems[J].Neurocomputing,2017,220:221-235.

[7] Modava M,Akbarizadeh G.Coastline extraction from SAR images using spatial fuzzy clustering and the active contour method[J].International Journal of Remote Sensing,2017,38(2):355-370.

[8] Wang Ya-fei,Zhao Fei-fei,Chen Pei-pei.A framework of spatiotemporal fuzzy clustering for land-cover change detection using SAR time series[J].International Journal of Remote Sensing,2017,38(2):450-466.

[9] Thong P H, Son L H. A novel automatic picture fuzzy clustering method based on particle swarm optimization and picture composite cardinality[J].Knowledge-Based Systems,2016,109:48-60.

[10] Liu Han-bing,Wang Xian-qiang,Jiao Yu-bo.Damage identification for irregular-shaped bridge based on fuzzy C-means clustering improved by particle swarm optimization algorithm[J].Journal of Vibroengineering,2016,18(4):2149-2166.

[11] Nasibov E N,Ulutagay G.A new approach to clustering problem using the fuzzy joint points method[J].Automatic Control and Computer Sciences,2005,39(6):8-17.

[12] Nasibov E N,Ulutagay G.On the fuzzy joint points method for fuzzy clustering problem[J].Automatic Control and Computer Sciences,2006,40(5):33-44.

[13] Nasibov E N,Ulutagay G.A new unsupervised approach for fuzzy clustering [J].Fuzzy Sets and Systems,2007,158(19):2118-2133.

[14] Nasibov E N.A robust algorithm for solution of the fuzzy clustering problem on the basis of the fuzzy joint points method [J].Cybernetics and Systems Analysis,2008,44(1):7-17.

[15] Nasibov E N,Atilgan C.A note on fuzzy joint points clustering methods for large datasets[J].IEEE Transactions on Fuzzy Systems,2016,24(6):1648-1653.

[16] Zhu Jian-ying.Some common key problems and their dealing methods in the application of fuzzy mathematical methods[J].Fuzzy Systems and Mathematics,1992,6(2):57-63.(in Chinese)

[17] Lee H S.An optimal algorithm for computing the max-min transitive closure of a fuzzy similarity matrix[J].Fuzzy Sets and Systems,2001,123(1):129-136.

[18] Che Xiang-jiu, Liang Sen. Improved algorithm of SPIHT based on max-heap tree[J].Journal of Jilin University(Engineering and Technology Edition),2016,46(3):865-869.(in Chinese)

[19] Zhang Min, Qin Hua, Su Yi-dan. Reseach of semi-definite programming SVM model[J].Computer Engineering and Design,2011,32(5):1785-1788.(in Chinese)

[20] Christopher D M,Prabhakar R,Hinrich S.Introduction to information retrieval[J].Journal of the American Society for Information Science & Technology,2008,2(2):96-1.

附中文參考文獻(xiàn):

[3] 趙勁帥,邱曉燕,馬菁曼,等.基于模糊聚類分析與模型識(shí)別的微電網(wǎng)多目標(biāo)優(yōu)化方法[J].電網(wǎng)技術(shù),2016,40(8):2316-2323.

[4] 徐恒鵬,李岳,史國(guó)良,等.基于模糊聚類的PM2.5擬合組分選擇模型的研究[J].中國(guó)環(huán)境科學(xué),2016,36(1):12-17.

[5] 李陽(yáng),龐永杰,盛明偉.結(jié)合空間信息的模糊聚類側(cè)掃聲納圖像分割[J].中國(guó)圖形圖像學(xué)報(bào),2015,20(7):865-870.

[16] 朱劍英.應(yīng)用模糊數(shù)學(xué)方法的若干關(guān)鍵問(wèn)題及處理方法[J].模糊系統(tǒng)與數(shù)學(xué),1992,6(2):57-63.

[18] 車翔玖,梁森.一種基于大頂堆的SPIHT改進(jìn)算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2016,46(3):865-869.

[19] 張敏,覃華,蘇一丹.半定規(guī)劃支持向量機(jī)模型的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(5):1785-1788.

猜你喜歡
測(cè)試數(shù)據(jù)集上復(fù)雜度
Cookie-Cutter集上的Gibbs測(cè)度
鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
一種低復(fù)雜度的慣性/GNSS矢量深組合方法
測(cè)試數(shù)據(jù)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
復(fù)扇形指標(biāo)集上的分布混沌
求圖上廣探樹的時(shí)間復(fù)雜度
基于自適應(yīng)粒子群優(yōu)化算法的測(cè)試數(shù)據(jù)擴(kuò)增方法
空間co-location挖掘模式在學(xué)生體能測(cè)試數(shù)據(jù)中的應(yīng)用
體育科技(2016年2期)2016-02-28 17:06:21
某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)
出口技術(shù)復(fù)雜度研究回顧與評(píng)述
永兴县| 崇信县| 屯留县| 庆元县| 静乐县| 平顶山市| 元江| 望江县| 衡山县| 定日县| 乳源| 汾阳市| 石台县| 永丰县| 马鞍山市| 浦江县| 吉林省| 金坛市| 阿巴嘎旗| 龙游县| 铁岭市| 赤城县| 平乐县| 金坛市| 印江| 筠连县| 绥棱县| 杂多县| 清水河县| 红原县| 宝山区| 宜川县| 淮安市| 永定县| 德兴市| 邛崃市| 岑巩县| 新营市| 开阳县| 年辖:市辖区| 喀喇沁旗|