王婷琪 張振宇 林 杰
(同濟(jì)大學(xué) 經(jīng)濟(jì)與管理學(xué)院,上海 200092)
執(zhí)行難問題嚴(yán)重影響著社會的和諧穩(wěn)定、法律的公平公正、司法的權(quán)威性,被社會廣泛關(guān)注,最高人民法院采取了一系列措施并取得一定的效果。黃松有對執(zhí)行難的涵義進(jìn)行闡述,分析了其主要表現(xiàn)形式以及形成原因,并提出一系列的解決措施。魏建文等認(rèn)為法律權(quán)威性的缺失是司法執(zhí)行難的本質(zhì)原因,因此增強(qiáng)社會和公眾的法律信仰才是解決問題的根本。潘溪指出,引入第三方評估來分析執(zhí)行難問題的原因并提出科學(xué)的解決方案,對解決執(zhí)行難問題有一定的幫助。張榕認(rèn)為執(zhí)行難主要是因?yàn)樾庞弥贫鹊娜笔?,完善信用懲戒制度、引入法律服?wù)中介機(jī)構(gòu)才能化解執(zhí)行難問題。
現(xiàn)有的研究主要強(qiáng)調(diào)執(zhí)行難的原因及解決問題的措施等,對被執(zhí)行人的特征分析較少,尤其是自然人,本文研究主要針對案件執(zhí)行中有財產(chǎn)隱匿人為自然人的情況進(jìn)行討論。財產(chǎn)隱匿人作為執(zhí)行難問題的主體,根據(jù)財產(chǎn)隱匿人的特征對財產(chǎn)隱匿人進(jìn)行聚類,對于尋找財產(chǎn)隱匿人的主要特征以及執(zhí)行難問題的解決具有非常重要的意義。
在實(shí)際執(zhí)行程序中,被執(zhí)行人特征的描述主要通過法官、執(zhí)行員等專業(yè)人士定性分析,通常采用模糊語言的方式對被執(zhí)行人的特征進(jìn)行描述。描述被執(zhí)行人的特征時,考慮到是由多名法官、執(zhí)行員等專業(yè)人士對某一特征評價,通常很難得出一致的意見并出現(xiàn)多個可能語言術(shù)語,為避免評價信息的丟失,Rodriguez等引入猶豫模糊語言術(shù)語集的概念,給解決此類問題提供了較好的思路。目前,學(xué)者們針對猶豫模糊語言術(shù)語集展開了大量的研究,提出距離測度和相似性測度、相關(guān)系數(shù)理論和集結(jié)函數(shù),并提出猶豫模糊語言TOPSIS、TODIM、VIKOR等多屬性決策方法。
聚類算法作為一種非監(jiān)督模式識別方法,主要根據(jù)數(shù)據(jù)的類內(nèi)相似性大和類外相似性小的原則,將一組待聚類對象聚集分成幾類的過程。目前被廣泛應(yīng)用在模糊控制、醫(yī)療診斷、信息檢索等領(lǐng)域。基本聚類算法主要包括基于分層的聚類、基于劃分的聚類和基于密度的聚類方法等。作為一種重要的聚類方法,基于劃分的聚類方法需要先輸入類別個數(shù),主要代表有K-均值算法等。K-均值算法的基本思想是,通過迭代逐次移動各類別的中心,直到得到最好的聚類結(jié)果為止。在算法構(gòu)造過程中,初始類別和類中心的確定直接影響著K-均值算法的迭代效率,目前并沒有通用的方法,只能假設(shè)而定。
目前,針對猶豫模糊信息的聚類算法有一定的研究。Zhang和Xu基于圖論的理想特性,提出一種猶豫模糊最小生成樹聚類算法;Chen和Xu提出一種新的猶豫模糊集關(guān)聯(lián)測度,建立關(guān)聯(lián)系數(shù)矩陣不斷迭代從而得到等價矩陣,并基于-截矩陣進(jìn)行分類;Chen和Xu將層次聚類的結(jié)果作為K-均值聚類的初始類別和類中心,從而使K-均值迭代效率大大提高;Zhang和Xu將凝聚式層次聚類算法拓展到猶豫模糊信息中,并將其拓展到區(qū)間猶豫模糊集上,通過實(shí)驗(yàn)驗(yàn)證算法的有效性。雖然猶豫模糊信息聚類算法的研究在國內(nèi)外有一定發(fā)展,但對猶豫模糊語言信息聚類算法的研究很少。
基于此,本文將提出一種猶豫模糊語言層次K-均值聚類算法。首先對猶豫模糊語言集的表達(dá)方式、距離測度函數(shù)以及集成函數(shù)進(jìn)行闡述;其次將猶豫模糊語言集拓展到K-均值聚類算法中,利用層次聚類的結(jié)果作為K-均值聚類的初始類別和類中心,提出一種猶豫模糊語言層次K-均值聚類算法;最后通過對有財產(chǎn)隱匿行為人的聚類實(shí)例驗(yàn)證了算法可行性。
定義1設(shè)S={s0,s1,K,sg}為語言術(shù)語集,猶豫模糊語言集HS是S中連續(xù)的語言術(shù)語項(xiàng)所構(gòu)成的有序子集。
定義2設(shè)xi∈X,且i=1,2,K,N。S={s0,s1,K,sg}是語言術(shù)語集,則X上的一個猶豫模糊語言術(shù)語集的數(shù)學(xué)形式為
其中,hs(xi):X→S是定義在集合X上的函數(shù),對任意的元素xi∈X,都有唯一hs(xi)的與其對應(yīng)。hs(xi)={sδl(xi)|sδl(xi)∈S,l=1,2,K,L(xi)},δl∈{0,1,K,g}為語言術(shù)語sδl(xi)的下標(biāo),L(xi)表示hs(xi)的語言術(shù)語個數(shù)。為了方便,稱hs(xi)為猶豫模糊語言數(shù),這樣猶豫模糊語言術(shù)語集HS就是所有猶豫模糊語言數(shù)的集合。hs(xi),sδl(xi)和L(xi)可簡寫為hiS,siδl,Li。
定義3設(shè)HSM(xi)={sδjM(xi)|sδjM(xi)∈S}和HSN(xi)={sδjN(xi)|sδjN(xi)∈S}是定義在屬性集合X=(x1,x2,L,xn)上的兩個猶豫模糊語言集,其中xi表示第i個特征屬性。設(shè)ω=(ω1,ω2,L,ωn)T為xi的權(quán)重向量,且滿足的距離測度滿足下面的性質(zhì):
(1)0≤d(HSM,HSN)≤1;
(2)d(HSM,HSN)=0,當(dāng)且僅當(dāng)HSM=HSN;
(3)d(HSM,HSN)=d(HSN,HSM)。
根據(jù)海明距離和歐氏距離,猶豫模糊語言加權(quán)海明距離和歐式距離可定義為
特別地,當(dāng)ω=(1/n,1/n,L,1/n)T,則公式(1)和(2)退化為猶豫模糊標(biāo)準(zhǔn)海明距離和歐式距離
其中δMj(xi)和δNj(xi)分別為猶豫模糊語言數(shù)HMS(xi)和HNS(xi)中第j大的元素的下標(biāo),LMi和LNi分別為猶豫模糊語言數(shù)HMS(xi)和HNS(xi)中所含的元素個數(shù),Li=max(LMi,LNi)。當(dāng)元素個數(shù)不同時,可以采用在元素較少的集合中添加元素的方法,態(tài)度悲觀者可在集合中添加最小元素,態(tài)度樂觀者添加最大的元素。
定義4對任意三個猶豫模糊語言數(shù)H,H1和H2,λ∈[0,1]運(yùn)算規(guī)則如下所示:
(1)HC=USα∈H{Sg-α};
(2)H1UH2=USα∈H1,Sβ∈H2{Sα∨β};
(3)H1IH2=USα∈H1,Sβ∈H2{Sα∧β};
(4)Hλ=USα∈H{(Sα)λ}=USα∈H{Sαλ);
(5)λH=USα∈H{λSα}=USα∈H{Sλα);
(6)H1⊕H2=USα∈H1,Sβ∈H2{Sα⊕Sβ}=USα∈H1,Sβ∈H2{Sα+β};
(7)H1?H2=USα∈H1,Sβ∈H2{Sα?Sβ}=USα∈H1,Sβ∈H2{Sαβ}。
性質(zhì)對任意三個猶豫模糊語言數(shù)H,H1和H2,都有以下性質(zhì):
(1)H1⊕H2=H2⊕H1;
(2)H1?H2=H2?H1;
(3)λ(H1⊕H2)=λH1⊕λH2,λ>0;
(4)(H1?H2)λ=Hλ1?Hλ2,λ>0。
定義5設(shè)Hi(i=1,2,L,n)為一組猶豫模糊語言集,則它們的加權(quán)平均函數(shù)可由下式給出:
基于猶豫模糊語言集的運(yùn)算法則,公式可以進(jìn)一步表示為
特別地,當(dāng)ω=(1/n,1/n,L,1/n)T,則公式(5)和(6)退化為
K-均值算法作為最常見的基于劃分的聚類算法之一,首先需給定聚類的類別數(shù),并給定初始類別的劃分,計算初始類別的類中心。在傳統(tǒng)的K-均值算法中,通常采用隨機(jī)選擇的方式確定初始類別,并通過不斷迭代尋找最優(yōu)的聚類類別。顯而易見,隨機(jī)選擇初始類別的方式將增加最終分類方案的迭代次數(shù)。針對這一問題,國內(nèi)外學(xué)者對K-均值算法的初始類別確定方法做了大量研究。研究表明,層次結(jié)構(gòu)在選取初始化類別過程中具有較好的效果,尤其是將層次凝聚聚類的結(jié)果作為K-均值聚類算法的初始類別,迭代效率遠(yuǎn)遠(yuǎn)大于隨機(jī)選擇。因此,本文將這一思想結(jié)合猶豫模糊語言環(huán)境,提出猶豫模糊語言層次K-均值聚類算法,主要步驟包括以下兩部分:
第一部分 層次凝聚聚類
設(shè)X=(x1,x2,L,xn)為屬性集合,ω=(ω1,ω2,L,ωn)T為xi的權(quán)重向量,且滿足Aj(j=1,2,K,n)是一組由m個猶豫模糊語言數(shù)構(gòu)成的集合,函數(shù)定義為
層次凝聚聚類的思路是,首先將n個猶豫模糊語言集各為一類,其次計算各類之間的距離測度,參照猶豫模糊語言加權(quán)海明距離(公式(1))或猶豫模糊語言加權(quán)歐幾里距離(公式(2)),并將距離最短的兩類合并為一類,根據(jù)公式(8)計算新的類中心,通過不斷的迭代直至將所有目標(biāo)聚成一類為止。
第二部分 K-均值聚類
步驟1給定聚類的類別數(shù)。
步驟2根據(jù)類別數(shù)將第一部分層次聚類的結(jié)果作為初始類,并根據(jù)公式(8)計算初始類中心。
步驟3根據(jù)公式(1)或(2)計算猶豫模糊語言集與各類中心之間的距離,將前者并入與其距離最近的一類。
步驟4根據(jù)步驟3的聚類結(jié)果更新類中心,若類中心穩(wěn)定,迭代停止;若類中心不穩(wěn)定,重復(fù)步驟2和步驟3,直到類中心穩(wěn)定為止。
本文以財產(chǎn)隱匿人聚類為例,假定對于特征屬性的語言標(biāo)度S={s0,s1,s2,s3,s4,s5,s6},分別表示非常差、比較差、差、一般、好、很好、非常好。現(xiàn)有7個被執(zhí)行人,分別從收入水平(C1)、語言風(fēng)格(C2)、交易行為(C3)、消費(fèi)習(xí)慣(C4)進(jìn)行評價,各特征屬性的描述如表1所示。假定各特征屬性的權(quán)重為ω=(0.12,0.23,0.37,0.28)T,決策矩陣如表2所示。例如,被執(zhí)行人A1在屬性C1下猶豫模糊語言數(shù)為{s5,s6},說明專家們的意見主要集中在很好和非常好之間。
表1 被執(zhí)行人(自然人)特征屬性
表2 猶豫模糊語言決策矩陣
第一部分 層次凝聚聚類
步驟1將每個猶豫模糊語言集Aj(j=1,2,3,4,5)看作一個獨(dú)立的類:{A1},{A2},{A3},{A4},{A5}。
步驟2根據(jù)公式(1)計算各類之間的猶豫模糊語言加權(quán)海明距離,距離計算過程中按態(tài)度悲觀添加元素。
A3和A5距離最近,可將A3和A5兩類合并,這樣Aj(j=1,2,3,4,5)被分為下面四類:{A1},{A2},{A3}和{A3,A5}。
步驟3根據(jù)公式(8)計算新的類中心:
計算每一類與其他三類的猶豫模糊語言加權(quán)海明距離:
A4和c{A3,A5}距離最近,則猶豫模糊語言集Aj(j=1,2,3,4,5)被分為下面三類:{A1},{A5}和{A3,A4,A5}。
步驟4根據(jù)公式(8)計算每類中心
計算每一類與其他兩類的距離:
A1和A2距離最近,則猶豫模糊語言集Aj(j=1,2,3,4,5)被分為下面兩類:{A1,A2}和{A3,A4,A5}。
最后將兩類合并為一類。
第二部分 K-均值聚類
為了執(zhí)行K-均值聚類,這里選擇層次聚類的結(jié)果作為初始類別。因?yàn)镵=1和K=5時,結(jié)果是唯一的,所以用K=2,3,4展示我們的算法:
(1)K=4:用層次聚類的結(jié)果{A1},{A2},{A4}和{A3,A5}作為初始類,計算類中心及每類和中心之間的距離:
基于上述計算的距離可以得到分類{A1},{A2},{A4}和{A3,A5}。因?yàn)槊款惖闹行牟蛔儯缘V埂?/p>
(2)K=3:將{A1},{A2}和{A3,A4,A5}作為初始類,對應(yīng)結(jié)果是:
基于上述計算的距離可得到分類{A1},{A2},{A4}和{A3,A5},且每類的中心不變,迭代停止。
(3)K=2:將{A1,A2}和{A3,A4,A5}作為初始類,對應(yīng)結(jié)果是:
顯然,每類的中心不再改變,迭代計算停止,因此分類結(jié)果為{A1,A2}和{A2,A4,A5}。
在此例中,利用層次聚類的結(jié)果作為K-均值聚類的初始類別,相對隨機(jī)選擇初始類別來說,可以提高聚類效率、減少迭代次數(shù),快速達(dá)到理想聚類結(jié)果。
實(shí)際生活中,對于事物特征屬性的評價通常采用模糊語言。猶豫模糊語言較好地貼合評價信息的不確定性和決策者的猶豫模糊性。本文基于猶豫模糊語言的信息表達(dá)優(yōu)勢和層次K-均值聚類算法的思想,提出一種猶豫模糊語言層次K-均值聚類算法。首先,構(gòu)造猶豫模糊語言決策矩陣進(jìn)行層次凝聚聚類,將每一個猶豫模糊語言集各成一類,計算各類之間的距離測度,將距離最小的兩類合并為一類并更新類中心,直至所有目標(biāo)聚為一類。然后將層次凝聚聚類結(jié)果作為K-均值聚類初始類別和類中心,將每個猶豫模糊語言集歸入距離最小的一類,直至類中心穩(wěn)定停止迭代。最后,以有財產(chǎn)隱匿行為人的案件為例進(jìn)行分析,結(jié)果表明,將層次聚類的結(jié)果作為K-均值聚類的初始類別,相對隨機(jī)選擇初始類別來說,可以提高聚類效率、減少迭代次數(shù),快速達(dá)到理想聚類結(jié)果,該聚類算法具有一定的可行性和有效性。