孫曉龍, 王靖, 杜吉祥
(華僑大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 福建 廈門 361021)
面向缺失像素圖像集的修正拉普拉斯特征映射算法
孫曉龍, 王靖, 杜吉祥
(華僑大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 福建 廈門 361021)
針對缺失像素圖像集,提出修正的拉普拉斯特征映射算法.該算法將缺失像素圖像集看成向量集,利用向量之間的余弦相似度衡量缺失像素圖像之間的距離,提出一種新的權(quán)值構(gòu)造函數(shù),并在多組標(biāo)準(zhǔn)測試數(shù)據(jù)集上進行實驗.結(jié)果表明:修正的拉普拉斯特征映射算法可以很好地挖掘缺失像素圖像數(shù)據(jù)集的內(nèi)在流形結(jié)構(gòu),減弱缺失像素帶來的不良影響.
流形學(xué)習(xí); 缺失像素; 拉普拉斯特征映射; 余弦相似度
在信息化時代,如何對產(chǎn)生的大量高維數(shù)據(jù)進行有效的分析,并從中挖掘出所需要的本質(zhì)信息顯得尤為重要,而數(shù)據(jù)降維技術(shù)正是一種有效的處理方法.常見的傳統(tǒng)數(shù)據(jù)降維方法有主分量分析(PCA)[1]、線性判別分析(LDA)和多維尺度變換(MDS)[2]等,這些方法可對線性結(jié)構(gòu)的數(shù)據(jù)進行學(xué)習(xí),但它存在的缺點是不能充分地處理復(fù)雜的非線性數(shù)據(jù).流形學(xué)習(xí)方法相對于傳統(tǒng)的線性維數(shù)約簡方法能夠較好地挖掘出隱藏在高維數(shù)據(jù)中的流形結(jié)構(gòu).代表性的流形學(xué)習(xí)方法有等距映射(ISOMAP)[3]、局部線性嵌入(LLE)[4]、拉普拉斯特征映射(LE)[5]和局部切空間對齊(LTSA)[6].Schafer等[7]先將缺損整數(shù)據(jù)中的缺失值按照某種原則和方法進行填充,再挖掘出填充后數(shù)據(jù)的本質(zhì)信息.通常的填充方法主要有人工填補法、單值填補法(singular imputation,SI)[8]、EM(expectation maximization)算法[9-10]等;而針對缺損數(shù)據(jù)進行主成分分析,也有一些改進算法[11-14],但是這些都無法很好地挖掘缺損數(shù)據(jù)之間的非線性關(guān)系,而且還會帶來累計誤差[15].因此,迫切需要在缺損數(shù)據(jù)挖掘中引入非線性降維方法即流形學(xué)習(xí).詹宇斌等[16]基于EM算法的主成分分析法[17],提出一種改進的LTSA算法(EM-LTSA).但是由于EM-PCAM作用于每個局部鄰域,所以當(dāng)缺失像素較多時,只用局部鄰域的特征難以準(zhǔn)確地提取主成成分,影響算法的有效性.目前,流形學(xué)習(xí)關(guān)于缺損數(shù)據(jù)的相關(guān)研究還比較少.一方面,對缺損數(shù)據(jù)難以準(zhǔn)確構(gòu)造局部鄰域;另一方面,對數(shù)據(jù)的局部幾何結(jié)構(gòu)難以準(zhǔn)確挖掘缺損.因此,本文提出一種修正的拉普拉斯特征映射算法.
LE是經(jīng)典的流形學(xué)算法,其基本思想是在高維空間中離得很近的點投影到低維空間中的點也應(yīng)該離得很近.LE算法首先通過計算任意兩個樣本點之間的歐氏距離,尋找樣本點最近的k個樣本點構(gòu)成局部鄰域.然后,用圖的方式構(gòu)造局部鄰域關(guān)系.通過選用指數(shù)衰減函數(shù)的方式構(gòu)造樣本點之間的權(quán)值,并在高維空間上構(gòu)造反映樣本點之間局部關(guān)系的權(quán)值矩陣W.最后,通過極小化帶有約束條件的價值函數(shù)計算樣本點的低維嵌入坐標(biāo).當(dāng)圖像出現(xiàn)缺失像素時,使用傳統(tǒng)的歐氏距離無法準(zhǔn)確地估計圖像之間的距離,進而不能正確地構(gòu)造局部鄰域和權(quán)值矩陣,所以傳統(tǒng)的LE算法無法從具有缺失像素的圖像集中挖掘出其內(nèi)在的流形結(jié)構(gòu).
對于每副ppx×qpx的圖像將其變成一個m(m=p×q)維的圖像向量xi(i=1,2,…,n),考慮圖像集中包含具有缺失像素的圖像,對于圖像向量xi(i=1,2,…,n)定義一個缺失像素標(biāo)記向量fi=(fi,1,fi,2,…,fi,m)T.該標(biāo)記向量初始值為全1向量,fi,j=0表示當(dāng)且僅當(dāng)圖像向量xi(i=1,2,…,n)中的第j個像素缺失,則整個圖像集的缺失標(biāo)記矩陣Fi(i=f1,f2,…,fn).
為了能夠在缺失像素圖像集上正確地構(gòu)造局部鄰域和權(quán)值矩陣W,對LE算法進行如下2點改進.
1) 基于缺失像素圖像集,構(gòu)造近鄰圖G(V,E).基于余弦相似度的基本思想,兩個具有缺失像素的圖像xi和xj之間的距離可以表示為
式(1)中:I表示圖像xi和xj已知像素的指標(biāo)集.兩幅圖像向量的余弦相似度sim(xi,xj)的范圍為[0,1],相似度越大,距離越小.在具有缺失像素的圖像集上使用文中提出的距離估計方法,得出任意兩個圖像之間的距離.以每個樣本點為圖的頂點,當(dāng)點xi與xj互為近鄰點時,G圖有邊,構(gòu)造出合適的近鄰圖G(V,E).
歐氏距離是最常見的距離衡量方式,傳統(tǒng)的拉普拉斯特征映射算法就是由樣本點之間的歐氏距離來確定樣本點的近鄰點,從而構(gòu)造近鄰域.歐氏距離衡量的是空間中各點間的絕對距離,由各個樣本點所在的位置坐標(biāo)(即個體特征維度的數(shù)值)直接決定,即
式(2)中:歐氏距離體現(xiàn)了樣本點數(shù)值特征的絕對差異,更多地從維度的數(shù)值大小體現(xiàn)差異,對絕對的數(shù)值敏感.余弦相似度則是最常見的相似度度量,余弦相似度衡量的是空間向量之間的夾角,體現(xiàn)的是樣本點向量方向上的差異,而非距離或長度上,對絕對的數(shù)值不敏感.
假設(shè)圖像數(shù)據(jù)集在沒有缺失像素的情況下,樣本點xi的一個近鄰樣本點為xj,一個非近鄰樣本點為xl.顯然,dist(xi,xj)≤dist(xi,xl)或者sim(xi,xj)≥sim(xi,xl).當(dāng)樣本點xj,xl出現(xiàn)缺失像素時,因為歐氏距離由個體特征維度的數(shù)值直接決定,對絕對數(shù)值敏感,其大小極易受到像素值缺失的影響,則dist(xi,xj)≥dist(xi,xl),改變了原有正確的大小關(guān)系.而余弦相似度衡量的是樣本向量方向上的差異,對絕對數(shù)值不敏感,其大小不易受到像素值缺失的影響,則sim(xi,xj)≥sim(xi,xl),仍然保持了其原有正確的大小關(guān)系.因此,余弦相似度衡量缺失像素圖像之間的距離,可以正確地構(gòu)造近鄰圖G(V,E),極大地減弱因缺失像素所帶來的不良影響.文中提出的距離衡量方法不僅實現(xiàn)了正確地構(gòu)造局部鄰域,同時也為提出新的權(quán)值構(gòu)造函數(shù)提供了基礎(chǔ).
2) 基于缺失像素圖像集,提出新的權(quán)值構(gòu)造函數(shù).在已知像素上求解其圖像向量的余弦相似度衡量兩幅圖像之間的距離,顯然,當(dāng)圖像已知像素的個數(shù)越少時,這種方式得出的距離的可靠性應(yīng)該越低,其權(quán)值應(yīng)該越小.基于上述分析,新的權(quán)值構(gòu)造函數(shù)為
式(3)中:|I|為已知像素指標(biāo)集I中像素的個數(shù);m是圖像的維數(shù).余弦相似度越大,圖像之間的相關(guān)性越大,權(quán)值應(yīng)該越大.同時,在已知像素構(gòu)成的向量上求解余弦相似度,并將其作為兩幅圖像之間距離的可靠程度.通過加入系數(shù)(exp(1-m/|I|)來衡量,其中,參數(shù)σ為固定值.當(dāng)|I|接近為0或者余弦相似度接近為0時,其權(quán)值接近為0;當(dāng)|I|接近為m并且余弦相似度接近為1時,其權(quán)值接近為1.
基于上述方法,對LE算法構(gòu)造局部鄰域和權(quán)值矩陣的步驟進行了改進,使其能夠在具有缺失像素的圖像集上正確地構(gòu)造局部鄰域和權(quán)值矩陣W.同時,通過對LE算法的分析也可以看出:僅構(gòu)造局部鄰域和權(quán)值矩陣的算法步驟與原始數(shù)據(jù)有關(guān),最終計算低維嵌入坐標(biāo)的步驟是對前面抽取的信息進行進一步的加工處理,與原始數(shù)據(jù)無關(guān).所以,低維嵌入坐標(biāo)的計算方法同LE算法一致,都是通過極小化帶有約束條件的價值函數(shù)來實現(xiàn),即
最終求解極小化問題歸結(jié)為圖拉普拉斯算子的廣義特征值的問題.修正的拉普拉斯特征映射算法步驟為
輸入:樣本圖像集矩陣X,鄰域參數(shù)k,低維嵌入維數(shù)d,缺失標(biāo)記矩陣F.
輸出:樣本圖像集矩陣X對應(yīng)的低維嵌入Y.
1) 利用式(1)計算圖像集矩陣X中任意兩幅圖像之間的距離.當(dāng)xj是xi的k個近鄰中的一個點時,則認為它們是近鄰的,即圖G(V,E)有邊(xi,xj).
2) 利用式(2)給構(gòu)造的近鄰圖G(V,E)賦權(quán)值,獲得權(quán)值矩陣W.
3) 計算低維嵌入結(jié)果.為了保持數(shù)據(jù)的局部特性,通過求解目標(biāo)模型的極小化.求解問題轉(zhuǎn)化為求解方程LY=λDY的廣義特征值問題.低維嵌入坐標(biāo)Y可由矩陣D1/2LD1/2的最小的第2個到第d+1個特征向量構(gòu)成,即
Y=[u2,u3,…,ud+1]T.
為了獲得具有缺失像素的圖像,每次實驗中,隨機從圖像集選取部分圖像,然后,構(gòu)造缺失像素.構(gòu)造缺失像素的方式有兩種:一種是構(gòu)造離散像素點的缺失,就是對每個選中的圖像隨機選取一定個數(shù)的像素點,將其像素值置為0,作為缺失像素;另一種是構(gòu)造矩形區(qū)域像素的缺失,就是對每個選中的圖像隨機選取一個dx×dy大小的矩形塊,將其像素置為0,作為缺失像素.同時,構(gòu)建其對應(yīng)的缺失標(biāo)記矩陣F.在實驗中,應(yīng)用4種不同的對比算法對圖像數(shù)據(jù)進行降維.
1) LE(original).將無缺失像素的圖像集直接用LE[7]算法降維到低維特征空間.
2) LE(missing).將具有缺失像素的圖像集直接用LE算法降維到低維特征空間.
3) LE(EM-PCAM)和LE(SI).先用EM-PCAM[13]或SI算法對具有缺失像素的圖像數(shù)據(jù)集中的缺失像素值進行填充,然后,將填充后得到的圖像集用LE算法降維到低維特征空間.
4) EM-LTSA.將具有缺失像素的圖像集直接用EM-LTSA[13]算法降維到低維特征空間.
對低維嵌入后的結(jié)果采用K-NN(K-nearest neighbor)分類器進行分類,得到不同對比算法的分類效果.
2.1實驗數(shù)據(jù)集
1) ORL(olivetti research laboratory)人臉圖像集.該數(shù)據(jù)集共有40個人不同角度的人臉圖像,每人10副圖像,共包含了200個112 px×92 px的灰度樣本點.
2) TEXTURE圖像集.從USC-SIPI圖像數(shù)據(jù)庫中選取4張1 024 px×1 024 px的紋理圖像,然后,將其分別裁剪成32 px×32 px像素子圖,每張原圖像裁剪得到4 356張子圖.從每張原圖得到的子圖集中隨機選取1 000張子圖,構(gòu)成一個包含4 000個32 px×32 px的樣本點.
3) COIL-20-PROC圖像集.該數(shù)據(jù)集包含20種不同的物品,每個物品在不同角度下的72張圖像,構(gòu)成一個包含1 440個128 px×128 px的樣本點.
2.2實驗結(jié)果與分析
對于所有流形學(xué)習(xí)算法都涉及到鄰域參數(shù)k和目標(biāo)維度d,參數(shù)k的選取范圍設(shè)置在[4,17],其目標(biāo)維度d的取值范圍設(shè)置在[3,85],參數(shù)σ取值范圍在[0.4,1.0].通過個重復(fù)3實驗,選取最優(yōu)參數(shù),并列出其中最好的實驗結(jié)果.
實驗1.為驗證面對不同缺失像素圖像集時文中算法效果的通用性,將文中算法和上述的各對比算法在3種圖像集上進行實驗.ORL人臉圖像、TEXTURE和COIL-20-PROC3種圖像集構(gòu)造矩形區(qū)域像素缺失的缺失區(qū)域大小(dx×dy)分別為60 px×60 px,16 px×16 px和60 px×60 px;3種圖像集構(gòu)造離散像素點缺失的缺失程度為50%(每副圖片中缺失像素點的個數(shù)占總像素點個數(shù)的百分比).隨機選取每個圖像集中50%樣本點作為訓(xùn)練集,剩下的樣本點形成測試集.實驗結(jié)果如表1所示.
表1 各算法在3種圖像數(shù)據(jù)集上的分類正確率Tab.1 Classification correct rates on three different images data sets
由表1可知:當(dāng)圖像集有缺失像素存在時,LE算法在K-NN分類器下的分類的正確率都遠遠低于其他算法.這說明LE算法不能很好地學(xué)習(xí)缺損數(shù)據(jù)的內(nèi)在流形結(jié)構(gòu).究其原因,LE算法在選擇近鄰域的步驟中,采用傳統(tǒng)的歐氏距離衡量缺失像素圖像之間的距離.歐氏距離的值極易受到像素值缺失的影響,從而無法準(zhǔn)確地選擇近鄰域,最終影響算法效果.
由表1還可知:基于EM-PCAM填充算法雖然能夠緩解缺失像素帶來的不良影響,但這種效果是有限的.這是由于EM-PCAM算法作用于每個局部鄰域,所以當(dāng)缺失像素較多時,只用局部鄰域的特征難以準(zhǔn)確地提取主成成分,影響算法的有效性.基于同樣的原因,EM-LTSA的改進效果也比較有限.基于SI[21]填充算法雖然比EM-PCAM算法有效,但是在TEXTURE數(shù)據(jù)集上改進效果也并不明顯.這是因為單值填充算法忽略了缺失特征的不確定性,同時,還會帶來累計誤差.在這3個缺損數(shù)據(jù)集上,文中算法的分類準(zhǔn)確率明顯高于其他算法.在COIL-20-PROC數(shù)據(jù)集上,文中算法同LE算法在無缺損數(shù)據(jù)集上的識別率接近.這說明了文中算法面對具有缺失像素的圖像集時,由于采用新的距離衡量方式和權(quán)值構(gòu)造函數(shù),極大地減弱了缺失像素值帶來的影響,從而構(gòu)造合適的近鄰圖和權(quán)值矩陣,所以可以很好地挖掘出圖像集內(nèi)在的流形結(jié)構(gòu).
實驗2.為了進一步測試文中算法在不同缺失程度圖像集上的魯棒性,將上述各對比算法和文中算法在不同缺失程度的ORL人臉圖像數(shù)據(jù)集上進行對比實驗.ORL構(gòu)造離散像素點缺失的缺失程度分別為20%,30%,40%,50%,60%,70%,80%,90%和95%.ORL構(gòu)造矩形區(qū)域像素缺失的大小(dx×dy)分別為20 px×30 px,30 px×40 px,40 px×40 px,40 px×50 px,50 px×50 px,50 px×60 px,60 px×60 px,60 px×70 px和80 px×70 px.隨機選取每個圖像集中50%的樣本點作為訓(xùn)練集,剩下的樣本點形成測試集.實驗結(jié)果,如圖1所示.圖1中:R為正確率;P為離散像素點缺失程度;S為矩形區(qū)域像素缺失的區(qū)域大小.
(a) 離散像素點缺失程度 (b) 矩形區(qū)域像素缺失的區(qū)域大小圖1 不同算法在不同缺失程度ORL圖像集上其分類正確率的變化Fig.1 Classification correct rates of ORL images set with different degree of missing for different algorithms
由圖1可知:即使面對較少程度的像素缺失,如20%的離散像素點缺失和30 px×20 px的矩形區(qū)域像素缺失,LE算法的分類正確率也遠低于其在未缺失像素圖像集時的分類準(zhǔn)確率(由實驗1可知為90%).這表明LE對數(shù)據(jù)缺失程度具有很強的敏感性,主要是因為LE算法采用的歐氏距離衡量方法對缺失的像素值具有很強的敏感性.在離散像素缺失的情形下,LE (EM-PCAM)和EM-LTSA的準(zhǔn)確率雖然高于LE算法的結(jié)果,但也對數(shù)據(jù)缺失程度具有很大的敏感性.這是因為EM-PCAM算法只作用于每個局部鄰域,所以當(dāng)缺失像素較多時,只用局部鄰域的特征難以準(zhǔn)確地提取主成成分,影響算法的有效性.面對較小程度的缺失,單值填充SI具有很好的效果,但也無法解決數(shù)據(jù)大規(guī)模缺失的問題.
因為單一的填充值忽略了缺失特征的不確定性,同時,隨著缺失程度的增加還會帶來累計誤差,將會嚴(yán)重影響填充大規(guī)模缺失數(shù)據(jù)的效果.在此數(shù)據(jù)集上,文中算法體現(xiàn)了對數(shù)據(jù)缺損程度具有非常好的魯棒性.即使離散像素缺失的程度達到95%,文中算法仍能保持很高的準(zhǔn)確率,因為文中算法在選擇近鄰域的步驟中采用余弦相似度的度量方法.由上文的理論分析可知:余弦相似度的度量方法對像素缺失值不敏感,所以無論圖像缺失程度變化如何,文中算法的分類正確率都可以保持在較高且穩(wěn)定的區(qū)間值內(nèi),具有非常好的魯棒性.
實驗3.為了檢測文中算法在不同訓(xùn)練點個數(shù)下的分類效果,在COIL-20-PROC圖像集上做了進一步的測試實驗.將規(guī)模為1 420的圖像集按照不同的訓(xùn)練測試比(training∶testing)分為5組進行實驗,其中,缺失像素的處理方式是構(gòu)造離散像素點的缺失,缺失程度為50%.不同算法在每種訓(xùn)練測試比下的分類正確率,如表2所示.
表2 不同算法在COIL-20-PROC圖像集上不同訓(xùn)練測試比下的分類正確率Tab.2 Classification correct rates of COIL-20-PROC images set for different training test
由表2可知:面對完整圖像集,訓(xùn)練測試比越大,LE算法分類的準(zhǔn)確率越高.當(dāng)面對缺失像素圖像集時,LE(missing),LE(EM-PCAM),LE(SI)和EM-LTSA的分類準(zhǔn)確率則不具有這個規(guī)律,即更少的訓(xùn)練點,可能得到更好的分類效果.這主要是因為面對訓(xùn)練集中的缺損數(shù)據(jù),這些方法無法準(zhǔn)確挖掘出它們和測試數(shù)據(jù)之間的本質(zhì)關(guān)系,即更多的缺損訓(xùn)練數(shù)據(jù)反而降低這些方法的分類效果.面對具有缺失像素的圖像集,文中算法在所有的訓(xùn)練測試比上都體現(xiàn)出了最好的分類效果.值得注意的是,隨著訓(xùn)練數(shù)據(jù)的增加,文中算法的分類效果也隨著增加.這表明文中算法能很好地挖掘訓(xùn)練集和測試集中缺損數(shù)據(jù)的本質(zhì)關(guān)系.
針對流形學(xué)習(xí)算法面對缺失像素圖像集的這一特例,受余弦相似度度量方法的啟發(fā),提出了適用于缺失像素圖像集的距離衡量方式和基于這種距離衡量方式的權(quán)值構(gòu)造函數(shù).對經(jīng)典的拉普拉斯特征映射算法進行改進,提出一種修正的拉普拉斯特征映射算法.實驗表明了文中算法的有效性.
[1] JOLLIFFE I T.Principal component analysis[J].Springer Berlin,2010,87(100):41-64.DOI:10.2307/3172953.
[2] COX T,COX M.Multidimensional scaling[J].Journal of the Royal Statistical Society Series A,1994,5(2):875-878.DOI:10.2307/2983485.
[3] TENENBAUM J B DE S V,LANGGORD J C.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500):2319-2323.DOI:10.1126/science.290.5500.2319.
[4] ROWEIS S T,SAUL L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290:2323-2326.DOI:10.1126/science.290.5500.2323.
[5] BELKIN M,NIYOGI P.Laplacian eigenmaps for dimension reduction and data representation[J].Neural Computation,2003,15(6):1373-1396.DOI:10.1162/089976603321780317.
[6] ZHANG Zhengyue,ZHA Hongyuan.Principal manifolds and nonlinear dimensionality reduction via tangent space alignment[J].Journal of Shanghai University,2005,26(1):313-338.DOI:10.1137/S1064827502419154.
[7] SCHAFER J L,GRAHAM J W.Missing data: Our view of the state of the art[J].Psychological Methods,2002,7(2):147-177.DOI:10.1037/1082-989X.7.2.147.
[8] 金連.不完全數(shù)據(jù)中缺失值填充關(guān)鍵技術(shù)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013:1-55.
[9] LITTLE R J A,RUBIN D B.Statistical analysis with missing data[M].New York:John Wiley and Sons,2002:364-365.DOI:10.2307/3172915.
[10] DEMPSTER A P,RUBIN D B.Maximum likehood estimation from incomplete data via the EM algorithm[J].Journal of the Royal Statistical Society,1977,39(1):1-38.
[11] STANIMIROVA I,DASZYKOWSKI M,WALCZAK B.Dealing with missing values and outliers in principal component analysis[J].Talanta,2007,72(1):172-178.DOI:10.1016/j.talanta.2006.10.011.
[12] SERNEELS S,VERDONCK T.Principal component analysis for data containing outliers and missing elements[J].Comput Stat Data Anal,2008,52(3):1712-1727.DOI:10.1016/j.csda.2009.04.008.
[13] LI Yongming.On incremental and robust subspace learning[J].Pattern Recongnition,2004,37(7):1509-1518.DOI:10.1016/j.patcog.2003.11.010.
[14] DANIJEL S,LEONARDIS A.Incremental and robust learning of subspace representations[J].Image and Vision Computing,2008,26(1):27-38.DOI:10.1016/j.patcog.2006.09.019.
[15] WILLIAMS D,LIAO Xuejun,XUE Ya,etal.On classification with incomplete data[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(3):427-436.DOI:10.1109/TPAMI.2007.52.
[16] 詹宇斌,殷建平,李寬.缺失像素圖像集的流形學(xué)習(xí)算法[J].吉林大學(xué)學(xué)報(工學(xué)版),2011,41(3):728-733.DOI:10.13229/j.cnki.jdxbgxb2011.03.014.
[17] ROWEIS S T.EM algorithm for PCA and SPCA[J].Advances in Neural Information Processing Systems,1999,10:626-632.DOI:10.1021/ja100409b.
(責(zé)任編輯: 陳志賢英文審校: 吳逢鐵)
ModifiedLaplacianEigenmapAlgorithmforMissingPixelsImageSet
SUN Xiaolong, WANG Jing, DU Jixiang
(College of Computer Science and Technology, Huaqiao University, Xiamen 361021, China)
In this paper, we propose a modified laplacian eigenmaps algorithm for the missing pixel images. The algorithm takes the missing pixel image set as a vector set, then using the cosine similarity between vectors to measure the distance between missing pixel images. Further, a new weight constructor function is proposed. Experiments on several sets of standard test data sets show that the modified laplacian eigenmaps algorithm can well excavate the intrinsic manifold structure of the missing pixel images and weaken the negative effects of missing pixels.
manifold learning; missing pixels; laplacian eigenmaps; cosine similarity
10.11830/ISSN.1000-5013.201512067
TP 181
A
1000-5013(2017)06-0862-06
2015-12-28
王靖(1981-),男,教授,博士,主要從事模式識別、推薦系統(tǒng)的研究.E-mail:wroaring@hqu.edu.cn.
國家自然科學(xué)基金資助項目(61370006); 福建省自然科學(xué)基金資助項目(2014J01237); 福建省教育廳科技項目(JA12006); 福建省高等學(xué)校新世紀(jì)優(yōu)秀人才支持計劃(2012FJ-NCET-ZR01); 華僑大學(xué)中青年教師科技創(chuàng)新資助計劃(ZQN-PY116)
華僑大學(xué)學(xué)報(自然科學(xué)版)2017年6期