李冠楠,譚慶昌*,張 闊,張宇鵬
(1.吉林大學(xué) 機(jī)械科學(xué)與工程學(xué)院,吉林 長(zhǎng)春 130025;2.中國(guó)科學(xué)院 長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,吉林 長(zhǎng)春 130033)
近年來,由于能源的不斷枯竭以及全球暖化問題的日益嚴(yán)重,促使各國(guó)都在不斷地尋找新能源,且考慮到地域限制、安全性等因素,現(xiàn)階段較可行的下一代替代能源便是太陽能。太陽能電池是獲取太陽能的最主要的光電組件,目前全球所生產(chǎn)的太陽能電池90%以上使用結(jié)晶硅,只有約10%使用薄膜技術(shù)。結(jié)晶硅依照制造材質(zhì)不同,又可分為單晶硅、多晶硅與非晶硅,現(xiàn)今消費(fèi)市場(chǎng)的應(yīng)用大多使用多晶硅,主要是因?yàn)槎嗑Ч柚瞥毯?jiǎn)單且無需封裝,所以價(jià)格較為便宜。在太陽能電池的制造過程中[1],常因?yàn)槭枋г斐商柲苄酒砻婀蝹?、污點(diǎn)以及裂痕等瑕疵產(chǎn)生,如果忽視這些瑕疵,會(huì)造成太陽能電池的工作效率降低,甚至喪失儲(chǔ)存電量的功能。因此,太陽能電池的制程檢測(cè)是必要的。
隨著太陽能電池產(chǎn)業(yè)的興起,太陽能芯片/電池的瑕疵檢測(cè)技術(shù)也得到了發(fā)展。2004年,F(xiàn)u等[2]使用高斯-拉普拉斯濾波器找出單晶太陽能芯片表面裂痕的邊緣,進(jìn)而使用形態(tài)學(xué)濾除噪聲并填補(bǔ)瑕疵。在檢測(cè)技術(shù)上首先使用圖像強(qiáng)化方法凸顯裂痕的輪廓,接著利用該輪廓的幾何特征及條件進(jìn)行辨識(shí)。蔡欣儒[3]在2007年利用亞像素邊界檢測(cè)、霍夫變換和最小平方誤差法來檢測(cè)單晶太陽能芯片的邊緣,并利用偵測(cè)到的邊緣來判定是否有破損瑕疵。同年,陳心怡[4]針對(duì)不同類型的太陽能芯片影像,發(fā)展出不同的瑕疵檢測(cè)技術(shù)。對(duì)具有均勻表面的太陽能芯片,以多選擇性閾值檢測(cè)瑕疵。對(duì)具有規(guī)律性紋理表面的太陽能芯片,則事先訓(xùn)練無瑕疵影像中10 種不同的紋理做為比對(duì),以此檢測(cè)模版區(qū)塊內(nèi)的瑕疵。
上述研究大多局限于單晶太陽能芯片的瑕疵檢測(cè),且假設(shè)裂痕在影像中有顯著的灰度差異。多晶太陽能芯片則不能使用這些方法進(jìn)行檢測(cè),主要是因?yàn)槎嗑柲苄酒砻婢Ц穹植己軓?fù)雜,且瑕庛與正常晶格的輪廓都呈現(xiàn)細(xì)長(zhǎng)線條形狀,如果使用該方法進(jìn)行檢測(cè),則會(huì)將瑕疵與正常晶格邊緣同時(shí)檢測(cè)出來,而造成檢測(cè)誤判。由于多晶太陽能芯片的表面瑕疵無法由肉眼或一般CCD 攝影察覺,因此可以運(yùn)用電致發(fā)光(EL)影像技術(shù)[5-6]來凸顯瑕疵。在EL 影像中,瑕疵具有條狀或線狀特性,而正常的隨機(jī)晶格背景也會(huì)被凸顯出來,使得自動(dòng)瑕疵檢測(cè)的困難加大。為此,本文提出了一種基于模糊C 均值(FCM)聚類法[7]的EL 影像瑕疵檢測(cè)方法。首先,根據(jù)多晶太陽能芯片EL 影像的樣本特性,對(duì)傳統(tǒng)FCM 聚類法進(jìn)行改進(jìn)。其次,提取經(jīng)過圖像處理的正常影像樣本的特征,并應(yīng)用這些樣本特征進(jìn)行訓(xùn)練,即對(duì)正常樣本進(jìn)行分群。最后,根據(jù)訓(xùn)練結(jié)果完成多晶太陽能芯片的瑕疵檢測(cè)。
本研究旨在提高針對(duì)多群組未知數(shù)據(jù)進(jìn)行辨識(shí)與分群的辨識(shí)準(zhǔn)確率,以傳統(tǒng)FCM 聚類分群法為基礎(chǔ)方法,加入本研究的衡量標(biāo)準(zhǔn)與分群方法進(jìn)行數(shù)據(jù)辨識(shí)與分群。由于具有二維特征的數(shù)據(jù)可以用繪圖的方法將結(jié)果顯示出來,因此本節(jié)僅以此類數(shù)據(jù)為例進(jìn)行說明。
其中,C 代表分群數(shù),N 為總樣本數(shù),xk為第k 個(gè)樣本。參數(shù)p 是具有加權(quán)性質(zhì)的指數(shù),即取決于主觀意識(shí)的模糊程度,也就是說p 值越大,模糊程度越大。在本研究中,使用的權(quán)重權(quán)數(shù)為p=2。
其中dik=‖xk-vi‖。各群中心點(diǎn)會(huì)因重新計(jì)算的權(quán)重的改變而跟著更新,計(jì)算方法如下:
通過迭代,當(dāng)目標(biāo)函數(shù)J 達(dá)最小值或收斂為一穩(wěn)定值時(shí),即求得各群中心點(diǎn)vi與最終分群結(jié)果并停止計(jì)算。
從傳統(tǒng)FCM 的模型來看,雖然可以用于對(duì)任意群數(shù)的數(shù)據(jù)進(jìn)行分群,但當(dāng)樣本的群數(shù)過多時(shí),通過上述的迭代求最小值的方法對(duì)樣本進(jìn)行分類,就會(huì)使目標(biāo)函數(shù)陷入局部的最小值,導(dǎo)致產(chǎn)生錯(cuò)誤的分群結(jié)果。
如圖1(a)所示的樣本,從數(shù)據(jù)的分布情況看,應(yīng)該將其分成20 群,但如果用傳統(tǒng)FCM 分群法一次將其分成20 組,結(jié)果得到的20 個(gè)群的中心位置如圖1(c)中實(shí)心點(diǎn)所示,從圖中可以明顯地看出分群效果不好,傳統(tǒng)FCM 分群法并沒有準(zhǔn)確地找到每個(gè)群的中心。
圖1 傳統(tǒng)FCM 聚類法分群結(jié)果。(a)多群組;(b)疏密程度不同;(c)圓形與非圓形分布。Fig.1 Results of conventional FCM clustering method.(a)Multiple clusters.(b)Different level of density.(c)Circular and non-circular.
由于傳統(tǒng)FCM 分群算法主要是利用樣本點(diǎn)至中心點(diǎn)距離dik=‖xk-vi‖計(jì)算方式進(jìn)行不斷的演算修正,因此適合在數(shù)據(jù)結(jié)構(gòu)密度相當(dāng)、數(shù)據(jù)形態(tài)成近圓的情況下使用。對(duì)于兩個(gè)數(shù)據(jù)形態(tài)擁有明顯差異或者疏密程度明顯不同的群集,以FCM 進(jìn)行分群,其結(jié)果卻不理想且有很明顯的差異,如圖1(b)和(c)所示。
一般認(rèn)為,傳統(tǒng)FCM 分群算法適合分較少群數(shù)的樣本,因此首先利用傳統(tǒng)FCM 分群算法將樣本分為兩群,通過均勻度的概念來衡量需要下一次分群的群組,即哪一群的均勻度差下一次就分哪一群,再用傳統(tǒng)FCM 分群算法將均勻度差的那一群分成兩群,以這兩群替換原來的群組。之后,繼續(xù)在剩下的所有群組中尋找均勻度最差的群組,并將其分成兩群,直到達(dá)到所需群數(shù)為止,其演算過程如圖2 所示。這種分群方法有助于充分利用傳統(tǒng)的FCM 分群算法的特點(diǎn),而且只需一個(gè)參數(shù)來控制分群結(jié)果,該參數(shù)即為所分群數(shù)。
圖2 針對(duì)多群數(shù)樣本的改進(jìn)FCM 聚類法流程圖Fig.2 Flow chart of improved FCM clustering method aiming at samples of multi-clusters
從樣本特征值的意義來看,一般認(rèn)為在同一群內(nèi)如果兩兩樣本的相關(guān)程度基本都一致,則該群的均勻性較好;如果兩兩樣本的相關(guān)程度不一致,則均勻度較差。因此,可以用主成分分析方法中的協(xié)方差矩陣來定義同組樣本的相關(guān)程度。
為了敘述方便,把測(cè)試樣本寫成如下形式:
首先,對(duì)樣本做零平均值處理,即:
其次,計(jì)算樣本的協(xié)方差矩陣K:
其中,A=[Δ x1Δ x2… Δ xc]。
最后,由協(xié)方差矩陣K 的特征值來計(jì)算群組的均勻度。令λ=[λ1λ2… λc]為協(xié)方差矩陣K 的c 個(gè)特征值,如果群組中樣本的相關(guān)性不一致,則c 個(gè)特征值的標(biāo)準(zhǔn)差較大,否則這個(gè)標(biāo)準(zhǔn)差較小。由于各群組樣本的疏密程度不完全相同,導(dǎo)致各群組的特征值不在同一數(shù)量級(jí)上,因此用協(xié)方差矩陣K 的特征值的標(biāo)準(zhǔn)差與均值的比值作為均勻性的衡量標(biāo)準(zhǔn),即均勻度,其公式為:
在使用上述改進(jìn)FCM 分群算法進(jìn)行分群時(shí),每次用傳統(tǒng)的FCM 分群算法把某個(gè)群組分為兩群,經(jīng)常會(huì)出現(xiàn)樣本形態(tài)不是近圓形或疏密程度不均的現(xiàn)象。為了避免這種情況導(dǎo)致錯(cuò)誤的分群結(jié)果,需要對(duì)每次分群時(shí)使用的傳統(tǒng)FCM 分群算法進(jìn)行改進(jìn)。本文將式(5)的目標(biāo)函數(shù)改為如下形式:
由于傳統(tǒng)的FCM 并沒有考慮到數(shù)據(jù)的分散程度,因此在本研究中加入了變異數(shù)因子,該變異數(shù)因子是每個(gè)樣本點(diǎn)對(duì)各群中心點(diǎn)之變異程度,以加強(qiáng)同一群樣本之間的緊密性(相關(guān)性):
同時(shí),將傳統(tǒng)FCM 算法中的dik=‖xk- vi‖修改為:
當(dāng)r 逐漸增加時(shí),每個(gè)樣本點(diǎn)至各群中心點(diǎn)距離的差距變大,便可達(dá)到加劇各群間差異性的目的。根據(jù)實(shí)驗(yàn)資料測(cè)試,本文采用r=3??偨Y(jié)起來,針對(duì)樣本分布形態(tài)的改進(jìn)FCM 算法演算流程如下:
(2)隨機(jī)從原始數(shù)據(jù)中取出一筆數(shù)據(jù)作為初始質(zhì)心位置vi;
(4)求得目標(biāo)函數(shù)J;
(7)更新質(zhì)心位置vi;
圖3 改進(jìn)FCM 聚類法分群結(jié)果。(a)多群組;(b)疏密程度不同;(c)圓形與非圓形分布。Fig.3 Results of improved FCM clustering method.(a)Multiple clusters.(b)Different level of density.(c)Circular and non-circular.
(8)重復(fù)(4)~(7),當(dāng)J 達(dá)最小值或收斂為一穩(wěn)定值時(shí),計(jì)算停止。
如圖3 所示,使用改進(jìn)FCM 聚類法對(duì)圖1 數(shù)據(jù)進(jìn)行分群,誤判點(diǎn)的數(shù)目明顯減少,對(duì)樣本的辨識(shí)率得到了明顯的提高。
圖4 形態(tài)學(xué)處理實(shí)驗(yàn)結(jié)果。(a)形態(tài)學(xué)處理前;(b)形態(tài)學(xué)處理后。Fig.4 Results of morphological processing.(a)Before morphological processing.(b)After morphological processing.
對(duì)于多晶太陽能芯片,金屬手指斷線(圖5(a))、微裂痕(圖5(b))和裂痕(圖5(c))是最常出現(xiàn)的3 種瑕疵,這些瑕疵在隨機(jī)晶格背景圖案中呈現(xiàn)條狀或帶狀特征。因此,根據(jù)Rainer Lienhart 等[8]提出的擴(kuò)展Haar 特征,本文選取以下12 個(gè)特征用于邊緣像素點(diǎn)的特征值提取,如圖6 所示。
圖6 的3 組特征,每組的后2 個(gè)特征是由該組前兩個(gè)特征逆時(shí)針旋轉(zhuǎn)45°得到的。在這3 組特征中,第1 組和第2 組是邊緣特征,第3 組是線狀特征。每個(gè)特征的特征值可用公式表示為
圖5 太陽能芯片EL 影像瑕疵種類。(a)金屬手指斷線;(b)微裂痕;(c)裂痕。Fig.5 Defect types of solar cell in EL image.(a)Fingerinterruption.(b)Micro-crack.(c)Crack.
圖6 本文所選用的12 種擴(kuò)展Haar 特征Fig.6 12 extended Haar features proposed in the article
其中:Fj代表第j 種Haar 特征的特征值,ω1是第j個(gè)Haar 特征的權(quán)值,ω2是第j 個(gè)Haar 特征中黑色矩形的權(quán)值,R1代表第j 個(gè)Haar 特征中包含的所有像素點(diǎn)的灰度值之和,R2代表第j 個(gè)Haar 特征中黑色矩形塊所包含的所有像素點(diǎn)的灰度值之和。前兩組特征原型的權(quán)值比ω1∶ω2=1∶(-2),第三組特征原型的權(quán)值比ω1∶ω2=1∶(-3)。
當(dāng)固定Harr 塊的大小時(shí),用這12 個(gè)特征對(duì)影像中的邊緣像素點(diǎn)進(jìn)行特征值提取,即以該像素點(diǎn)為中心對(duì)Haar 塊大小的區(qū)域內(nèi)的所有像素點(diǎn)做如公式(10)的運(yùn)算,對(duì)于每個(gè)邊緣像素點(diǎn)就可以得到該樣本的12 特征值。為了測(cè)量像素尺寸不同大小的瑕疵,可以取多種Haar 特征的尺寸,如果取r 種Haar 特征的尺寸,對(duì)于某一個(gè)像素點(diǎn),就可以得到12 ×r 個(gè)特征值。
本文在訓(xùn)練時(shí),只采用正常邊緣像素點(diǎn)的樣本作為訓(xùn)練樣本,這就要求要收集到幾乎全部形式的正常樣本。這種要求對(duì)于用肉眼判斷的方式是很難做到的。本文采用以下方法:(1)通過觀察首先收集得到一些不同形式的正常無瑕疵的EL 影像(如圖7 所示),共10 張,將這些影像上的每個(gè)邊緣像素點(diǎn)作為一個(gè)樣本,這些樣本稱作不完全正常樣本;(2)用上述不完全原本進(jìn)行訓(xùn)練,并對(duì)若干張正常影像進(jìn)行測(cè)試,在測(cè)試結(jié)果中會(huì)出現(xiàn)很多誤判點(diǎn),這些誤判點(diǎn)是將正常樣本判成了瑕疵樣本,原因在于訓(xùn)練樣本中并不含有這些正常樣本,因此再將這些誤判點(diǎn)附近的影像(如圖8 所示)加入到訓(xùn)練影像中,這樣就得到了幾乎全部形式的正常樣本。
圖7 不完全的無瑕疵太陽能芯片EL 影像(經(jīng)過形態(tài)學(xué)處理)Fig.7 Incomplete EL image of defect-free solar cell (after morphological processing)
圖8 誤判的無瑕疵太陽能芯片EL 影像(經(jīng)過形態(tài)學(xué)處理)Fig.8 Misjudged EL image of defect-free solar cell (after morphological processing)
用上述正常樣本進(jìn)行訓(xùn)練,即使用第二節(jié)改進(jìn)的FCM 分群法將其分為n 個(gè)群集。對(duì)于每個(gè)測(cè)試樣本,計(jì)算它到自身所屬群的群中心的歐式距離
其中,xi為第i 個(gè)樣本,i=1,2,…,n;vj為xi所在群的中心,j=1,2,…,n。
則每一群的閾值可定義為:
胃穿孔發(fā)病的原因具有較強(qiáng)的復(fù)雜性,其發(fā)病的原因也比較多,如胃潰瘍、胃癌等,在傳統(tǒng)的急性胃穿孔治療中,主要采用開放式穿孔修復(fù)術(shù)。當(dāng)前治療急性胃穿孔最好的方式是外科手術(shù)治療,此外應(yīng)盡早實(shí)施手術(shù)。若患者就診時(shí)已經(jīng)超過12h且腹部感染情況較為嚴(yán)重[6]。出現(xiàn)中毒性休克、腸粘連、腸梗阻以及其他并發(fā)癥的可能性明顯提高,且相關(guān)的研究顯示,對(duì)于急性胃穿孔患者,只要患者耐受,均可采用胃大部切除手術(shù)進(jìn)行治療。
對(duì)于某個(gè)待測(cè)樣本,根據(jù)公式(11)計(jì)算其到第j 個(gè)群中心的距離dj,如果該距離大于Tj,則這個(gè)樣本不在該群中;如果該距離小于Tj,則這個(gè)樣本在該群中。即:
如果測(cè)試樣本不屬于n 群中的任何一個(gè)群,就定義該樣本是瑕疵樣本;如果測(cè)試樣本屬于n群中的某個(gè)群,就定義它是一個(gè)正常樣本。
實(shí)驗(yàn)時(shí),使用一個(gè)直流電源向太陽能電池輸出0.4~0.6 V 電壓和6~20 mA/cm2電流;使用冷卻的近紅外光(λ=1.1~1.2 μm)CCD 相機(jī)在完全密不透光的環(huán)境下取像,無需任何外加光源。
從圖6 各Haar 特征的樣式可以看出,Group1和Group2 將Haar 塊的寬w 平均分成了2 份,Group3 將Haar 塊的寬w 平均分成了3 份。因此,為了使每個(gè)Haar 特征的每個(gè)區(qū)域(黑色區(qū)域或白色區(qū)域)都為整像素,Haar 塊的寬w 必須是6 的整數(shù)倍。通過觀察和實(shí)驗(yàn)分析,選擇參數(shù)如下:
Haar 塊大小:h=18,w=6,12,…,42;分群組數(shù):30 組;閾值Tj中t 值:0.02。
圖9 原始測(cè)試影像與測(cè)試結(jié)果。(a)~(h):原始瑕疵影像;(a')~(h'):瑕疵檢測(cè)結(jié)果。Fig.9 Original testing images and testing results.(a)~(h):Original defect image.(a')~(h'):Defect detection result.
實(shí)驗(yàn)選用改進(jìn)FCM 聚類法對(duì)正常樣本進(jìn)行分群,并用該訓(xùn)練結(jié)果對(duì)50 塊太陽能芯片(20 塊瑕疵+30 塊正常)進(jìn)行測(cè)試,測(cè)試的統(tǒng)計(jì)結(jié)果顯示:20 塊瑕疵樣本中,有18 塊被判為瑕疵,2 塊被判為正常,誤差為10%;30 塊正常樣本中,0 塊被判為瑕疵,30 塊被判為正常,誤差為0。50 個(gè)樣本的總辨識(shí)率高達(dá)96%,其中12 塊的測(cè)試結(jié)果如圖9 所示。
本文介紹的改進(jìn)FCM 分群算法能夠有效地解決多群數(shù)數(shù)據(jù)分類問題,明顯提高分群辨識(shí)率。本研究在訓(xùn)練過程中只用到了正常樣本,省去了收集瑕疵樣本的復(fù)雜過程,給瑕疵檢測(cè)帶來了極大的方便。根據(jù)瑕疵的特點(diǎn),本文選擇大小適當(dāng)?shù)腍aar 特征,使用改進(jìn)FCM 分群法將訓(xùn)練樣本分為30 組,閾值Tj中的t 選用0.02,可以有效地對(duì)太陽能電池EL 影像中的瑕疵進(jìn)行檢測(cè),并能夠近似地給出瑕疵的位置,有助于工廠進(jìn)行自動(dòng)化的太陽能電池的制造檢測(cè)。
[1]Zhang M J,Li J D,Chen J S.Solar cell and production of polysilicon[J].J.Mater.Metall.,2007,6(1):33-38.
[2]Fu Z,Zhao Y Z,Liu Y,et al.Solar cell crack inspection by image processing[C]// 2004 International Conference on Business of Electronic Product Reliability and Liability,New York:Cambridge University Press,2004:77-80.
[3]Tsai H J.The Scale Measurement and Defect Inspection for Printed Solar Cell[D].Chungli:National Central University,2004.
[4]Chen S Y.Surface Defect Detection for Solar Cells[D].Chungli:National Central University,2004.
[5]Fuyuki T,Kondo H,Yamazaki T,et al.Photographic surveying of minority carrier diffusion length in polycrystalline silicon solar cells by electroluminescence[J].Appl.Phys.Lett.,2005,86(26):262108.
[6]Fuyuki T,Kitiyanan A.Photographic diagnosis of crystalline silicon solar cells utilizing electroluminescence[J].Appl.Phys.A,2009,96(1):189-196.
[7]Bezdek J C.Pattern Recognition with Fuzzy Objective Function Algorithm[M].New York:Plenum Press,1981.
[8]Lienhart R,Maydt J.An extended set of Haar-like features for rapid object detection[C]// 2002 IEEE ICIP,New York:CRC Press,2002:900-903.