國(guó)中正,陳維娜,王曉賓,付鈞澤
(中國(guó)人民公安大學(xué) 偵查學(xué)院,北京 100038)
書(shū)寫(xiě)墨跡的種類(lèi)鑒別是法庭科學(xué)領(lǐng)域的重要研究?jī)?nèi)容之一,不僅可以為添改文件檢驗(yàn)提供依據(jù),還能夠鑒別相應(yīng)的書(shū)寫(xiě)工具,縮小偵查范圍,為庭審提供證據(jù)。一般采用儀器分析法采集墨跡數(shù)據(jù),采用化學(xué)計(jì)量法[1-2]進(jìn)行鑒別歸類(lèi)。儀器分析法主要包括色譜法[3-4]、質(zhì)譜法[5-6]、紅外光譜法[7-8]、紫外光譜法[9-10]等,化學(xué)計(jì)量法主要包括聚類(lèi)分析法和主成分分析法。其中系統(tǒng)聚類(lèi)法是一種常見(jiàn)的無(wú)監(jiān)督分類(lèi)方式,能使類(lèi)間對(duì)象的異質(zhì)性和類(lèi)內(nèi)對(duì)象的同質(zhì)性最大化,從而達(dá)到物以類(lèi)聚的目的,同時(shí)對(duì)傳統(tǒng)視覺(jué)分類(lèi)方法起到良好的補(bǔ)充作用;主成分分析法的中心思想是將數(shù)據(jù)降維,從而實(shí)現(xiàn)低維數(shù)據(jù)代替高維數(shù)據(jù)的效果。超光譜成像技術(shù)是在多光譜成像技術(shù)基礎(chǔ)上發(fā)展起來(lái)的新型遙感技術(shù),具有“圖譜合一”的優(yōu)勢(shì),目前已經(jīng)在生態(tài)[11]、軍事[12]、文物保護(hù)[13]、醫(yī)學(xué)診斷[14]等方面獲得廣泛應(yīng)用。近年來(lái),超光譜技術(shù)結(jié)合化學(xué)計(jì)量法已經(jīng)在文件檢驗(yàn)領(lǐng)域的油墨種類(lèi)鑒別方面取得不少突破[15-19]。
目前,關(guān)于藍(lán)色圓珠筆、藍(lán)色中性筆、黑色記號(hào)筆、鋼筆等工具筆的墨跡鑒別分類(lèi)的文獻(xiàn)較多,但還沒(méi)有關(guān)于直液式走珠筆墨跡種類(lèi)區(qū)分的文獻(xiàn)。直液式走珠筆的儲(chǔ)墨和出墨結(jié)構(gòu)類(lèi)似于鋼筆,筆頭類(lèi)似于圓珠筆,在使用時(shí),墨水流經(jīng)筆桿的毛細(xì)結(jié)構(gòu)直接到達(dá)筆尖,不需要借助筆芯,兼?zhèn)滗摴P和圓珠筆的優(yōu)點(diǎn),筆墨流動(dòng)性好、書(shū)寫(xiě)穩(wěn)定、儲(chǔ)墨量大,深受大眾歡迎,逐漸成為主流的書(shū)寫(xiě)工具之一,因此,建立該類(lèi)書(shū)寫(xiě)工具的墨跡種類(lèi)鑒別的方法對(duì)于法庭科學(xué)領(lǐng)域中工具筆墨跡鑒別的應(yīng)用實(shí)踐具有重要意義。本工作采用超光譜技術(shù)采集了直液式走珠筆墨跡樣品的光譜數(shù)據(jù),采用聚類(lèi)分析進(jìn)行了分類(lèi),并采用主成分分析對(duì)聚類(lèi)分析的分類(lèi)結(jié)果進(jìn)行了驗(yàn)證,可為涉及此類(lèi)書(shū)寫(xiě)工具的案件偵破提供思路。
VSC 8000型超級(jí)文檢工作站,搭載掃描范圍為400~1 000 nm 的超光譜模塊,光學(xué)分辨率為1 nm,裝配連續(xù)干涉帶通濾色鏡點(diǎn)光源,電源功率100 W。
收集市面上常見(jiàn)的29種直液式走珠筆,筆墨顏色均為黑色,筆頭直徑均為0.5 mm;書(shū)寫(xiě)襯墊物和書(shū)寫(xiě)載體均為尖兵牌A4紙。
選擇反射光譜模式,超光譜掃描范圍為400~1 000 nm,掃描步進(jìn)值為4 nm。
1.3.1 墨跡樣品的超光譜試驗(yàn)
將10 張A4 紙作為書(shū)寫(xiě)襯墊物,平放在桌面上,另取一張A4紙置于襯墊物上部,用收集的29種直液式走珠筆在A4紙上依次書(shū)寫(xiě)序號(hào)1~29,共計(jì)29個(gè)墨跡樣品,將墨跡樣品放于載物臺(tái)上,選擇3個(gè)墨跡均勻的點(diǎn)作為采樣點(diǎn),按照儀器工作條件進(jìn)行超光譜試驗(yàn),采用The Unscrambler X10.4軟件對(duì)光譜數(shù)據(jù)進(jìn)行平均濾波平滑處理,以消除噪聲的影響,取3組數(shù)據(jù)的平均值。
1.3.2 聚類(lèi)分析試驗(yàn)
采用SPSS.25 中的系統(tǒng)分類(lèi)模塊對(duì)光譜數(shù)據(jù)進(jìn)行聚類(lèi)分析,聚類(lèi)方法為沃爾德法,測(cè)量區(qū)間為平方歐式距離,轉(zhuǎn)換值為標(biāo)準(zhǔn)化中的Z得分,得到聚類(lèi)集中計(jì)劃表和樹(shù)狀圖。
1.3.3 主成分分析試驗(yàn)
使用主成分分析法能夠?qū)庾V數(shù)據(jù)進(jìn)行有效的降維處理,得出各類(lèi)墨跡樣品在主成分特征空間中的獨(dú)立分布,從而對(duì)系統(tǒng)聚類(lèi)的結(jié)果進(jìn)行對(duì)比,驗(yàn)證分類(lèi)效果[20]。采用SPSS.25中的因子分析模塊進(jìn)行主成分分析,變量為400~1 000 nm 范圍內(nèi)的波長(zhǎng),從相關(guān)性矩陣出發(fā),提取大于1的特征根與其所對(duì)應(yīng)的主成分。
29個(gè)直液式走珠筆墨跡樣品的超光譜曲線(xiàn)圖見(jiàn)圖1。
圖1 第Ⅰ大類(lèi)和第Ⅱ大類(lèi)墨跡樣品的超光譜曲線(xiàn)圖Fig.1 Hyperspectral curves of ink samples of the first category and second category
由圖1可見(jiàn):在400~650 nm 的范圍內(nèi),29種墨跡樣品均在440 nm 和480 nm 處形成了明顯的向上的反射峰,在460 nm 處形成了向下的吸收峰;在650~850 nm 的范圍內(nèi),1~14號(hào)、16號(hào)、17號(hào)、20~24號(hào)等21個(gè)樣品的反射率隨波長(zhǎng)的增大而急劇上升,而15號(hào)、18號(hào)、19號(hào)、25~29號(hào)等8個(gè)樣品的反射率隨波長(zhǎng)上升趨勢(shì)較為平穩(wěn),與前21條曲線(xiàn)對(duì)比差異明顯。根據(jù)這一特征,可將前面21條曲線(xiàn)對(duì)應(yīng)的墨跡歸屬為第Ⅰ大類(lèi)墨跡樣品(圖1a,曲線(xiàn)對(duì)應(yīng)的墨跡序號(hào)分別1,2,3,4,5,6,7,8,9,10,11,12,13,14,16,17,20,21,22,23,24);后面8條曲線(xiàn)對(duì)應(yīng)的墨跡歸屬為第Ⅱ大類(lèi)墨跡樣品(圖1b,曲線(xiàn)對(duì)應(yīng)的墨跡序號(hào)分別為15,18,19,25,26,27,28,29)。
分別對(duì)上述兩大類(lèi)墨跡的光譜數(shù)據(jù)進(jìn)行聚類(lèi)分析,并根據(jù)聚類(lèi)集中計(jì)劃表繪制聚合系數(shù)隨分類(lèi)數(shù)變化的散點(diǎn)圖,結(jié)果見(jiàn)圖2,將曲線(xiàn)變化趨勢(shì)開(kāi)始變得平緩的點(diǎn)作為分類(lèi)數(shù)。
由圖2可知:兩大類(lèi)墨跡樣品均在分類(lèi)數(shù)大于4時(shí),曲線(xiàn)的變化趨勢(shì)變平緩,因此將第Ⅰ大類(lèi)和第Ⅱ大類(lèi)墨跡樣品都分為4小類(lèi)。
兩大類(lèi)墨跡樣品聚類(lèi)分析樹(shù)狀圖見(jiàn)圖3。
如圖3所示:當(dāng)平方歐式距離為4時(shí),可將第Ⅰ大類(lèi)21種墨跡樣品分為4 小類(lèi):第1 類(lèi)為6 號(hào)、8號(hào)、10號(hào)、24號(hào);第2類(lèi)為2號(hào)、3號(hào)、4號(hào)、12號(hào)、14號(hào)、20號(hào)、21號(hào);第3類(lèi)為1號(hào)、5號(hào)、7號(hào)、9號(hào)、22號(hào);第4類(lèi)為11號(hào)、13號(hào)、16號(hào)、17號(hào)、23號(hào)。當(dāng)平方歐式距離為5時(shí),可將第Ⅱ大類(lèi)的8種墨跡樣品 分 為4小類(lèi):第5 類(lèi) 為15 號(hào)、18 號(hào)、19 號(hào)、28號(hào);第6 類(lèi) 為25 號(hào)、29 號(hào);第7 類(lèi) 為26 號(hào);第8類(lèi)為27號(hào)。
圖2 第Ⅰ大類(lèi)和第Ⅱ大類(lèi)的聚合系數(shù)隨種類(lèi)數(shù)變化圖Fig.2 Diagrams showing the change of coefficients of the first and second category with the number of categories
圖3 第Ⅰ大類(lèi)和第Ⅱ大類(lèi)墨跡樣品系統(tǒng)聚類(lèi)樹(shù)狀圖Fig.3 The hierarchical clustering dendrograms of ink samples of the first and second category
由上面結(jié)果可知:運(yùn)用系統(tǒng)聚類(lèi)的方法,可將29種直液式走珠筆形成的墨跡樣品分為8類(lèi)。
用SPSS.25 分析軟件分別對(duì)第Ⅰ大類(lèi)(1~4類(lèi))、第Ⅱ大類(lèi)(5~8類(lèi))光譜數(shù)據(jù)進(jìn)行主成分分析,得到的分析結(jié)果見(jiàn)表1和表2。
表1 第Ⅰ大類(lèi)墨跡樣本主成分分析結(jié)果Tab.1 Analytical results of principal component analysis of ink samples of the first category
由表1和表2可知:在第Ⅰ大類(lèi)墨跡樣品的光譜數(shù)據(jù)提取到的7個(gè)主成分中,前2個(gè)主成分累計(jì)貢獻(xiàn)率為87%;在第Ⅱ大類(lèi)墨跡樣品的光譜數(shù)據(jù)提取到的4個(gè)主成分中,前2個(gè)主成分的累積貢獻(xiàn)率為97%。這兩大類(lèi)墨跡樣品前兩個(gè)主成分均已包含了絕大部分的光譜信息。因此,基于前2個(gè)主成分繪制了這兩大類(lèi)墨跡樣品的超光譜數(shù)據(jù)的主成分得分圖,見(jiàn)圖4,以對(duì)系統(tǒng)聚類(lèi)的分類(lèi)結(jié)果進(jìn)行驗(yàn)證。
表2 第Ⅱ大類(lèi)墨跡樣本的主成分分析結(jié)果Tab.2 Analytical results of principal component analysis of ink samples of the second category
圖4 第Ⅰ大類(lèi)和第Ⅱ大類(lèi)墨跡樣本主成分得分圖Fig.4 The score charts of principal component of ink samples of the first and second category
如圖4所示:運(yùn)用系統(tǒng)聚類(lèi)所得出的8種分類(lèi)結(jié)果在主成分得分圖中區(qū)分明顯,第1~8類(lèi)所包含的樣品都能聚集在一塊,說(shuō)明聚類(lèi)分析的分類(lèi)結(jié)果是合理的。
采用超光譜技術(shù)采集了29種直液式走珠筆墨跡數(shù)據(jù),通過(guò)光譜曲線(xiàn)的走勢(shì)將其分為第Ⅰ大類(lèi)和第Ⅱ大類(lèi),系統(tǒng)聚類(lèi)又將這兩大類(lèi)各自分為4小類(lèi),并得到了主成分分析結(jié)果的驗(yàn)證。該方法可對(duì)傳統(tǒng)形態(tài)學(xué)分類(lèi)鑒別方法起到了補(bǔ)充作用;在刑事案件以及民事糾紛中,還可為涉及此類(lèi)書(shū)寫(xiě)工具的添改文件檢驗(yàn)、書(shū)寫(xiě)工具鑒別提供數(shù)據(jù)支持和方法。