姜 紅 王 欣 顧安舟
(中國人民公安大學(xué),北京,100038)
在犯罪現(xiàn)場中,常常能提取到超市的收銀小票、銀行的取款憑證等證物,因此,現(xiàn)場遺留紙張的分析檢驗是法庭科學(xué)研究的重要課題之一。刑事技術(shù)人員經(jīng)過檢驗分析現(xiàn)場提取的紙張,如熱敏紙等,可以從中獲取違法犯罪分子的人群特征、行蹤動向和經(jīng)濟狀況等。充分利用這些信息可以刻畫違法犯罪分子的特征,縮小偵查范圍,為偵查破案和庭審服務(wù)提供便利。熱敏紙是一種加工紙,指涂布了含有成色材料、經(jīng)熱信號激勵可自身顯色的信息記錄紙。目前,紙張的檢驗方法主要有紅外光譜法、掃描電子顯微鏡/能譜法和拉曼光譜法等[1-3]。本研究利用X射線熒光光譜儀(XRF)對收集到的31 種熱敏紙樣品進行檢驗,依據(jù)熱敏紙樣本所含元素種類及其含量的差異,對樣品進行區(qū)分;選用SPSS 22.0 統(tǒng)計分析軟件,結(jié)合主成分分析法和系統(tǒng)聚類分析法,對實驗結(jié)果進行處理和驗證,得到了較為滿意的結(jié)果。
X 射線熒光光譜儀(XRF,X-MET7500 型,英國),Rh靶,電壓45 kV,電流50 μA,測試時間110 s。
31 個不同來源的熱敏紙樣品,樣品信息如表1所示。
表1 熱敏紙樣品表
分別剪取31 種樣品,按上述實驗條件進行XRF檢驗,獲取光譜數(shù)據(jù);樣品尺寸為10 mm×10 mm,每個樣品進行3次平行實驗。
根據(jù)XRF 檢測31 種熱敏紙樣品的結(jié)果可知,其中含有的主要元素有Ca、Ti、Fe、Ni、Cu、Zn、Sn、Sb、Pb 等,其中元素Ca、Ti、Fe 的含量最多,其主要原因是紙張常用填料為碳酸鈣,因此所含Ca 元素含量較多[4-5];此外,為增強紙張機械強度、白度和光澤度,造紙過程中常使用的復(fù)鹽、漂白劑等會引入Ti、Fe元素[6-7];另外,在紙張的殺菌抑菌、防腐劑和阻燃劑的添加及印刷過程中,往往會引入Ni、Zn 和Pb 等元素[8]。不同品牌、系列及批次的熱敏紙樣品由于原料和加工工藝不同,所含元素種類和含量會有所區(qū)別,因此,可以將各樣本中所含元素種類和含量作為鑒定樣品的依據(jù)。
通過比較分析熱敏紙樣品中所含元素種類、含量以及元素含量比可以對樣本進行初步分類,但僅憑以上方法無法對樣本進行較為精確的分類;同時,當樣本數(shù)量較大時,人工進行比較和分類耗時耗力,因此,尋求一種更為精確、便捷的分類方法是十分必要的。主成分分析法是一種常用的分析方法,旨在利用降維的思想,把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標[9-10]。表2所示為利用主成分分析法得到的31種熱敏紙的特征方差貢獻率。
表2 主成分分析特征方差貢獻率
主成分分析法中,通常選擇特征根大于1 且累積方差貢獻率大于85%的主成分作為代表性特征。由表1 可知,本實驗僅提取了1 個主成分。但是由于成分之間的相關(guān)性較大,1 個主成分無法準確映射出各樣品在三維矢量空間的具體分布情況,分類結(jié)果并不理想。因此,需要借助其他分析方法進行進一步探究。
近年來,聚類分析法被廣泛應(yīng)用于理化檢驗領(lǐng)域。系統(tǒng)聚類又稱為凝聚性層次聚類,主要是根據(jù)數(shù)據(jù)之間的距離,合并相近程度最高的兩簇成一個新簇,不斷重復(fù)此過程,直到所有個體都歸為一個簇[11-12]。判別分析法是用一種根據(jù)已有的數(shù)據(jù)集去分析新的數(shù)據(jù)類別的方法,可以通過此方法建立預(yù)測模型[13-15]。本研究嘗試將兩種分析方法相結(jié)合,以期實現(xiàn)對熱敏紙的準確檢驗。
本研究采用組間平均連接法度量類間距離,選擇平方歐氏距離度量區(qū)間表征樣品之間的差異,再進行系統(tǒng)聚類,譜系圖如圖1所示。當并類距離最?。?)時,樣本可分為6類;當并類距離為2時,樣品可分為4類;當閾值達到25時,停止凝聚,所有樣品并為一類。隨機選擇1#、12#、31#樣品的3 次重復(fù)實驗結(jié)果進行分析,在排除實驗誤差的情況下,以同一樣本重復(fù)實驗結(jié)果為一類來確定并類距離。根據(jù)譜系圖分析可知,當并類距離最?。?)時,將樣品分為6類是最科學(xué)合理的。
圖1 31種熱敏紙聚類分析結(jié)果
選用SPSS22.0統(tǒng)計分析軟件中的判別分析模塊,采用 Fisher’s 函數(shù)系數(shù),選擇 Box’s M 描述統(tǒng)計量,將檢測數(shù)據(jù)作為自變量,用F檢驗的概率決定變量是否加入函數(shù)或被剔除,得到了判別函數(shù)特征值(見表3)和6 類樣品在所建立的兩個判別函數(shù)上的聯(lián)合分布圖(見圖2)。
表3 判別式函數(shù)摘要
圖2 31種熱敏紙的聯(lián)合分布圖
本研究在分類過程中建立了4 個判別函數(shù),其特征值如表3 所示。其中,判別函數(shù)1 和判別函數(shù)2 特征值的方差貢獻率分別為93.7%和5.1%,累積方差貢獻率分別為93.7%和98.7%,所攜帶的信息量遠大于后面的判別函數(shù)。判別函數(shù)1 和判別函數(shù)2 的規(guī)范相關(guān)性系數(shù)分別為0.996和0.935,表明被分類的組別在判別函數(shù)1 和判別函數(shù)2 上差異顯著。因此,選擇判別函數(shù)1和判別函數(shù)2作為判別軸建立聯(lián)合分布圖。
由圖2 可以看出,6 類樣品重心區(qū)別明顯,與判別函數(shù)2 的判別軸相比,判別函數(shù)1 的判別軸區(qū)分情況更加顯著。通過判別分析建立預(yù)測模型,可以預(yù)測新紀錄,即可以區(qū)分新數(shù)據(jù)的所屬類別。用樣品初始數(shù)據(jù)進行檢驗,正確率可達95.7%。
本研究基于X射線熒光光譜分析法,將無監(jiān)督的系統(tǒng)聚類法與有監(jiān)督的判別分析法相結(jié)合,對31 種熱敏紙樣品進行了多角度的分析,當并類距離最?。?)時,可將樣品分為6類;驗證的同時進行了判別分析,總體預(yù)測正確率為95.7%。該方法快速、準確且無損,適用于法庭科學(xué)領(lǐng)域。但該方法在定量分析上仍有不足,后期將引入新的數(shù)據(jù)處理方法或驗證算法,以提高模式識別的廣度與深度。