于子洋 楊瑞琴 黃 陽 秦 皓 胡 燦 朱 軍**王 萍 郭洪玲 梅宏成**
(1)中國人民公安大學偵查學院,北京 100038;2)公安部物證鑒定中心,北京 100038)
穩(wěn)定同位素分析具有示蹤指示能力強、檢測速度快、測量結果準確等特點,被廣泛應用于生態(tài)學和地球化學為代表的眾多學科[1-4]。大氣中水蒸氣的氧(O)、氫(H)穩(wěn)定同位素比值受同位素分餾作用的影響,表現(xiàn)出特定的空間變化規(guī)律[5-6]。其以降水等形式成為地表水,參與到動植物的生長和代謝活動,最終反映在動植物體組織中,由此形成的生物體內O、H穩(wěn)定同位素比值分布規(guī)律可用于研究動物遷移軌跡、物證的真?zhèn)舞b定和溯源推斷等[7-12]。法庭科學研究人員為探究人體組織穩(wěn)定同位素在個體溯源推斷領域的應用潛力,對頭發(fā)、牙齒、指甲等人體組織進行了不同種類元素的穩(wěn)定同位素檢測和分析[13-15]。人頭發(fā)主要由氨基酸組成,長出毛囊后便停止代謝,不再與其他部分和環(huán)境發(fā)生交換,化學性質穩(wěn)定,因此成為記錄飲食、飲水中穩(wěn)定同位素信息的良好載體[16]。
目前研究人員已經(jīng)針對人頭發(fā)中O、H穩(wěn)定同位素開展了部分研究。研究人員發(fā)現(xiàn)人頭發(fā)中O、H穩(wěn)定同位素比值與日常飲用水中O、H穩(wěn)定同位素比值存在正相關關系,人頭發(fā)中H 元素大約有30%左右直接來源于飲水,但當人體攝入大量含有不同δ2H值的食物時,其與當?shù)仫嬎南嚓P關系會被極大弱化[9,17],不同地區(qū)日常飲用水對居民頭發(fā)中O、H 穩(wěn)定同位素的影響程度可能存在差異[18]。在溯源推斷領域,Bol 等[19]檢測了英格蘭當?shù)鼐用窈屯鈦碛慰皖^發(fā)中O穩(wěn)定同位素比值,結合居民頭發(fā)中碳(C)、氮(N)穩(wěn)定同位素比值,利用主成分分析法區(qū)分了當?shù)鼐用窈屯鈦碛慰?。Ehleringer 等[20]和Gautam 等[21]通過大量樣品測定,制作了美國和韓國居民頭發(fā)的O、H穩(wěn)定同位素地圖,幫助實現(xiàn)個體活動軌跡的還原和來源地域的判定。中國地域遼闊,匯集了大量不同的氣候類型及不同飲食習慣,中國居民頭發(fā)穩(wěn)定同位素組成必然存在特有的分布規(guī)律。但現(xiàn)有穩(wěn)定同位素研究報道多來自美國、西歐等國家和地區(qū),針對中國居民頭發(fā)中O、H等元素穩(wěn)定同位素特征的研究相對較少[22]。在溯源推斷時,相關研究多聚焦于單一種類穩(wěn)定同位素數(shù)據(jù)的空間分布特征對比,少有利用統(tǒng)計學手段進行溯源推斷,導致頭發(fā)穩(wěn)定同位素數(shù)據(jù)的溯源推斷能力未被充分發(fā)掘。
本研究對華中(鄭州市、南陽市)、華東(溫州市)、華南(賀州市)、西南(昆明市)和西北(哈密市)等5個地區(qū)6個城市常住居民的頭發(fā)樣本進行了O、H穩(wěn)定同位素比值檢驗,探討中國不同城市居民頭發(fā)O、H穩(wěn)定同位素比值差異和影響因素,考察利用不同統(tǒng)計方法對中國居民頭發(fā)溯源推斷的準確性和可靠性,拓展對中國居民頭發(fā)中O、H穩(wěn)定同位素分布特征及其溯源能力的認識。
Flash EA 2000 型元素分析儀、253 Plus 型穩(wěn)定同位素比質譜儀、ConFlo Ⅳ型連續(xù)流接口裝置,美國Thermo Scientific 公司產(chǎn)品;KQ-250 DB 型數(shù)控超聲波清洗器,昆山市超聲波儀器有限公司產(chǎn)品;202-0AB電熱恒溫干燥箱,北京中興偉業(yè)儀器有限公司產(chǎn)品;XPR 2電子天平,Mettler Toledo公司產(chǎn)品。CBS(鹿蹄,δ18OVSMOW=3.8‰,δ2HVSMOW=-157‰)、USGS42 (人頭發(fā),δ18OVSMOW=8.56‰,δ2HVSMOW=-78.5‰)、USGS43(人頭發(fā),δ18OVSMOW=14.11‰,δ2HVSMOW=-50.3‰)穩(wěn)定同位素標準品,購自美國Reston 穩(wěn)定同位素實驗室;甲醇、氯仿,色譜純,Thermo Fisher 公司產(chǎn)品;實驗用水,PURELAB Ultra 超純水儀(英國ELGA 公司產(chǎn)品)制備;錫箔杯,瑞士Santis公司產(chǎn)品。
在6個城市征集當?shù)爻W【用瘢ㄖ辽僭诋數(shù)剡B續(xù)生活8個月以上)作為頭發(fā)樣本提供志愿者,共采集頭發(fā)樣本198 份,具體樣本信息如表1 所示。所有用于O、H穩(wěn)定同位素檢驗的頭發(fā)樣本均為志愿者貼近頭皮3 cm 左右的頭發(fā),普通人每月頭發(fā)生長速度約為1 cm,貼近頭皮3 cm 左右的頭發(fā)樣本可以保證其為攝入當?shù)厥澄锖退L成。
Table 1 Information of samples and their origin
參照O'Connell 等[23]的研究,按照以下流程對頭發(fā)樣本進行清洗:用甲醇-氯仿(2∶1,v/v)超聲清洗1 h;用去離子水超聲清洗2 次,每次15 min;用甲醇-氯仿(2∶1,v/v)超聲清洗0.5 h;用去離子水超聲清洗3次,每次15 min。將清洗后的頭發(fā)在85℃恒溫箱中干燥3.5 h。將干燥后的頭發(fā)切割成小段,稱取約300 μg,用穩(wěn)定同位素分析專用銀杯包裹。分別稱量約300 μg 的CBS、USGS42、USGS43 標準物質,用穩(wěn)定同位素分析專用銀杯包裹。包好的頭發(fā)樣本和標準物質用元素分析-穩(wěn)定同位素比質譜儀進行檢測。
水樣采集后于4℃以下密封保存,檢測前用0.22 μm濾膜過濾。
元素分析儀:氦氣(He)吹掃流速200 ml/min,高溫裂解爐溫度1 380℃,色譜柱溫度80℃;接口裝置ConFloⅣ:He稀釋壓力60 kPa。
1.6.1 頭發(fā)樣本O、H穩(wěn)定同位素比值測定
在1.5 所設定儀器條件下對頭發(fā)樣本和標準物質同時檢測,每個樣本重復檢測3 次,采用Ⅰsodat3.0軟件分析數(shù)據(jù)。
1.6.2 水樣O、H穩(wěn)定同位素比值測定
檢測時,每6個樣品插入一個標準樣品,每個樣品重復測定3 次,每次進樣2 μl,利用標準樣品校正得到檢測結果。
1.6.3 樣本O、H穩(wěn)定同位素比值測定
O、H穩(wěn)定同位素比值分別用δ18O和δ2H表示,兩者相對標準為標準平均海水。計算公式如式(1)所示:
公式中R表示重同位素與輕同位素豐度比。
1.6.4 樣本O、H穩(wěn)定同位素比值的數(shù)據(jù)校正與分析
參照Qi 等[24]和劉昌景等[25]制定的O、H 穩(wěn)定同位素比值數(shù)據(jù)校正方法,將CBS、USGS42和USGS43 標準物質的δ18O 和δ2H 測定值與真實值進行線性擬合,得出線性校正方程。通過線性校正方程和頭發(fā)樣本δ18O 和δ2H 的測定值計算出其真實值。
利用SPSS 20.0 軟件對樣本的O、H 穩(wěn)定同位素比值進行統(tǒng)計分析。
檢測所得6個城市居民頭發(fā)δ18O 平均值是(9.3±1.0)‰,范圍為6.0‰~11.7‰。居民頭發(fā)δ2H平均值是(-71.2±12.0)‰,范圍為-105.2‰~-47.8‰。對比不同城市居民頭發(fā)O、H穩(wěn)定同位素比值數(shù)據(jù),不同城市存在顯著性差異(ANOVA,δ18O:F=72.04,P<0.01;δ2H:F=305.85,P<0.01)。
對比不同城市居民頭發(fā)δ18O 和δ2H 的標準偏差,二者存在顯著相關性(PCCs(皮爾遜相關系數(shù)),r=0.65,P<0.05),表明隨著城市中居民頭發(fā)δ18O離散程度的增加,居民頭發(fā)δ2H的離散程度增加。進一步對比居民頭發(fā)δ18O 和δ2H,二者存在顯著正相關性(PCCs,r=0.71,P<0.01),表明二者具有相似變化趨勢(圖1)。居民頭發(fā)δ2H會隨居民頭發(fā)δ18O增加而增加。
Fig.1 δ18O and δ2H values of resident hair samples in different cities
本研究檢測中國6個城市居民飲用水的O、H穩(wěn)定同位素比值(暫無哈密飲用水數(shù)據(jù)),不同城市居民飲用水δ18O 平均值是(-7.7±1.6)‰,范圍為-12.1‰~-4.7‰。居民飲用水δ2H 平均值是(-53.4±16.1)‰,范圍為-88.9‰~-27.5‰(圖2)。不同城市居民飲用水δ18O 和δ2H,二者存在顯著相關性(PCCs,r=0.99,P<0.01)。Chen 等[26]研究認為,大氣降水中的O、H同位素比值受空間變化的影響,存在明顯的地域差異,其與緯度和海拔存在明顯負相關關系。本研究并未發(fā)現(xiàn)飲用水δ18O、δ2H與經(jīng)度、緯度存在明顯相關關系,但飲用水中δ18O 和δ2H 與 海 拔 存 在 明 顯 負 相 關 性(PCCs,δ18O:r=-0.84,P=0.03;δ2H:r=-0.84,P=0.01)。這表明居民居住地大氣降水O、H同位素比值與飲用水可能不完全相同,不同來源水的自然或人工混合會影響居民飲用水中O、H同位素的組成。
Fig.2 Distribution of δ18O and δ2H values of drinking water samples in different cities
不同城市居民頭發(fā)和飲用水中δ18O和δ2H關系如圖3 所示。整體而言,居民頭發(fā)中O、H 穩(wěn)定同位素與水中相比完全不同。居民頭發(fā)中18O 相較飲用水中18O是富集的,居民頭發(fā)中2H相較飲用水2H是貧化的,表明飲用水中O、H穩(wěn)定同位素在被人體組織同化的過程中出現(xiàn)了明顯了同位素分餾[17]。不同城市居民頭發(fā)δ18O、δ2H 和日常飲用水中的δ18O、δ2H 存在一定對應關系。居民飲用水δ18O、δ2H較高的賀州、溫州居民頭發(fā)中δ18O、δ2H同樣表現(xiàn)出高值,居民飲用水δ18O、δ2H 最低的昆明,其居民頭發(fā)中δ18O、δ2H 較低,這表明盡管在人體內存在同位素分餾現(xiàn)象,飲用水中O、H穩(wěn)定同位素的空間分布特征還是在很大程度上保留在了居民頭發(fā)當中。與飲用水中δ18O和δ2H相似,居民頭發(fā)中δ18O、δ2H 與空間因素存在一定相關關系,雖與經(jīng)度、緯度無明顯相關關系,但與海拔存在明顯負相關關系(PCCs,δ18O:r=-0.67,P=0.05;δ2H:r=-0.75,P=0.01),且相關性與飲用水相比明顯減弱。這可能是因為空間因素是經(jīng)由飲用水影響頭發(fā)中穩(wěn)定同位素組成,在此過程中空間因素的影響能力逐漸減弱。
Fig.3 Distribution of mean δ18O and mean δ2H values of resident hair and drinking water samples in different cities
對不同城市居民頭發(fā)和飲用水δ18O、δ2H 平均值進行回歸分析,二者存在明顯的正相關關系。對于居民頭發(fā)和飲用水δ18O平均值,其線性回歸方程為:δ18O頭發(fā)=0.4×δ18O水+12.7(R2=0.91)。對于H 穩(wěn)定同位素,其線性回歸方程為:δ2H頭發(fā)=0.5×δ2H水-39.6(R2=0.90)。根據(jù)不同城市居民頭發(fā)和飲用水δ18O、δ2H 平均值的回歸方程,不同城市居民頭發(fā)中O、H穩(wěn)定同位素分別有40%和50%來自于日常飲用水。何亞等[22]同樣發(fā)現(xiàn)中國居民頭發(fā)中O、H 穩(wěn)定同位素比值與水中的O、H 穩(wěn)定同位素比值顯著相關。
不同國家居民頭發(fā)和飲用水中δ18O、δ2H 如表2 所示,居民頭發(fā)δ18O 范圍約為4‰~20‰,δ2H 為-140‰~-48‰;飲用水δ18O 范圍約為-18‰~4‰,δ2H 為-140‰~-8‰。不同國家居民頭發(fā)δ18O、δ2H均存在明顯差異,飲用水中δ18O、δ2H 的變化是導致這種差異的重要原因。目前關于頭發(fā)中穩(wěn)定同位素的研究尚處于起步階段,不同研究中樣本量和采樣地區(qū)的選擇不同會導致所得數(shù)據(jù)存在差異(例如本研究和Thompson等[18]的研究)。另外,居民飲食數(shù)據(jù)收集受限,不同飲食習慣與居民組織中穩(wěn)定同位素組成的關系尚待深入研究,導致不同地區(qū)間數(shù)據(jù)的直接比較相對困難。分析頭發(fā)和飲用水中O、H穩(wěn)定同位素的關聯(lián)性,不同地區(qū)中二者的關聯(lián)程度存在差異,美國居民頭發(fā)O、H穩(wěn)定同位素分別有35%和27%來自于日常飲用水[20],韓國居民頭發(fā)比例分別為27%和36%[21],回歸方程中較高的斜率與居民更多使用當?shù)厥澄锖退嘘P[27],本研究和Thompson 等[18]的研究中,中國居民均存在較大的斜率,意味著中國居民可能相對更多的直接或間接食用當?shù)厥澄锖退?,這為其在溯源推斷領域的應用提供了便利。
Table 2 δ18O and mean δ2H values of resident hair and drinking water samples between the Chinese and people of other countries
在法庭科學領域,針對頭發(fā)的檢測目前主要集中于表觀形態(tài)學特征和DNA 分析,對其中穩(wěn)定同位素組成的分析和應用相對較少。結合人頭發(fā)中多種元素穩(wěn)定同位素組成進行綜合分析,研究人員可以推斷人的飲食習慣,進而推斷居住地域乃至活動軌跡,輔助人員身份鑒定,為司法活動提供幫助。目前利用多種元素的穩(wěn)定同位素進行統(tǒng)計學分析從而對人的居住地進行溯源推斷的研究較少。本研究利用典型判別和神經(jīng)網(wǎng)絡將測得的6個城市居民頭發(fā)中的O、H穩(wěn)定同位素數(shù)據(jù)結合已有的碳、氮穩(wěn)定同位素數(shù)據(jù)進行統(tǒng)計學分析,建立相應數(shù)學模型,檢驗模型的判別準確率,探討這些統(tǒng)計方法對居民居住地推斷的有效性。
2.4.1 居民頭發(fā)O、H穩(wěn)定同位素比值的典型判別分析
典型判別分析是在樣品類別明確的前提下,建立最優(yōu)化的線性組合模型來概括類間差異的統(tǒng)計分析方法,是一種應用廣泛的多元統(tǒng)計技術。對所構建典型判別函數(shù)有效性的驗證方法主要包括自身驗證和交互驗證等。典型判別函數(shù)的有效性由判別準確率表示,其數(shù)值為判別準確的樣本數(shù)與總樣本數(shù)的比值。
本研究對6個城市198份居民頭發(fā)δ18O、δ2H進行判別分析,以考察居民頭發(fā)O、H穩(wěn)定同位素對居民居住城市的溯源推斷能力。所得標準化的判別函數(shù)式如下:判別函數(shù)式1 為Y1=0.35XO+ 0.90XH,判別函數(shù)式2為Y2=0.93XO-0.43XH。這組判別函數(shù)特征值如表3所示,判別函數(shù)式1的方差貢獻率為96.5%,攜帶了絕大部分的原始數(shù)據(jù)信息,判別函數(shù)式2的方差貢獻率為3.5%,二者合計攜帶100%的可用于判別分析的原始數(shù)據(jù)信息。兩個函數(shù)式P值均小于0.01,表明兩個函數(shù)式在進行判別分析時均存在統(tǒng)計學意義,兩個函數(shù)式均應當保留作為判別函數(shù)模型。
由以上兩個判別函數(shù)式所構建判別函數(shù)模型對6個城市居民頭發(fā)δ18O、δ2H 進行判別分析可獲得各類別的聯(lián)合分布圖(圖4)。兩條坐標軸分別由函數(shù)判別式1和判別函數(shù)式2構成。
由圖4 可見,各城市居民頭發(fā)在判別函數(shù)式1上的區(qū)別效果較判別函數(shù)式2更為明顯。哈密、昆明與其他城市明顯分開,賀州分布區(qū)域與其他城市亦有較為明顯的區(qū)別。南陽、鄭州、溫州等3個城市分布集中,區(qū)分效果相對較差。由上判別函數(shù)所得分類結果如表4 所示。6個城市居民頭發(fā)樣本自身驗證和交叉驗證的整體判別準確率分別為66.1%和63.9%,不同城市居民頭發(fā)的驗證判別準確率為55.2%~84.6%。
不同城市居民頭發(fā)樣本的自身驗證判別準確率的分布趨勢與交叉驗證基本一致,整體略高于交叉驗證。其中,哈密、溫州、昆明、賀州等城市判別效果相對較好,其判別準確率均在60%以上。鄭州和南陽兩城市判別效果相對較差,錯判主要發(fā)生在二者之間。造成錯判的可能原因在于鄭州和南陽距離相對較近,因此容易相互錯判,而這兩個城市均位于中國中部地區(qū),與位于中國東部的溫州、南部的賀州和西南部的昆明和西北部的哈密相距很遠,O、H穩(wěn)定同位素比值差異較大(表4),所以分類效果相對較好。值得注意的是,地理位置對頭發(fā)O、H穩(wěn)定同位素比值的影響并不是唯一的,哈密和昆明雖然距離遠,但是其居民頭發(fā)和飲用水中O、H穩(wěn)定同位素比值相差不大,這是導致哈密和昆明兩地居民頭發(fā)錯判的主要原因。
Table 3 Abstract of Fisher discriminant function of δ18O and δ2H values of resident hair
Fig.4 Distribution of hair samples in different cities on function 1 and function 2 obtained from δ18O and δ2H
Table 4 Classification results of hair samples
2.4.2 居民頭發(fā)C、N、O、H穩(wěn)定同位素比值的典型判別分析
結合已有的6個城市居民頭發(fā)C、N 穩(wěn)定同位素比值(數(shù)據(jù)未發(fā)表),本研究對6個城市居民頭發(fā)δ13C、δ15N、δ18O、δ2H 等4 種穩(wěn)定同位素數(shù)據(jù)進行典型判別分析。典型判別分析所得標準化的判別函數(shù)式如表5所示,判別函數(shù)式1的方差貢獻率為74.8%,判別函數(shù)式2的方差貢獻率為23.4%,判別函數(shù)式3的方差貢獻率為1.7%,三者合計攜帶99.9%的原始數(shù)據(jù)信息。3個判別函數(shù)式的P值均小于0.01,表明3個函數(shù)式在進行判別分析時均存在統(tǒng)計學意義,3個函數(shù)式均應當保留作為判別函數(shù)模型。判別函數(shù)式4的方差貢獻率僅為0.1%,P值為0.51,不具有統(tǒng)計學意義,因此排除判別函數(shù)式4。
Table 5 Abstract of Fisher discriminant function of δ13C,δ15N,δ18O,δ2H values of resident hair
以δ13C、δ15N、δ18O、δ2H 等4 種穩(wěn)定同位素數(shù)據(jù)構建的典型判別函數(shù)模型對6個城市居民頭發(fā)樣本進行判別分析得到聯(lián)合分布圖(圖5)。分別以函數(shù)判別式1和判別函數(shù)式2作為分布圖的x軸和y軸。由圖5 可見,各組質心在x軸和y軸均可得到較為明顯的區(qū)分。昆明、哈密兩城市樣本可以與其他城市完全分開。各城市樣品組質心之間區(qū)分程度要明顯好于圖4。這表明C、N、O、H 等4 種穩(wěn)定同位素數(shù)據(jù)構建的判別函數(shù)模型區(qū)分效果好于以O、H兩種穩(wěn)定同位素數(shù)據(jù)構建的判別函數(shù)模型。
Fig.5 Distribution of hair sample on function 1 and function 2 obtained from δ13C,δ15N,δ18O,δ2H
由上判別函數(shù)所得分類結果如表6 所示。6個城市居民頭發(fā)樣本自身驗證的整體判別準確率為86.6%,不同城市居民頭發(fā)樣本自身驗證判別準確率為75.0%~92.7%。交互驗證的整體判別準確率為76.0%,不同城市居民頭發(fā)樣本交互驗證判別準確率為64.3%~87.8%,判別效果相對較好,對比表5,各個城市的判別準確率相較O、H兩種穩(wěn)定同位素數(shù)據(jù)構建的判別函數(shù)模型均有不同程度的上升,其中以哈密和昆明上升最為明顯,這與圖5 分布相一致。
Table 6 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H
利用C、N、O、H 不同穩(wěn)定同位素數(shù)據(jù)分別構成的判別函數(shù)模型其判別準確率如表7 所示。δ13C、δ15N、δ18O、δ2H 各自單獨構建判別函數(shù)時,整體交互驗證判別準確率分別為30.3%、52.0%、44.0%、50.0%。δ15N和δ2H單獨構建的判別函數(shù)模型的判別效果要好于δ18O和δ13C,表明不同種類元素穩(wěn)定同位素的溯源推斷能力存在差異,H穩(wěn)定同位素在4種元素中具有最優(yōu)的溯源推斷潛力。利用δ13C、δ15N和δ18O、δ2H兩種穩(wěn)定同位素組成的判別函數(shù)模型,其判別準確率分別為59.1%和66.1%,其判別效果要好于單一元素。利用4種穩(wěn)定同位素構建判別函數(shù)的判別準確率為76.0%,相較兩種元素構成的判別函數(shù)模型,其判別準確率提高了20%,優(yōu)于何亞等[22]利用O、H 穩(wěn)定同位素數(shù)據(jù)進行判別分析的判別準確率,這表明隨著判別分析中使用的穩(wěn)定同位素種類的增加,判別函數(shù)模型的判別能力逐漸增強,這與Thompson 等[18]利用多種穩(wěn)定同位素進行地域區(qū)分時所得到的結論相似。
Table 7 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H or their combination
2.4.3 居民頭發(fā)C、N、O、H穩(wěn)定同位素比值的神經(jīng)網(wǎng)絡分析
神經(jīng)網(wǎng)絡分析是借鑒神經(jīng)元之間的聯(lián)系,利用計算機的計算能力模擬神經(jīng)網(wǎng)絡的信息傳遞過程,構成一個大規(guī)模、非線性、自適應的動力系統(tǒng),具有自組織、自適應、自學習的能力。其優(yōu)點在于對變量沒有假設要求,有能力自動且精確的給出復雜聯(lián)系的近似表達式,具有一定容錯性,為處理模糊的、數(shù)據(jù)不完全的、不精確的模式識別提供了一個全新途徑,處理非線性問題的能力優(yōu)于傳統(tǒng)統(tǒng)計分析方法。本研究嘗試利用目前應用較多的多層感知器神經(jīng)網(wǎng)絡(MLP) 和徑向基函數(shù)神經(jīng)網(wǎng)絡(RBF)對6個城市居民頭發(fā)中C、N、O、H 穩(wěn)定同位素數(shù)據(jù)進行溯源推斷,探究兩種神經(jīng)網(wǎng)絡模型對居民頭發(fā)的溯源推斷能力。
利用SPSS 軟件的MLP 對6個城市居民頭發(fā)的δ13C、δ15N、δ18O、δ2H進行分類建模,所得模型摘要如表8所示。將各城市居民頭發(fā)C、N、O、H穩(wěn)定同位素數(shù)據(jù)按照訓練集70%、驗證集30%的比例構建MLP 模型,其輸入層為δ13C、δ15N、δ18O、δ2H 4 種穩(wěn)定同位素數(shù)據(jù),輸出層為6個城市類別。
Table 8 Abstract of MLP model
上述MLP 模型對不同城市居民頭發(fā)的分類情況如表9所示。訓練集中各城市居民頭發(fā)的分類準確率為50.0%~100.0%,整體分類準確率為78.5%。驗證集中各城市居民頭發(fā)的分類準確率為50%~100%,整體分類準確率為82.8%,哈密、鄭州、昆明、賀州4個城市的分類準確率相對較高,準確率為83.3%~100%。這與2.4.1中所構建判別函數(shù)模型的判別結果相似。
利用SPSS 軟件RBF 對6個城市居民頭發(fā)的δ13C、δ15N、δ18O、δ2H進行分類建模,所得模型摘要如表10所示。
Table 9 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H in MLP model
Table 10 Abstract of RBF model
上述徑向基函數(shù)神經(jīng)網(wǎng)絡模型對不同城市居民頭發(fā)的分類情況如表11 所示。訓練集中各城市居民頭發(fā)的分類準確率為63.6%~93.1%,整體分類準確率為79.5%。驗證集中各城市居民頭發(fā)的分類準確率為69.2%~100.0%,整體分類準確率為78.8%。訓練集中,哈密的分類準確率最高,準確率達到93.1%。除鄭州外,其他城市的分類準確率均在70%以上。測試集中,哈密、南陽、昆明、溫州的分類準確率較高。
Table 11 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H in RBF model
對比MLP 和RBF 兩種神經(jīng)網(wǎng)絡模型利用不同城市居民頭發(fā)C、N、O、H 穩(wěn)定同位素數(shù)據(jù)的溯源推斷能力,MLP 驗證集的整體分類準確率(82.8%)略優(yōu)于RBF(78.8%)。需要注意的是,雖然MLP 模型在訓練集中對鄭州居民頭發(fā)的分類準確率達到了88.9%,但在驗證集中僅為50.0%,構建的兩種神經(jīng)網(wǎng)絡模型對鄭州居民頭發(fā)的區(qū)分能力均較差,反映出神經(jīng)網(wǎng)絡模型在進行頭發(fā)分類時的局限性。
本文利用不同城市居民頭發(fā)C、N、O、H 穩(wěn)定同位素數(shù)據(jù)所構建的典型判別函數(shù)、MLP 模型和RBF模型3種溯源推斷模型,其整體判別準確率依次為76.0%(交互驗證)、82.8%(測試集)、78.8%(測試集),3種溯源模型分類準確率差別不大,其中MLP 模型整體分類準確率最高,其次為RBF 函數(shù),典型判別函數(shù)相對較差。對比不同模型所得的分類結果,即便是同一城市的頭發(fā)樣本,不同模型之間構建邏輯的差異會導致部分樣本錯判到不同的城市。雖然MLP 模型達到了最高的分類準確率,但相對典型判別函數(shù),其出現(xiàn)了對某些城市樣本分類準確率較低的情況,這可能與本研究數(shù)據(jù)量相對較小有關,在應用時應加以注意。
本文對中國6個城市常住居民頭發(fā)進行了O、H穩(wěn)定同位素比值分析,結果表明,部分城市間居民頭發(fā)δ18O、δ2H 存在顯著差異,居民頭發(fā)整體δ18O 和δ2H 存在顯著正相關性。居民頭發(fā)O、H 穩(wěn)定同位素比值與日常飲用水O、H穩(wěn)定同位素比值呈顯著正相關,中國城市居民頭發(fā)中O、H穩(wěn)定同位素分別有35%和50%來自于日常飲用水。在溯源推斷中,利用居民頭發(fā)中O、H穩(wěn)定同位素數(shù)據(jù)進行典型判別分析,其交互驗證的整體判別準確率為63.9%,結合C、N 穩(wěn)定同位素數(shù)據(jù)建立判別模型,其判別準確率大幅提升,交互驗證的整體判別準確率達到76.0%,且隨著判別分析中使用的穩(wěn)定同位素種類的增加,判別函數(shù)模型的判別能力顯著增強。本文建立的多層感知器神經(jīng)網(wǎng)絡模型的整體分類準確率為82.8%,徑向基函數(shù)神經(jīng)網(wǎng)絡模型整體分類準確率為78.8%,3種溯源推斷數(shù)學模型中,多層感知器神經(jīng)網(wǎng)絡模型的判別準確率最高,但需注意,相對典型判別函數(shù),神經(jīng)網(wǎng)絡模型出現(xiàn)了對某些城市樣本分類準確率較低的情況,在應用時應加以注意。