王小龍 朱盼盼 梁紫妍
1. 安徽建筑大學(xué) 電子與信息工程學(xué)院 安徽 合肥 230601;
2. 安徽建筑大學(xué) 土木工程學(xué)院 安徽 合肥 230601
玻璃文物鑒別主要任務(wù)是在已通過技術(shù)手段得到大量文物化學(xué)成分或者部分化學(xué)成分的情況下,通過模糊聚類以及隨機(jī)森林算法辨別文物成分的合理性以及對于機(jī)器無法分析的化學(xué)成分予以補(bǔ)充分析,可應(yīng)用在文物發(fā)掘,文物鑒別、分析等場景,對回溯中國古代外交往來,市場貿(mào)易有重要的價(jià)值[1]。
在風(fēng)化過程中,內(nèi)部元素與環(huán)境元素進(jìn)行大量交換,導(dǎo)致其成分比例發(fā)生變化,從而影響對其類別的正確判斷。在已知文物類別的情況下,對于分析其化學(xué)成分之間的關(guān)聯(lián)關(guān)系以及不同類別之間的化學(xué)成分關(guān)聯(lián)關(guān)系的差異性,實(shí)際上就是通過灰色關(guān)聯(lián)度的綜合評(píng)價(jià)來為同類別間的化學(xué)成分排序,以此來探究文物的實(shí)際價(jià)值[2-3]?,F(xiàn)通過技術(shù)手段,使用儀器獲得一批古代文物的相關(guān)數(shù)據(jù),如下表1所示。
表1 文物成分?jǐn)?shù)據(jù)表
同時(shí),由于技術(shù)手段的限制,導(dǎo)致部分文物的本分化學(xué)組分不清,需要通過下文的方式得出相關(guān)的數(shù)據(jù),并加以分析文物屬性。
按照表2中的數(shù)據(jù)構(gòu)建模糊矩陣,以高鉀玻璃的風(fēng)化、未風(fēng)化,鉛鋇玻璃的風(fēng)化、未風(fēng)化作為分類對象,14種化學(xué)物質(zhì)作為分類指標(biāo)。
表2 文物風(fēng)化情況表
1.1.1 絕對值減數(shù)法。
1.1.2 構(gòu)建矩陣。
1.1.3 模糊聚類。
按梯度規(guī)定得到分類情況,此處應(yīng)通過SPSSPRO實(shí)現(xiàn)計(jì)算,從計(jì)算可以得出:第1類劃分,共將文物玻璃分為兩大類,第1批編號(hào)為1-6,第2批編號(hào)7-10,通過表2得出,該類劃分編號(hào)文物的共性為高鉀、鉛鋇的不同,而由于受環(huán)境風(fēng)化程度影響較大,在數(shù)學(xué)分析上使得4-5的鉛鋇文物編入高鉀文物中,通過高鉀、鉛鋇不同,聯(lián)系實(shí)際生活,可以大致判斷文物出土的地域特點(diǎn);第2類劃分,將第1批編號(hào)化為次一級(jí)編號(hào)為1-4,次二級(jí)編號(hào)為5-6,將第2批編號(hào)化為次一級(jí)編號(hào)7-9,次二級(jí)編號(hào)9-10,該類劃分在考慮高鉀、鉛鋇的基礎(chǔ)上劃分為風(fēng)化與未風(fēng)化,例如,通過表2可以得出,第1批次一級(jí)劃分文物,屬高鉀風(fēng)化文物。第3類劃分,將文物分為5批,第1批為1-2,第2批為3,第3批為4-6,第4批為7-8,第5批為9-10。針對編號(hào)5-10的文物研究人員深度挖掘4-6號(hào)文物與7-8號(hào)文物化學(xué)成分內(nèi)在之間的聯(lián)系,將兩類文物的14種化學(xué)物質(zhì)構(gòu)建特征矩陣,通過提取兩個(gè)自變量之間的特征值,影響兩類文物進(jìn)入同一組的主要貢獻(xiàn)前5名分別為氧化鉛、氧化鋇、二氧化硅、氧化鉀、氧化鍶)[4]。選擇二氧化硅、氧化鉀、氧化鉛、氧化鋇、氧化鍶作為特征變量,認(rèn)為它們對分類4-6與7-8為一組做出貢獻(xiàn)。以此為自變量,以高鉀,鉛鋇為因變量,構(gòu)建線性回歸方程:
對于這個(gè)公式,利用SPSSPRO分析其合理性:從F檢驗(yàn)的結(jié)果分析可以得到,顯著性P值為0.000***,水平上呈現(xiàn)顯著性,拒絕回歸系數(shù)為0的原假設(shè),因此模型基本滿足要求。對于變量共線性表現(xiàn),VIF全部小于10,因此模型沒有多重共線性問題,模型構(gòu)建良好,通過這個(gè)公式可以發(fā)現(xiàn),帶入上述數(shù)據(jù),在圖像附近的都可被視作初步高鉀玻璃,不符合即為鉛鋇玻璃,即就能認(rèn)為符合高鉀玻璃。
通過已得出的相關(guān)公式,帶入A1~A8相關(guān)數(shù)據(jù),得出表3。
表3 線性函數(shù)的預(yù)測
對于表2的屬性分類,以表2為訓(xùn)練集對其進(jìn)行訓(xùn)練,通過隨機(jī)森林的方法,多次迭代,讓計(jì)算機(jī)來模擬情況,但由于樣本數(shù)量較少,為了避免過擬合的情況出現(xiàn),研究人員模擬采集文物樣本風(fēng)化點(diǎn),根據(jù)已知的高鉀玻璃風(fēng)化的化學(xué)成分范圍隨機(jī)生成1000個(gè)待分類數(shù)據(jù),再通過隨機(jī)森林產(chǎn)生的分類標(biāo)準(zhǔn)對其進(jìn)行分類,觀察分類結(jié)果是否隸屬于高鉀風(fēng)化類。于此,排除了過擬合的可能,隨機(jī)森林結(jié)果如表4。
表4 隨機(jī)森林預(yù)測表
再對比第三問得出的結(jié)論發(fā)現(xiàn)與結(jié)果一致,故模糊聚類具有穩(wěn)定性,且亞分類標(biāo)準(zhǔn)為5是較為合適的結(jié)果。
本文通過對風(fēng)化玻璃文物的化學(xué)成分?jǐn)?shù)據(jù)進(jìn)行大數(shù)據(jù)分析,提出基于模糊聚類和灰色關(guān)聯(lián)度的風(fēng)化玻璃文物分析,通過對風(fēng)化點(diǎn)與未風(fēng)化點(diǎn)的化學(xué)成分進(jìn)行特征提取,利用模糊聚類算法得到樣本點(diǎn)譜系圖,直觀地看出玻璃文物的一級(jí)分化情況,按照化學(xué)成分中心點(diǎn)平均值將與風(fēng)化結(jié)果相關(guān)性高的成分提取出來,擬合出玻璃分類與化學(xué)成分的線性表達(dá),從而鑒別其種類。