国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹(shù)和K-means聚類(lèi)的古玻璃成分分析

2023-06-07 14:30謝佳欣
關(guān)鍵詞:決策樹(shù)紋飾風(fēng)化

謝佳欣

(首都經(jīng)濟(jì)貿(mào)易大學(xué),北京 100071)

0 引言

絲綢之路是古代中西方文化交流的通道,其中玻璃貿(mào)易是早期貿(mào)易往來(lái)的象征。我國(guó)在吸收國(guó)外技術(shù)后就地取材,制作出了與外來(lái)玻璃外觀相似,但化學(xué)成分不同的玻璃制品。

制作古玻璃的主要原料有石英砂、可降低熔化溫度的助熔劑和作為穩(wěn)定劑的石灰石。古代玻璃極易受埋藏環(huán)境的影響而風(fēng)化,內(nèi)、外部元素會(huì)產(chǎn)生較多變化,從而導(dǎo)致無(wú)法對(duì)風(fēng)化后的文物類(lèi)別進(jìn)行判斷。其中未風(fēng)化文物雖然不排除局部有較淺風(fēng)化,但依舊能從表面看出文物的紋飾、顏色;風(fēng)化文物表面則有明顯的風(fēng)化區(qū)域和未風(fēng)化區(qū)域。

該文基于決策樹(shù)和K-means 聚類(lèi)算法對(duì)古玻璃的成分進(jìn)行分析和鑒別,探尋文物的紋飾、顏色、表面風(fēng)化與玻璃類(lèi)型的關(guān)系,并對(duì)玻璃進(jìn)行亞分類(lèi),以期取得更好的保存效果,避免進(jìn)一步風(fēng)化或損失。

1 樣品數(shù)據(jù)說(shuō)明

現(xiàn)得到一批我國(guó)古代玻璃制品的相關(guān)數(shù)據(jù),共有58 個(gè)文物,考古工作者根據(jù)這些文物樣品的化學(xué)成分,并利用其他檢測(cè)手段已將其分為高鉀玻璃和鉛鋇玻璃2 種類(lèi)型。其中58 個(gè)文物紋飾、類(lèi)型、顏色和表面風(fēng)化的相關(guān)信息見(jiàn)表1(表1 僅展示1 號(hào)~3 號(hào)文物的信息),58 個(gè)文物各化學(xué)成分含量的比例見(jiàn)表2(表2 僅展示1 號(hào)~3 號(hào)文物的信息)。

表1 文物的紋飾、類(lèi)型、顏色和表面風(fēng)化信息

表2 文物的各元素含量

2 文物的紋飾、顏色、表面風(fēng)化與玻璃類(lèi)型的關(guān)系

2.1 決策樹(shù)模型的建立和求解

作為有監(jiān)督學(xué)習(xí)的算法,決策樹(shù)算法可根據(jù)數(shù)據(jù)的不同特征,不斷地對(duì)數(shù)據(jù)進(jìn)行分類(lèi),最終實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類(lèi)。其中的CRT 生長(zhǎng)法是將數(shù)據(jù)進(jìn)行拆分,向因變量靠攏,形成與因變量同質(zhì)的段,在存在缺失值和變量數(shù)多的情況下較有優(yōu)勢(shì)。結(jié)合數(shù)據(jù)特點(diǎn),決策樹(shù)模型中的CRT 生長(zhǎng)法比較適合探究文物的紋飾、顏色、表面風(fēng)化與玻璃類(lèi)型的關(guān)系。

根據(jù)表1 中的數(shù)據(jù),以紋飾、顏色、紋飾類(lèi)型為自變量,有、無(wú)風(fēng)化作為因變量,利用決策樹(shù)分析得出3 個(gè)自變量的重要性,具體結(jié)果見(jiàn)表3。紋飾∶顏色∶類(lèi)型≈10 ∶4 ∶3,具體玻璃類(lèi)型分類(lèi)結(jié)果正確率為84.5%,結(jié)果如圖1 所示。

圖1 決策樹(shù)對(duì)是否風(fēng)化的分類(lèi)圖

表3 4 類(lèi)玻璃元素含量均值

根據(jù)圖1 可知,高鉀玻璃中紋飾為A、C 的均為表面未風(fēng)化,紋飾為B 的表面都出現(xiàn)了風(fēng)化情況;鉛鋇玻璃中藍(lán)綠、淺藍(lán)、深綠、黑這幾種顏色的玻璃多為風(fēng)化玻璃,其中藍(lán)綠、黑色的玻璃都出現(xiàn)了風(fēng)化。還可以通過(guò)紋飾來(lái)判斷其是否風(fēng)化。

2.2 結(jié)果分析

結(jié)合上述圖表的分析可以得出如下結(jié)論:1)當(dāng)玻璃類(lèi)型為高鉀玻璃時(shí),如果紋飾類(lèi)型為B,則其極易被風(fēng)化。2)當(dāng)玻璃類(lèi)型為鉛鋇玻璃時(shí),紋飾類(lèi)型C 的玻璃比紋飾類(lèi)型A 的玻璃更易風(fēng)化。鉛鋇玻璃中藍(lán)綠、黑色玻璃更易被風(fēng)化。3)顏色和類(lèi)型對(duì)文物的影響相差不大,顏色的影響略大于類(lèi)型,紋飾比顏色和紋飾類(lèi)型在玻璃類(lèi)型分類(lèi)中具有更重要的作用。

3 對(duì)高鉀玻璃、鉛鋇玻璃進(jìn)行亞類(lèi)劃分

3.1 高鉀玻璃、鉛鋇玻璃的各元素含量統(tǒng)計(jì)

該文基于玻璃元素特征對(duì)玻璃進(jìn)行亞分類(lèi)。為探尋在4 個(gè)類(lèi)別(高鉀玻璃風(fēng)化、高鉀玻璃未風(fēng)化、鉛鋇玻璃風(fēng)化、鉛鋇玻璃未風(fēng)化)的基礎(chǔ)上進(jìn)行亞分類(lèi)是否合理,該文計(jì)算了4 類(lèi)玻璃文物類(lèi)型的化學(xué)成分的均值,具體結(jié)果見(jiàn)表3。

根據(jù)表3 可以得到大致的分類(lèi)規(guī)律:1)在不同組合下,且在不同采樣點(diǎn),各化學(xué)物質(zhì)組成成分中均有SiO2含量較高的特點(diǎn),這與玻璃中SiO2為主要成分的客觀現(xiàn)實(shí)一致。2)在不同風(fēng)化情況下,高鉀玻璃SiO2、K2O 和CaO 的含量變化顯著,鉛鋇玻璃SiO2、PbO、BaO 和CaO 的含量占比變化顯著,這與引言中“古代常添加石灰石作為穩(wěn)定劑”、高鉀玻璃以草木灰為助熔劑、鉛鋇玻璃以鉛礦石為助熔劑的信息相符,說(shuō)明數(shù)據(jù)整體與客觀現(xiàn)實(shí)沒(méi)有明顯偏差,且4 類(lèi)玻璃元素含量均值差異較大,則在4 類(lèi)的基礎(chǔ)上進(jìn)行亞分類(lèi)是合理的。

3.2 K-means 聚類(lèi)模型的建立

該文將玻璃14 種成分的比例作為聚類(lèi)[1]依據(jù)建立K-means 聚類(lèi)模型,分別對(duì)4 個(gè)類(lèi)別的玻璃進(jìn)行亞分類(lèi)。具體的算法步驟如下。

3.2.1 利用手肘法確定聚類(lèi)個(gè)數(shù)K

手肘法是一種利用誤差平方和(SSE)和K值的關(guān)系圖確定最優(yōu)K值的方式,其算法思想為隨聚類(lèi)中心(K值)的逐漸增多,SSE逐漸減少。當(dāng)K值小于真實(shí)聚類(lèi)數(shù)時(shí),隨著K值的增大,SSE變化較大;當(dāng)K值大于真實(shí)聚類(lèi)數(shù)時(shí),隨著K值的增大,SSE 變化較小。其中手肘法核心指標(biāo)SSE的表達(dá)式如公式(1)所示。

式中:SSE為誤差平方和;Cj為第j個(gè)簇;Q為Cj的樣本點(diǎn);P為Cj的質(zhì)心。

不同K值下SSE的值如圖2 所示。根據(jù)圖2 可知,4個(gè)類(lèi)別的SSE隨K值的變化均在K=2 時(shí)有強(qiáng)烈的轉(zhuǎn)折(圖中圓圈內(nèi)的點(diǎn)),因此均選取分類(lèi)中心個(gè)數(shù)K=2。

圖2 不同K 值下SSE 的值

3.2.2 K-means 聚類(lèi)算法流程

K-means 最小化,是要最小化所有的文物數(shù)據(jù)點(diǎn)與其所關(guān)聯(lián)的聚類(lèi)中心點(diǎn)之間的歐式距離之和,歐式距離的定義如公式(2)所示。

式中:xij為多維向量,其中i為第i個(gè)樣本數(shù)據(jù),j為第j維;mkj為第k簇的聚類(lèi)中心。

聚類(lèi)的各類(lèi)總的距離平方和E 如公式(3)所示。

式中:ci為第i簇樣本;k為一共有k簇。

用SPSS 對(duì)4 個(gè)類(lèi)別分別進(jìn)行聚類(lèi)的算法流程見(jiàn)表4。

表4 K-means 聚類(lèi)算法流程

3.3 K-means 聚類(lèi)結(jié)果及其分析

對(duì)4 個(gè)類(lèi)別建立聚類(lèi)模型,均選擇聚類(lèi)數(shù)為2 類(lèi),設(shè)置最大迭代次數(shù)為10 次。

3.3.1 高鉀未風(fēng)化玻璃聚類(lèi)的結(jié)果及分析

該文通過(guò)F 檢驗(yàn)結(jié)果,并以顯著性P值≤0.05 的化學(xué)成分做分析。在高鉀未風(fēng)化玻璃聚類(lèi)的結(jié)果中,通過(guò)F 檢驗(yàn)和P 檢驗(yàn)的化學(xué)成分為二氧化硅(SiO2)、氧化鉀(K2O)和氧化鈣(CaO)。聚類(lèi)規(guī)則見(jiàn)表5。

表5 高鉀未風(fēng)化玻璃聚類(lèi)的結(jié)果

根據(jù)表5 可知,高鉀未風(fēng)化玻璃主要包括以下2 種:聚類(lèi)1,二氧化硅(SiO2)相對(duì)含量較高的玻璃,該文稱(chēng)為SiO2玻璃。聚類(lèi)2,氧化鉀(K2O)和氧化鈣(CaO)含量相對(duì)較高的玻璃,該文稱(chēng)為K2O-CaO 玻璃。

3.3.2 鉛鋇未風(fēng)化玻璃聚類(lèi)的結(jié)果及分析

在對(duì)鉛鋇未風(fēng)化玻璃聚類(lèi)的結(jié)果中,通過(guò)F 檢驗(yàn)和P檢驗(yàn)的化學(xué)成分為二氧化硅(SiO2)、氧化鎂(MgO)和氧化鉛(PbO)。聚類(lèi)規(guī)則見(jiàn)表6。

表6 鉛鋇未風(fēng)化玻璃聚類(lèi)的結(jié)果

根據(jù)表6 可知,鉛鋇未風(fēng)化玻璃主要包括聚類(lèi)1,二氧化硅(SiO2)、氧化鎂(MgO)相對(duì)含量較高的玻璃,該文稱(chēng)為SiO2-MgO 玻璃。聚類(lèi)2,氧化鉛(PbO)含量相對(duì)較高的玻璃,該文稱(chēng)為PbO 玻璃。

3.3.3 高鉀風(fēng)化玻璃聚類(lèi)的結(jié)果及分析

在對(duì)鉛鋇未風(fēng)化玻璃聚類(lèi)的結(jié)果中,通過(guò)F 檢驗(yàn)和P檢驗(yàn)的化學(xué)成分為二氧化硅(SiO2)和氧化鋁(Al2O3)。聚類(lèi)規(guī)則見(jiàn)表7。

表7 高鉀風(fēng)化玻璃聚類(lèi)的結(jié)果

根據(jù)表7 可知,高鉀風(fēng)化玻璃主要分為:聚類(lèi)1,二氧化硅(SiO2)相對(duì)含量較高的玻璃,該文稱(chēng)為SiO2玻璃。聚類(lèi)2,氧化鉛(PbO)含量相對(duì)較高的玻璃,該文稱(chēng)為PbO 玻璃。

3.3.4 鉛鋇風(fēng)化玻璃聚類(lèi)的結(jié)果及分析

在對(duì)鉛鋇未風(fēng)化玻璃聚類(lèi)的結(jié)果中,通過(guò)F 檢驗(yàn)和P檢驗(yàn)的化學(xué)成分為氧化鎂(MgO)、氧化銅(CuO)、氧化鉛(PbO)、氧化鋇(BaO)以及二氧化硫(SO2)。聚類(lèi)規(guī)則見(jiàn)表8。

表8 鉛鋇風(fēng)化玻璃聚類(lèi)的結(jié)果

根據(jù)表8 可知,鉛鋇風(fēng)化玻璃主要分為:聚類(lèi)1,氧化鎂(MgO)、氧化鉛(PbO)相對(duì)含量較高的玻璃,該文稱(chēng)為MgO-PbO 玻璃。聚類(lèi)2,氧化銅(CuO)、氧化鋇(BaO)和二氧化硫(SO2)含量相對(duì)較高的玻璃,該文稱(chēng)為CuO-BaO-SO2玻璃。

綜上所述可以得到玻璃亞類(lèi)劃分體系,見(jiàn)表9。表9在4 個(gè)大類(lèi)上劃分了亞類(lèi),每個(gè)大類(lèi)劃分為2 個(gè)亞類(lèi)[2]。

表9 玻璃亞類(lèi)劃分體系表

4 結(jié)語(yǔ)

該文通過(guò)描述性統(tǒng)計(jì)和決策樹(shù)算法研究了古玻璃風(fēng)化前、后化學(xué)成分和特征的變化,通過(guò)特征分析鑒別文物所屬的不同類(lèi)型。并基于各類(lèi)玻璃的化學(xué)成分,利用K-means 聚類(lèi)提出古玻璃亞類(lèi)的劃分原則。該文研究結(jié)果和數(shù)據(jù)處理方法有助于在探尋絲綢之路上古玻璃的文化與科技交流方面取得一些新突破。

猜你喜歡
決策樹(shù)紋飾風(fēng)化
帶狀紋飾的類(lèi)型
蠟染的紋飾探討
雕漆紋飾的修復(fù)
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
敦煌莫高窟第285窟龕楣紋飾研究
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
地面激光雷達(dá)在斜坡風(fēng)化探測(cè)中的應(yīng)用
基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
基于圖像的風(fēng)化仿真