付心儀 李巖 孫志軍 杜鵑 王鳳平 徐迎慶
內(nèi)容摘要:煙熏病害是敦煌壁畫的典型病害之一,具有顏色破壞大、修復(fù)難度高、相關(guān)研究少等難點,實體修復(fù)對煙熏病害尚沒有有效的復(fù)原手段。針對敦煌壁畫所面臨的煙熏病害,以莫高窟第156窟北壁煙熏壁畫作為典型研究對象,從數(shù)字化復(fù)原和物理化學(xué)分析的角度出發(fā),利用兩次煙熏模擬實驗,探究了顏料在煙熏條件下產(chǎn)生的變化規(guī)律,收集了顏色在煙熏過程中變化的數(shù)據(jù)集,提出了基于機器學(xué)習(xí)的煙熏壁畫數(shù)字化復(fù)原方法。本研究創(chuàng)新性地采用了基于模擬實驗的數(shù)字化色彩復(fù)原研究方法,取得了珍貴的煙熏壁畫數(shù)據(jù)樣本,相關(guān)數(shù)字化研究成果可以應(yīng)用在煙熏類壁畫的數(shù)字化色彩復(fù)原中,將煙熏前的顏色展現(xiàn)給社會大眾。
關(guān)鍵詞:煙熏壁畫;數(shù)字化復(fù)原;機器學(xué)習(xí);物理化學(xué);模擬實驗
中圖分類號:K854.3? 文獻(xiàn)標(biāo)識碼:A? 文章編號:1000-4106(2021)01-0137-11
Abstract:Soot damage is one of the typical types of deterioration seen in Dunhuang murals, though it is a somewhat a typical research topic when compared with other types of deterioration. Soot damage is particularly damaging to the color of murals and cannot be ameliorated by conventional physical restoration methods. Focusing on the soot damaged murals in Mogao cave 156, and by conducting two simulation experiments of soot damage from the perspective of digital restoration and physicochemical analysis, this paper explores the pattern of changes in paint pigments under the influence of soot and collects relevant data on color change. The researchers then pose a digital restoration method for soot damaged murals based on machine learning that is applicable to the restoration of similarly colored murals.
Keywords:soot damaged murals; digital restoration; machine learning; physical chemistry; simulation experiment
1 引 言
敦煌莫高窟是壁畫類文化遺產(chǎn)的典型代表,現(xiàn)存壁畫4.5萬平方米。敦煌壁畫曾飽受煙熏病害的侵?jǐn)_,其成因是在莫高窟尚未建立現(xiàn)代保護(hù)機制前,附近的善男信女在佛事活動期間居住在窟內(nèi)使用明火燒香、煮飯和取暖,由于香油和碳等物質(zhì)的沉降,造成壁畫顏色變黃、變暗甚至變黑的現(xiàn)象。煙熏病害對壁畫的色彩和構(gòu)圖造成了大范圍的嚴(yán)重破壞,但目前尚沒有十分有效的治理此種病害的手段。敦煌壁畫的保護(hù)專家們曾經(jīng)嘗試通過溶液清洗等方法洗掉煙漬,如段修業(yè)等人針對莫高窟第71窟的煙熏壁畫,先后使用清水、硝酸、高錳酸鉀、重鉻酸鉀等氧化劑溶液對煙熏部位進(jìn)行清洗,除了已經(jīng)氧化的顏色,其余顏色基本露出[1]。然而,由于某些溶劑帶有顏色,清洗后的壁畫可能會覆蓋一層溶劑顏色,長期的清洗效果和是否有后遺癥還需要觀察。
壁畫的數(shù)字化復(fù)原方法,具有復(fù)原成本低、文物保護(hù)性高、結(jié)果可復(fù)制、復(fù)原周期短等優(yōu)勢,相關(guān)領(lǐng)域的研究工作也取得了一定的成果[2-4]。針對煙熏壁畫的色彩復(fù)原問題,我們采用煙熏實驗、顏料成分分析和數(shù)字化手段的綜合復(fù)原方法,首先對壁畫遭受煙熏的過程進(jìn)行模擬分析,探索顏料和色彩在煙熏條件下的變化規(guī)律,然后在數(shù)字化維度計算壁畫煙熏前的色彩。
2 敦煌莫高窟煙熏壁畫現(xiàn)狀調(diào)研
莫高窟現(xiàn)存有壁畫和彩塑的洞窟數(shù)為492個,根據(jù)王進(jìn)玉[5]等人的統(tǒng)計,具有煙熏病害的洞窟一共有47個。經(jīng)過初步篩選,我們對其中的16個洞窟(第8,57,94,99,120,156,178,227,231,235,236,237,257,370,445,450窟)進(jìn)行了實地考察,期望找到一個保存相對完好,且壁畫的煙熏程度具有層次感的洞窟。
通過對洞窟的朝代、保存現(xiàn)狀、煙熏程度三個維度的考察,最終選取第156窟北壁壁畫作為典型研究對象。該窟始建于晚唐年間,位于莫高窟崖面的頂層,其壁畫內(nèi)容保存完好,煙熏程度較輕,并且方便進(jìn)行數(shù)字化。
第156窟北壁的煙熏壁畫如圖1所示,該煙熏區(qū)域以煙道為中心,向兩側(cè)壁畫邊緣擴散,呈現(xiàn)越來越淺的煙熏趨勢。壁畫上半部分,由于煙霧的長期積累,形成的煙熏比壁畫下半部分更深。由于煙道內(nèi)煙霧具有比較高的溫度,高溫會影響碳顆粒的附著,所以根據(jù)壁畫距離煙熏著火點的位置,可以將壁畫的煙熏區(qū)域分為“近火高溫?zé)熝焙汀斑h(yuǎn)火低溫?zé)熝眱煞N。這兩種煙熏狀態(tài)形成的顏色變化不盡相同,其中近火高溫?zé)熝纬傻臒熝瑓^(qū)域,碳顆粒覆蓋較厚,顏色較深,幾乎看不出壁畫本來的內(nèi)容與顏色;遠(yuǎn)火低溫?zé)熝纬傻臒熝瑓^(qū)域,碳顆粒覆蓋較薄,顏色較淺,某些位置可以分辨出原始的壁畫內(nèi)容和顏色。
3 研究方法
如圖2所示,我們采用基于典型煙熏壁畫的數(shù)字化色彩復(fù)原方法。莫高窟洞窟內(nèi)的壁畫經(jīng)過“自然煙熏過程”,由原始壁畫逐漸變色成為煙熏壁畫,對于這個自然煙熏過程和煙熏后壁畫顏料成分和色相變化的研究,是煙熏壁畫數(shù)字化復(fù)原的關(guān)鍵。由于敦煌莫高窟壁畫的不可接觸性,對煙熏顏色進(jìn)行科學(xué)合理的采樣、檢測與分析難度非常大,國際上相關(guān)的工作又處在近乎空白的階段,僅能通過一些原位無損分析手段,如便攜式熒光光譜儀、便攜式拉曼光譜測量儀等[6-8],推斷煙熏后顏料的主要物質(zhì)成分。所以,經(jīng)過廣泛的專家論證,我們最終采用通過對使用與敦煌莫高窟壁畫相同顏料繪制的壁畫樣塊,使用與實際煙熏相同的燃料,進(jìn)行實地?zé)熝姆桨?,來獲取煙熏壁畫色彩復(fù)原的原始數(shù)據(jù),即“煙熏實驗過程”。煙熏實驗的主要目的是,通過對相同或相近顏料的快速煙熏,得到顏色在煙熏條件下的變色過程,通過對該過程的物理化學(xué)和數(shù)字化分析,科學(xué)地總結(jié)出煙熏對壁畫顏色的影響,從而探究煙熏色彩復(fù)原的方法。我們通過對洞窟內(nèi)煙熏壁畫進(jìn)行無損物質(zhì)成分分析的方法,即“成分驗證”來驗證煙熏實驗的結(jié)果符合自然煙熏過程。根據(jù)實驗煙熏壁畫的顏色變化,我們提出基于機器學(xué)習(xí)的“煙熏數(shù)字化復(fù)原模型”方法,使用煙熏實驗前后的色彩空間數(shù)據(jù)集建立色彩復(fù)原模型,最后應(yīng)用到“洞窟煙熏壁畫數(shù)字化復(fù)原”中。
4 壁畫煙熏實驗的設(shè)計與實施
壁畫的煙熏實驗可以為煙熏色彩的數(shù)字化復(fù)原提供數(shù)據(jù)依據(jù)。我們于2013年春季和2015年春季赴敦煌搭建了模擬實驗平臺,分別進(jìn)行了“近火高溫”煙熏實驗和“遠(yuǎn)火低溫”煙熏實驗,兩次煙熏實驗均取得了預(yù)期的煙熏結(jié)果。
4.1 “近火高溫”煙熏實驗
本次實驗實施時間為2013年5月,選址在距離敦煌莫高窟5千米之外的戈壁環(huán)境。為了在野外環(huán)境保證煙霧對壁畫的作用,需要對煙霧進(jìn)行聚攏,最終采用0.5m×0.5m×1m的立方體磚砌窯的形式,對放置于其內(nèi)的壁畫進(jìn)行煙熏,磚砌窯下方具有燃料進(jìn)口和通風(fēng)口,頂部設(shè)置擋板用于取放畫板和控制煙量,畫板放置于磚窯內(nèi)部墻壁一側(cè),在磚窯底部生火起煙對其進(jìn)行煙熏,其示意圖和實物圖如圖3所示。
本次煙熏實驗樣本制作的過程分為地仗制作、顏料選擇與調(diào)制、壁畫繪制三個步驟。首先使用敦煌土、敦煌本地麻線和植物等材料,按照與古代敦煌壁畫相同的材料和工藝為模擬樣本制作地仗,再由敦煌研究院美術(shù)所專家客觀臨摹莫高窟第71窟壁畫彌勒經(jīng)變局部圖。樣本繪制過程中,使用了由下述敦煌壁畫基本顏料按照一定比例混合形成的15種混合顏料實物樣本:石青、朱砂、蛤粉、石綠、敦煌綠、淡青、淺綠、草綠、石榴黑、大火黑、朱磦、普蘭、敦煌土、熟褐、部分國畫顏料。
在實驗進(jìn)行過程中,使用本地的杏樹、楊樹等木材作為燃燒材料,燃燒穩(wěn)定生煙之后,將壁畫放入磚窯內(nèi),每隔1小時取出觀察煙熏上色程度,并進(jìn)行物質(zhì)成分與數(shù)字化采樣,煙熏時間累積約24小時。提取的物質(zhì)樣本數(shù)據(jù)共計約600組,數(shù)字化拍攝圖片約400張,最終形成的完整壁畫的煙熏漸變結(jié)果如圖4所示??傮w來講,第一次煙熏實驗達(dá)到的視覺效果,基本模擬了第156窟煙熏壁畫“近火高溫” 的煙熏效果。
4.2 “遠(yuǎn)火低溫”煙熏實驗
本次實驗實施時間為2015年6月,經(jīng)過對第一次煙熏實驗的經(jīng)驗總結(jié),本次實驗設(shè)置了較為豐富的實驗對照組,采用簡單易控制的顏色樣條來進(jìn)行煙熏對比實驗。
本次設(shè)計實驗主要考慮“遠(yuǎn)火低溫”的煙熏覆蓋模擬,為了把溫度的因素和煙霧因素分開,采用如圖5(a)所示的煙熏方法,選擇封閉的煙熏空間,將煙熏樣本豎向懸掛于墻上,生煙裝置置于煙熏場地外面,可以一定程度地減小溫度對壁畫的影響。本次實驗同時記錄了煙熏樣本及煙熏環(huán)境的高度、溫度、濕度等過程數(shù)據(jù)。
“遠(yuǎn)火低溫”煙熏實驗共制作26塊地杖,其中25塊分為5組進(jìn)行煙熏,每組5塊,1塊不煙熏,作為對照組。地仗的具體制作為:使用20cm×30cm的木板作為底層支撐材料,在木板上固定敦煌本地麻布,然后將混有細(xì)麻繩的敦煌土涂抹在麻布上,晾干后磨平表面裂隙,形成地仗板。隨后使用25種礦物顏料在地仗上制作1cm寬的色條,作為煙熏樣本。本次顏料來源為西藏“扎西彩虹”藏傳礦物顏料,每種顏料分別編號并采樣用于以后期定量分析實驗。
“遠(yuǎn)火低溫”煙熏實驗的場地,最終選定位于敦煌合水村一處民房內(nèi)進(jìn)行,民房大小約為2m×1.8m×2.2m,與一個小型洞窟相似,溫度和濕度適宜,回避了風(fēng)力、日照、天氣等因素,是比較理想的煙熏實驗場地。
在民房內(nèi)將每組5塊色板,按照高度依次垂直懸掛于民房后方的墻壁上4塊,第5塊放置于民房頂部,用于模擬洞窟頂部壁畫的煙熏情況。每一高度的色板附近設(shè)置溫度計和濕度計,全程記錄煙熏時的溫度和濕度。生煙爐和火源放置于民房門外,所生煙霧通過一個約0.5米的煙道,并通過窗簾進(jìn)入民房內(nèi),用來降低煙的溫度,如圖5(b)和圖5(c)所示。
本次煙熏實驗燃料全部為敦煌當(dāng)?shù)氐臈顦?、杏樹木材。正式實驗中,?5塊色板分為5組,每組5塊,分別煙熏1、2、3、4、5個小時,煙熏時長結(jié)束后,將每組色板進(jìn)行數(shù)字化采樣和封存處理,并按照煙熏時長標(biāo)記每組的煙熏程度。實驗同時記錄了煙熏過程中共計13個采樣點的溫度和濕度變化。采樣結(jié)果顯示壁畫附近的平均溫度變化范圍為27℃—55℃,濕度范圍63%—72%,濕度主要來源于木材中的水分。可以看出,火源與色板的隔離,起到了溫度隔離的作用。
“遠(yuǎn)火低溫”煙熏實驗共得到5組計25塊不同煙熏程度的色板樣本,并進(jìn)行了標(biāo)準(zhǔn)數(shù)字化采樣,最終形成的階梯煙熏結(jié)果如圖6所示,總體煙熏結(jié)果從視覺上滿足“遠(yuǎn)火低溫”的要求。
5 煙熏壁畫顏料成分分析
隨著物理化學(xué)學(xué)科的發(fā)展,對于壁畫顏料物質(zhì)成分的測量變得切實可行,通過手持式熒光光譜儀和非接觸手持拉曼光譜儀等原位無損測量手段,可以測量出壁畫顏料的主要物質(zhì)成分[9]。煙熏色彩復(fù)原研究涉及的物質(zhì)成分物理化學(xué)分析分為三種對象,分別為莫高窟煙熏壁畫顏料成分分析、煙熏前實驗顏料成分分析和煙熏后實驗顏料成分分析。
5.1 莫高窟煙熏壁畫顏料成分分析
由于相關(guān)文獻(xiàn)對于唐代壁畫所使用的顏料物質(zhì)成分已經(jīng)有所考證[10],故我們對莫高窟第156窟北壁的煙熏后壁畫顏料進(jìn)行了分析,希望對比得出壁畫顏料經(jīng)過長年的煙熏之后,發(fā)生了怎樣的物理化學(xué)變化。得到的結(jié)果與煙熏模擬實驗前后的顏料物理成分分析結(jié)果進(jìn)行對比,可以形成對照組,驗證煙熏實驗數(shù)據(jù)對于重現(xiàn)煙熏壁畫的科學(xué)合理性。
我們在莫高窟第156窟北壁的煙熏壁畫上選取了73個測量點(如圖7所示),并對這些采樣點進(jìn)行了X射線熒光光譜分析(XRF)。由于XRF是一種定性的測量手段,只能測定出元素構(gòu)成,不能直接準(zhǔn)確地確定材料成分,所以檢測出元素成分之后,需要結(jié)合壁畫顏料知識和繪畫內(nèi)容對其顏料成分進(jìn)行推斷。
最終的XRF測量分析結(jié)果如表1所示,通過分析得出以下結(jié)論:紅色顏料為赭石(Fe2O3)和鉛丹(Pb3O4),藍(lán)色顏料為石青(CuCO3·Cu(OH)2),綠色為氯銅礦(Cu2(OH)3Cl),土黃色為纖鐵礦(γ-FeO(OH)),棕黑色可能為鉛丹的退化產(chǎn)物氧化鉛(PbO2),黑色大部分為煙熏碳層覆蓋導(dǎo)致顏色變黑。這個結(jié)果與唐代壁畫顏料常用物質(zhì)成分的分析結(jié)果[10]基本保持一致,可以初步認(rèn)定,經(jīng)過煙熏之后,壁畫顏色的色相偏移主要是由黑色碳層覆蓋導(dǎo)致的。
5.2 煙熏前顏料成分分析
煙熏前實驗顏料成分分析,主要針對兩次煙熏實驗分別使用的顏料進(jìn)行物質(zhì)成分分析,證明其與敦煌壁畫所使用顏料成分是否相同。
在“近火高溫”煙熏實驗中,我們對紅色、藍(lán)色、綠色、白色、黑色這5種典型顏色的成分進(jìn)行了拉曼分析。結(jié)果表明,紅色的主要顯色成分為朱砂(HgS),藍(lán)色的主要顯色成分為大量酞菁藍(lán)(C32H16CuN8)和少量石青(Cu3(CO3)2(OH)2),綠色的主要顯色成分為酞菁綠(C32H3Cl15CuN8),白色的主要顯色成分為碳酸鈣(CaCO3)和二氧化鈦(TiO2),黑色的主要顯色成分為炭黑(C)。由于純礦物顏料比較難以獲取,所以本次煙熏實驗使用的顏料并非純礦物顏料,有部分有機合成顏料,與敦煌壁畫上所使用的顏色成分不全相同。
“遠(yuǎn)火低溫”煙熏實驗所使用的顏料來源于西藏“扎西彩虹”純礦物顏料,我們對其使用X射線衍射分析(XRD)手段和拉曼光譜鑒定手段進(jìn)行鑒定,結(jié)果如表2所示。結(jié)果表明,第二次實驗使用的顏料與敦煌壁畫基本相同,為各種礦物,顯色成分和對應(yīng)色相與相關(guān)研究[10]相同?!斑h(yuǎn)火低溫”煙熏實驗的結(jié)果,可以作為真實模擬煙熏洞窟顏色變化的重要依據(jù)。
5.3 煙熏后顏料成分分析
我們對“近火高溫”煙熏實驗和“遠(yuǎn)火低溫”煙熏實驗煙熏后的樣本分別進(jìn)行了拉曼分析實驗,得到以下分析結(jié)果。
“近火高溫”煙熏實驗后的顏料表面覆蓋了無定型碳,使得顏色色相發(fā)生了改變,未引入其他物質(zhì)。主要的顯色成分除朱砂(HgS)外,酞菁藍(lán)(C32H16CuN8)、酞菁綠(C32H3Cl15CuN8)、碳酸鈣(CaCO3)和二氧化鈦(TiO2)等未發(fā)生顯著變化。朱砂(HgS)由于其熱穩(wěn)定性較差,在高溫條件下易發(fā)生氧化反應(yīng),產(chǎn)生汞蒸氣和二氧化硫,使得紅色顏料層減少。
“遠(yuǎn)火低溫”煙熏實驗由于嚴(yán)格控制了實驗溫度,經(jīng)過拉曼分析后發(fā)現(xiàn),所有顏料均未發(fā)生物質(zhì)成分的改變,根據(jù)煙熏時間的不同,顏料表面覆蓋的無定型碳厚度隨時間增加而增多,但由于煙熏時間較短,所以碳層非常薄,無法進(jìn)行定量的厚度測量。
經(jīng)過以上物理化學(xué)分析,可以發(fā)現(xiàn)“近火高溫”煙熏實驗和“遠(yuǎn)火低溫”煙熏實驗均科學(xué)合理地模擬了敦煌壁畫的煙熏過程,與第156窟北壁煙熏壁畫的XRF測量結(jié)果相符。
6 煙熏壁畫數(shù)字化色彩復(fù)原理論與方法
結(jié)合煙熏實驗前后的物理化學(xué)分析結(jié)果,我們采用“遠(yuǎn)火低溫”煙熏實驗的數(shù)字化數(shù)據(jù)作為煙熏色彩數(shù)字化復(fù)原的數(shù)據(jù)樣本,并提出基于機器學(xué)習(xí)的煙熏壁畫數(shù)字化色彩復(fù)原理論與方法。
6.1 數(shù)據(jù)預(yù)處理
“遠(yuǎn)火低溫”煙熏實驗的色板數(shù)據(jù)預(yù)處理經(jīng)過數(shù)字化采集、顏色校正、樣條生成、顏色抽取四個步驟。數(shù)字化采集使用佳能EOS 5D Mark Ⅲ 相機對26塊色板進(jìn)行數(shù)字化拍攝,顏色矯正使用愛色麗護(hù)照型色卡經(jīng)Adobe Lightroom進(jìn)行統(tǒng)一的顏色校正。樣條生成使用Adobe Photoshop軟件,對每塊色板上的28種顏色分別提取600×20像素大小的顏色樣條,共提取728個顏色樣條,作為后續(xù)顏色抽取的數(shù)據(jù)源。顏色抽取采用平均取樣的方法,對每一個顏色樣條進(jìn)行5×5像素滑動窗口的平滑取樣,最終每個顏色樣條抽取數(shù)據(jù)點480個,煙熏色板數(shù)據(jù)集的總數(shù)據(jù)點為3494440個,數(shù)據(jù)集的規(guī)模足夠作為后續(xù)研究的訓(xùn)練樣本,但仍需根據(jù)具體情況對數(shù)據(jù)集進(jìn)行篩選。
6.2 典型色相的煙熏變化分析
未經(jīng)煙熏的畫板顏色可以分類為紅色、藍(lán)色、綠色、黃色、白色、黑色6種色相,每種色相又有顏色深淺之分。這種深淺的分別,在色彩數(shù)據(jù)空間上可以用顏色的灰度值進(jìn)行表征。根據(jù)RGB顏色計算灰度值的方法多種,其中比較符合人眼識別顏色深淺的方法是浮點算法,也是最常用的灰度計算方法。浮點算法的計算方法如公式1所示,其中Gray是顏色灰度,R、G、B是顏色的三個分量。
Gray=R×0.299+G×0.587+B×0.114(公式1)
我們對經(jīng)過顏色抽取之后所有數(shù)據(jù)點計算了其灰度值,并按照顏色編號進(jìn)行分類后,按灰度值降序排列。隨后我們選取了編號為5(二青)、13(二綠)、15(土黃)、20(暗紅)、25(仁白布粉)的5種顏料,作為藍(lán)色、綠色、黃色、紅色和白色的代表色相樣例,分析其煙熏后的變化特征。每種顏色的數(shù)據(jù)點數(shù)量為12480個,為了更好地表現(xiàn)每種顏色經(jīng)過煙熏后的色相過渡變化,將每種顏色按照平均間隔取樣,提取400個點制作成20×20大小的像素方格,形成圖8的典型色相煙熏變化圖。
從圖8中可以明顯看出,每個色相均有由淺到深的煙熏變化梯度,這也說明了煙熏實驗成功地模擬了顏色經(jīng)過煙熏之后的色相加深變化。其中藍(lán)色、綠色色相,隨著煙熏程度的加深,顏色逐漸變深,最終幾乎變成黑色,可見煙熏對這兩種色相的上色比較容易;相對于藍(lán)色和綠色,紅色、黃色和白色色相在煙熏程度較深時才有比較明顯的變化,說明這些色相在煙熏時間較長時才會有比較明顯的變化。這也與第156窟北壁煙熏壁畫的表現(xiàn)相一致,壁畫上藍(lán)色和綠色隨著煙熏程度的加深色相逐步變深,甚至有些遠(yuǎn)火低溫?zé)熝瑓^(qū)域的綠色被熏成黑色,而紅色和黃色的色相變深相對較較慢,只在近火高溫區(qū)域才呈現(xiàn)出全黑的趨勢。這一規(guī)律的發(fā)現(xiàn),對于后續(xù)不同色彩復(fù)原的研究具有較強的指導(dǎo)意義。
6.3 基于K-近鄰算法的壁畫數(shù)字化色彩復(fù)原理論與方法
壁畫色彩復(fù)原的主要科學(xué)問題,可以歸納為判斷變色后的色相屬于哪種原始色彩的分類問題,此類問題使用機器學(xué)習(xí)的手段可以得到較好結(jié)果。由于已有足夠的煙熏色彩樣本空間數(shù)據(jù),對于待復(fù)原的顏色,在此樣本空間內(nèi)搜索相近的顏色數(shù)據(jù),在分類準(zhǔn)確率較高的前提下,其搜索到的顏色所對應(yīng)的色相就是待復(fù)原色彩的煙熏前色彩。
常用的機器學(xué)習(xí)分類策略包括有監(jiān)督的學(xué)習(xí)策略和無監(jiān)督的學(xué)習(xí)策略兩種,針對煙熏顏色的分類問題,由于已有具有先驗知識的人工標(biāo)記訓(xùn)練集,所以有監(jiān)督的學(xué)習(xí)策略更為適用。比較幾種常見的有監(jiān)督學(xué)習(xí)算法策略,K-近鄰算法可以通過計算輸入目標(biāo)在樣本數(shù)據(jù)空間中最鄰近的K個樣本,通過一定的投票策略,來決定輸入目標(biāo)分類的問題,最符合煙熏色彩復(fù)原所面臨的科學(xué)問題,故我們采用K-近鄰算法[11]來設(shè)計并實現(xiàn)了煙熏色彩數(shù)字化復(fù)原的理論模型。其框架如圖9所示,該方法的流程描述如下:
a)由煙熏實驗色板生成具有4維特征值的顏色訓(xùn)練數(shù)據(jù)集,并對訓(xùn)練集數(shù)據(jù)進(jìn)行人工標(biāo)注分類;
b)對于待分類顏色,選擇合適的距離函數(shù),遍歷訓(xùn)練集,計算該顏色與訓(xùn)練集數(shù)據(jù)的距離,并按照距離由近到遠(yuǎn)排成隊列;
c)在2的隊列中選取k個最近鄰最為分類策略的輸入;
d)使用合適的分類策略對k個最近鄰的標(biāo)記結(jié)果進(jìn)行分類,得到的結(jié)果作為待復(fù)原顏色的分類;
e)調(diào)試k參數(shù)、距離函數(shù)和分類策略并重復(fù)2-4步驟,直至分類模型在測試集上達(dá)到滿意的分類準(zhǔn)確率,將優(yōu)化迭代后的分類結(jié)果作為最終結(jié)果。
顏色訓(xùn)練數(shù)據(jù)集由26塊煙熏色板按照數(shù)字化工作流程提取生成,原始數(shù)據(jù)集共28種顏色分類,包含3494440個數(shù)據(jù)點,經(jīng)過篩選與分析,去掉幾類敦煌壁畫中沒有的顏色,最后選擇六種色相共12種顏色數(shù)據(jù)作為訓(xùn)練集,包括黑色色相[1(黑色)],藍(lán)色色相[5(二青)、6(三青)],綠色色相[10(頭綠)、13(二綠)、14(三綠)],黃色色相[15(土黃)、16(雌黃)],紅色色相[20(暗紅)、23(淡茶色)、28(本地土紅)],白色色相[25(仁白布粉)],共149760個數(shù)據(jù)點。每個數(shù)據(jù)點包含4維特征值,分別為RGB色彩空間的三個分量值(數(shù)據(jù)范圍0—255)和該數(shù)據(jù)點的灰度值。
顏色測試集從第156窟北壁的煙熏壁畫上產(chǎn)生,選擇壁畫上出現(xiàn)的5種色相(黑色、藍(lán)色、綠色、紅色、黃色),每種色相500個測試點,形成共2500個數(shù)據(jù)點的測試集。測試集用于驗證不同參數(shù)下K-近鄰算法的分類準(zhǔn)確率,所以對這2500個數(shù)據(jù)點進(jìn)行了人工標(biāo)注,用于和分類輸出結(jié)果進(jìn)行比對。
距離函數(shù)在三種常用的距離函數(shù)中進(jìn)行選擇,分別是歐幾里得距離(Euclidean),余弦距離(Cosine)和曼哈頓距離(Cityblock),這三種距離的定義分別見公式2、公式3和公式4。最終距離函數(shù)的選擇還需要根據(jù)參數(shù)k的大小和分類策略進(jìn)行決定,通過算法在測試樣本集上的準(zhǔn)確率來確定。
參數(shù)大小的選擇是整個算法準(zhǔn)確率保證的核心,衡量k參數(shù)形成的分類策略的準(zhǔn)確率通常使用近似誤差(Approximation Error)和估計誤差(Estimation Error)兩個評價標(biāo)準(zhǔn)。近似誤差可以理解為對訓(xùn)練集的分類誤差,估計誤差可以理解為對測試集的測試誤差。當(dāng)選擇的k比較小時,模型的復(fù)雜度越高,近似誤差越小,估計誤差越大。而選擇的k比較大時,模型的復(fù)雜度越低,近似誤差越大,對于訓(xùn)練集的數(shù)據(jù)分類越差。所以k參數(shù)的選擇要通過不斷調(diào)整參數(shù)觀察測試集的分類準(zhǔn)確率來確定,主要方法是從一個比較小的k開始(比如k=1),逐漸增加k,觀察其對分類準(zhǔn)確率的影響。
K-近鄰的分類策略用于在最終的k個近鄰中決定輸入數(shù)據(jù)的最終分類,具體策略包括最近鄰法(Nearest),隨機法(Random)和投票法(Consensus)。最近鄰法采用k個近鄰中分類最多的數(shù)據(jù)作為最終分類,隨機法在k個近鄰中隨機選擇一類作為最終分類,而投票法只在最終的k個近鄰都為同一分類時,將其作為最終分類,如果k個近鄰屬于兩個以上分類,則投票法不給出分類。
我們使用大小為149760的訓(xùn)練集訓(xùn)練K-近鄰算法的分類模型,并在2500個測試樣本集上根據(jù)k的大?。╧=1,k=3,k=5,k=25)、距離函數(shù)的選擇(Euclidean,Cosine,Cityblock)和分類策略(Nearest,Random,Consensus),進(jìn)行分類準(zhǔn)確率測試,共得到36組分類結(jié)果(部分結(jié)果如表3所示),其結(jié)果按照準(zhǔn)確率降序排序。最終結(jié)果顯示,當(dāng)k=1時,使用歐幾里得距離(Euclidean)的三種分類策略表現(xiàn)相同且最好,準(zhǔn)確率達(dá)到96.36%。
需要說明的是,對于測試數(shù)據(jù)集96.36%的分類準(zhǔn)確率,已經(jīng)能夠滿足煙熏色彩復(fù)原的需求,但由于敦煌壁畫的繪畫線條非常復(fù)雜,即便知道了色彩的原始顏色,自動化的復(fù)原手段也是不適用的,會導(dǎo)致壁畫的繪畫紋理發(fā)生破壞,只有在核心算法支撐的基礎(chǔ)上,使用交互復(fù)原的手段,才能產(chǎn)出滿足需求的復(fù)原結(jié)果。
此外,該方法尚有一定的局限性,對于不同煙熏程度的壁畫,其復(fù)原效果也會有不同。目前該方法僅適用于煙熏程度較輕的壁畫,對于煙熏程度比較重,甚至被熏為黑色的壁畫,尚且無法復(fù)原。
7 結(jié) 語
本文從敦煌煙熏壁畫的數(shù)字化色彩復(fù)原入手,利用實地調(diào)研、模擬實驗、機器學(xué)習(xí)、算法設(shè)計等方法,形成了別具創(chuàng)新性的煙熏壁畫數(shù)字化色彩復(fù)原工作流程,提出了基于機器學(xué)習(xí)的煙熏壁畫數(shù)字化色彩復(fù)原理論與方法,復(fù)原準(zhǔn)確率可達(dá)96.36%。該理論與方法,不僅可以用于煙熏壁畫的色彩復(fù)原,也可以為其他變色壁畫的數(shù)字化色彩復(fù)原提供參考。
參考文獻(xiàn):
[1]段修業(yè),李云鶴.莫高窟七十一窟煙熏壁畫清洗試驗[J].敦煌研究,1982,2:176-180.
[2]付心儀,麻曉娟,孫志軍.破損壁畫的數(shù)字化復(fù)原研究:以敦煌壁畫為例[J].裝飾,2019(1):21-27.
[3]Fu,X.Y.,Han,Y.,Sun,Z.J.,Ma,X.J.,Xu,Y.Q..Line-drawing Enhanced Interactive Mural Restoration For Dunhuang Mogao Grottoes[C]//ISPRS Annals of the Pho-togrammetry,Remote Sensing and Spatial Information Sci-ences.2017,IV-2/W2:99-106.
[4]徐永明,趙靜.基于現(xiàn)代信息技術(shù)的壁畫模擬修復(fù):以內(nèi)蒙古大昭寺“花變主題佛”壁畫為例[J].中國藏學(xué),2015(2):175-177.
[5]王進(jìn)玉.敦煌莫高窟洞窟現(xiàn)狀調(diào)查與病害分類[J].敦煌研究,2005(6):113-117.
[6]Bikiaris,D.,S.Daniilia,S.Sotiropoulou,O.Katsimbiri,E.Pavlidou,A.P.Moutsatsou,Y.Chryssoulakis.Ochrediffer-entiation through micro-Raman and micro-FTIR spectroscopies:application on wall paintings at Meteora and Mount Athos,Greece[J].Spectrochim Acta,Part A,2000,56(1):3-18.
[7]Pita,E.,E.Proniewicz,B.Szmelter-Fausek,J.Olszewska-wietlik,L.M.Proniewicz.Micro-Raman spectroscopy ana-lysis of the 17th century panel painting‘Servilius Appius by Isaac van den Blocke[J].Raman Spectrosc,2014,45(11/12):1019-1025.
[8]Chaplin,T.D.,R.J.Clark,and B.W.Singer.Early 20th C Russian painting?Raman identification of modern pigments on a pastel supposedly Painted by the renowned artist Natalia Goncharova[J].Raman Spectrosc,2014,45(11/12):1322-1325.
[9]梁金星,萬曉霞,孫志軍,等.敦煌壁畫顏料顏色數(shù)據(jù)庫構(gòu)建方法[J].敦煌研究,2017(1):132-140.
[10]李最雄.絲綢之路石窟壁畫彩塑保護(hù)[M].北京:科學(xué)出版社,2005:54-57.
[11]Cover T,Hart P.Nearest neighbor pattern classification[J].IEEE transactions on information theory,1967,13(1):21-27.