姬 靜
(1. 西安交通大學檔案館、博物館,西安 710049;2. 西安交通大學機械制造系統(tǒng)工程國家重點實驗室,西安 710049)
我國是四大文明古國之一,五千年的文明為我們留下了豐富的文化遺產(chǎn),其中書法作品更是歷史悠久,源遠流長,情況也最為復雜。為了能夠更加深入的挖掘書法作品的藝術(shù)價值,為歷史研究和書法收藏提供有效依據(jù),書法作品的真?zhèn)舞b定顯得尤為重要,它不僅是書法史以及書法藝術(shù)研究的重要課題之一,也是一直以來困擾書法作品收藏界的難題。
一直以來,書法作品的真?zhèn)舞b定問題都被歸屬于藝術(shù)領域。專家鑒定法依然是當前主流的書法真?zhèn)舞b定方法。其主要做法為:專家根據(jù)個人經(jīng)驗,從書法作品的藝術(shù)風格、時代風格、個人風格、書法內(nèi)容、筆法、結(jié)構(gòu)、章法以及題款、印章、材質(zhì)等方面入手,進行綜合判定[1]。由于偽作與真跡會存在局部上的細微差異,專家只能將作品的局部區(qū)域與真作一一比對,不要說一些巨幅作品,就是常見的書法作品,要將所有區(qū)域進行分別比對,可想而知其工作量是多么龐大,如此繁重工作反而更容易造成鑒定結(jié)果準確率的降低,因此,該方法不僅耗時耗力,而且準確率不高。另一方面,該方法主要依靠鑒定專家的個人主觀因素,缺乏可以量化的,客觀的鑒定指標,對于同一幅書法作品,不同的專家可能會給出截然相反的鑒定結(jié)果,容易引起爭議。伴隨著數(shù)字化、智能化時代的到來,國內(nèi)外一些著名大學及研究機構(gòu),例如:澳大利亞昆士蘭理工大學、新加坡管理大學、賓夕法尼亞州立大學、浙江大學、北京交通大學、中科院計算所等單位的研究學者已經(jīng)在中國書法作品的自動分類、自動識別等領域開展了一些探索與研究[2–3],這些研究使得書法鑒定專家進行書法分類、檢索的時間得到了極大節(jié)省,可以將其精力及工作的重心放到書法真?zhèn)巫R別與鑒定上。另一方面,基于深度學習的圖像識別技術(shù)是數(shù)字圖像研究領域的一個重要分支與研究方向,并且在近幾十年來得到了極大的發(fā)展,在人臉識別、條形碼識別、交通信息化及計算機視覺等諸多領域,該技術(shù)均得以應用[4–5]。因此,本文也將基于深度學習的圖像識別技術(shù)應用于書法真?zhèn)舞b定,從多個方面分析其結(jié)果并與本文所提出的方法進行比對。
目前常見的書法仿制手段有三種:高仿印刷、臨摹和兩者混搭。由于書法仿制手段的發(fā)展,即使是對相同版面、相同內(nèi)容的兩幅書法作品進行真?zhèn)舞b定,依靠人工及肉眼已很難識別,然而,真?zhèn)螘ㄗ髌凡豢杀苊獾拇嬖谛螤钌霞毼⒉町悾M管肉眼難以察覺。本文的研究主要針對上述問題,將模式識別領域中的不變矩應用于書法真?zhèn)舞b定,提出了形狀真實度的概念,分析比較了七種常用不變矩的形狀真實度性能,實驗結(jié)果表明,由Hu 矩計算的形狀真實度性能最佳,能夠識別出肉眼不易觀察的細節(jié)差異。能夠為書法鑒定提供科學可靠的輔助手段,具有一定借鑒意義。
本文提出的形狀真實度概念基于模式識別領域中的不變矩。目前常用的不變矩包括Hu 矩、Zernike 矩、Pseudo-Zernike 矩、Legendre 矩、Fourier-Mellin 矩、Tchebichef矩和Krawtchouk 矩。
Hu 矩是一種經(jīng)典的不變矩,在1962 年由Hu 提出[6],具有平移、旋轉(zhuǎn)和縮放不變性。對于圖像f(x,y),其p+q階幾何矩的定義為
p+q階中心距的定義為
其中(ˉx,ˉy)為圖像的重心坐標,滿足
歸一化的中心距定義為
Hu 根據(jù)歸一化的中心距構(gòu)造了7 個不變矩
Zernike 矩是一種無信息冗余的連續(xù)正交矩,廣泛應用于圖像重建、目標識別、數(shù)字水印、邊緣檢測、圖像檢索等領域。對于圖像f(x,y),重復率為q的p階Zernike 矩的定義為[7]
該式須滿足條件(p ?|q|)為非負偶數(shù)。式(5)中,f(ρ,θ)為圖像f(x,y)的極坐標形式;(ρ,θ)為Zernike 多項式Vpq(ρ,θ)的共軛復數(shù),Zernike 多項式的定義為
與Zernike 矩相比,Pseudo-Zernike 矩具有更好的特征表現(xiàn)性和噪聲穩(wěn)定性[8]。Pseu do-Zernike 矩的形式與Zernike 矩的形式相似,僅需將Zernike 多項式換為Pseudo-Zernike多項式。Pseudo-Zernike 多項式的定義為[9]
該式只需滿足(p ?|q|)為非負整數(shù)。
Legendre 矩也是一種使用廣泛的連續(xù)正交矩,(p+q)階Legendre 矩的定義為[10]
其中Pp(x)為p階Legendre 多項式,其定義為
正交Fourier-Mellin 矩是一種廣泛應用于模式識別、邊緣檢測等領域的連續(xù)正交矩。對于圖像f(x,y),重復率為q的p階Fourier-Mellin 矩的定義為[11]
其中Qp(ρ)為ρ的p階多項式,其定義為
Tchebichef 矩是由Mukundan 等人[12]提出的離散正交矩。對于寬度為M、高度為N的圖像f(x,y),(p+q)階Tchebichef 矩的定義為
該迭代關(guān)系的初始值為
?ρ(p,M)的表達式為
Krawtchouk 矩是由Yap 等人[13]提出的離散正交矩,對于寬度為、高度為N的圖像f(x,y),(p+q)階Krawtchouk 矩的定義為
該遞推關(guān)系的初始值為
其中w(x;m,M ?1)為加權(quán)函數(shù),滿足迭代關(guān)系
迭代關(guān)系的初始值為
由于不變矩能夠描述圖像中物體的形狀特征[15],根據(jù)兩幅圖像之間不變矩的差異,定義圖像A 中物體相對于圖像B 中物體的形狀真實度
本文提出的書法真?zhèn)舞b定模型由硬件與軟件兩個系統(tǒng)構(gòu)成,硬件裝置由本項目組自行研發(fā)設計,是專門針對書法作品的高清數(shù)字化掃描設備,如圖1 和圖2 所示。該設備采用了兩個對書法作品友好的,發(fā)光強度穩(wěn)定且均勻的白色線型光源,該光源發(fā)出的光經(jīng)過高精密的柱狀透鏡聚合后,照射到書法作品的同一掃描區(qū)域。線陣相機CCD 將該區(qū)域所成的像轉(zhuǎn)化為電信號,經(jīng)過圖像采集卡量化處理后,形成數(shù)字圖像并存儲于計算機中,其實現(xiàn)了光信號到電信號再到數(shù)字圖像的信號轉(zhuǎn)換。
圖1 書法作品高清數(shù)字掃描設備硬件裝置圖
圖2 書法作品高清數(shù)字掃描設備硬件原理圖
由于本系統(tǒng)采用的是CCD 線陣相機,它一次只能采集一行掃描對象的高清晰圖像。因此,為了獲得一幀圖像,光學系統(tǒng)(由光學鏡頭與線陣CCD 相機組成)需要沿著主掃描方向進行運動以實現(xiàn)對掃描對象的全部數(shù)據(jù)采集。軟件系統(tǒng)的鑒定流程圖如圖3 所示。
圖3 基于形狀真實度的書法真?zhèn)舞b定方法的流程圖
通過掃描設備獲取待鑒定書法作品和目標書法作品的圖像信息,首先對待鑒定書法作品的圖像和目標書法作品的圖像進行預處理。由于光學數(shù)碼設備獲取的圖像含有鏡頭畸變,故在預處理過程中需要進行鏡頭畸變校正[16]。此外,還要消除其他因素如亮度、顏色的影響,本文采取了圖像二值化的處理方式。但是我們所采集的書法作品往往年代久遠,污漬、破損等情況不可避免,這些大大增加了預處理的困難和麻煩。這是因為污漬及破損區(qū)域,通過數(shù)字掃描表現(xiàn)在圖像上,其灰度值與書法作品本身的文字的灰度值相差不大,使得二值化的效果大大降低。Otsu、Sauvola、Kittler、Niblack、自適應閾值[17–18]都是目前主流的二值化算法。其中,自適應閾值方法是通過灰度直方圖來確定二值化閾值的方法。其確定的閾值和最終得到的灰度圖像密切相關(guān)于不同灰度值圖像的像素數(shù)目。具體說來,首先計算圖像中不同灰度值所對應的像素總數(shù),對書法作品而言,總體上講基本是白底黑色,但是因為年代久遠等因素的影響,存在紙張泛黃等現(xiàn)象,盡管如此,其灰度直方圖仍然會存在兩個較為明顯的峰值,我們將兩個峰值中間的最低點的灰度值作為二值化的閾值,大大提升了二值化的效果,這是由于該閾值使得灰度值較大的像素的數(shù)目與灰度值較小的像素的數(shù)目恰好同時達到最大,這樣不僅最大程度地保持了書法筆劃的細節(jié)特征,并且由于所掃描的文字源圖像一般灰度值變化不大,比較平緩,這樣的像素點就會統(tǒng)一被處理,在最終獲得的二值化圖像中,文字邊緣不易產(chǎn)生毛刺等現(xiàn)象,作品的紋理特征會更好的呈現(xiàn)出來。綜上,本文選取自適應閾值二值化方法。兩幅圖像經(jīng)預處理后,計算待鑒定書法作品圖像相對于目標書法作品圖像的形狀真實度,如果該值大于形狀真實度的閾值,則判斷待鑒定書法作品為真,反之則為假。書法形狀真實度閾值的選取通常需要一定的經(jīng)驗,對于不同的書法作品應取不同的閾值,閾值的選取需要考慮平移、旋轉(zhuǎn)和縮放變換對圖像形狀真實度的影響,具體方法見3.2 節(jié)。
在進行書法真?zhèn)舞b定時,由于拍攝條件不可能完全相同,獲取的待鑒定書法作品圖像和目標書法作品圖像之間會存在位置、角度和比例上的差異,即便經(jīng)過圖像變換處理也不能將這種差異完全消除,因此有必要對形狀真實度的平移、旋轉(zhuǎn)和縮放不變性進行分析。除此之外,還需討論形狀真實度對書法形狀差異的識別能力,識別書法形狀差異是實現(xiàn)書法真?zhèn)舞b定的依據(jù)。本研究分別針對形狀真實度的平移、旋轉(zhuǎn)和縮放不變性分析以及形狀真實度對于書法差異的識別能力兩方面設計了專門的軟件系統(tǒng),用于進行形狀真實度的性能分析,以此說明本文所提出的圖像形狀真實度方法對于書法真?zhèn)舞b定的借鑒意義及實用價值。
理想的形狀真實度應只與兩幅圖像的形狀有關(guān),而與圖像的平移、旋轉(zhuǎn)和縮放變換無關(guān)。但在實際應用中,由各矩計算的形狀真實度并不具有理想的平移、旋轉(zhuǎn)和縮放不變性。因此,需為形狀真實度選取具有平移、旋轉(zhuǎn)和縮放不變性的最佳矩。為測試各矩計算的形狀真實度的不變性,設計了如圖4 所示的程序框架結(jié)構(gòu),采用了如圖5 所示的實驗對象,圖5(a)至圖5(d)分別為永字行書、永字隸書、勤字行書、勤字隸書的圖像。
圖4 形狀相似度計算程序的結(jié)構(gòu)框架
圖5 形狀真實度不變性測試的實驗對象
實驗中所有圖像的尺寸均為1 000×1 000 像素,平移變換實驗中采用的平移向量為(100,0)、(100,100)、(0,100)、(?100,100)、(?100,0)、(?100,100)、(0,?100)、(100,?100),將這八組平移實驗中的最小形狀真實度作為衡量平移不變性的性能指標。在旋轉(zhuǎn)和縮放變換實驗中,考慮到實際進行書法鑒定時多為用同一數(shù)碼設備獲取的圖像,實驗采用了小角度旋轉(zhuǎn)和小比例縮放,旋轉(zhuǎn)的角度為±5?和±10?,縮放比例為0.9 倍、0.95 倍、1.05 倍和1.1 倍,將旋轉(zhuǎn)和縮放實驗中的最小形狀真實度作為衡量旋轉(zhuǎn)不變性和縮放不變性的性能指標。
此外,實驗還計算了平移、旋轉(zhuǎn)和縮放變換的綜合不變性
其中ST、SR和SS分別為真品書法圖像在平移、旋轉(zhuǎn)和縮放中的最小形狀真實度。將三種變換的形狀真實度差異累加,即是圖像變換中的最大差異,據(jù)此可計算出圖像在復合變換中的最小形狀真實度,以此作為綜合不變性的性能指標。綜合不變性越趨近于100%,說明平移、旋轉(zhuǎn)和縮放不變性越好。實驗中各矩的綜合不變性如表1 所示,表中Zer 矩代表Zernike 矩,Pse 矩代表Pseudo-Zernike 矩,Leg 矩代表Legendre 矩,F(xiàn)ou 矩代表Fourier-Mellin 矩,Tch 矩代表Tchebichef 矩,Kra 矩代表Krawtchouk 矩。從表1 可以看出,由Hu 矩計算的形狀真實度在各組實驗中的綜合不變性均能達到99%以上,高于其他矩計算的形狀真實度。這意味著由Hu 計算的形狀真實度具有最佳的平移、旋轉(zhuǎn)和縮放不變性。因此,Hu 矩是描述形狀真實度的最佳矩。
表1 由各不變矩計算的形狀真實度的不變性比較
為測試形狀真實度對書法形狀差異的識別能力,采用圖6 所示的書法對本文提出的形狀真實度進行測試。
圖6 書法形狀差異的識別能力測試對象
從圖6 可以看出,真品書法作品與贗品書法作品之間差別很小,不易用肉眼辨別。實驗中分別將真品《清靜無為》書法作品、贗品《清靜無為》書法作品、真品《誡子書》書法作品和贗品《誡子書》書法作品作為待鑒定書法作品,計算待鑒定書法作品圖像相對于真品書法作品圖像的形狀真實度,以及由式(22)計算的平移、旋轉(zhuǎn)和縮放綜合不變性,結(jié)果如表2 所示。由式(22)計算的綜合不變性反映了圖像平移、旋轉(zhuǎn)和縮放過程中的最小形狀真實度,可將該值作為識別書法形狀差異的閾值。當待鑒定書法作品圖像相對于目標書法作品圖像的形狀真實度大于該值時,判斷待鑒定書法作品為真;否則,則判斷待鑒定書法作品為假。從表2 可以看出,真品《清靜無為》書法作品的形狀真實度大于綜合不變性閾值,鑒定結(jié)果為真品;贗品《清靜無為》書法作品的形狀真實度小于綜合不變性閾值,鑒定結(jié)果為贗品;真品《誡子書》書法作品的形狀真實度大于綜合不變性閾值,鑒定結(jié)果為真品;贗品《誡子書》書法作品的形狀真實度小于綜合不變性閾值,鑒定結(jié)果為贗品;以上實驗結(jié)果與實際情況一致。
表2 書法形狀差異的識別能力的測試結(jié)果
進一步,為了驗證系統(tǒng)的鑒別能力和系統(tǒng)性能,在測試系統(tǒng)的過程中,我們針對包含真?zhèn)蔚?84 幅書法作品,分別使用了專家鑒定法,基于深度學習技術(shù)的鑒定方法以及本文提出的方法進行測試比較,在實驗中采用的是交叉驗證的方法,即:將184 幅樣本中的183 幅作為訓練集,建立模型,剩余1 幅作為測試集,檢驗模型。如此分別輪換測試集和訓練集,完成對所有樣本的訓練與檢驗,測試結(jié)果如下。
1) 鑒定準確率
2) 鑒定時間開銷
為了說明鑒定系統(tǒng)的效率,我們在上述實驗中測試了三種方法的時間開銷。測試結(jié)果見表4,從表4 中可以看出,本文所提出的方法的平均鑒定時間開銷為15.17 ms,與其他兩種方法相比,鑒定效率最高,具有明顯優(yōu)勢。
表3 書法作品鑒定準確率驗證結(jié)果
表4 書法作品鑒定效率驗證結(jié)果
3) 抗干擾性
為了進一步驗證三種方法在鑒定過程中的抗干擾性能,我們對上述測試樣本分別添加了隨機噪聲,使用以上三種方法鑒定真?zhèn)危源藖眚炞C并對比三種方法的抗干擾性能。結(jié)果如表5 所示,可以看出,本文方法鑒定準確率略有降低,但是影響不大,仍是可接受范圍。需要注意的是,由于不變矩不具有理想的平移、旋轉(zhuǎn)和縮放不變性,當一幅贗品書法作品的形狀無限接近于真品書法作品時,會存在形狀真實度無法區(qū)分兩幅書法作品形狀差異的情況。盡管如此,由Hu 矩計算的形狀真實度仍可以識別出肉眼不易觀察的書法作品細節(jié)差異,具有較好的實用價值。
表5 書法作品鑒定抗干擾性能驗證結(jié)果
本文將模式識別領域中的不變矩應用于書法作品真?zhèn)舞b定,提出了形狀真實度的概念,用該指標衡量待鑒定書法作品圖像相對于真品書法作品圖像的形狀真實程度,通過設定閾值的方法對書法作品的真?zhèn)芜M行鑒定。文中分析比較了Hu 矩、Zernike 矩、Pseudo-Zernike 矩、Legendre 矩、Fourier-Mellin 矩、Tchebichef 矩和Krawtchouk 矩等七種常見不變矩的形狀真實度的性能。實驗結(jié)果表明,Hu 矩是描述形狀真實度的最佳矩,并且該系統(tǒng)通過高清晰、高精度、高保真的書法作品的圖像采集與處理,進一步保證了鑒定的可靠性,由于不可避免的存在噪聲等因素的影響,系統(tǒng)的確存在誤判,但是誤判率較低,且該系統(tǒng)能夠識別出肉眼不易觀察的細節(jié)差異。通過與主流的專家鑒定方法相比:是鑒定書法作品真?zhèn)蔚妮o助依據(jù),可以提高書法作品鑒定的效率與可信性,與基于深度學習的真?zhèn)巫R別方法對比,該方法的鑒定準確率高,鑒定時間開銷短,且抗干擾性好。在書法真?zhèn)舞b定中具有較好的實用價值。本文將模式識別領域與書法作品真?zhèn)舞b定的結(jié)合與應用做了一些探討和嘗試,實驗證明該方法的可行性,后續(xù)可考慮由近及遠,對當代及近現(xiàn)代的書法作品,采用高精度的數(shù)字化掃描及拍攝手段,建立書法作品數(shù)字化數(shù)據(jù)庫,通過本文提出的方法,可對庫中的書法特征進行對比與匹配,從而為專家鑒定書法提供一種科學可靠的輔助手段,具有一定借鑒意義。進一步地,應用本文的方法如何解決同一書法風格不同書法作品的真?zhèn)舞b定問題,以及書法風格隨著年齡而逐漸變化的書法作品的真?zhèn)舞b定問題,有待后續(xù)下一步的研究與拓展。