■ 云南麗江師范高等專科學(xué)校 王兆春
背景:東巴象形文字是一種納西族最原始的圖畫(huà)象形文字,以前主要由納西族祭司及東巴經(jīng)師傳授和使用,主要用于撰寫(xiě)東巴經(jīng)書(shū)故稱東巴文。納西話叫“司究魯究”其中“司”為木、“魯”為石、“究”為痕跡,意為“木跡石跡”,見(jiàn)木畫(huà)木,見(jiàn)石畫(huà)石之意。東巴文共有1500多個(gè)單字,詞義豐富,能夠清晰細(xì)膩的表達(dá)人們的思想情感,能清晰明了的記錄復(fù)雜多樣的事件,也能寫(xiě)詩(shī)作文。東巴文被稱之為世界唯一存活著的象形文字,被譽(yù)為文字的“活化石”。2003年,東巴古籍被聯(lián)合國(guó)教科文組織列入世界記憶名錄。東巴文字的最大特點(diǎn)正如清代余慶遠(yuǎn)在《維西見(jiàn)聞錄》中所道:“專象形,人則圖人,物則圖物,以為書(shū)契”。這些字形帶有濃厚的圖畫(huà)味道。東巴象形文字在歷史、人文等領(lǐng)域已有深入的研究,但東巴文字單純從數(shù)學(xué)角度對(duì)其進(jìn)行研究的目前還很少。而且現(xiàn)有的東巴文化數(shù)字化資源內(nèi)容相對(duì)淺顯,不利于深入學(xué)習(xí)?,F(xiàn)有的數(shù)字化資源相似度較高,雖然有不同的偏重點(diǎn),但是其中有很多內(nèi)容都是相同的。另外,這些資源多為文字、圖片或視頻資料,數(shù)字化形式單一,還停留在靜態(tài)保護(hù)的層面,無(wú)法全面體現(xiàn)蘊(yùn)含在東巴文化中的文化內(nèi)涵、民族精神和價(jià)值觀。更沒(méi)有對(duì)東巴文字進(jìn)行微觀數(shù)字化研究。
研究對(duì)象:本文將以方國(guó)瑜先生的《納西象形文字譜》、和品正先生的《東巴常用字典》、趙凈修先生的《東巴象形文常用字詞譯注》中的東巴象形文字為研究對(duì)象,構(gòu)建東巴象形文字庫(kù),文字庫(kù)共計(jì)1570個(gè)東巴象形文字分成數(shù)詞類、天象類、時(shí)令類、地理類、方位類、植物類、畜禽類、鳥(niǎo)類、獸類、蟲(chóng)魚(yú)類、人體器官類、人物稱謂類、勞作類、餐飲類、器物類、形容詞類等16大類。再根據(jù)模型建構(gòu)的難易程度分成簡(jiǎn)單文字庫(kù)共計(jì)1432個(gè)東巴象形文字和復(fù)雜文字庫(kù)共計(jì)138個(gè)東巴象形文字。
研究方法:下面我們用東巴文字:
“k'? d? dz?r m? ts'?r,bi ho d?i m? guo”譯為“根深樹(shù)不倒、林茂水長(zhǎng)流”,我們以其中的第一個(gè)東巴文字k'?(根)為例進(jìn)行數(shù)學(xué)模型的建構(gòu)。具體操作步驟如下:
第二步:在Getdata Dragh Digitizer軟件中對(duì)圖片建立平面直角坐標(biāo)系。為了方便操作我們將橫縱坐標(biāo)都統(tǒng)一約定為0-10。并統(tǒng)一規(guī)定x軸的變量為自變量,y軸的變量為因變量。
第三步:根據(jù)x軸自變量的單調(diào)性把圖像分成以下四個(gè)部分。具體如圖一的紅線所示:
圖一
第四步:用Point capture mode對(duì)四個(gè)部分分別進(jìn)行圖像數(shù)據(jù)化。
第五步:對(duì)第四步的數(shù)據(jù)在Excel中進(jìn)行預(yù)處理。
第五步:在Matlab中對(duì)第五步的離散數(shù)據(jù)用Savitzky-Golay卷積平滑法對(duì)離散數(shù)據(jù)進(jìn)行去噪處理。
第六步:在Matlab中對(duì)第五步中去噪后的數(shù)據(jù)進(jìn)行合理擬合。
如下圖二所示將圖像的第一部分?jǐn)?shù)據(jù)化后,再將數(shù)據(jù)去噪處理,最后將處理后的數(shù)據(jù)在Matlab軟件中進(jìn)行擬合,一般擬合過(guò)程中擬合的次數(shù)不超過(guò)5次。根據(jù)第一部分圖像的數(shù)學(xué)性質(zhì)我們?cè)跀M合時(shí)選取了2次擬合。圖二右半部分藍(lán)線段為擬合的函數(shù)圖像,紅點(diǎn)為我們用Point capture mode對(duì)第一部分進(jìn)行圖像數(shù)據(jù)化的離散數(shù)據(jù),擬合的函數(shù)與離散數(shù)據(jù)基本吻合因此擬合函數(shù)選取合理,具體的擬合函數(shù)為y=-0.3282x2+3.3021x+2.9673。
圖二
同理可將剩余的三部分依次數(shù)據(jù)化后,再將數(shù)據(jù)在Excel中進(jìn)行預(yù)處理,然后將數(shù)據(jù)進(jìn)行去噪處理,最后將處理后的數(shù)據(jù)在Matlab軟件中選取適當(dāng)?shù)暮瘮?shù)進(jìn)行擬合即三次重復(fù)上述6個(gè)步驟得到三個(gè)擬合函數(shù)。擬合的函數(shù)分別為:y=0.0140x4-0.2873x3+2.0059x2-5.2620x+4.7936,y=-0.0951x3+2.0084x2-13.6588x+36.3840,y=-0.2346x2+5.4821x-14.9517。
第七步:根據(jù)第六步的四個(gè)分段擬合函數(shù)對(duì)每個(gè)擬合函數(shù)選取適當(dāng)?shù)亩x域范圍,k'?(根)就可以由第六步的四個(gè)函數(shù)共同擬合而成即構(gòu)建出k'?(根)的數(shù)學(xué)模型。
擬合函數(shù)的圖像如圖三的右半部分所示,而圖三的左半部分是我們用Point capture mode對(duì)總的四個(gè)部分進(jìn)行圖像數(shù)據(jù)化的離散數(shù)據(jù)構(gòu)成的圖像,擬合的函數(shù)圖像與離散數(shù)據(jù)圖像基本吻合,因此擬合函數(shù)及其定義域范圍選取合理整個(gè)東巴文字?jǐn)M合完畢。
圖三
結(jié)語(yǔ):根據(jù)上述的方法步驟所有的1570東巴象形文字都可以構(gòu)造出對(duì)應(yīng)的數(shù)學(xué)模型及對(duì)應(yīng)的數(shù)據(jù)庫(kù),這為東巴象形文字?jǐn)?shù)字化和東巴經(jīng)典古籍象形文字智能識(shí)別奠定了良好的基礎(chǔ)。也在大數(shù)據(jù)時(shí)代為東巴文化遺產(chǎn)系統(tǒng)性、活態(tài)性保護(hù)與傳承奠定了結(jié)實(shí)的基礎(chǔ)。也為2D或3D建模、場(chǎng)景搭建、人機(jī)交互等技術(shù)等使東巴文化數(shù)字化資源得到最大限度地共享和利用,為廣泛傳播東巴文化奠定基礎(chǔ)。