張效儒
在考古研究特別是科技考古領(lǐng)域中,使用統(tǒng)計圖表的形式呈現(xiàn)數(shù)據(jù)并分析結(jié)論這一研究方式近年來得到廣泛運用。近五年考古學(xué)核心期刊發(fā)表的相關(guān)論文中,SPSS、R語言、Origin、Systat是較常用的統(tǒng)計分析軟件,其中SPSS占絕對比重。SPSS英文全稱“Statistical Product and Service Solutions”,中文名為“統(tǒng)計產(chǎn)品和服務(wù)解決方案”,它是世界上最早發(fā)明的一款數(shù)據(jù)統(tǒng)計分析軟件,運算結(jié)果可靠,國際認可度較高。相較其他幾款統(tǒng)計分析軟件,SPSS以各類功能模塊和菜單命令為主要操作方式,復(fù)雜運算無須單獨編輯語法命令,簡單易學(xué),非統(tǒng)計專業(yè)人員也較容易掌握操作要領(lǐng)。
瓦件是古代城市遺址中的常見建筑構(gòu)件,以往發(fā)掘簡報和報告中,披露瓦件尺寸數(shù)據(jù)是普遍做法,但進一步研究數(shù)據(jù)所反映的深層次問題往往淺嘗輒止。這里使用SPSS 24.0版本,簡要介紹SPSS數(shù)據(jù)管理和繪圖的操作流程,初步探討SPSS在瓦件研究領(lǐng)域中的作用。這里選取秦都咸陽城、西漢長安城和漢魏洛陽城發(fā)表的瓦件數(shù)據(jù)進行分析,這幾座城址時空范圍不同,選用不同圖形輸出方式以分析不同城址瓦件材料,一方面可以讓使用者依據(jù)材料的特點更有針對性地選取圖形輸出方式,另一方面可以結(jié)合材料特點更全面展示SPSS的各項繪圖功能以及可以實現(xiàn)的目的。
SPSS繪圖類型和輸出方式
SPSS繪圖與傳統(tǒng)考古繪圖存在根本區(qū)別,它并不針對遺跡、遺物自身形態(tài)繪圖,而是對采集的遺跡和遺物數(shù)據(jù)進行統(tǒng)計分析,以問題為導(dǎo)向輸出條形圖、折線圖、面積圖、餅圖、散點圖、箱圖等多種圖形。以秦都咸陽城一號宮殿瓦當(dāng)數(shù)據(jù)為例,在“圖形”菜單中,“圖表構(gòu)建器”“圖形畫板模板選擇器”“舊對話框”是三種常用的圖形輸出方式。
圖表構(gòu)建器
“圖表構(gòu)建器”是一種交互式圖形生成器,由“變量框”“圖表預(yù)覽使用示例數(shù)據(jù)框”“圖庫”等相關(guān)單元框組成。圖庫提供多種圖形,每種圖形根據(jù)選取變量的不同又分為多種類型。若繪制某一圖形,只需在圖庫中雙擊或?qū)D庫中某一圖形直接拖入“圖表預(yù)覽使用示例數(shù)據(jù)框”即可。例如選用箱圖,若要呈現(xiàn)秦都咸陽城一號宮殿不同類型瓦當(dāng)直徑數(shù)據(jù)分布情況,可將變量框中“類型”拖入X軸,將所要分析的瓦當(dāng)直徑變量拖入Y軸。有時會選取多組變量進行綜合分析,可以在“組/點ID”選項卡中勾選聚類變量,然后在變量框中進行選擇。標題和腳注也可根據(jù)具體需要進行設(shè)置,設(shè)置完成后點擊“確定”,此時數(shù)據(jù)運算過程會在獨立的“查看器”中顯示。
圖形畫板模板選擇器
“圖形畫板模板選擇器”是一種更加智能的交互式可視化圖形生成工具,根據(jù)選取的變量組合,系統(tǒng)自動生成符合數(shù)據(jù)運算邏輯的圖形預(yù)覽,供使用者選擇。這種圖形輸出方式一方面直觀高效地對數(shù)據(jù)變量進行統(tǒng)計,提供多種圖形選擇;另一方面規(guī)定了數(shù)據(jù)在科學(xué)運算下輸出的幾種理想方案,一定程度上減少了手動選擇可能出現(xiàn)的紕漏。
選擇“圖形畫板模板選擇器”,在界面中選擇秦都咸陽城一號宮殿瓦當(dāng)數(shù)據(jù)中的“類型”“當(dāng)面徑”變量,右側(cè)預(yù)覽區(qū)域自動顯示由這兩個變量可生成的各類圖形,根據(jù)需求進行選擇,同時在“詳細”“標題”“選項”等選項卡中對將要生成的圖形進一步設(shè)置。
舊對話框
“舊對話框”中的幾類圖形實際是“圖表構(gòu)建器”中所有圖形種類的精簡版,除界面顯示略有不同外,操作理念基本相同。以簇狀條形圖為例,在“舊對話框”中選擇“條形圖”,勾選“簇狀”“個案組摘要”,點擊“定義”進入“定義簇狀條形圖”界面。在此界面中,將左側(cè)“當(dāng)面徑”變量拖入右側(cè)“變量”框中,SPSS提供多種統(tǒng)計方式,包括“個案數(shù)”“個案百分比”“累計個案數(shù)”等,此處需要統(tǒng)計每一瓦當(dāng)個案中的直徑數(shù)值,所以勾選“其他統(tǒng)計”,默認“值的平均值”。如果不需要統(tǒng)計原始數(shù)據(jù),“更改統(tǒng)計”菜單還提供了“標準差”“值的中位數(shù)”“方差”等多種選擇。設(shè)置完變量后,需要將左側(cè)類型變量拖入右側(cè)“類別軸”,這是圖形中X軸的分類依據(jù)。在數(shù)據(jù)庫中,每一瓦當(dāng)個案均附有“型式”信息,如果還需要進一步以型式進行分組,可以將左側(cè)“型式”變量拖入右側(cè)“聚類定義依據(jù)”中。以上所有設(shè)置完成后,點擊“確定”,在“查看器”中輸出圖形。除條形圖外,其他種類圖形設(shè)置均與此類同。
單一數(shù)據(jù)變量的圖形輸出
單一數(shù)據(jù)變量的圖形輸出是較為常用的方式,它是對前文提及的三種圖形輸出方式更具體、更綜合的應(yīng)用。SPSS可以呈現(xiàn)瓦件某一數(shù)據(jù)變量在不同地點的總體分布特征,也可以呈現(xiàn)各地點各類瓦件某一數(shù)據(jù)變量的分布特征。依據(jù)單一數(shù)據(jù)變量是否分組,可分為變量無分組圖形輸出和變量分組圖形輸出。
單一數(shù)據(jù)變量無分組圖形輸出
單一數(shù)據(jù)變量無分組圖形輸出可有效對多個出土地點同一類器物數(shù)據(jù)進行觀察。西漢長安城出土瓦當(dāng)?shù)牡攸c多、數(shù)量豐富,是考察單一數(shù)據(jù)變量的較好案例。根據(jù)以往研究成果,可大致將各遺址瓦當(dāng)時代劃分為西漢早期至中期和西漢中期至晚期兩大階段。以西漢早期至中期各遺址瓦當(dāng)直徑數(shù)據(jù)為例進行分析,箱圖是較為適合的呈現(xiàn)方式。箱圖可觀察數(shù)據(jù)的分布范圍、平均數(shù)、中位數(shù)、二分位數(shù)、四分位數(shù)、最大值、最小值、異常值、極值等。在數(shù)據(jù)編輯器中建立西漢早期至中期瓦當(dāng)數(shù)據(jù)或打開提前保存好的瓦當(dāng)數(shù)據(jù)文件,之后在“圖表構(gòu)建器”中選擇箱圖,將“遺址”變量拖入X軸,將“直徑”變量拖入Y軸,點擊“確定”,在“查看器”中輸出圖形,可得到各遺址瓦當(dāng)直徑原始箱圖。箱圖顯示,未央宮椒房殿遺址瓦當(dāng)直徑出現(xiàn)異常值,編號為32的瓦當(dāng),直徑21cm,超出了IQR(四分位距)的1.5倍,說明在箱圖較為集中的區(qū)域范圍內(nèi),此瓦當(dāng)直徑偏大。陽陵陵園南門遺址同時出現(xiàn)了極值和異常值,編號57(直徑15cm)和61(直徑20.8cm)顯示為極值;編號59(直徑15.5cm)、60(直徑15.5cm)和67(直徑18.8cm)顯示為異常值。異常值和極值的存在反映了陽陵陵園南門瓦當(dāng)直徑差異大。與未央宮和武庫瓦當(dāng)直徑分布態(tài)勢相比,陽陵陵園南門瓦當(dāng)直徑整體偏大,這一現(xiàn)象為討論陽陵陵園門闕的等級問題提供了新視角。
單一數(shù)據(jù)變量分組圖形輸出
單一數(shù)據(jù)變量分組圖形輸出往往因為瓦件存在更詳細的分類而得到更豐富的數(shù)據(jù)信息,箱圖亦是較好的選擇。以西漢長安城中期至晚期各遺址瓦當(dāng)直徑數(shù)據(jù)為例,使用“圖形畫板模板選擇器”,同時選中“遺址”“紋飾”“直徑”,在圖形預(yù)覽中選擇“聚類箱圖”,點擊“確定”即可輸出聚類箱圖。聚類箱圖首先根據(jù)不同遺址分類,在此基礎(chǔ)上再根據(jù)各遺址不同類型瓦當(dāng)進一步區(qū)分,形成雙重分類依據(jù)。箱圖顯示,與云紋瓦當(dāng)相比,多數(shù)遺址的文字瓦當(dāng)中位數(shù)數(shù)值更高,箱形區(qū)域更集中,顯示出文字瓦當(dāng)規(guī)格的特殊性,這為探討文字瓦當(dāng)?shù)氖褂玫燃壧峁┝烁鼮橹庇^的線索。
數(shù)據(jù)變量的標準化處理與圖形輸出
瓦件的標準化研究是較為新穎的研究視角,田亞岐、騰銘予、蔡彥、馬歡歡等學(xué)者運用Systat對瓦件的標準化研究為我們提供了一種新思路。此視角可以觀察同一時代不同遺址或同一遺址不同時代瓦件整體和個體之間的標準化程度,進而探究工匠熟練程度、工匠流動以及手工業(yè)管理制度等問題。
與Systat統(tǒng)計分析方式相比,SPSS統(tǒng)計分析更高效、便捷。漢魏洛陽城歷時性長,出土瓦件種類豐富,階段性演變特征明顯,是進行瓦件標準化分析的較好案例。漢魏洛陽城出土的各類瓦件大致分屬漢晉、魏晉十六國和北魏三個時期,漢晉時期主要流行繩紋面布紋里板瓦、繩紋面布紋里筒瓦、云紋瓦當(dāng)、文字瓦當(dāng);魏晉十六國時期主要流行籃紋板瓦、部分素面筒瓦、三角緣云紋瓦當(dāng);北魏時期主要流行磨光面板瓦、磨光面筒瓦、部分素面筒瓦、蓮花紋瓦當(dāng)、獸面紋瓦當(dāng)、忍冬紋瓦當(dāng)?shù)?。其中,流行于魏晉十六國時期的瓦件個體數(shù)量較少,尚難進行數(shù)據(jù)統(tǒng)計,本文選取數(shù)量較多的漢晉和北魏時期瓦件進行統(tǒng)計分析。漢晉時期板瓦67件,筒瓦65件,瓦當(dāng)61件;北魏時期板瓦22件,筒瓦20件,瓦當(dāng)32件。統(tǒng)計變量包括板瓦厚度、筒瓦厚度、瓦當(dāng)厚度、瓦當(dāng)邊輪寬度。
在統(tǒng)計分析前首先要對四個變量數(shù)據(jù)進行標準化處理,SPSS默認的標準化處理方式為Z-score處理方式,公式為標準化值=(變量值-平均值)÷標準差。在SPSS中導(dǎo)入漢魏洛陽城漢晉和北魏時期板瓦厚度數(shù)據(jù),在菜單欄中選擇“分析”菜單,選擇“描述統(tǒng)計”中的“描述”菜單,在描述界面,將板瓦“厚度”變量拖入變量框中,并勾選“將標準化值另存為變量”,以方便對標準化值進一步分析。同樣的,將筒瓦和瓦當(dāng)相關(guān)變量按照同樣的方法進行標準化處理。然后使用SPSS制作板瓦厚度、筒瓦厚度、瓦當(dāng)厚度、瓦當(dāng)邊輪寬度標準值的箱圖。
箱圖顯示,盡管漢魏洛陽城漢晉時期板瓦和筒瓦厚度標準化值比北魏時期更為集中,但極值和異常值過多,說明漢晉時期工匠整體受到的制瓦規(guī)范約束性更弱。漢魏洛陽城北魏時期瓦當(dāng)邊輪寬度標準化值比漢晉時期更為集中,但兩時期均存在異常值和極值現(xiàn)象,這反映出北魏時期瓦當(dāng)邊輪寬度標準化程度應(yīng)當(dāng)更高。北魏時期瓦當(dāng)厚度的標準化值同樣比漢晉時期更為集中,說明北魏時期瓦當(dāng)厚度標準化程度比漢晉時期高。因此,漢魏洛陽城北魏時期瓦件整體標準化程度應(yīng)高于漢晉時期,工匠受到更嚴格的約束和管理。與漢晉時期相比,洛陽城出土的北魏時期各類瓦件差異較大,漢晉時期流行的繩紋板瓦、繩紋筒瓦、云紋瓦當(dāng)在北魏時期基本消失,代之以磨光面板瓦、素面筒瓦、磨光面筒瓦、獸面紋瓦當(dāng)、蓮花紋瓦當(dāng)和忍冬紋瓦當(dāng)?shù)?,其中多?shù)種類瓦件與漢晉時期相比更為厚重,燒制質(zhì)量高,規(guī)格較大,多磨光,尚黑色,宮城核心區(qū)域出土的瓦件特征更為明顯。北魏遷都洛陽之初,孝文帝便在洛陽進行大規(guī)模營建工程,作為入主中原的少數(shù)民族政權(quán),北魏以洛陽為都時期并沒有完全沿用中原地區(qū)漢晉時期瓦件,而是沿用平城時期創(chuàng)制的瓦件。此時期瓦件制作工藝水平達到前所未有的高度,瓦件數(shù)據(jù)一定程度上反映出工匠生產(chǎn)管理體系乃至匠作制度應(yīng)比漢晉時期更嚴格,也在一定程度上反映出北魏統(tǒng)治者改革創(chuàng)新的雄心。
以上案例表明,與瓦件傳統(tǒng)研究相比,使用SPSS對瓦件數(shù)據(jù)進行分析具有兩個明顯優(yōu)勢:第一,SPSS可高效處理數(shù)量龐大的瓦件數(shù)據(jù),通過繪制不同圖形,將數(shù)據(jù)用更加立體、直觀的方式呈現(xiàn),從而發(fā)現(xiàn)新問題,得到新認識;第二,SPSS的運用可使瓦件制作工藝研究從宏觀走向微觀,為探究匠作制度提供一種工具和思路。
感謝南京大學(xué)優(yōu)秀博士研究生創(chuàng)新能力提升計劃B(202002B070)對本文的支持。
(作者為南京大學(xué)歷史學(xué)院博士研究生)