鄭文俊 吳曼妮 周茂杰
(桂林理工大學旅游與風景園林學院,廣西 桂林 541004)
“十四五規(guī)劃”建議提出“實施鄉(xiāng)村建設(shè)行動”“保護傳統(tǒng)村落和鄉(xiāng)村風貌”。侗族傳統(tǒng)聚落具有豐富的自然和人文景觀,彰顯了地域性的建筑藝術(shù)魅力與傳統(tǒng)山地生態(tài)文明智慧,是西南地區(qū)人居環(huán)境建設(shè)和旅游開發(fā)的重要載體。提高聚落景觀品質(zhì)、提升聚落景觀的視覺美感和營造具有吸引力的民族特色鄉(xiāng)村景觀,是新時期侗族地區(qū)鄉(xiāng)村可持續(xù)發(fā)展面臨的現(xiàn)實需求,也是規(guī)劃設(shè)計學科領(lǐng)域亟需研究的重點課題。在鄉(xiāng)村景觀視覺質(zhì)量評價研究領(lǐng)域,劉濱誼、謝花林等較早提出并構(gòu)建了鄉(xiāng)村景觀評價指標體系[1-2];也有學者嘗試將景觀視覺質(zhì)量評價從單純的美學角度向生態(tài)角度衍生[3-4],或通過視覺現(xiàn)狀質(zhì)量、敏感度及吸收力等構(gòu)建評價體系,將指標轉(zhuǎn)化為數(shù)值進行疊加,對景觀視覺研究區(qū)域的管理及未來發(fā)展提出具體對策,重塑鄉(xiāng)村歸屬感[5-6]。不同群體對于典型鄉(xiāng)村景觀元素的審美具有一致性,不同景觀要素在不同鄉(xiāng)村群落中體現(xiàn)出差異性[7]。VR技術(shù)[8]、眼動儀分析法[9-10]等現(xiàn)代科學技術(shù)也引入鄉(xiāng)村視覺景觀質(zhì)量評價中,這些技術(shù)從機體反應(yīng)層面為景觀視覺感知與審美偏好研究提供了客觀證據(jù)??傮w而言,通過構(gòu)建指標體系,以問卷調(diào)查的方法過度依賴人為評價,受評價主體的專業(yè)、學識、認知的影響較大。所以建立客觀評價模型,從認知尺度和物理特征出發(fā),以多種方式結(jié)合建立新的視覺評價模型成為當下主要的研究方向。
美景度評價法(scenic beauty estimation,SBE)以實景照片(幻燈片)作為評價的媒介載體,評判者通過觀看以實景照片制作的幻燈片后,依據(jù)主觀直接感受進行評價。這種方法可操作性較強,優(yōu)點顯著,被認為是景觀評價心理物理學派最嚴格且準確的方法[11-12]。利用SBE,可以從人的感知角度分析景觀的質(zhì)量[13-15]。圖像分割方法將圖像分成若干不相交的區(qū)域,現(xiàn)有的圖像分割方法大多基于邊緣、紋理等,可以將圖像分成前景和背景兩個部分[16]。隨著深度學習的發(fā)展,利用全卷積神經(jīng)網(wǎng)(FCN)可實現(xiàn)圖像的像素級分類,解決圖像的語義分割問題[17-19]。利用圖像分割法可以將圖像細分成不同的語義單元,實現(xiàn)景觀資源精細化評價。本文針對景觀評價中對景觀要素內(nèi)容、構(gòu)成比例分析的不足,利用SBE與全卷積神經(jīng)網(wǎng)絡(luò)圖像分割法相結(jié)合構(gòu)建景觀評價模型,建立景觀評價值與景觀圖像構(gòu)圖比例的關(guān)聯(lián),通過圖像的語義組合比例分析圖像構(gòu)圖對美景度的影響。這些研究有利于解決景觀美景度與圖像構(gòu)圖的定量分析問題,更全面有效、精細化地解譯景觀圖像美感。
湘桂黔侗族聚居區(qū)主要包括貴州省南侗地區(qū)(從江縣、榕江縣、黎平縣),湖南省南侗地區(qū)(通道侗族自治縣、靖州苗族侗族自治縣),廣西壯族自治區(qū)三江侗族自治縣、龍勝各族自治縣等,總面積約2.0萬km2。該區(qū)域分布有300余座“中國傳統(tǒng)村落”“中國少數(shù)民族特色村寨”等國字號侗族村寨,還有1 000余座保護相對較好的侗族聚落[20]。為了保證研究案例的有效性與代表性,選取3?。▍^(qū))中知名度較高、保存完整并已經(jīng)進行了不同程度旅游開發(fā)的3處典型村寨為案例地,即廣西三江程陽八寨、湖南通道芋頭古侗寨和貴州黎平肇興侗寨。程陽八寨是知名的少數(shù)民族旅游村寨;芋頭侗寨擁有保存完整的明清古建筑群[21],被列入第5批全國重點文物保護名錄;肇興侗寨距今有860多年的歷史,占地約18萬m2,是全國最大的侗族村寨之一[22]。
1.2.1 美景度評價法
(1)圖像選取
眾多研究證實,在景觀評價中采用照片作為實景替代材料具有較高可靠性與可操作性,突破現(xiàn)場評價對人力、物力的限制并對評判內(nèi)容和程序進行有效監(jiān)督。同時,為保證觀察視角更豐富多元,避免單一拍攝者主觀偏好,選取馬蜂窩、攜程、同程等網(wǎng)站游客上傳的案例地實景照片作為研究素材。剔除像素較低、過度處理、鏡頭畸變等不合格圖像,并咨詢多位專家意見,最終確定210張案例地景觀照片為評價對象,每個案例地各70張,并按照景觀要素特征分成復合景觀、農(nóng)林景觀、濱水景觀、街巷景觀、建筑景觀等5類。
(2)被試選擇及評判方式
選擇不同專業(yè)在校大學生作為被試者,將其分為專業(yè)組(風景園林專業(yè))、非專業(yè)組社科(旅游管理專業(yè))、非專業(yè)組工科(環(huán)境工程、給排水等專業(yè))三類,最終共招募350人,男女比例接近1∶1。采用7分制李克特量表為評價尺度(1分=非常不美,4分=一般,7分=非常美),以紙質(zhì)問卷形式進行[11]。由于不同個體的審美尺度存在差異,其原始評價分值不能直接用于比較,需進行標準化處理,本文采用改良后的SBE標準化方法[20]。
(3)評價流程
評價在裝有投影設(shè)備的教室中進行。將選取的210張聚落景觀照片按隨機序列標號導入PPT,并分為A、B、C三組,每組各70張,避免同類景觀連續(xù)出現(xiàn)導致視覺疲勞。每張圖像播放時間為6 s,每一組播放完休息1 min,圖像不回放,評價結(jié)果不修改,使評價者集中注意力、憑第一印象給予分值。具體步驟為:①工作人員發(fā)放問卷,講解評價步驟。②在正式評價開始前,播放3張類似照片引導被試者預練習。使被試者了解評價內(nèi)容,適應(yīng)播放時間與打分模式,再開始正式評判。③開始正式測評并回收問卷。
1.2.2 基于全卷積神經(jīng)網(wǎng)絡(luò)的圖像分割方法
(1)全卷積神經(jīng)網(wǎng)絡(luò)模型
全卷積神經(jīng)網(wǎng)絡(luò)采用卷積化、上采樣、跳躍結(jié)構(gòu)相結(jié)合的方法構(gòu)建深度學習模型[23]。卷積運算部分采用經(jīng)典VGG16模型的前5層,每層縮小200/100,總共縮小3 200/100[16,24]。然后采用fcn-8s反卷積與跳躍結(jié)構(gòu)結(jié)合,將卷積化縮小后的結(jié)果通過轉(zhuǎn)置卷積擴大2倍,與第4層下采樣的結(jié)果相加,再通過轉(zhuǎn)置卷積擴大2倍,與第3層下采樣的結(jié)果相加,最后通過轉(zhuǎn)置卷積擴大8倍得到和輸入形狀一樣大的結(jié)果。
(2)圖像預處理及增強
基于小樣本的機器學習方法,為了獲得足夠的學習樣本,通常采用圖像擴充法處理圖像并加入圖像庫。圖像的本質(zhì)是一個多維矩陣,一般是N×M×K的矩陣,可以理解為有K個N×M的二維矩陣疊加;圖像的處理是對這樣的矩陣進行計算操作,使用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分類識別也是圖像處理的一種,但它的操作是對圖像特征的提取和分類,利用圖像預處理是對圖像中的數(shù)值進行改變形成新的圖像。
圖像處理可以對圖像進行統(tǒng)一化和擴充。項目中主要對圖像的大小進行統(tǒng)一,采用灰度化、對比度等方式進行圖像庫的擴充,包括圖像縮放、歸一化、隨機旋轉(zhuǎn)、對比度增強等方法。
利用現(xiàn)有的210張侗族景觀圖像進行預處理及增強,每張圖像擴充成30張,得到總共6 300張圖像,用于深度學習模型訓練。圖像中的語義單元分成6類,分別是天空、建筑、水面、森林、農(nóng)田、道路。
(3)模型訓練
基于全卷積神經(jīng)網(wǎng)絡(luò)的圖像分割分成4個步驟,首先將圖像分成訓練集、驗證集、測試集3個部分[25]。然后采用Labelme軟件分別對訓練集、驗證集的圖像內(nèi)容進行分類標注,圖像中每類語義單元用一種顏色值表示。最后訓練集數(shù)據(jù)訓練圖像分割模型,并用驗證集數(shù)據(jù)驗證模型的分割精度,完成訓練后保存模型并用測試集觀察圖像分割效果,用全卷積神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)圖像分割。
圖像分割訓練時采用batch大小為15,訓練次數(shù)為2萬次,采用交叉熵評價圖像分割效果。采用酷睿i7處理器、20G內(nèi)存的計算機進行機器學習模型訓練,完成一次訓練約20 h,訓練交叉熵值和驗證交叉熵值約為1.83。
在SBE景觀質(zhì)量評價實驗中,聚落景觀美景度分值整體分布在-4.62~9.01;平均美景度為2.24;其中分值在0~4分最為集中。使用聚類分析將SBE值進一步劃分為4等級,美景度等級劃分如表1所示。結(jié)果表明:美景度為高等級的個案數(shù)有32個,占比15%;美景度為中等偏上的個案數(shù)有77個,占比37%;美景度為中等偏下的個案數(shù)有74個,占比35%;美景度為低等級的個案數(shù)有27個,占比13%。整體來看,案例地大多數(shù)景觀樣點視覺質(zhì)量處于中等水平。
表1 美景度等級劃分
各類型景觀的SBE值分布情況,可從一定程度反映不同類型景觀之間的視覺質(zhì)量差異與公眾景觀偏好。本研究中5類景觀的SBE均值比較結(jié)果為:復合景觀(3.35)>農(nóng)林景觀(3.12)>濱水景觀(2.58)>街巷景觀(1.76)>建筑景觀(1.46)。復合景觀SBE分值上限、下線均為最高,說明其更受人們喜愛,且被認為具有更高美學價值;其次是農(nóng)林與濱水景觀,較高分值上限表明田園風光在聚落視覺景觀中占據(jù)重要地位,但其中也存在視覺質(zhì)量較低的部分;街巷與建筑景觀SBE值下限最低且出現(xiàn)了最低離群值,說明這兩類景觀視覺質(zhì)量大多不佳;全體圖像中得分最低的樣點出現(xiàn)在建筑景觀中,同時,與其他類型相比,建筑景觀分值波動最大,說明其景觀視覺質(zhì)量最容易受到干擾和破壞。
利用全卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)圖像分割,在訓練完深度學習模型后,將原有的210張原始圖像作為輸入,測試其輸出分類圖像,輸出的圖像中將每個素都歸為一類,而不是具體的像素值。圖像分割效果如圖1所示。
圖1 圖像分割效果
圖1中左邊是原始圖像,右邊是為分割后的圖像,其中綠色區(qū)域表示建筑,紅色表示天空,紫色表示森林,粉色表示田地,黃色表示道路。經(jīng)過圖像分割,可以將一副圖像分成語義實體的有機組合。每張圖像用一個6維向量表示,分別代表5類語義塊的占比,用各語義塊的像素數(shù)量與圖像的總像素相除得到。
為解決圖像拍攝中諸多條件不一致引發(fā)的美景度值變化的問題,利用專家分析法,篩選出95張陽光充足、景觀內(nèi)容本身沒有瑕疵的圖像進行統(tǒng)計分析,旨在找到美景度與圖像內(nèi)容構(gòu)成比例之間的關(guān)系。其中濱水類13張,道路類12張,全景類27張,建筑類37張,農(nóng)林類6張。利用SPSS進行回歸分析,得到SBE值與6類語義塊之間的關(guān)系。
經(jīng)過線性回歸分析得到R值為0.69,R方值為0.476,與0.5差別不大,更改F值為16.195,因為因變量有6個,所以基本可以說明用回歸方程可以擬合描述出變量與SBE值的關(guān)系。
因為建筑的面積占比與其他5個變量具有線性相關(guān)性,所以便排除在回歸方程之外,最后得到SBE值與道路,水面、田地、樹木、天空等要素面積占比之間的關(guān)系回歸方程為公式(1):
其中,X1為天空,X2為樹木,X3為田地,X4為水面,X5為道路?;貧w分析中除了道路的sig值為0.101,大于0.05外,其他的值均小于0.05,顯著性較強。
本文利用全卷積神經(jīng)網(wǎng)絡(luò)圖像分割算法,實現(xiàn)侗族聚落景觀圖像語義分割。構(gòu)建了美景度與圖像語義單元占比回歸方程,對美景度進行了定量分析。采用的圖像分割方法與閾值法、邊緣檢測法、區(qū)域生長法等傳統(tǒng)的分割方法相比,不僅分割前景和背景,且實現(xiàn)了圖像的內(nèi)容識別,圖像元素間具有語義聯(lián)系,符合人對圖像的理解。與基于卷積神經(jīng)網(wǎng)絡(luò)算法[16,19,25-27]以圖像為單位進行分類不同,全卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)了像素級分類,對圖像進行了深層次分析,應(yīng)用于侗族景觀圖像分割,可以分析復雜的場景,開拓了新的圖像分割應(yīng)用領(lǐng)域。利用圖像語義塊的像素占比向量表示圖像,構(gòu)建美景度與圖像語義塊的線性回歸方程,發(fā)現(xiàn)美景度與構(gòu)圖、圖像內(nèi)容的關(guān)聯(lián)性,實現(xiàn)圖像構(gòu)成與美景度的聯(lián)系。本方法在圖像評價過程中減少了專家依賴,為建立全自動圖像景觀評價系統(tǒng),大規(guī)模自動識別、評價景觀圖像打下了基礎(chǔ)。實驗分析表明美景度與圖像內(nèi)容之間具有有機關(guān)聯(lián),可以用線性方程表示。從SBE值與圖像內(nèi)容的回歸方程中可看出,侗族聚落景觀的美景度與樹木關(guān)聯(lián)性最強,其次是天空,與道路和田地的關(guān)聯(lián)性最弱。
由于本文景觀圖像來源于網(wǎng)絡(luò),拍攝人員、環(huán)境、自然條件不統(tǒng)一,全部圖像不能用一個方程表示,需要介入專家進行人工篩選,挑選出拍攝條件一致的圖像進行回歸分析,而人工介入,會導致誤差疊加,回歸方程的擬合效果需要提升。在后續(xù)研究中,可通過控制拍攝條件并統(tǒng)一景觀區(qū)域,來提升圖像內(nèi)容分析的精確度。