毛志睿 高鈺桔 陳笑葵
1 昆明理工大學建筑與城市規(guī)劃學院 昆明 650500 2 廣州市城市更新規(guī)劃設計研究院有限公司 廣州 510030
公園作為服務群眾日常生活的公共服務產品和城市綠地系統的核心組成部分,承載著美化環(huán)境、休閑游憩、傳承文化等重要功能。十九大報告指出:“中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發(fā)展之間的矛盾?!痹诖吮尘跋拢瑺I造大眾喜愛的城市公園景觀環(huán)境對于增強人民幸福感、實現城市高質量發(fā)展具有重要意義。因此,有必要對城市公園進行客觀合理的景觀評價,從而為公園的管理維護及其規(guī)劃建設提供科學依據。
景觀評價研究興起于20世紀60年代,在對“基于專業(yè)/設計”“基于公眾感知”等問題的討論過程中,逐漸分化出專家學派、心理物理學派、認知學派和經驗學派[1-4]。心理物理學派主要通過數理統計手段構建美景度與各景觀要素關聯的數學模型,定量描述特定景觀環(huán)境的群體評價結果,因其良好的科學性、廣泛性、敏感性、精確性和實用性被認為是更加可靠的研究模式[5]。目前主流評價方法包括且不限于美景度評價法(SBE)、語義差異法(SD)、審美評判測量法(BIB-LCJ)、層次分析法(AHP)等,其開展研究的基礎數據主要依靠抽樣問卷調查或專家打分的方式獲得[6-10]。隨著“通信與信息技術”和物聯網技術的發(fā)展,景觀評價過程中形成了有別于傳統抽樣調研和靜態(tài)統計數據的新數據環(huán)境(New Data Environment)[11-13],越來越多的學者開始嘗試借助新數據和新技術(如機器學習等)展開范圍更廣、基數更大的景觀評價研究[13-16],其中網絡用戶生成內容(User Generated Content,UGC)指互聯網用戶在各類網絡平臺上面共享自己的原創(chuàng)內容所產生的數據,具體包括網絡文本、網絡圖片和網絡音視頻等[17]。當前使用UGC數據進行景觀評價尚處于起步階段,如聶婷等[18]利用新浪微博和大眾點評數據,通過詞頻分析挖掘了珠江景觀意象和需求評價;李穎[19]基于攜程網和去哪兒網評價數據,借助語義差異法、因子分析法和GIS分析法對麗水市景區(qū)進行評價分析,在歸納麗水市景區(qū)景觀優(yōu)劣勢的基礎上提出相應優(yōu)化策略。
上述研究提出采用UGC數據進行大范圍景觀評價是一種可行思路,在一定程度上表明UGC數據可以作為傳統抽樣數據的有效補充,但仍缺乏對UGC數據運用于中微觀尺度景觀評價的進一步探討?;诖?,本文嘗試使用UGC數據作為景觀評價的基礎數據,結合現場問卷調研,對昆明市主城區(qū)5個典型公園的景觀視覺質量進行評價,旨在與時俱進地提出結合新數據和新技術的公園景觀評價思路,豐富公園景觀視覺質量評價的技術手段,為大規(guī)模公園景觀評價和人性化公園景觀環(huán)境營造提供支撐。
根據《城市綠地分類標準(CJJ/T 85-2017)選取昆明市主城區(qū)的大觀公園、翠湖公園、黑龍?zhí)豆珗@、金殿公園、海埂公園5個市級公園為研究對象,公園篩選條件如下:1)考慮公園的尺度及實際使用情況,將面積在1 hm2以內的社區(qū)公園和游園排除在外;2)考慮到研究基礎數據來源為網絡用戶生成內容,為保證數據客觀性及公園服務對象的多樣性,將專類公園排除在外;3)由于“用戶生成內容”有價值密度低的局限性,為保證UGC數據的精確性,比對研究時間內各公園的用戶生成內容數據,對數據質量較差的公園予以排除。
首先,借助Python3.7爬取并清洗公園的網絡評論文本數據,確定評價指標,再實地發(fā)放問卷獲得線下評論打分數據;其次,借助自然語言處理中的情感分析技術量化UGC數據,根據選取的評價指標篩選數據并以七段法的方式進行標準化處理,而后分別用網絡評論文本數據與線下打分數據借助SD法對5個公園景觀質量差異進行刻畫;最后,使用因子分析法提煉公共因子并計算綜合景觀視覺質量。
1.2.1 UGC數據收集與清洗
美團網和攜程網擁有規(guī)模龐大的網絡用戶群體,其商品、景點評價信息需要購買后才能發(fā)布,數據精度和可信度較高,因此選取美團和攜程的評論文本作為本次景觀視覺質量評價的基礎數據。評論文本內容于2021年10月18日通過Python 3.7爬取獲得,篩除亂碼和無意義內容后最終獲得15079條評論文本,其中大觀公園3531條、翠湖公園2626條、黑龍?zhí)豆珗@2761條、金殿公園4449條、海埂公園1712條。對篩選后的文本內容進行分詞、標注詞性,去除方位詞、代詞等停用詞后提取詞頻,選取與公園景觀環(huán)境體驗有關且出現頻次大于25的形容詞、名詞、動詞和習用語等。
1.2.2 評價指標選取
語義差異法(Semantic Differential,SD)又稱感受記錄法,能夠將使用者對特定事物的心理感受進行量化并可視化[20]。本研究借鑒景觀空間、環(huán)境感知、情感分析等理論,理解大數據的特點和優(yōu)勢,在可獲取的UGC數據中,在充分考慮大眾視角對景觀評價的影響下,綜合考慮各個公園的旅游資源和使用者的環(huán)境感知,從不同維度界定指標的范圍,從而構建景觀視覺質量評價指標。在語義差異法步驟中,需要盡可能收集和研究對象相關的形容詞對,本文首先尋找以往文獻[21-23]中出現的常用形容詞對,然后依據章俊華[20]提出的篩選條件(一是剔除難以形成完全相對的形容詞組,保證評價內容的正負兩面性,避免形成片面的評價;二是剔除在中心點兩側形成不對稱的形容詞組,避免繪圖出現差異;三是剔除不常用的形容詞組,保證UGC社區(qū)用戶能涵蓋所選形容詞組的范圍),在統計出現頻次大于25的形容詞組的基礎上,對UGC數據中使用者的評價進行歸納篩選,最終從景觀內涵、景觀空間、景觀氛圍和景觀管理4個維度選取14項評價指標(表1),對相關形容詞組進行歸類,以統一游客同種含義不同表達的網絡評價內容。
1.2.3 問卷調查與數據統計分析
現場問卷調研于2022年4—5月完成,分別對5個城市公園內游人隨機發(fā)放問卷。問卷內容包括游人的基本信息及由UGC數據處理后篩選的景觀視覺質量評價指標拓展得到的正反義詞,將每個形容詞按照“很好(3分)、好(1分)、一般(0分)、較差(-1分)、差(-3分)”5個等級進行劃分,并對每項維度和指標進行量化計算,最后得到景觀視覺質量評價得分。
自然語言處理(Natural Language Processing,NLP)是將人類語言習慣轉化為機器所能理解的語言后對各類文本數據進行處理分析[24]。本研究對于UGC數據的處理是基于自然語言處理平臺,借助樸素貝葉斯方法對人工標注的550條積極評價語料和550條消極評價語料進行機器學習訓練,得到精度達到94.25%的情感分析模型。使用該模型對包含各形容詞組內容的評論進行情感分析打分,根據七段法的原則將得分進行標準化處理,得到區(qū)間在[-3,3]的標準化網絡評價數據(表2),標準化處理公式如下:
表2 網絡評價數據標準化示意
式(1)中,Value為標準化后數據,senti為情感分析打分結果。
1.2.4 城市公園視覺景觀綜合質量分析
利用SPSS 25.0對獲得的線上UGC數據和線下問卷打分數據進行主成分分析,在此基礎上使用因子分析法提煉公共因子,采用最大方差法對初始因子載荷矩陣進行旋轉以方便公共因子命名,最后以累積方差貢獻率作為公共因子權重系數,加權求和獲得公園景觀視覺質量綜合得分,計算公式如下:
式(2)中,E為公園景觀視覺質量綜合得分,Wi為第i個公共因子的權重值,Pi為第i個公共因子的得分。
本研究獲取清洗整理后的網絡用戶評論文本共15079條。由表3可知:在用戶信息公開的9032條評論文本中,網絡用戶年齡集中在16~54歲(90.8%),其中16~34歲的青年人占54.7%,35~54歲的中年人占36.1%;0~15歲的兒童占2.5%,55~80歲的老年人占6.7%。在問卷樣本中,55~80歲的老年人占有效問卷數量的63%,35~54歲的中年人占24.7%,16~34歲的青年人占12.3%。根據上述年齡結構特征,兩種方法互為補充,可以進行交叉驗證。
表3 公園使用人群年齡結構特征
根據UGC評價數據標準化結果,繪制語義差異得分表(表4)。結果表明,公園景觀視覺質量的影響因子中較為重要的有景觀內涵維度的美感(2.57),景觀空間維度的蔭蔽度(2.69)和形體感(2.18),景觀氛圍維度的舒適度(2.77)、愉 悅 度(2.52)和 氛 圍 感(2.41),景觀管理維度的便捷度(2.18)和性價比(2.12)。
表4 基于UGC數據的語義差異得分情況
本研究共計發(fā)放調研問卷1000份,有效問卷900份。結果(表5)顯示,公園景觀視覺質量評分中較為重要的影響因子是景觀氛圍維度的舒適度(2.61)與氛圍感(2.19),景觀管理維度的便捷度(2.58)、整潔度(2.57)和管理水平(2.28)。
表5 基于問卷數據的語義差異得分情況
由于樣本量小于變量個數,因此進行因子分析計算相關系數矩陣檢驗變量間相關性[25]。從兩類數據中提煉得到特征值大于1的公共因子有4個,累積解釋方差達100%,由于碎石圖曲線在第5個因子以后放緩,因此選擇4個公共因子足夠解釋原有變量(表6)。
表6 總方差解釋情況
融合UGC數據和問卷數據的評價分值,采用方差最大法對初始因子載荷矩陣進行旋轉。結果(表7)顯示,進行旋轉后的初始因子載荷矩陣在6次迭代后收斂,且各因子軸中因子負載≥0.5,故4個公共因子的命名分別為景觀環(huán)境(歷史感、蔭蔽度、整潔度、性價比、形體感、趣味性),景觀認知(特色度、美感、方向感、管理水平),景觀氛圍(氛圍感、便捷度)和景觀體驗(舒適度、愉悅度)。
表7 因子負荷量
依項計算公園各項公共因子得分,進而得到城市公園景觀視覺質量總體得分,結果如表8所示:對公眾而言,景觀環(huán)境對公園景觀視覺質量影響力最大;其次為公園景觀的認知感與氛圍感;景觀的體驗感對公園景觀視覺質量綜合得分的影響力最小。
表8 景觀視覺質量總體得分
經過自然語言處理技術量化后的UGC數據結合傳統SD法、因子分析法能夠較好地反映公眾視野下的公園景觀視覺質量差異。UGC數據獲取的便利性意味著該思路可為大規(guī)模公園景觀質量評價提供切實有效的支撐,但由于當前互聯網使用群體的年齡段主要集中在16~54歲,研究結果存在一定局限性;而現場調研問卷數據采集靈活方便,信息獲取簡單,但在樣本采集精力、采集數量等方面存在一定局限性。將UGC數據與現場調研問卷數據進行交叉比對驗證,研究結果更為科學,置信度更高。
相對于以往研究者自主選擇指標而言,采用UGC數據的優(yōu)勢在于此數據反映的是游客游覽公園印象最深刻的內容,避免了研究者在指標選取階段的主觀臆斷,但這一特質也限制了有特殊指標如聲音、嗅覺等方面的景觀質量評價研究。目前而言,UGC數據更適合作為景觀視覺質量評價的依據,對公園等貼近居民生活的景觀進行調查[26]。
從兩類數據出發(fā),以各自數據統計得到的公園得分平均值為基準與公園內部各指標得分情況進行對比,發(fā)現不同年齡段的居民對于城市公園景觀視覺質量的關注點不盡相同。16~34歲的青年人一般在非工作時間使用公園以獲得身心放松,他們對公園的特色、美感有較高的需求,更加關注公園的景觀內涵;35~54歲的中年人對公園的景觀管理水平有較高的要求,他們是社會責任的主要承擔者,更整潔、管理有序的公園環(huán)境對這個年齡段的人群具有更強的吸引力;55歲以上的老年人側重享受公園的景觀氛圍感,這個年齡段的人群有更高的健康意識和社交需求,更加關注公園景觀的舒適度與愉悅度。
本文通過使用UGC數據和現場問卷調研相結合,對昆明市主城區(qū)5個典型公園的景觀視覺質量進行評價,景觀綜合得分表明:翠湖公園景觀視覺綜合質量最佳,其次為大觀公園、黑龍?zhí)豆珗@、金殿公園和海埂公園;公園的“景觀環(huán)境”顯著影響景觀視覺質量得分,該因子主要涵蓋歷史感、蔭蔽度、整潔度、性價比、形體感和趣味性6個方面,因此在各個公園后續(xù)規(guī)劃建設中可有針對性地加強上述6方面的環(huán)境營造。
當前各公園景觀視覺質量水平存在較大差異,提升方向感、趣味性等景觀視覺質量因子是當前5個公園使用者共同的迫切需求。金殿公園、大觀公園和黑龍?zhí)豆珗@景觀視覺質量因子影響力相對一致,3個公園均需要提升其方向感的質量,翠湖公園需要提升園區(qū)的環(huán)境衛(wèi)生水平,海埂公園需要加強景觀內涵維度的質量。