計浩浩,張 誠,卿粼波,王正勇,韓龍玫
(1.四川大學 電子信息學院,四川 成都 610065;2.成都市規(guī)劃和自然資源局 規(guī)劃設計研究院,四川 成都 610081)
傳統(tǒng)的城市定量研究主要采用問卷調(diào)查、現(xiàn)場調(diào)研等方法收集數(shù)據(jù)。如Gehl等[1]創(chuàng)建的公共空間-公共生活調(diào)查法,通過現(xiàn)場計數(shù)、地圖標記和跟蹤記錄等方法獲取具體的活動特征信息,進而客觀評價公共空間品質。傳統(tǒng)調(diào)研方法雖然可以獲得較為全面、詳細的信息,但是非常費時費力,無法進行大規(guī)模的城市定量研究,也難以精確到街道尺度[2]。
近年來街景圖片作為直接反應城市公共空間的圖像大數(shù)據(jù),具有真實感強、信息度豐富和覆蓋范圍廣等特點,能夠有效描述城市公共空間場景,彌補非視覺數(shù)據(jù)的不足,在提取城市街道空間屬性方面具有極大的優(yōu)勢[3]。Naik等[4-6]利用計算機視覺的方法,將街景圖片應用于城市街道安全,且通過不同時間的街景圖片識別城市外觀的變化,揭示城市物理變化的預測因子。Seiferling等[7]結合計算機視覺和街景圖片對城市綠化覆蓋率進行自動測度。但是,目前只有少部分研究者利用計算機視覺方法對城市街道空間品質進行研究[4-8],并且其中大部分研究未充分挖掘城市空間品質屬性。研究結果表明,街道在城市生活中扮演著極為重要的角色,它不僅是交通的主要載體,也是重要的城市開放空間,是居民認識和城市生活的基本單元[2]。而建筑輪廓、表面裝飾和建筑物的高度等物理屬性也會對環(huán)境產(chǎn)生影響[9],同時,建筑的好壞也會影響著人們的心理感受[10]。因此,本文基于街景圖像提出一種機器學習方法,選擇從街道、建筑兩個不同尺度對城市空間品質進行評價,實現(xiàn)對城市空間品質的大規(guī)模自動評估。
本文使用機器學習模型來量化城市空間品質,具體技術路線如圖1所示。首先,利用騰訊街景地圖爬取城市街景圖片,并利用爬取的街景圖片制作城市空間品質數(shù)據(jù)集。然后,訓練街道空間品質量化模型和建筑立面品質量化模型。利用訓練好的模型對城市空間品質進行大規(guī)模量化。最后,在Web端建立綜合可視化分析平臺,完成城市空間品質量化的友好可視化。
圖1 技術路線整體框架
由于目前僅有少量學者對此方面展開研究,關于城市公共空間的數(shù)據(jù)集較少,常用的數(shù)據(jù)集有Cityscapes[11]、BDD[12]等。但是,這兩個數(shù)據(jù)集的數(shù)據(jù)均來自國外的街景圖片,與我國的城市空間環(huán)境存在一定差異,且數(shù)據(jù)集中街道場景單一,缺乏建筑部分的數(shù)據(jù),不適合用于本研究。因此,本文通過騰訊街景地圖提供的應用程序接口爬取國內(nèi)街景圖片建立城市空間品質數(shù)據(jù)集,制作過程主要包括4個步驟,具體流程如圖2所示。
圖2 城市空間品質數(shù)據(jù)集制作流程
(1)數(shù)據(jù)搜集。首先,利用QGIS軟件導出研究區(qū)域的路網(wǎng)數(shù)據(jù),并使用ArcGIS軟件對路網(wǎng)數(shù)據(jù)進行刪簡等預處理。對簡化后的路網(wǎng)數(shù)據(jù)以100 m的間隔距離提取采樣點,然后導出每個采樣點的街道名稱、經(jīng)緯度等信息。根據(jù)導出的采樣點信息,利用騰訊地圖提供的全景靜態(tài)街景圖API進行街景圖片的爬取,總共爬取了112 347張街景圖片。
(2)數(shù)據(jù)預處理。爬取的街景圖片由于角度、遮擋等問題,存在大量不具有研究價值的街景圖片。為了分類出具有研究價值的街景圖像,提出了一種基于機器學習的街景圖像識別模型。本文從爬取的數(shù)據(jù)庫中隨機抽取8539張圖片,人工標注“建筑類”、“街道類”和“不合格類”街景圖片。將標注好的圖片用于訓練Inception_v3[13]預訓練模型,以遷移學習的方式將數(shù)據(jù)庫中的圖片分為3類,分別是“建筑類”、“街道類”和“不合格類”。其中,“建筑類”街景圖片用于對城市公共空間中的建筑立面品質進行量化評估,“街道類”街景圖像用于對城市公共空間中的街間品質進行量化評估,而“不合格類圖片”不用于本研究。
(3)建立數(shù)據(jù)標簽。城市空間品質數(shù)據(jù)集的制作分為兩個部分:街道空間品質數(shù)據(jù)集和建筑立面品質數(shù)據(jù)集。隨機選擇“街道類圖片”和“建筑類圖片”各3491和2960作為數(shù)據(jù)集,通過人工評分的方式為數(shù)據(jù)集建立標簽。
(4)數(shù)據(jù)擴充。由于我國大部分城市空間品質處于中等水平,爬取的數(shù)據(jù)類別存在一定的不均衡問題。本文對數(shù)據(jù)集中樣本類別不足的圖片采用鏡像、加噪等方式進行數(shù)據(jù)增強。最后,獲取5157張街景圖像制作街道空間品質數(shù)據(jù)集,3980張街景圖像制作建筑立面品質數(shù)據(jù)集。
正如1.2節(jié)所述,城市空間品質數(shù)據(jù)集的制作采用人工評分的形式為數(shù)據(jù)集制作標簽?;诮志皥D像的人工主觀評分的方法始于Ewing[14]。本文基于文獻[8,14,15]以及咨詢規(guī)劃領域專家,并結合國內(nèi)街景圖片的不同特色,選取“開敞度、整潔性、意象化、維護度”4個指標用于街道空間品質的評價;選取“意象化、維護質量”兩個指標用于建筑立面品質的評價。其評價體系標準見表1~表6,評分標準示例如圖3、圖4所示。為了盡量降低主觀性帶來的誤差,本研究選擇10名研究生并對他們進行指標評價體系的培訓,然后共同對數(shù)據(jù)集進行評分,選擇大多數(shù)都認可的分數(shù)。
表1 開敞度評分標準
表2 整潔性評分標準
表3 意象化評分標準
表4 維護度評分標準
表5 建筑立面設計意象化評分標準
表6 建筑立面維護質量評分標準
圖3 建筑評分示例
圖4 街道評分示例
傳統(tǒng)圖像的描述特征(如SIFT、HOG和LBP),無法有效描述同一場景中圖像的細微差別,例如顏色,不同的圖像顏色在描述特征空間中可能具有相同的像素強度。Porzi等[16]通過實驗結果表明,卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)特征在預測人類感知方面要優(yōu)于傳統(tǒng)描述特征。而AlexNet[17]網(wǎng)絡在2012年的ImageNet圖像識別競賽中獲得冠軍,在圖像識別方面表現(xiàn)十分出色。因此,本文采用深度學習網(wǎng)絡AlexNet提取街景圖片的CNN特征。相比于主流的使用深度學習網(wǎng)絡解決大規(guī)模非線性問題,支持向量回歸(support vector regression,SVR)擅長解決中小規(guī)模數(shù)據(jù)集的復雜非線性問題,SVR通過尋求結構化風險最小函數(shù)來提高學習機泛化能力,使其在輸入數(shù)據(jù)量較少的情況下,亦能獲得良好的統(tǒng)計規(guī)律。除此之外,SVR的計算復雜度不依賴于輸入空間的維數(shù),具有良好的泛化能力,預測精度高等優(yōu)點[18]。故本文將深度學習網(wǎng)絡與SVR進行結合,對城市空間品質進行量化。
SVR使用支持向量機(support vector machines,SVM)來擬合曲線,SVM的稀疏解和良好的泛化特性使其能夠適應回歸問題。SVM通過在函數(shù)f(x)周圍引入一個ε-不敏感區(qū)域實現(xiàn)對SVR的泛化,該區(qū)域稱為ε-間隔帶[18]。與傳統(tǒng)回歸模型不同,SVR能容忍輸出f(x)與實際值y之間最多有ε的偏差,即僅當c與y之間的差別絕對值大于ε時才計算損失,如圖5所示。
圖5 SVR原理
對于回歸問題,給定訓練樣本,D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈R,其思想為確定一個函數(shù),使得輸出f(x)與實際值y盡可能接近。
一般的SVR估計函數(shù)采用式(1)形式
f(x)=(ω·Φ(x))+b
(1)
其中,ω∈RN,b∈R, Φ表示從RN到高維空間的非線性變換。其目標就是找到合適的ω和b的值,使得x的值可以通過最小化回歸風險來確定。于是,SVR問題可表示為
(2)
其中,C為正則化常數(shù),lε為ε-不敏感損失函數(shù)
(3)
張婷等[19]指出融合卷積神經(jīng)網(wǎng)絡低層特征和高層特征,有助于獲取更豐富的圖像信息,能夠達到更準確的分類結果。最新的DenseNet[20]網(wǎng)絡也采用類似的思想,在DenseNet網(wǎng)絡中,每一層的輸入特征都是由前面所有層的輸出并聯(lián)得到,而該層的輸出特征向量也會被直接作用于其后面的所有層。因此,本文借鑒DenseNet網(wǎng)絡的思想,對AlexNet網(wǎng)絡進行了改進,將每一層的輸出特征與前面所有層的輸出特征進行融合,加強卷積神經(jīng)網(wǎng)絡之間的特征傳遞。同時,將全連接層FC8層輸出特征作為SVR的輸入特征,提出了跨連AlexNet+SVR網(wǎng)絡模型,如圖6所示。
圖6 跨連AlexNet+SVR網(wǎng)絡模型結構
在模型性能評估方面,使用均方誤差(mean squared error,MSE)作為回歸結果的度量指標,用于衡量人工評分分數(shù)值與機器學習預估值之間的差異度,如式(4)所示
(4)
其中,n為樣本總數(shù)量,yi和ti分別為每張圖像人工評分分數(shù)值與機器學習預估值。
為了驗證本文所提跨連AlexNet+SVR網(wǎng)絡模型提取空間品質特征的有效性,本文單獨利用AlexNet網(wǎng)絡、VGG16網(wǎng)絡[21],分別在網(wǎng)絡最后的全連接層后面接一個Sigmoid層,將網(wǎng)絡的輸出向量映射為0~1的浮點數(shù),對應空間品質量化值,進行回歸實驗對比。同時,為了驗證CNN特征相比傳統(tǒng)描述特征的有效性,實驗分別選取了圖像灰度值(Gray)、圖像的LBP特征和HOG特征分別作為SVR的輸入特征,進行實驗對比。除此之外,本文與相關文獻[22]的實驗方法進行了對比。由于量化指標與數(shù)據(jù)集的不同,為了統(tǒng)一評估標準,在基于本文所使用的數(shù)據(jù)集上,分別對本文方法和文獻[22]的方法進行性能測試。
表7顯示了各方法在量化街道空間品質測試集上的性能。如表7所示,在傳統(tǒng)圖像描述特征中,采用LBP特征進行SVR回歸實驗結果最好,其MSE為0.0595,但是依然高于采用圖像CNN特征進行回歸的MSE,充分說明了CNN特征更適合于圖像預測感知任務。相比于只利用深度學習網(wǎng)絡進行回歸量化街道空間品質,利用深度學習網(wǎng)絡提取圖像特征,并結合SVR的方法,實驗效果最好。此外,本文提出的跨連AlexNet網(wǎng)絡進一步優(yōu)化了提取的CNN特征,實驗結果得到了進一步提升,最終MSE達到0.0165。同時,與文獻[22]提出的實驗方法相比,本文提出的實驗方法量化誤差更小,效果更佳,驗證了本文提出的跨連AlexNet+SVR網(wǎng)絡對街道空間品質評估上的有效性。
表7 街道空間品質量化實驗結果
同樣地,在建筑立面品質量化模型性能評估方面采用了相同的對比實驗,表8顯示了各方法在量化建筑立面品質測試集上的性能。結果表明,與評估街道空間品質性能相似,使用本文所提跨連AlexNet網(wǎng)絡提取CNN特征預測建筑立面品質效果最好,也進一步驗證了本文實驗方法能夠有效評估建筑立面品質。
表8 建筑立面品質量化實驗結果
本文以成都市為研究案例,利用訓練好的模型對城市空間品質進行大規(guī)模量化,得到每個街道采樣點的街道空間品質分數(shù)和建筑立面品質分數(shù),并將每個街道采樣點的街道空間品質分數(shù)和建筑立面品質分數(shù)進行融合。同時,為了降低個別采樣點的量化誤差,本文將同一街道的多個采樣點進行求和平均,以街道為單位,利用百度地圖API提供的地理坐標系繪制成都市空間品質量化地圖,如圖7所示。其中,利用散點圖表示街道采樣點,且點擊每個散點可以查看該街道采樣點的經(jīng)緯度、空間品質量化結果以及圖片等信息。同時,本文基于Echarts建立了圖表分析功能,利用 ECharts插件中的餅圖、柱狀圖等功能,對城市空間品質不同等級的占比情況以及空間品質排名情況進行統(tǒng)計分析。本文將量化后的空間品質分為4個等級進行可視化,由于在城市規(guī)劃以及城市管理中,更側重于識別出空間品質的兩端值,故本文賦予等級兩端更寬的取值范圍,分別為(0.0-0.3], (0.3-0.5], (0.5-0.7]以及(0.7-1.0],等級越高表示空間品質越好。
如圖7所示,成都市三環(huán)內(nèi)西邊整體的空間品質高于東邊,南邊整體的空間品質好于北邊。特別地,A區(qū)域是成都火車北站附近,由于該區(qū)域公共設施建造時間較久遠,設施老化嚴重,空間品質較低;B區(qū)域主要是鐵路交匯的區(qū)域,公共設施較差,空間品質也處于較低水平,這與實際的情況基本吻合。該量化地圖能夠讓城市研究者更詳細、全面地了解城市建設環(huán)境,能為城市研究提供有效的技術支持和數(shù)據(jù)支撐。當?shù)鼐用窈陀慰鸵部梢詮倪@些地圖中受益,更多地了解高質量的城市環(huán)境和城市住宿地點,為日常旅行規(guī)劃更佳的路線。
圖7 成都市空間品質量化地
需要指出的是,雖然對模型性能的分析結果表明,模型評分與人們的實際評價之間存在關聯(lián),但所量化的結果與實際情況并不完全相符,存在一定誤差。例如,等級4的街道采樣點可能并不總是比等級1的街道采樣點具有更好的空間品質,但這些采樣點在大多數(shù)情況下都比等級1的采樣點具有更好的空間品質。我們分析了導致誤差可能的幾個原因——在數(shù)據(jù)預處理過程中,“街道類”“建筑類”圖片的錯誤分類,誤將“街道類”分為“建筑類”圖片,或者誤將“建筑類”分為“街道類”圖片;由于拍攝角度的影響,圖像未完全展示街道、建筑特征;街道或者建筑受樹木、車等物體的遮擋問題;訓練樣本的不足,當涉及到非常特殊的情況時,模型未能充分發(fā)揮其性能等原因。典型示例如圖8所示。
圖8 量化結果誤差較大示例
本文基于機器學習技術,提出了一種城市規(guī)劃領域研究方法,以實現(xiàn)對城市空間品質的大規(guī)模自動評估。本文選擇了街道尺度的開敞度、整潔性、維護度和意象化以及建筑尺度的建筑立面維護質量和意象化這幾個關鍵指標作為研究的出發(fā)點,優(yōu)化卷積神經(jīng)網(wǎng)絡,并結合SVR,對城市空間品質進行大規(guī)模量化。本文選取成都市三環(huán)內(nèi)為研究案例,繪制城市空間品質量化地圖。實驗結果表明,本文提出的機器學習模型準確度較高,在量化街道空間品質任務上,MSE為0.0165,在量化建筑立面品質任務上,MSE為0.0309,可以有效地對城市空間品質進行大規(guī)模量化。同時,本研究為城市研究者了解案例研究區(qū)域的空間品質提供了一種方法和數(shù)據(jù)支持。城市空間品質可以作為城市研究者在考慮房地產(chǎn)價格、教育質量、街道安全等社會經(jīng)濟變量時的參考指標[3]。對于空間品質較差的區(qū)域,規(guī)劃師可以從建筑結構、綠化、圍護等方面考慮改善城市外觀,促進城市發(fā)展。
本文的工作也存在數(shù)據(jù)量不足、數(shù)據(jù)質量不佳等問題,有待進一步豐富數(shù)據(jù)集,提高數(shù)據(jù)集的質量。同時,本文實驗結果需進一步根據(jù)實際情況驗證。后續(xù)將結合房價等經(jīng)濟數(shù)據(jù)或者問卷調(diào)查等方式進行驗證。除此之外,在城市規(guī)劃以及城市管理中,更側重于識別出空間品質的兩端值,如何設計新的誤差模型使之更適應于城市規(guī)劃領域、更加準確地識別空間品質的兩端值,也是我們在未來工作中需要研究的問題。