鄧章 陳毅興
摘 要:在城市建筑群能耗模擬中,建筑類型和建筑年代是典型建筑參考的主要依據(jù),目 前較難直接獲取相關數(shù)據(jù).為識別建筑類型,以長沙市區(qū)21538個建筑輪廓(不含城市地圖信 息點和區(qū)域邊界輪廓信息)為例,基于建筑輪廓的輪廓面積、近似矩形短邊寬度、近似矩形系數(shù)等幾何特征,運用隨機森林方法成功識別出低層住宅、公寓式住宅和其他類型,整體準確率為81.7%.為識別建筑年代,以長沙市中心區(qū)域 7900個建筑輪廓為例,基于歷史衛(wèi)星影像數(shù)據(jù),運用卷積神經(jīng)網(wǎng)絡方法自動提取不同年代的建筑輪廓,平均精確度為80%.然后分別相交分析推斷出 5077 棟建筑建造于2005年之前,1606 棟建筑建造于2005—2014年,1217 棟建筑 建造于2015—2017年.該方法同樣適用于其他城市,為后續(xù)的建筑群能耗模擬提供了數(shù)據(jù) 支持.
關鍵詞:城市建筑群能耗模擬;建筑類型;建造年代;隨機森林;卷積神經(jīng)網(wǎng)絡中圖分類號:TU111 文獻標志碼:A
Identification of City-scale Building Information Based on GIS Datasets and Historical Satellite Imagery
DENG Zhang1,CHEN Yixing1,2?
(1.College of Civil Engineering,Hunan University,Changsha 410082,China;
2.Key Laboratory of Building Safety and Energy Efficiency of the Ministry of Education(Hunan University),Changsha 410082,China)
Abstract:Building type and built year are critical parameters to infer archetype buildings for urban building en-ergy modeling(UBEM).Currently,it is difficult to directly obtain these data for most cities.For the building type identification,taking 21538 building footprints(without a point of interest and community boundary information)in Changsha City as an example,this paper used the random forest algorithm to successfully identify low-rise resi-dences,apartment residences,and other types based on the geometric characteristics,with an overall accuracy of81.7%.For the determination of built year,7900building footprints in the downtown area of Changsha were selected as a case study,and this paper applied the convolutional neural network algorithm to automatically extract building footprints from different historical satellite imageries,with an average precision of80%.Then,the intersection analy-sis showed that 5077 buildings were built before 2005,1606 buildings were built from 2005 to 2014,and1217buildings were built from 2015 to 2017.The proposed method can be easily applied to other cities,and provide data support for UBEM in the future.
Key words:urban building energy modeling;building type;built year;random forest;convolutional neural net-work
隨著城鎮(zhèn)化進程加快,建筑能耗總量不斷上升,建筑成為第三“能耗大戶”[1],因此建筑節(jié)能對城市的可持續(xù)發(fā)展尤為關鍵.建筑能耗模擬可用于評價 節(jié)能技術措施[2].城市尺度的建筑群能耗模擬是國 際城市能源研究領域的一個新興方向,可以更好地 評估新區(qū)能源規(guī)劃和舊區(qū)節(jié)能改造等技術方案,從而推動節(jié)能減排目標的實施.由于缺乏每棟建筑的詳細數(shù)據(jù),在城市建筑群能耗模擬中,圍護結(jié)構(gòu)和空調(diào)系統(tǒng)等參數(shù)一般根據(jù)典型建筑進行假定,而建筑類型及建造年代是典型建筑參考的主要依據(jù)[3].
目前獲取數(shù)據(jù)最直接的方法是利用政府機構(gòu)公開的數(shù)據(jù)平臺,絕大部分的研究中都采用這種方式.歐美一些大城市的數(shù)據(jù)平臺存儲了大量城市建筑信 息,如建筑輪廓、樓層數(shù)、建筑類型和建造年代等數(shù)據(jù)[4-5],可用于建筑群能耗模擬.公開數(shù)據(jù)平臺節(jié)省了大量收集數(shù)據(jù)的時間,但受限于特定的城市.另一種直接的方法是實地調(diào)研[6].當調(diào)研的范圍擴大至城市級別,是極其耗時耗力的.
當較難獲取直接的數(shù)據(jù)時,可運用相關的數(shù)據(jù) 來間接推斷建筑類型及年代.對于建筑分類,首先可以利用多種數(shù)據(jù)進行識別.Wang等人[7]使用建筑輪 廓和城市電子地圖信息點(POI)數(shù)據(jù),運用邏輯回歸的監(jiān)督學習算法識別出南京市2 275 棟商業(yè)建筑.Niu等人[8]使用微信定位數(shù)據(jù)、出租車 GPS 軌跡及POI等數(shù)據(jù),運用空間聚類算法推斷廣州天河區(qū)各建 筑功能.Deng等人[9]提出了基于POI和區(qū)域邊界輪 廓等地理信息系統(tǒng)(GIS)數(shù)據(jù),運用分類和無監(jiān)督學 習聚類的方法,識別出長沙市區(qū)68966個建筑輪廓中69%的建筑類型.對于未識別的21538個建筑輪 廓,其大部分為老舊住宅建筑,只含建筑輪廓面積和樓層數(shù)等幾何信息.僅已知建筑幾何信息時,Hecht等人[10]基于建筑輪廓數(shù)據(jù)的幾何特征,運用隨機森 林的監(jiān)督學習算法,主要將住宅建筑分為11種類型,非住宅建筑分為工業(yè)和商業(yè)建筑.Lu等人[11]基于建筑輪廓的面積、周長和高度,周邊80m 內(nèi)其他建 筑信息和周邊道路、停車場、植被的信息,運用決策樹和隨機森林等四種監(jiān)督學習算法,將建筑分為單 戶住宅、多戶住宅和非住宅建筑,四種算法中準確率最高為76.1%.
對于建造年代,Biljecki等人[12]基于3D建筑模型(CityGML)的建筑類型、高度、鄰近建筑數(shù)量及體積等9種屬性,運用隨機森林的監(jiān)督學習算法推測建 筑年代.Tooke等[13]和Rosser等[14]均基于遙感數(shù)據(jù)的建筑輪廓面積、周長、屋頂傾斜度及體積等二維和三 維屬性,運用隨機森林算法分別推測3282棟和2 553棟住宅的建筑年代.監(jiān)督學習需要大量已知的樣本 進行訓練,更適用于城市內(nèi)的街區(qū)尺度.Zirak等[15]根據(jù)建筑年代普查數(shù)據(jù)隨建筑類型和供熱面積的分布,指定對應建筑的年代.Schwanebeck等[16]根據(jù)土 地普查數(shù)據(jù)獲取住宅地塊內(nèi)的建筑年代.然而這些 普查數(shù)據(jù)有時較難獲得.Li等[17]和Zeppelzauer等[18]運用卷積神經(jīng)網(wǎng)絡的深度學習算法提取街景圖像特 征,對不同時期的特征進行分類從而推斷獨戶住宅的年代.近些年來,遙感影像(航空等影像)被廣泛用于提取建筑物信息[19].Deng等人[9]通過人工對比歷 史衛(wèi)星影像數(shù)據(jù),獲取 243棟建筑年代信息.相比于街景圖像受限于地理位置,航空影像成圖范圍小,衛(wèi) 星影像對整個城市具有更全面的覆蓋,因此歷史影 像的自動對比對于大規(guī)模運用是省時省力的.
綜上所述,一種基于有限和公開數(shù)據(jù)來識別建 筑類型和年代的方法將具有更好的適用性.本文基于長沙市區(qū)未識別的21538個建筑輪廓的幾何特 征,運用監(jiān)督式分類學習算法識別建筑類型.本文同時利用基于深度學習的圖像識別算法,自動提取歷 史衛(wèi)星影像的建筑輪廓,檢測建筑物變化,用于推斷 長沙市區(qū)大量建筑的建造年代.
1研究方法
1.1基本信息
本文的研究區(qū)域為長沙市.在建筑類型識別方面,先前的研究通過城市地圖信息點 POI和區(qū)域邊界輪廓數(shù)據(jù)已成功識別出長沙市區(qū)68966個建筑輪 廓中69%的建筑類型.圖1展示了21538個沒有POI和區(qū)域邊界輪廓數(shù)據(jù)的建筑輪廓在長沙市五區(qū)的分布及示例,數(shù)據(jù)來源于2017年.其中18933個建筑 輪廓包含地上樓層數(shù)信息,6 層及以下建筑占比為91%.衛(wèi)星影像是指衛(wèi)星拍攝的真實地理面貌,可用來檢測地面上建筑、道路等信息.通過歷史衛(wèi)星影像的對比,可觀測地理信息的變化.目前谷歌地球免費 支持查看和下載高精度的歷史影像,因此根據(jù)時間 軸獲取長沙市五區(qū)2005—2014年的影像數(shù)據(jù).
1.2 建筑類型分類
圖2所示為建筑類型分類的流程圖.第一步是 通過分析建筑輪廓和樓層數(shù)據(jù)來獲取每棟建筑的特征參數(shù),包括地上樓層數(shù)、輪廓面積、輪廓周長、近似 矩形短邊寬度、近似矩形長寬比、近似矩形系數(shù).首 先,地上樓層數(shù)的信息大部分來自GIS數(shù)據(jù)庫,對于2605個缺少樓層信息的建筑,利用百度街景手動補 全.然后,利用地理信息系統(tǒng)軟件 QGIS 計算獲得每個建筑輪廓的面積和周長.建筑輪廓的形狀與建筑類型有較大關系,但是建筑輪廓的信息很難直接使用輪廓的坐標點進行分析,因此需要引入其他參數(shù)來反映輪廓的形狀特點,如住宅建筑大多為長條形.本文就此提出了近似矩形的概念,當對輪廓進行旋 轉(zhuǎn)操作后,每個旋轉(zhuǎn)角度都對應一個矩形框包圍輪 廓各邊界點.選取面積最小的矩形框作為輪廓的近 似矩形,如圖2所示.輪廓面積與最小矩形面積的比值定義為近似矩形系數(shù),系數(shù)越接近1,表示輪廓形 狀越近似于矩形.同時近似矩形的長寬比和短邊寬度也能描述形狀特征,因此增加了近似矩形短邊寬度、近似矩形長寬比和近似矩形系數(shù)3個特征參數(shù).
第二步是根據(jù)百度街景對3036個建筑輪廓的實際建筑類型進行標記.通過衛(wèi)星圖發(fā)現(xiàn)建筑輪廓中絕大部分為老舊住宅建筑,由于當時沒有小區(qū)邊 界的概念而未被識別.其他類型的建筑由于數(shù)量較 少,進一步細分后將沒有足夠的數(shù)據(jù)進行監(jiān)督學習 訓練,因此本文將建筑輪廓的類型分為低層住宅、公寓式住宅和其他類型.標記得到低層住宅845個,公寓式住宅1547個,其他類型644個.圖3所示為各類建筑輪廓的特征參數(shù)分布.從圖3可看出低層住宅和公寓式住宅具有不同的特點,如絕大部分低層住宅的輪廓面積、輪廓周長小于公寓式住宅,低層住宅地上樓層數(shù)的中位數(shù)為2,而公寓式住宅地上樓層數(shù)的中位數(shù)為6.后續(xù)的隨機森林分類模型學習分析各類特征參數(shù)的特點,從而識別出不同類型.
本文采用了隨機森林的分類模型,將6個參數(shù)作為模型輸入,建筑類型作為模型輸出.隨機森林是一個包含多個決策樹的分類器,決策樹是機器學習中一種常用的分類方法,基于if-then-else 規(guī)則,根據(jù) 待分類項中相應的特征屬性值判斷進入相應的分支,直至到達葉子節(jié)點,得到分類結(jié)果,從而形成一個樹狀結(jié)構(gòu).隨機森林是用隨機的方式生成多個互 不關聯(lián)的決策樹,各自獨立地學習和預測,最后統(tǒng)計多個決策樹投票結(jié)果來決定最終結(jié)果,因此優(yōu)于任 何一個單分類器的分類結(jié)果.本文決策樹的數(shù)量取 值為100,最大深度為10.之后采用k 折交叉驗證法,評估訓練后模型的性能,避免模型出現(xiàn)過擬合.k 折 交叉驗證是指將數(shù)據(jù)集等比例劃分成k份,以其中的1份作為測試數(shù)據(jù),其他的k-1份數(shù)據(jù)作為訓練數(shù)據(jù),隨機重復驗證k次,k 通常取10.最后將訓練完成的模型用于18 502個建筑輪廓的分類.
1.3 建造識別
由于衛(wèi)星影像是可見光成像,極易受氣候條件 影響,存在云層遮擋和光線不同等問題,因此篩選出高質(zhì)量成像且光影效果較為接近的影像,分別是 2005年、2008年、2012年和2014年,地面分辨率為0.53m,圖像格式為tiff 格式.圖4所示為建筑建造年代識別示意圖.兩個不同年代的衛(wèi)星影像作為輸入,通過卷積神經(jīng)網(wǎng)絡方法實現(xiàn)圖像分割,分別識別和生成建筑物輪廓矢量數(shù)據(jù).由于每次衛(wèi)星拍攝影像時角度不同,導致不同的影像中建筑物存在一定的偏移,因此利用QGIS的相交分析工具,考慮兩建筑相交重疊部分超過50%,判斷為同一建筑,然后檢測 出變化的建筑,從而確定它們的建造年代為2013—2014年.
卷積神經(jīng)網(wǎng)絡(CNN)是一種包含卷積計算且具有深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡,屬于深度學習的范疇,在圖像識別中得到廣泛應用.相比于傳統(tǒng)的神經(jīng)網(wǎng)絡需要讀取 整幅圖像,CNN能夠有效地將大數(shù)據(jù)量的圖像降維成小數(shù)據(jù)量,且同時保留圖片特征.典型的CNN 由卷積 層、池化層和全連接層3個部分構(gòu)成.卷積層通過卷積 核(過濾器)的過濾提取出圖片中局部的特征;池化層用于繼續(xù)降低數(shù)據(jù)維度,可大大減少運算量;全連接層與傳統(tǒng)神經(jīng)網(wǎng)絡結(jié)構(gòu)類似,用來輸出結(jié)果.目前CNN有FCN、U-Net等多種代表算法用于圖像語義分割,Mask R-CNN算法用于實例分割.語義分割是指為圖像中的每個像素打上類別標簽,而實例分割是目標檢測和語 義分割的結(jié)合,能區(qū)分同類中的不同實例.影像中識別出建筑物并提取輪廓,屬于實例分割的范圍,因此本文選取 Mask R-CNN算法.
Mask R-CNN算法屬于監(jiān)督學習,需要用標記的樣本對模型進行訓練,我們選取了2014年影像中的一個區(qū)域,運用已有的1602個建筑輪廓矢量數(shù)據(jù)作為標記數(shù)據(jù),包含多種不同形狀,但不包括建筑的陰 影,如圖5所示.由于衛(wèi)星在拍攝影像時存在一定的傾斜角度,導致 GIS數(shù)據(jù)與影像存在偏差,如圖6(a)所示,神經(jīng)網(wǎng)絡對這種類型的噪聲較為敏感,為了提高標記數(shù)據(jù)的質(zhì)量,對建筑輪廓進行了相應的平移調(diào)整,如圖6(b)所示.然后將影像通過滑動窗口切 片成256×256像素尺寸,并且考慮切片邊緣的重疊,再使用旋轉(zhuǎn)、縮放、平移等數(shù)據(jù)增強方法來增加有限的數(shù)量集,確保模型的識別精度和泛化能力,獲得2145個地圖瓦 片圖片 作為數(shù)據(jù) 集.之 后 選用Python和PyTorch 深度學習框架對模型進行訓練和調(diào)參.數(shù)據(jù)集按9∶1劃分為訓練集和驗證集,模型的骨干網(wǎng)絡(backbone)選取 ResNet50,訓練輪數(shù)(ep-ochs)選取 20,并且在學習曲線中自動提取最佳學習率.最后基于訓練好的模型輸入不同年代的影像進行預測生成相應的建筑輪廓.
2結(jié)果分析
2.1建筑分類結(jié)果
隨機森林模型中采用C4.5算法,以信息增益率為準則選擇屬性.圖7展示了各特征參數(shù)重要度,可見樓層數(shù)對建筑分類最為重要,其次是近似矩形短 邊寬度,輪廓周長的影響最小.采用混淆矩陣對各個類型的識別效果進行評估,如表1所示,其中對角線 上的值表示正確分類的樣本.10折交叉驗證后結(jié)果顯示,整體準確率為81.7%,與文獻[11]中用面積、周 長等基本屬性分類得到的76.1% 準確率相比,該方法得到了有效提升.準確率表示預測正確的結(jié)果占總樣本的百分比.除了準確率外,還采用精確率和召回率評估不同類型的識別效果.精確率表示所有被 預測為某類的樣本中實際為該類樣本的概率,召回率表示實際為該類樣本中被預測正確的概率.由表1可看出,低層和公寓式住宅召回率都在98%左右,表示可以很好地被推斷正確.但低層和公寓式住宅精確率在80%左右,是由于其他類型中包含零售商店和飯店等類型,在幾何特征上與低層住宅相似,其 他類型中包含學校和行政樓等類型,在幾何特征上與公寓式住宅相似,因此它們中有一部分被錯誤地 推斷為其他類型.
將訓練好的模型用于預測剩下的18 502 棟建 筑類型,結(jié)果見表2.數(shù)量最多的為低層住宅,共有10428 棟,以1~3層為主,較為密集地分布在區(qū)域 內(nèi).公寓式住宅共有5686棟,以5~6層為主,住宅群分布較為均勻.其他類型共有2388 棟,分布較為分散.
2.2 建造年代識別結(jié)果
Mask R-CNN模型一般選用平均精確度(aver-age precision)作為評價指標,平均精確度是對精確率-召回率曲線上的精確率求均值.結(jié)果顯示平均精確度為80%,對于相互有間隔的建筑能較好地識別,而對密集分布的低層建筑識別較弱.本文選取長沙市中心范圍為4.17 km×4.33km的區(qū)域作為研究區(qū)域,將訓練完成的模型應用于該區(qū)域進行建筑物識別和提取.圖8 展示了2014年、2012年、2008年和2005年四個年代的示例.從圖8可以明顯看出每棟 建筑隨不同年代的變化.
根據(jù)已有的2017年建筑矢量數(shù)據(jù),依次與各個年代提取的建筑輪廓進行交集計算,將建造年代分為2015—2017年、2013—2014年、2009—2012年、2005—2008年、2005年之前等五個階段,結(jié)果如表3所示.在7900個建筑輪廓中,5077 棟(64%)建筑的建造年代在2005年之前,符合中心城區(qū)早期開發(fā)建設的情況.
3結(jié)論
本文提出了基于GIS和歷史衛(wèi)星影像數(shù)據(jù)識別城市建筑類型和建造年代的方法.運用隨機森林的監(jiān)督學習方法,將建筑類型分為低層住宅、公寓式住宅和其他類型.利用卷積神經(jīng)網(wǎng)絡的深度學習方法 進行歷史衛(wèi)星影像識別,成功提取各個年代建筑輪 廓,然后相交分析推斷出建筑年代.主要結(jié)論如下:
1)建筑類型識別方面,針對長沙市區(qū)21538個建筑輪廓(不含 POI和區(qū)域邊界輪廓信息),提出近 似矩形的概念,新增近似矩形短邊寬度、近似矩形長寬比、近似矩形系數(shù)作為特征參數(shù)反映輪廓形狀特 征.分析顯示,樓層數(shù)和近似矩形短邊寬度是影響分類最為重要的兩個特征參數(shù).訓練結(jié)果顯示,分類模型的整體準確率為81.7%.在用于預測的18 502個建 筑輪廓中,成功識別出10428 棟低層住宅、5686 棟公寓式住宅.
2)建造年代識別方面,訓練結(jié)果顯示,建筑輪廓 提取模型的平均精確度為80%.將其應用于長沙市中心區(qū)域 7900個建筑輪廓,交集計算推斷出 5077個建筑的建造年代為2005年之前,1606個建筑的建 造年代為2005—2014年,1217個建筑的建造年代為2015—2017年.
參考文獻
[1]李念平,韓陽麗,何穎東,等.長沙地區(qū)混合通風住宅老年人空調(diào)使用行為[J].湖南大學學報(自然科學版),2020,47(11):141-148.
LI N P,HAN Y L,HE Y D,et al.Air-conditioning use behaviors of elderly in mixed-mode residential buildings in Changsha[J].Journal of Hunan University(Natural Sciences),2020,47(11):141-148.(In Chinese)
[2]陳淑琴,鄔佳婧,葛堅,等.辦公建筑空調(diào)隨機使用行為模擬方法及案例應用[J].湖南大學學報(自然科學版),2021,48(5):157-164.
CHEN S Q,WU J J,GE J,et al.Simulation method and case study of stochastic usage behavior of air conditioners in office buildings[J].Journal of Hunan University(Natural Sciences),2021,48(5):157-164.(In Chinese)
[3]冷紅,宋世一.城市尺度建筑節(jié)能規(guī)劃的國際經(jīng)驗及啟示[J].國際城市規(guī)劃,2020,35(3):103-112.
LENG H,SONG S Y.Building energy efficiency planning at urban scale:international experience and inspiration[J].Urban Plan-ning International,2020,35(3):103-112.(In Chinese)
[4]CHEN Y X,HONG T Z,LUO X,et al.Development of city build-ings dataset for urban building energy modeling[J].Energy and Buildings,2019,183:252-265.
[5]MONTEIRO C S,COSTA C,PINA A,et al.An urban building da-tabase(UBD)supporting a smart city information system[J].En-ergy and Buildings,2018,158:244-260.
[6]李信儀.居住建筑區(qū)域能耗模型研究[D].重慶:重慶大學,2018.
LI X Y.A study about residential building stock energy modelling[D].Chongqing:Chongqing University,2018.(In Chinese)
[7]WANG C,WU Y,SHI X,et al.Dynamic occupant density models
of commercial buildings for urban energy simulation[J].Buildingand Environment,2020,169:106549.
[8]NIU N,LIU X P,JIN H,et al.Integrating multi-source big data to
infer building functions[J].International Journal of Geographical Information Science,2017,31(9):1871-1890.
[9]DENG Z,CHEN Y X,PAN X,et al.Integrating GIS-based point
of interest and community boundary datasets for urban building en-ergy modeling[J].Energies,2021,14(4):1049.
[10]HECHT R,MEINEL G,BUCHROITHNER M.Automatic identifi-cation of building types based on topographic databases—a com-parison of different data sources[J].International Journal of Car-tography,2015,1(1):18-31.
[11]LU Z Y,IM J,RHEE J,et al.Building type classification using
spatial and landscape attributes derived from LiDAR remote sens-ing data[J].Landscape and Urban Planning,2014,130:134-148.
[12]BILJECKI F,SINDRAM M.Estimating building age with3D GIS
[J].ISPRS Annals of the Photogrammetry,Remote Sensing and Spatial Information Sciences,2017,IV-4/W5:17-24.
[13]TOOKE T R,COOPS N C,WEBSTER J.Predicting building ages
from LiDAR data with random forests for building energy modeling[J].Energy and Buildings,2014,68:603-610.
[14]ROSSER J F,BOYD D S,LONG G,et al.Predicting residential
building age from map data[J].Computers,Environment and Ur-ban Systems,2019,73:56-67.
[15]ZIRAK M,WEILER V,HEIN M,et al.Urban models enrichment
for energy applications:challenges in energy simulation using dif-ferent data sources for building age information[J].Energy,2020,190:116292.
[16]SCHWANEBECK M,KR?GER M,DUTTMANN R.ImprovingGIS-based heat demand modelling and mapping for residential buildings with census data sets at regional and sub-regional scales[J].Energies,2021,14(4):1029.
[17]LI Y,CHEN Y Q,RAJABIFARD A,et al.Estimating building age
from google street view images using deep learning[C]//Proceed-ings of the10th International Conference on Geographic Informa-tion Science.Melbourne:Leibniz International Proceedings in In-formatics,2018:1-7.
[18]ZEPPELZAUER M,DESPOTOVIC M,SAKEENA M,et al.Auto-matic prediction of building age from photographs [C]//Proceed-ings of the 2018 ACM on International Conference on Multimedia Retrieval.New York:ACM,2018:126-134.
[19]陳仁朋,吳熠文,余加勇,等.基于無人機影像序列的城市精細化三維模型精度評估[J].湖南大學學報(自然科學版),2019,46(11):172-180.
CHEN R P,WU Y W,YU J Y,et al.Method accuracy evaluations of building urban detailed3D model based on the unmanned aerial vehicle image sequences and its accuracy evaluatios[J].Journal of Hunan University(Natural Sciences),2019,46(11):172-180.(In Chinese)