王美玲,張和生*
(1.太原理工大學(xué),山西 太原 030024)
目前夜間燈光數(shù)據(jù)在人口空間化方面的應(yīng)用十分廣泛[1-3]。最早的夜間燈光影像是由美國(guó)國(guó)防氣象衛(wèi)星(DMSP)搭載的線性掃描業(yè)務(wù)系統(tǒng)(OLS)提供的。通過(guò)研究發(fā)現(xiàn),人口密度與燈光強(qiáng)度顯著相關(guān),因此DMSP/OLS數(shù)據(jù)具有刻畫人口空間分布的潛力[4]。 隨著對(duì)D M S P/O L S數(shù)據(jù)研究的深入,學(xué)者發(fā)現(xiàn)DMSP/OLS數(shù)據(jù)在城市中心存在大面積的輻射飽和區(qū)域,這些飽和區(qū)域無(wú)法體現(xiàn)城市中心區(qū)人口分布的差異[5]。雖然有學(xué)者提出利用植被指數(shù)修正DMSP/OLS數(shù)據(jù)增加城鎮(zhèn)用地內(nèi)部人口分布的差異性,并通過(guò)城鄉(xiāng)分區(qū)建模來(lái)提高空間化結(jié)果的精度,但由于DMSP/OLS數(shù)據(jù)本身精度不高,因此限制了人口空間化結(jié)果的精度[6]。同時(shí),美國(guó)國(guó)家地球物理數(shù)據(jù)中心僅提供了1992-2013年的DMSP/OLS數(shù)據(jù),不能用于近些年人口空間分布的研究。
2011年美國(guó)新一代極軌運(yùn)行環(huán)境衛(wèi)星系統(tǒng)預(yù)備項(xiàng)目衛(wèi)星(NPP)搭載的航天器可見(jiàn)紅外成像輻射計(jì)套件(VIIRS)拍攝的夜間燈光數(shù)據(jù)彌補(bǔ)了2013年后夜間燈光數(shù)據(jù)的空缺,且NPP/VIIRS數(shù)據(jù)分辨率較高,也不存在燈光飽和現(xiàn)象。利用多源數(shù)據(jù)建立回歸模型發(fā)現(xiàn),NPP/VIIRS和DMSP/OLS均可用于人口空間化分析,且基于前者反演的人口空間化結(jié)果精度較高[7]。隨著研究尺度的不斷縮小,受城市內(nèi)部公共服務(wù)設(shè)施的影響,夜間燈光亮度值與人口值的相關(guān)性有所降低。為了進(jìn)一步提高小尺度人口空間化的精度,胡云鋒[8]等提出了利用夜間燈光數(shù)據(jù)和土地利用數(shù)據(jù)構(gòu)建逐步回歸模型的方法。王珂靖[9]等將NPP/VIIRS夜間燈光數(shù)據(jù)與商業(yè)、居住區(qū)空間分布相結(jié)合,利用空間回歸模型得到了精細(xì)空間尺度的常住人口分布結(jié)果。隨著機(jī)器學(xué)習(xí)算法的不斷成熟,出現(xiàn)了利用機(jī)器學(xué)習(xí)算法對(duì)人口數(shù)據(jù)進(jìn)行空間化的研究。此外,譚敏[10]等基于隨機(jī)森林模型,利用夜間燈光數(shù)據(jù)、道路網(wǎng)絡(luò)數(shù)據(jù)、水域分布數(shù)據(jù)等空間變量得到了珠江三角洲30 m格網(wǎng)的人口空間化結(jié)果。
地理空間模型在線性回歸的基礎(chǔ)上加入了空間要素,雖然結(jié)果的精度較高,但模型結(jié)構(gòu)復(fù)雜、模型精度很大程度上受數(shù)據(jù)的空間分布影響;基于機(jī)器學(xué)習(xí)算法的人口空間化方法,雖然對(duì)數(shù)據(jù)結(jié)構(gòu)要求低,但樣本的選擇對(duì)模型精度影響較大,同時(shí)自變量與因變量之間的數(shù)量關(guān)系模糊,無(wú)法明確各變量對(duì)人口分布的影響;而逐步回歸模型的模型簡(jiǎn)單,能明確因變量與自變量之間的關(guān)系,且可通過(guò)分區(qū)進(jìn)一步提高人口數(shù)據(jù)空間化結(jié)果精度,還可對(duì)各分區(qū)進(jìn)行深入的精度分析,是在人口空間化研究中使用較多的方法??偟膩?lái)說(shuō),利用夜間燈光數(shù)據(jù)和土地利用數(shù)據(jù)分區(qū)構(gòu)建逐步回歸模型,是適用于不同尺度的人口數(shù)據(jù)空間化的典型方法。
長(zhǎng)期以來(lái),國(guó)內(nèi)研究采用的夜間燈光數(shù)據(jù)均來(lái)自國(guó)外。為了擁有屬于自己的夜間燈光數(shù)據(jù),武漢大學(xué)發(fā)射了全球首顆專業(yè)夜光遙感衛(wèi)星——珞珈一號(hào),也是目前國(guó)際上第三顆具備夜間燈光數(shù)據(jù)拍攝能力的衛(wèi)星,具有重要的歷史意義和研究?jī)r(jià)值[11]。與其他夜間燈光影像相比,珞珈一號(hào)夜間燈光影像的分辨率顯著提高,具有明顯的城市結(jié)構(gòu)分布,能清晰地區(qū)分城市范圍、道路以及大面積房屋[12]。雖然鐘亮[13]等發(fā)現(xiàn)珞珈一號(hào)數(shù)據(jù)與人口數(shù)據(jù)的相關(guān)性較高,但缺乏利用珞珈一號(hào)數(shù)據(jù)的人口空間化研究。
北京市是我國(guó)政治、文化中心,經(jīng)濟(jì)發(fā)達(dá),城市發(fā)展迅速,人口基數(shù)大;同時(shí)外來(lái)人口不斷涌入城市,給城市資源、環(huán)境管理造成巨大壓力,因此了解北京市的人口空間分布對(duì)北京的城市規(guī)劃和綜合管理具有重要的參考意義。
綜上所述,本文以北京市為研究區(qū),將珞珈一號(hào)和NPP/VIIRS數(shù)據(jù)分別與土地利用數(shù)據(jù)相結(jié)合,分區(qū)構(gòu)建漸進(jìn)回歸模型,以實(shí)現(xiàn)北京市人口的100 m格網(wǎng)空間化,并對(duì)人口空間化結(jié)果進(jìn)行了精度評(píng)價(jià),旨在通過(guò)對(duì)比兩種夜間燈光數(shù)據(jù)人口空間化的結(jié)果來(lái)說(shuō)明珞珈一號(hào)數(shù)據(jù)在人口空間化方面的應(yīng)用價(jià)值和潛力。
本文選取北京市作為研究區(qū),總面積為1.641萬(wàn) km2;人口眾多,2017年常住人口高達(dá)2 170.7萬(wàn)人,是我國(guó)人口高度集聚的三大城市之一。北京市的西部和北部地區(qū)多山地丘陵,地形起伏較大,人口較少、分布相對(duì)集中;東南部地勢(shì)平坦,居住著全市絕大多數(shù)的人口,占總?cè)丝诘?1%,科技產(chǎn)業(yè)園區(qū)、高等教育和科研機(jī)構(gòu)、商業(yè)中心、行政中心,文化中心均分布于此,是人口分布高度集中的區(qū)域。根據(jù)北京市鄉(xiāng)鎮(zhèn)(街道)行政區(qū)劃,全市分為325個(gè)行政區(qū)。本文將各鄉(xiāng)鎮(zhèn)(街道)的WorldPop人口數(shù)據(jù)總值作為行政區(qū)人口統(tǒng)計(jì)數(shù)據(jù),再利用行政區(qū)統(tǒng)計(jì)人口和面積得到人口密度(最大可達(dá)3.3萬(wàn)人/km2)。根據(jù)人口密度,本文分別以0.2 萬(wàn)人/km2、0.56 萬(wàn)人/km2和1.53 萬(wàn)人/km2為界,將行政區(qū)劃分為4個(gè)分區(qū),如圖1所示。
圖1 人口密度分區(qū)圖
珞珈一號(hào)01星由武漢大學(xué)于2018年6月2日發(fā)射,是珞珈一號(hào)科學(xué)實(shí)驗(yàn)衛(wèi)星系列中的第一顆衛(wèi)星。珞珈一號(hào)01星配備高靈敏度的夜光攝像機(jī),光譜帶寬為0.319 μm,可獲得高精度夜間燈光圖像,夜間動(dòng)態(tài)范圍可達(dá)14位,空間分辨率為130 m,幅寬為250 km,約15 d完成全球夜光遙感。珞珈一號(hào)夜間燈光數(shù)據(jù)可在湖北省數(shù)據(jù)與應(yīng)用中心高分辨率地球觀測(cè)系統(tǒng)中免費(fèi)下載。由于珞珈一號(hào)衛(wèi)星圖像的輻射校準(zhǔn)仍在改進(jìn)中,本文利用圖像灰度值(DN值)進(jìn)行分析,采用2018年9月數(shù)據(jù),分辨率為120 m。另外,由于原始數(shù)據(jù)為GEC系統(tǒng)幾何糾正產(chǎn)品,因此還需對(duì)珞珈一號(hào)夜間燈光數(shù)據(jù)進(jìn)行地理配準(zhǔn)。
NPP/VIIRS夜間燈光數(shù)據(jù)采用2018年9月數(shù)據(jù),分辨率為450 m。WorldPop人口數(shù)據(jù)來(lái)源于WorldPop Project 官方網(wǎng)站,空間分辨率約為90 m。2017年北京市土地利用數(shù)據(jù)來(lái)源于地理國(guó)情云平臺(tái),分辨率為100 m,并將原始數(shù)據(jù)重分類為耕地、林地、草地、水域、城鎮(zhèn)用地、農(nóng)村居民地、其他建設(shè)用地和未利用地8類。
本文采用的矢量數(shù)據(jù)和柵格數(shù)據(jù)坐標(biāo)統(tǒng)一為WGS84地理坐標(biāo)系,并將其投影為墨卡托UTM投影,除土地利用外的其他柵格數(shù)據(jù)采用雙線性法重采樣為100 m。
根據(jù)“無(wú)土地?zé)o人口”的原則,回歸方程的常數(shù)為0,模型公式為:
式中,Pi為第i個(gè)行政區(qū)的人口;N為土地利用類型數(shù)量;NLij為第i個(gè)行政區(qū)第j種土地利用類型下的燈光輻射總量;NAij為第i個(gè)行政區(qū)第j種土地利用類型下的燈光輻射面積;aj、bj為回歸系數(shù)。
本文利用SPSS軟件分區(qū)構(gòu)建漸進(jìn)回歸模型,以行政區(qū)內(nèi)人口統(tǒng)計(jì)數(shù)據(jù)為因變量,以統(tǒng)計(jì)行政區(qū)內(nèi)每種土地利用類型下的燈光輻射總量和燈光輻射面積為回歸模型的自變量,自變量進(jìn)入方程的方式為步進(jìn),置信水平為0.05,剔除的置信水平為0.1。雖然模型會(huì)剔除不顯著相關(guān)的自變量,但還存在某些自變量系數(shù)為負(fù)的情況,這些系數(shù)會(huì)使人口的估計(jì)值出現(xiàn)負(fù)數(shù)。為保證最終進(jìn)入模型的自變量系數(shù)全為正,本文在第一次構(gòu)建模型的基礎(chǔ)上,將系數(shù)為負(fù)的自變量直接剔除,再對(duì)剩余的自變量進(jìn)行第二次建模。
對(duì)比不同模型下相同格網(wǎng)的人口空間化結(jié)果時(shí),一般采用決定系數(shù)(R2)、平均絕對(duì)誤差(MAE)和 平均相對(duì)誤差(MRE)3個(gè)指標(biāo)。R2用來(lái)評(píng)價(jià)模型的擬合程度,數(shù)值在0~1之間,越接近1,模型的擬合程度越高;MAE和MRE分別用來(lái)評(píng)價(jià)模型在整體和各分區(qū)的精度,數(shù)值越低,模型精度越高。其計(jì)算 公式為:
式中,POPi為第i個(gè)行政區(qū)的統(tǒng)計(jì)人口數(shù);POPi'為 第i個(gè)行政區(qū)的人口估計(jì)值;POP為區(qū)域內(nèi)所有行政區(qū)統(tǒng)計(jì)人口的平均值;POP'為區(qū)域內(nèi)所有行政區(qū)估計(jì)人口的平均值;A為統(tǒng)計(jì)范圍內(nèi)行政區(qū)總數(shù)。
由于各區(qū)人口的回歸值和統(tǒng)計(jì)值存在誤差,本文通過(guò)式(5)對(duì)各柵格人口的初步估計(jì)值進(jìn)行修正。
式中,P'ik為第i個(gè)行政區(qū)第k個(gè)柵格的人口修正值;Pik為第i個(gè)行政區(qū)第k個(gè)柵格的人口估計(jì)值。
兩種數(shù)據(jù)人口空間化結(jié)果在主城區(qū)的展示如圖2 所示,可以看出,NPP/VIIRS數(shù)據(jù)的人口空間化結(jié)果單元柵格內(nèi)人口分布的最大值為623,遠(yuǎn)小于WorldPop數(shù)據(jù)的最大值1 380;而珞珈一號(hào)數(shù)據(jù)結(jié)果的最大值為1 432,與WorldPop數(shù)據(jù)的最大值更接近,這是由于VIIRS傳感器對(duì)高輻射的探測(cè)能力有限,使得探測(cè)到的燈光最大值低于實(shí)際值,進(jìn)而導(dǎo)致人口空間化結(jié)果的最大值過(guò)低,而珞珈一號(hào)提高了探測(cè)能力,能如實(shí)記錄燈光的高亮值,空間化結(jié)果的最大值也更接近實(shí)際值。從局部來(lái)看,NPP/VIIRS數(shù)據(jù)人口空間化結(jié)果的行政區(qū)范圍內(nèi)部平滑、差異性小,而在行政區(qū)邊界變化突兀;珞珈一號(hào)數(shù)據(jù)結(jié)果能明顯看出人口分布與街道分布的空間耦合,清晰反映行政區(qū)內(nèi)人口分布的差異性,且在行政區(qū)邊界處銜接良好。
圖2 NPP/VIIRS和珞珈一號(hào)人口空間分布圖
由人口空間化結(jié)果可知,北京市人口主要分布在城區(qū),受城市規(guī)劃等影響,人口密度并非越靠近城市核心區(qū)越大,而是在核心區(qū)周圍呈多點(diǎn)集中分布。這些地區(qū)人口密度大、通勤人口多、人口流動(dòng)大,對(duì)交通和基礎(chǔ)設(shè)施具有巨大需求,因此未來(lái)要考慮通過(guò)改善交通將北京市人口疏解到更外層地區(qū)的方式來(lái)緩解人口增長(zhǎng)帶來(lái)的巨大壓力。
利用SPSS軟件構(gòu)建漸進(jìn)回歸模型得到人口空間化參數(shù),如表1所示,可以看出,利用NPP/VIIRS和珞珈一號(hào)數(shù)據(jù)構(gòu)建的模型R2均較高,說(shuō)明在街道尺度夜間燈光數(shù)據(jù)與人口分布有明顯的相關(guān)關(guān)系;且人口密度越大的分區(qū),R2越大,人口密度越小的分區(qū),R2越小,說(shuō)明夜間燈光數(shù)據(jù)與人口分布的相關(guān)程度隨人口密度變化而變化,人口密度越大,相關(guān)程度越高,反之,相關(guān)程度越小。對(duì)比兩種夜間燈光數(shù)據(jù)發(fā)現(xiàn),各分區(qū)珞珈一號(hào)數(shù)據(jù)的R2均大于NPP/VIIRS數(shù)據(jù),說(shuō)明珞珈一號(hào)數(shù)據(jù)與人口分布具有更緊密的相關(guān)關(guān)系。
表1 漸進(jìn)回歸模型的人口空間化參數(shù)
從精度上來(lái)看,與NPP/VIIIRS數(shù)據(jù)相比,珞珈一號(hào)數(shù)據(jù)人口空間化結(jié)果的整體MAE和MRE更小,誤差更小、精度更高,說(shuō)明珞珈一號(hào)數(shù)據(jù)對(duì)人口的擬合程度更高,擬合效果更好。從各分區(qū)來(lái)看,人口密度越大的分區(qū),MRE越小,人口密度越小的分區(qū),MRE越大;而MAE在各分區(qū)的變化情況與MRE略有不同,MAE在分區(qū)一、分區(qū)二和分區(qū)三的變化與MRE相同,隨人口密度的增大而減小,但分區(qū)一的MAE小于其他分區(qū),這并不代表分區(qū)一的精度就高于其他區(qū)分區(qū)。其原因有兩個(gè):①分區(qū)一的行政區(qū)人口基數(shù)小,計(jì)算得到的MAE也不會(huì)太大;②分區(qū)一的行政區(qū)個(gè)數(shù)遠(yuǎn)多于其他分區(qū),雖然MAE較小,但絕對(duì)誤差總值更大。因此,在人口密度大的地區(qū),基于珞珈一號(hào)數(shù)據(jù)的人口空間化結(jié)果精度更高,對(duì)人口的擬合效果更好;而在人口密度小的地區(qū),基于珞珈一號(hào)數(shù)據(jù)的人口空間化結(jié)果精度較低,擬合效果較差。
本文分別基于珞珈一號(hào)夜間燈光數(shù)據(jù)和NPP/VIIRS數(shù)據(jù)分區(qū)構(gòu)建了漸進(jìn)回歸模型,進(jìn)而實(shí)現(xiàn)了人口空間化;并將空間化結(jié)果制圖,對(duì)比了兩種數(shù)據(jù)擬合人口的能力和精度。其主要結(jié)論為:①利用回歸公式計(jì)算得到人口初步估計(jì),再經(jīng)過(guò)公式修正得到基于 NPP/VIIRS和珞珈一號(hào)數(shù)據(jù)的北京市100 m空間分辨率的人口分布圖,其中基于珞珈一號(hào)數(shù)據(jù)得到的人口最大值為1 432,更接近WorldPop數(shù)據(jù)的最大值1 380,且其人口分布圖能清晰展示城市內(nèi)部人口空間分布的差異,分區(qū)邊界平滑自然,能更好地應(yīng)用于城市資源、環(huán)境管理中;②對(duì)比兩種夜間燈光數(shù)據(jù)和漸進(jìn)回歸模型對(duì)人口空間化的模型參數(shù)發(fā)現(xiàn), 珞珈一號(hào)數(shù)據(jù)的整體和各分區(qū)精度均優(yōu)于NPP/VIIRS數(shù) 據(jù),尤其是在人口密度小的區(qū)域的擬合程度明顯高于 NPP/VIIRS??偟膩?lái)講,珞珈一號(hào)夜間燈光數(shù)據(jù)更適合小尺度人口空間化研究。
本文在使用珞珈一號(hào)數(shù)據(jù)前并沒(méi)有進(jìn)行去噪處理,因此提出一種適用于人口空間化研究的去噪方法是新的研究方向。另外,利用珞珈一號(hào)數(shù)據(jù)進(jìn)行小尺度人口空間化研究時(shí)如何提高人口密度小的區(qū)域的精度還需進(jìn)一步深入研究。珞珈一號(hào)數(shù)據(jù)的時(shí)空分辨率明顯高于其他夜間燈光數(shù)據(jù),其在研究突發(fā)事件的影響范圍方面具有巨大的應(yīng)用潛力,可作為未來(lái)的研究方向。