陶思然,葉霞飛
(同濟大學,道路與交通工程教育部重點實驗室,上海201804)
隨著社會經(jīng)濟的快速發(fā)展,城市群正在成為快速帶動經(jīng)濟發(fā)展的增長極。在我國,以城市群為主體構(gòu)建大中小城市和小城鎮(zhèn)協(xié)調(diào)發(fā)展的城鎮(zhèn)格局將逐步形成,此過程將通過城市間的頻繁交流而實現(xiàn),大量的城際客運交通需求應(yīng)運而生。然而,作為城際客運出行需求預(yù)測的重要環(huán)節(jié),城際客運出行分布預(yù)測研究目前還不完善,一個較為突出的問題是,對可以將出發(fā)城市與到達城市關(guān)聯(lián)起來的因素考慮不足??梢越柚请H客運出行分布預(yù)測中較為常用的模型之一重力模型[1]對該問題進行說明。自1946年Zipf[2]發(fā)現(xiàn),城際客運量與兩個城市人口的乘積成正比,與兩個城市間的距離成反比后,這種規(guī)律隨著后續(xù)研究的開展,同時參考物理學重力模型,慢慢演變?yōu)榻袢盏闹亓δP?,即兩個城市之間的客流交換量與起點城市的出發(fā)量、終點城市的到達量成正比,與兩個城市間的出行阻抗成反比。出行阻抗一般由兩個城市間出行所花費的時間、金錢、所使用交通方式的舒適度等因素決定。可以看出,此時僅有城際廣義出行阻抗由出行的兩個端點共同決定,可以解釋為何一個城市能更多地與特定城市發(fā)生關(guān)聯(lián)。
但事實上,在四階段模型體系中,質(zhì)量項的研究在出行生成階段已完成,故可知在出行分布預(yù)測模型中,僅考慮出行阻抗這一個關(guān)聯(lián)性因素是不足的[3]。針對這種不足,陶思然等[4]從城際客運出行主要的出行目的出發(fā),抽象出一些主要的關(guān)聯(lián)性影響因素,例如政治關(guān)聯(lián)因素、母子公司關(guān)聯(lián)因素、產(chǎn)業(yè)關(guān)聯(lián)因素、生存關(guān)聯(lián)因素、旅游關(guān)聯(lián)因素等。
本文主要針對旅游關(guān)聯(lián)因素進行研究。假日旅游出行已有大量文獻進行研究,但隨著社會生產(chǎn)力的發(fā)展,自由職業(yè)者增多,年休假制度普及,交通設(shè)施日臻完善,平常的工作日及周末也會有數(shù)量可觀的旅游出行。例如,日本第5 次(2010年)全國干線旅游純流動調(diào)查將出行目的分為公務(wù)、旅游、私人、其他與不明這5 類。調(diào)查數(shù)據(jù)顯示,平常工作日有約2/5的OD對間城際旅游目的出行量占城際全目的總出行量的比例超過20%,平常周末城際旅游出行量占比更高。對于國內(nèi)而言,僅考慮長三角26市范圍內(nèi),南京市一個平常工作日城際到達量約43萬人次,而南京市5A和4A級景點同一日接待同范圍內(nèi)城際游客約13萬人次。盡管這13萬人次不一定都是當天出行,但由于長三角地區(qū)交通設(shè)施較為完善,彼此聯(lián)系也較為緊密,故當日出行者應(yīng)該占有一定的比重。由于這部分出行擁有獨特的關(guān)聯(lián)機制,在模型中體現(xiàn)兩個城市間因旅游而產(chǎn)生的關(guān)聯(lián)性就顯得非常重要,這種重要性可以通過下例進行說明:假設(shè)有A、B、C、D這4座城市,其中,A和B擁有旅游資源,C和D完全沒有旅游資源,則C城市與D 城市之間應(yīng)該不存在旅游客流交換量。然而,由于C、D 兩座城市與A、B 兩座城市之間將存在旅游客流交換量,即在C、D 兩座城市的出發(fā)、到達總量中,將包含一定量的旅游客流。因此若采用基本重力模型,將使C城市與D城市之間的預(yù)測客流交換量中包含旅游客流交換量,從而導(dǎo)致其客流預(yù)測結(jié)果偏大。
目前,已有部分學者重點關(guān)注了出發(fā)地與到達地之間的旅游關(guān)聯(lián)性,并得到一定的研究成果。有部分學者將網(wǎng)絡(luò)搜索指數(shù)作為變量加入模型,例如,單德朋等[5]認為,谷歌搜索指數(shù)可以作為旅游地宣傳促銷努力程度的度量。但網(wǎng)絡(luò)搜索指數(shù)的關(guān)鍵詞收集和選取方案還未形成成熟的體系[6]。文化距離也是建立出行兩端關(guān)聯(lián)關(guān)系常用的影響因素,例如,畢娟[7]認為兩地間文化維度的差異可以解釋中國入境游客的客源地分布,且文化距離和目的地選擇行為呈倒“U”型關(guān)系。但文化距離的計算依賴于主觀的文化差異測量指標,需要通過調(diào)查問卷獲取數(shù)據(jù),目前為止更適用于入境旅游研究。資源異質(zhì)性則一直被旅游學科研究者認為可以解釋特定城市對間的旅游關(guān)聯(lián)。例如,陳潔[8]利用余弦相似度將旅游資源異質(zhì)性化為因子加入重力模型,對每個城市的吸引力進行修正。但資源異質(zhì)性的評判標準缺乏合理度量,其僅將景點分為自然景觀類景點、人文景觀類景點與休閑活動類景點,每個類別內(nèi)部仍然可能存在異質(zhì)性。
綜上所述,既有研究提出的關(guān)聯(lián)項存在不成熟、適用范圍受限和度量標準不合理等問題,故本文試圖提出一個新的關(guān)聯(lián)項,以表達各個城市對其他城市的旅游偏好,并將其加入城際客運出行分布預(yù)測模型中,以體現(xiàn)客源地與旅游地之間的關(guān)聯(lián)性對城際客運出行分布的影響。
本文借助長三角26 個城市的數(shù)據(jù)開展研究,即:上海、南京、無錫、常州、蘇州、南通、鹽城、揚州、鎮(zhèn)江、泰州、杭州、寧波、嘉興、湖州、紹興、金華、舟山、臺州、合肥、蕪湖、馬鞍山、滁州、安慶、銅陵、池州、宣城??紤]到秋日環(huán)境較為適宜旅游,夏日學校放暑假,同時避開下雨日,最終將數(shù)據(jù)獲取時間確定為2019年7月24日(周三)、7月28日(周日)、10月24日(周四)和10月26日(周六)。如無特殊說明,后文所述“其他城市”“城際游客”等概念時,皆指研究范圍和研究日期內(nèi)的其他城市和城際游客。
本文所利用的OD 出行數(shù)據(jù)為手機信令數(shù)據(jù),由聯(lián)通公司旗下智慧足跡科技有限公司依托聯(lián)通手機用戶的移動軌跡,確定當日跨行政邊界的出行量,再根據(jù)起點城市和終點城市的聯(lián)通用戶市場占有率進行擴樣而得。
本文對各城市旅游偏好的研究,需要借助各個城市的景點從其他城市吸引到的游客數(shù)據(jù)來進行。根據(jù)國家標準《旅游區(qū)(點)質(zhì)量等級的劃分與評定(GB/T 17775-2003)》,我國旅游景區(qū)質(zhì)量等級劃分為5 個等級,由高到低依次為AAAAA(5A)、AAAA(4A)、AAA(3A)、AA(2A)、A 級旅游區(qū)(點)。該標準規(guī)定,5A與4A級景點的年游客量分別需達到60 萬人次與50 萬人次,遠超過3A(30 萬人次)、2A(10萬人次)與A(3萬人次)級景點,且知名度總體上更高,吸引城際游客的能力更強,故本文選取研究范圍內(nèi)所有的5A 和4A 級景點進行研究。后文所述“全市景點總個數(shù)”“全部景點城際總旅游客流量”等概念時,皆指該城市內(nèi)所有5A 和4A 級景點數(shù)以及該城市內(nèi)所有5A 和4A 級景點的城際總體旅游客流量。
景點游客數(shù)據(jù)是指,目標日出現(xiàn)在景區(qū)的各城市游客數(shù)量。其中,游客來源地判斷標準為其常住地,即游客1年內(nèi)居住時長大于6 個月的城市。判斷其為游客的標準為,在目標日進入景區(qū)范圍并停留超過1 h。舍棄部分用地性質(zhì)復(fù)雜以致無法判斷進入者是否為游客的景點,例如無法僅統(tǒng)計進入上海金茂大廈88 層觀光廳的聯(lián)通用戶,故該景點舍去。最終得到共計513 個景點的當日游客的常住地數(shù)據(jù)。
本文中廣義出行阻抗由兩個城市間各交通方式的出行時間和費用構(gòu)成??紤]的交通方式包括:鐵路列車、私家車、長途巴士。其中,鐵路列車數(shù)據(jù)來自鐵路12306網(wǎng)站;私家車出行時間數(shù)據(jù)自百度地圖爬取,出行費用數(shù)據(jù)依賴百度地圖爬取路線計算高速通行費及油耗費用;長途大巴數(shù)據(jù)參考巴士管家網(wǎng)、114 票務(wù)網(wǎng)、客運站網(wǎng)、快票出行APP 等多個網(wǎng)絡(luò)平臺的數(shù)據(jù)。每種交通方式的廣義出行費用計算方法為:出行費用+出行時間×時間價值。其中,時間價值為出發(fā)城市與到達城市2019年人均可支配收入的均值。收入數(shù)據(jù)來源于各個城市的統(tǒng)計年鑒。最終,每個OD對間廣義出行費用為各交通方式廣義出行費用的均值。
從文獻綜述不難看出,目前仍然很難提取出一個能夠有效表達兩地之間旅游關(guān)聯(lián)的變量,此問題在集計模型中更為凸顯,因為旅游是人們出于主觀意愿所進行的活動,客觀上并不存在一個因素使得某個地區(qū)的人“必須”去另一個地區(qū)旅游。但通過對各景點城際游客客源地分布數(shù)據(jù)進行分析后發(fā)現(xiàn),盡管旅游行為受旅游者的主觀意愿支配,但城際游客客源地分布在集計層面上仍然呈現(xiàn)出較強的規(guī)律性。以南京市為例說明,圖1為2019年7月24日、7月28日、10月24日和10月26日這4個分析日內(nèi),南京市5A和4A級景點的城際游客客源地分布數(shù)據(jù)。
圖1 南京市5A和4A級景點客源地分布Fig.1 Spatial patterns at 5A and 4A tourist attractions in Nanjing
如圖1所示,在4個研究日期內(nèi),南京市城際游客客源地分布大致相同,僅僅在數(shù)量上有所差異。本文采用相關(guān)系數(shù)ρ和差異系數(shù)λ描述客源地分布數(shù)列之間的差距。假設(shè)為某日某城市的城際游客客源地分布向量,為同一城市不同日期的城際游客客源地分布向量,其中,xi和yi皆按照與目標城市距離由近及遠順序進行排列。相關(guān)系數(shù)ρ和差異系數(shù)λ的計算公式為
相關(guān)系數(shù)ρ用來衡量X與Y變化趨勢的接近程度,差異系數(shù)λ用來衡量每個組成元素的差異。綜合ρ和λ可以表示兩個序列的相似程度。圖1中南京市4 d數(shù)據(jù)之間的關(guān)系如表1所示。
表1 南京市不同日期城際游客客源地分布之間的ρ 與λTable 1 ρ and λ between spatial patterns of intercity tourists on different dates in Nanjing
從表1可以看出,雖然數(shù)據(jù)的日期分別屬于暑期工作日、暑期周末、金秋工作日、金秋周末,但南京市城際游客客源地分布情況相差不大。
為分析城市單個景點與城市所有景點的城際游客客源地分布情況,表2給出南京市各景點與南京市整體城際游客客源地分布間的ρ與λ。從表中可以看出,南京市城際旅游客流量較大的景點,不同日期的客流規(guī)律性都比較強,各個客源地分布占比相差也較小;而城際旅游客流量較小的景點,則沒有明顯傾向,可能具有規(guī)律性,也可能不具有規(guī)律性。如果一個景點的ρ與λ可以滿足ρ≥0.8,λ≤0.2,且該景點同時滿足城際旅游客流量大于等于該市所有景點城際旅游客流量的均值,即將其定義為頭部景點,則南京市頭部景點共11個,占全市景點總個數(shù)的44%,其城際旅游客流量卻占全部景點城際總旅游客流量的89%。說明南京市不同日期城際游客客源地分布規(guī)律是由頭部景點決定的。
表2 南京市各景點與南京市整體城際游客客源地分布間的ρ 與λTable 2 ρ and λ between spatial patterns of intercity tourists of each attraction and Nanjing
其他城市也存在類似規(guī)律。如果考慮研究范圍內(nèi)全部513 個景點,共163 個景點符合頭部景點標準,占全部景點的32%,其城際旅游客流量卻占全部景點城際總旅游客流量的82%。
綜上所述得到以下基本結(jié)論:
(1)一個城市的城際游客客源地分布規(guī)律雖然受到旅游者個人主觀因素的影響,但從整體上來看仍會呈現(xiàn)出較強的規(guī)律性。
(2)一個城市的城際游客客源地分布規(guī)律主要由頭部景點決定,而這些頭部景點的城際游客客源地分布往往較為接近,這可能是由于這些景點名氣更高,交通可達性更好,故從統(tǒng)計學角度來看,非過夜旅游者在游覽時去往這些景點的概率是相等的,過夜游客可能在一次旅行中將這些景點都游覽一遍。
由此可見,在中國目前環(huán)境下,一個城市的城際游客客源地分布主要由頭部景點決定,而大部分頭部景點已經(jīng)存在相當長的一段時間,城際游客的客源地分布較為穩(wěn)定?;谏鲜鎏卣?,可以借助一個城市旅游景點的城際游客客源地分布構(gòu)建其他城市居民對該城市的旅游偏好,為城際客運出行分布預(yù)測模型更好地描述旅游關(guān)聯(lián)的影響奠定基礎(chǔ)。
親景度是馬耀峰等[9]在研究入境旅游時提出的概念,該指標利用客源國在某國的某個目標城市的外國游客占比與客源國在該國的外國游客占比,反映客源國游客對目標國不同城市的旅游偏好程度。假設(shè)到某地的某旅游客源國人數(shù)為Mi,到某地的外國游客人數(shù)為M1,到該地所在國旅游的某客源國人數(shù)為Gi,到該地所在國旅游的外國人數(shù)為G1,則親景度L的計算公式為
本文研究范圍內(nèi)各城市之間交流緊密,對彼此景點信息獲取渠道較多,獲取速度較快,按照常理,人們出游應(yīng)當更加隨心所欲,使景點客流失去規(guī)律性。但是由第2節(jié)研究結(jié)果可知,從整個城市角度來看,城際游客客源地分布是較為穩(wěn)定的。這反而說明,這種穩(wěn)定的規(guī)律性體現(xiàn)了一個地區(qū)居民的旅游偏好,因此,可以引入親景度的概念,基于城際游客客源地分布特征,在集計層面上構(gòu)建一個變量,用以表達一個城市的居民出于文化、歷史等原因,對其他城市的旅游偏好。
假設(shè)城市i對城市j的親景度為Li→j,表達式為
式中:xi→j為i城市居民在j城市旅游景點出現(xiàn)的數(shù)量(人次·d-1)。
根據(jù)親景度構(gòu)建兩個城市之間的旅游偏好為
式中:Lij為城市i與城市j之間基于親景度的旅游偏好變量;Li→j為城市i對城市j的親景度;Lj→i為城市j對城市i的親景度;η為待標定系數(shù)。
因此,構(gòu)建引入旅游偏好變量的城際客運出行分布預(yù)測模型。
式中:Tij為城市i到城市j單日出行交換量(人次·d-1);Oi為城市i單日出行出發(fā)量(人次·d-1);Dj為城市j單日出行到達量(人次·d-1);f()Cij為城市i與城市j之間的廣義出行阻抗;f()Lij為兩個城市之間的旅游偏好;aijm為交通方式m的權(quán)重,本文按均值進行計算;cijm為交通方式m在兩地間的出行費用(元);vij為城市i與城市j的時間價值均值(元·h-1);tijm為交通方式m在兩地間的出行時間(h);k,α,β,γ,η為待標定系數(shù)。
首先利用長三角26 城市全目的出行OD 數(shù)據(jù)以及5A 和4A 級景點的城際游客客源地分布數(shù)據(jù)進行模型系數(shù)標定,再利用標定完成的模型計算城際客運出行分布預(yù)測值??紤]到矩陣的行約束和列約束,利用Fratar 迭代得出最終的城際客運出行分布預(yù)測值。評判模型預(yù)測能力的標準可采用R2以及預(yù)測前后城際客運出行分布量的標準誤差σ,σ的表達式為
采用最小二乘法對模型進行標定,即利用取對數(shù)方法將式(6)演變?yōu)?/p>
第2節(jié)已經(jīng)說明,不同日期的城際游客客源地分布基本沒有差別,故此處僅使用2019年7月24日的數(shù)據(jù)對模型進行標定。
首先對各變量進行相關(guān)性檢驗和多重共線性檢驗,檢驗結(jié)果如表3所示。
從表3 可以看出,各變量的方差膨脹因子(Variance Inflation Factor,VIF)都小于10,說明多重共線性并不嚴重,可以進行回歸。對基本重力模型和加入旅游偏好變量的重力模型分別進行標定,得到結(jié)果如表4所示。
表3 各變量相關(guān)性檢驗和多重共線性檢驗Table 3 Bivariate correlation between variables and multicollinearity of variables
表4 加入旅游偏好變量前后模型標定結(jié)果對比Table 4 Calibration of gravity model with and without tourism preference
從表3 和表4 可以明顯看出,加入親景度相關(guān)的旅游偏好變量后,與基本重力模型相比,模型R2從0.69上升至0.88,標準誤差從現(xiàn)狀交換量均值的0.95倍下降至0.50倍,證明該變量對提升城際客運出行分布預(yù)測模型精度十分有效。
參與標定的OD 對共649 個,在引入旅游偏好變量后,誤差減小的OD 對為486 個,占所有OD 對的75%;誤差增大的OD 對為163 個,占所有OD 對的25%。分別計算絕對誤差與相對誤差。絕對誤差為每個OD 對間的預(yù)測出行量與實際出行量之間差值的絕對值,相對誤差為每個OD對間的絕對誤差除以其實際出行量,則不同OD對間的絕對誤差與相對誤差均值如表5所示。
表5 不同OD對的絕對誤差與相對誤差Table 5 Absolute error and relative error of different OD pairs
從表5可以看出:對于引入旅游偏好變量后誤差減小的OD 對而言,其誤差降低幅度較大;對于誤差增大的OD對而言,雖然誤差增大的幅度也較大,但由于其絕對值較小,故研究范圍內(nèi)OD 對間誤差整體呈較為顯著的下降趨勢,證明該變量對改善城際客運出行分布預(yù)測模型的預(yù)測能力具有較為顯著的效果。
需要注意的是,雖然城市的城際游客客源地分布較為穩(wěn)定,但是由不同季節(jié)或工作日、雙休日導(dǎo)致的城際出行者數(shù)量差距還是較大的,在使用絕對數(shù)據(jù)建模時應(yīng)當針對不同日期分別標定。
本文針對目前城際客運出行分布預(yù)測過程中對城際旅游關(guān)聯(lián)性考慮不足的問題,提出一個可以表征兩個城市間旅游關(guān)聯(lián)性的旅游偏好變量,并以此為基礎(chǔ)構(gòu)建了城際客運出行分布預(yù)測改進模型。
(1)借助手機信令數(shù)據(jù),通過對長三角26 個城市范圍內(nèi)的5A 和4A 級景點城際游客客源地分布進行分析后發(fā)現(xiàn),雖然旅游是一項主觀的活動,但在集計層面上,同一個城市中的頭部景點均呈現(xiàn)出相近且穩(wěn)定的客源地分布規(guī)律;長三角26 個城市范圍內(nèi)頭部景點城際旅游客流量占全部5A 和4A級景點城際總旅游客流量的比例達到82%,其中南京市的這一比例達到了89%。由此可見,一個城市的城際游客客源地分布主要是由頭部景點決定,其城際總體游客客源地分布也呈現(xiàn)出與頭部景點相似的規(guī)律。另外,從暑期工作日、暑期周末、金秋工作日、金秋周末4 d 的數(shù)據(jù)來看,在非節(jié)日情況下,上述規(guī)律也非常穩(wěn)定。
(2)基于長三角26個城市范圍內(nèi)5A和4A級景點城際游客客源地分布規(guī)律,借助親景度指標,提出可以表征城際旅游關(guān)聯(lián)性的旅游偏好變量,構(gòu)建了在基本重力模型中引入旅游偏好變量后的城際客運出行分布預(yù)測模型。利用長三角26個城市的出行分布現(xiàn)狀數(shù)據(jù)對模型進行標定后發(fā)現(xiàn),與基本重力模型相比較,模型R2從0.69 上升至0.88,標準誤差從現(xiàn)狀交換量均值的0.95倍下降至0.50倍;誤差減小的OD對占全部OD對數(shù)量的75%。由此可見,旅游偏好變量的引入對提高城際客運出行分布預(yù)測模型的精度是有效的。
然而,對于城際客運出行分布預(yù)測而言,城市間的旅游關(guān)聯(lián)性因素僅僅是出行分布眾多影響因素中的一個,本文建立的模型也僅僅說明了引入旅游關(guān)聯(lián)性因素的重要性,所以今后還應(yīng)繼續(xù)對影響城際客運出行分布的城市間其他主要關(guān)聯(lián)性因素逐一加以研究,并對研究成果進行融合,從而構(gòu)建更加完善的城際客運出行分布預(yù)測模型。