季殊楊
(長河高級(jí)中學(xué) 浙江 杭州 310000)
酒店入住情況是城市發(fā)展的一個(gè)直觀體現(xiàn),也是眾多酒店經(jīng)營者的關(guān)注點(diǎn)。對(duì)酒店入住情況進(jìn)行預(yù)測,比如月入住次數(shù)、月收入等具體指標(biāo)的預(yù)測,使酒店不僅可以合理安排收支,提高資金使用效益,而且還可以根據(jù)市場行情調(diào)整經(jīng)營戰(zhàn)略,以便更好地適應(yīng)市場形勢(shì)。特別地,預(yù)測將來的月入住次數(shù),根據(jù)預(yù)測的月入住次數(shù)來準(zhǔn)備房間,制定合理的房間價(jià)格,以便更好地滿足客戶需求,提升消費(fèi)體驗(yàn),同時(shí)避免房間資源浪費(fèi),解決供需不平衡的問題,實(shí)現(xiàn)酒店收益最大化。
總的來說,酒店入住情況預(yù)測相關(guān)的研究并不多見,但是對(duì)于類似的時(shí)間序列數(shù)據(jù)的預(yù)測則覆蓋了眾多領(lǐng)域和方法。文獻(xiàn)[1]基于對(duì)太陽黑子數(shù)時(shí)間序列的奇異譜分析(singular spectrum analysis,SSA),討論和分析了太陽活動(dòng)的周期性和趨勢(shì)性,以及太陽活動(dòng)中的一些周期之間的可能關(guān)系,并對(duì)太陽黑子活動(dòng)做出預(yù)報(bào)。文獻(xiàn)[2]應(yīng)用時(shí)間序列的廣義自回歸條件異方差模型(generalized auto-regressive conditional heteroskedasticity,GARCH),對(duì)匯率體制改革后的人民幣美元匯率建模并預(yù)測,驗(yàn)證了GARCH模型預(yù)測匯率的可行性,并取得了令人滿意的預(yù)測效果。文獻(xiàn)[3]通過分析青藏高原東部冬半年(1967—1996)雪災(zāi)的氣候特征,表明雪災(zāi)的總趨勢(shì)是增加的。文獻(xiàn)[4]通過奇異譜分析,發(fā)現(xiàn)北京市能源消費(fèi)排放二氧化碳量自2007年起進(jìn)入下降階段,而上海市能源消費(fèi)排放二氧化碳量自2012年起進(jìn)入平穩(wěn)或下降階段。文獻(xiàn)[5]提出了基于奇異譜分析和組合核函數(shù)最小二乘支持向量機(jī)(least squares support veotor maohine,LSSVM)的短時(shí)交通流量預(yù)測模型,以廈門市的實(shí)測交通流量數(shù)據(jù)為基礎(chǔ),對(duì)預(yù)測模型進(jìn)行實(shí)驗(yàn)驗(yàn)證和對(duì)比分析,結(jié)果表明所構(gòu)建的模型具有較好的預(yù)測效果,能夠有效提高短時(shí)交通流量預(yù)測精度。
奇異譜方法是一種特別適合于研究周期振蕩行為的分析方法,它是從時(shí)間序列的動(dòng)力重構(gòu)出發(fā),并與經(jīng)驗(yàn)正交函數(shù)相聯(lián)系的一種統(tǒng)計(jì)技術(shù),是EOF(empirical orthogonal function)分解的一種特殊應(yīng)用,目前已應(yīng)用于多種時(shí)間序列的分析中。奇異譜分析分解的空間結(jié)構(gòu)與時(shí)間尺度密切相關(guān),可以較好地從含噪聲的有限尺度時(shí)間序列中提取信息。奇異譜分析通過濃縮主要信息和減小誤差,從數(shù)據(jù)中找出其變化的主要趨勢(shì),不被暫時(shí)的數(shù)據(jù)影響,使預(yù)測結(jié)果能更好地符合實(shí)際。奇異譜分析具體可以分為嵌入、奇異值分解、分組和重構(gòu)四個(gè)步驟。
本文的整體研究方法大致分為以下幾個(gè)步驟:首先從互聯(lián)網(wǎng)上搜集到維多利亞1980年1月到1995年6月的酒店入住數(shù)據(jù)并整理成“.csv”格式的數(shù)據(jù)文件,再將數(shù)據(jù)進(jìn)行預(yù)處理(將原始數(shù)據(jù)時(shí)間序列化),然后將預(yù)處理后得到的數(shù)據(jù)劃分成訓(xùn)練集和測試集,并由此對(duì)訓(xùn)練集建立SSA模型,接著應(yīng)用SSA模型進(jìn)行預(yù)測,最后將所得到的預(yù)測值與測試集對(duì)比進(jìn)一步計(jì)算預(yù)測精度。整個(gè)過程的具體步驟如下所示(算法1):
首先,引入“Rssa”和“rminer”這兩個(gè)程序包到開發(fā)環(huán)境中。第一步,通過調(diào)用“read.csv()”函數(shù),將酒店的入住情況數(shù)據(jù)讀取進(jìn)來,并保存到“Rn”這個(gè)變量中。然后,我們從“Rn”變量中取出月總?cè)胱〈螖?shù)這一列數(shù)據(jù),依次使用“as.numeric()”和“ts()”函數(shù)將其數(shù)值化和時(shí)間序列化,接著將1980年1月到1994年12月的180個(gè)數(shù)據(jù)點(diǎn)劃分為訓(xùn)練集,把1995年1月到1995年6月的6個(gè)數(shù)據(jù)點(diǎn)劃分為測試集,分別保存在“train”變量和“test”變量中。隨后,我們應(yīng)用“ssa()”函數(shù)對(duì)訓(xùn)練集建立SSA模型,通過“forecast()”函數(shù)建立預(yù)測模型。最后使用“plot()”和“l(fā)ines()”這兩個(gè)繪圖函數(shù)繪制實(shí)驗(yàn)結(jié)果,并應(yīng)用“mmetric()”函數(shù)計(jì)算預(yù)測精度。
本文所使用的數(shù)據(jù)是維多利亞酒店1980年1月到1995年6月的月入住情況數(shù)據(jù)(分為月度入住次數(shù)和月度酒店收入兩個(gè)時(shí)間序列),共有186個(gè)數(shù)據(jù)點(diǎn),其中前180個(gè)點(diǎn)作為訓(xùn)練集,最后6個(gè)點(diǎn)作為測試集。總的來說,兩個(gè)時(shí)間序列數(shù)據(jù)呈上升趨勢(shì),但是也存在以年為單位的周期性波動(dòng),主要是受一年中不同季節(jié)的影響,可能與旅游淡旺季有一定關(guān)聯(lián)。本文使用了R和RStudio作為實(shí)驗(yàn)運(yùn)行環(huán)境,R語言是一款可編程的統(tǒng)計(jì)分析軟件,集統(tǒng)計(jì)分析與圖形顯示于一體。RStudio為R語言提供了具有圖形界面的開發(fā)環(huán)境,易于編輯和運(yùn)行。其中,本實(shí)驗(yàn)應(yīng)用了R語言中的Rssa和Rminer兩個(gè)程序包,Rssa是奇異譜分析的程序包,Rminer是數(shù)據(jù)挖掘的程序包。
本文選用了均方根誤差(Root Mean Square Error,RMSE)作為模型的度量指標(biāo),來計(jì)算模型的預(yù)測精度。RMSE值越小,表明模型的預(yù)測效果越好。RMSE的計(jì)算公式為,其中y和f分別表示時(shí)間序列的觀測值和模型輸出值,T為數(shù)據(jù)點(diǎn)的個(gè)數(shù)。本文對(duì)測試集計(jì)算RMSE值來定量地評(píng)價(jià)模型的預(yù)測精度。
本實(shí)驗(yàn)分別對(duì)兩個(gè)時(shí)間序列應(yīng)用SSA遞歸和向量預(yù)測模型展開實(shí)驗(yàn),并根據(jù)RMSE值比較預(yù)測精度。具體模型參數(shù)和實(shí)驗(yàn)結(jié)果如表1所示。從表中可以看出,以上四個(gè)模型得到的RMSE值的數(shù)量級(jí)均小于原始數(shù)據(jù)的數(shù)量級(jí),說明SSA模型的預(yù)測效果較好。此外,可以發(fā)現(xiàn)使用遞歸預(yù)測模型得到的月度入住次數(shù)和月度酒店收入RMSE值均小于向量預(yù)測模型得到的RMSE值,說明遞歸預(yù)測模型比向量預(yù)測模型精度要高。
本文應(yīng)用奇異譜分析方法建立酒店入住情況的預(yù)測模型,分別應(yīng)用遞歸和向量預(yù)測模型對(duì)月度酒店入住次數(shù)和月度酒店收入進(jìn)行預(yù)測,其中遞歸預(yù)測模型與向量預(yù)測模型相比更優(yōu),預(yù)測精度(RMSE值)分別達(dá)到了23953.79和2897.07?;谀壳肮ぷ?,后續(xù)還可以做進(jìn)一步研究,比如應(yīng)用自回歸移動(dòng)平均(autoregressive integrated moving average,ARIMA)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)等模型進(jìn)行實(shí)驗(yàn),比較各種統(tǒng)計(jì)學(xué)和人工智能等不同預(yù)測模型的優(yōu)劣。
[1]袁忠良.基于奇異譜分析研究太陽黑子長期行為的周期性及其預(yù)報(bào)[D].重慶大學(xué),2015.
[2]惠曉峰,柳鴻生,胡偉,等.基于時(shí)間序列GARCH模型的人民幣匯率預(yù)測[J].金融研究,2003(5):99-105.
[3]董安祥,瞿章,尹憲志,等.青藏高原東部雪災(zāi)的奇異譜分析[J].高原氣象,2001,20(2):214-219.
[4]趙立祥,劉亞萍.基于奇異譜分析方法的北京、上海能源消費(fèi)的二氧化碳排放趨勢(shì)研究[J].科技管理研究,2015,35(21):236-244.
[5]商強(qiáng),楊兆升,張偉,等.基于奇異譜分析和CKF-LSSVM的短時(shí)交通流量預(yù)測[J].吉林大學(xué)學(xué)報(bào)(工),2016,46(6):1792-1798.
[6]王鑫,吳際,劉超,等.奇異譜分析在故障時(shí)間序列分析中的應(yīng)用[J].北京航空航天大學(xué)學(xué)報(bào),2016,42(11):2321-2331.