【摘要】近年來,由于互聯(lián)網(wǎng)的快速發(fā)展,搜索引擎已經(jīng)成為網(wǎng)民普遍使用的工具。百度指數(shù)記錄了用戶的搜索關(guān)注與需求,為研究互聯(lián)網(wǎng)搜索行為與實際的市場需求之間的關(guān)系提供了必要的數(shù)據(jù)基礎。本文基于百度指數(shù),利用計量經(jīng)濟學中的協(xié)整理論和格蘭杰因果關(guān)系分析了互聯(lián)網(wǎng)搜索量與國內(nèi)大眾途觀汽車實際銷售量之間的關(guān)系,建立了引入互聯(lián)網(wǎng)搜索量的市場需求預測模型;并且通過建立對比模型,比較加入百度關(guān)鍵詞搜索量前后的預測模型的精度,結(jié)果表明加入百度指數(shù)后的模型精度有了很大的提高,這對于企業(yè)進行產(chǎn)量決策具有重大的指導意義。
【關(guān)鍵詞】汽車產(chǎn)業(yè) 百度指數(shù) 時間序列 大數(shù)據(jù) 預測
一、前言
汽車工業(yè)是我國國民經(jīng)濟的支柱產(chǎn)業(yè),是我國賴以實現(xiàn)現(xiàn)代化、城市化的基礎和保障。近日,國內(nèi)最大汽車互聯(lián)網(wǎng)企業(yè)易車發(fā)布的易車指數(shù)顯示:數(shù)據(jù)分析2014車市,國人偏愛SUV。在2014年,SUV在國內(nèi)用戶關(guān)注市場的占比超越緊湊型車,成為最搶眼的細分市場。對于SUV在中國的前景不論是其一枝獨秀的銷量,還是頻頻推出的新車,都表明消費者已經(jīng)進行了投票。而當下,我國的汽車產(chǎn)業(yè)也正面臨著重重危機,產(chǎn)能過剩,就是最大風險之一。是故汽車生產(chǎn)企業(yè)能否做好產(chǎn)能規(guī)劃就顯得極為重要。本文選取了近幾年在國內(nèi)SUV市場上面,銷量一直穩(wěn)居前茅的大眾途觀為例進行探索研究。
隨著大數(shù)據(jù)時代的來臨,搜索引擎的普遍使用,用戶進行信息獲取的同時也將自己的搜索痕跡留在了搜索引擎中,大量的搜索記錄信息匯聚在一起,便包含了用戶現(xiàn)實生活中的行為意圖,更能反映出群體用戶的社會性、經(jīng)濟性規(guī)律的發(fā)展趨勢。最近幾年出現(xiàn)了大量運用網(wǎng)絡搜索數(shù)據(jù)進行預測的研究。基于網(wǎng)絡搜索數(shù)據(jù)的流感預測、失業(yè)率監(jiān)測、旅游及房地產(chǎn)銷售預測都擁有較高的準確度,網(wǎng)絡數(shù)據(jù)的即時性可以很好的彌補傳統(tǒng)預測方法的滯后性。因此,可以利用網(wǎng)絡搜索數(shù)據(jù)對網(wǎng)民的在線活動進行監(jiān)測,它能從大量搜索數(shù)據(jù)中獲取新的關(guān)聯(lián)信息,能從復雜數(shù)據(jù)背景中通過數(shù)據(jù)分析創(chuàng)建合成指數(shù),找出解決問題的有效途徑。因此,依托網(wǎng)絡搜索數(shù)據(jù)的時效性,挖掘用戶對汽車的需求,對于汽車生產(chǎn)企業(yè)制定產(chǎn)能規(guī)劃具有極為現(xiàn)實的意義。
二、國內(nèi)外相關(guān)研究
Ginsberg等(2008)[1]發(fā)現(xiàn)基于Google搜索引擎端的搜索數(shù)據(jù),預測到了流感的爆發(fā),這比急病防控中心的預測提前了兩周;Askitas等(2009)[2]運用搜索數(shù)據(jù),對德國的失業(yè)率進行了研究,發(fā)現(xiàn)上月第三四周的網(wǎng)絡搜索量與本月失業(yè)率相關(guān)性最強。在國內(nèi),利用網(wǎng)絡搜索量數(shù)據(jù)進行的研究還不多,但也取得了一定的突破,主要是在CPI、旅游業(yè)、汽車行業(yè)、股票市場預測方面有了比較大的突破:梁志峰(2010)[5]從谷歌搜索引擎端得到的數(shù)據(jù),對我國湘潭地區(qū)的網(wǎng)絡關(guān)注度進行了研究,主要是針對一些熱點關(guān)鍵詞的搜索量做了時間以及空間上的比較。劉穎等(2011)[6]運用經(jīng)濟含義,將搜索數(shù)據(jù)整理為股民行動指數(shù)、市場行情指數(shù)以及宏觀形勢指數(shù)三種,并通過實證證實了搜索指數(shù)對于股票市場具有顯著地預測能力。
三、實證分析
(一)數(shù)據(jù)的選取
本文通過一些關(guān)鍵詞挖掘工具,選取了“途觀”、“大眾途觀”兩個搜索量最多的關(guān)鍵詞(此二者的搜索量遠高于其他關(guān)鍵詞搜索量),利用百度指數(shù)可以合并的特點,采取“途觀+大眾途觀”的合成檢索,利用其得到的百度指數(shù)作為原始數(shù)據(jù),以2012年1月到2014年12月作為樣本數(shù)據(jù),數(shù)據(jù)量滿足計量經(jīng)濟學建模的要求,以2015年1月到2015年6月的數(shù)據(jù)作為檢驗數(shù)據(jù),由圖示法展示2012到2014年實際銷售量與百度關(guān)鍵詞搜索量的曲線圖,可以發(fā)現(xiàn)百度搜索指數(shù)與實際銷售量的走勢基本一致。
(二)互聯(lián)網(wǎng)搜索量數(shù)據(jù)與實際數(shù)據(jù)的關(guān)系
通過對兩組數(shù)據(jù)進行單位根檢驗以及協(xié)整檢驗發(fā)現(xiàn):原時間序列的自相關(guān)系數(shù)不是很快的趨近零(如滯后期K=2,3),表明序列是非平穩(wěn)的。然后對其進行對數(shù)處理并進行差分運算再進行ADF檢驗,其自相關(guān)與偏相關(guān)系數(shù)很快的趨近零,可初步表明該序列為平穩(wěn)序列。由此判定兩組數(shù)據(jù)為一階單整序列,滿足協(xié)整檢驗前提。其次對兩組變量進行普通最小二乘回歸,對其殘差進行單位根檢驗,由于檢驗統(tǒng)計量為-8.81,小于顯著性水平0.01時的臨界值-4.25,可認為估計殘差序列為平穩(wěn)序列,進而得到序列xs1(銷量)與zs1(指數(shù))具有協(xié)整關(guān)系。
(三)預測模型的對比分析
通過逐步比較定階確定原時間序列分析模型為ARMA(3,2)模型,運用此模型對2015年1月到6月的銷量進行預測,然后加入百度指數(shù)重新進行模型的預測,對比分析結(jié)果(表1)
表1 實際銷量與加入指數(shù)前后的模型預測值對比
單位:萬輛
對比實際值與預測值,我們發(fā)現(xiàn),較之上述ARMA模型的預測結(jié)果,預測精度有了很大程度的提高,改進后的模型預測誤差更小。
四、結(jié)論
本文基于百度指數(shù),利用計量經(jīng)濟學中的協(xié)整理論和格蘭杰因果關(guān)系分析了互聯(lián)網(wǎng)搜索量與大眾途觀類型汽車實際銷售量之間的關(guān)系,建立了引入互聯(lián)網(wǎng)搜索量的市場需求預測模型;并且通過建立對比模型,比較加入百度關(guān)鍵詞搜索量前后的預測模型的精度,結(jié)果表明加入百度指數(shù)后的模型精度有了很大的提高,這對于企業(yè)進行產(chǎn)量決策具有重大的指導意義。
參考文獻
[1]Ginsberg, Mohebbi, Patel, Brammer, Smolinski and Brilliant, 2009, Detecting influenza epidemics using search engine query data [J]. Nature 457: 1012-1014.
[2]Askitas N, Zimmermann K F. 2009. Google econometrics and unemployment forcasting[J]. Applied Economics Quarterly, 55(2):107-120.
[3]劉穎,呂本富,彭賡.網(wǎng)絡搜索對股票市場的預測能力: 理論分析與實證檢驗[J].經(jīng)濟管理,2011, 33(1):172-180.
作者簡介:孔令頂(1989-),男,漢族,河南衛(wèi)輝人,現(xiàn)就讀于蘭州交通大學,碩士研究生,研究方向:運營管理、數(shù)據(jù)挖掘。