李 曄, 丁圓蘋
(河南農業(yè)大學信息與管理科學學院,鄭州 450002)
灰色系統(tǒng)理論自20世紀80年代創(chuàng)立以來,因其適用于“小樣本、貧信息”特征的數(shù)據(jù)建模而受到學者們的廣泛關注. 灰色預測模型是灰色系統(tǒng)理論的重要分支之一[1],由于其只需要少量數(shù)據(jù)便可實現(xiàn)預測的特點,已被廣泛運用到工程、醫(yī)療、農業(yè)等多個領域[2-4].
傳統(tǒng)灰色預測模型以實數(shù)作為研究對象,然而隨著科學技術的迅速發(fā)展,人們面臨的系統(tǒng)變得更加復雜,受認知程度所限,越來越多的數(shù)據(jù)不能以確切的數(shù)值表達,而區(qū)間灰數(shù)的表示方法則更符合人們對系統(tǒng)內數(shù)據(jù)的把握和認知[5]. 因此,建立面向區(qū)間灰數(shù)的預測模型已成為學者們的研究熱點之一. 現(xiàn)有文獻中,學者們利用“區(qū)間灰數(shù)白化”的思想,通過信息分解法[6-7]、幾何坐標轉換法[8-9]、灰色屬性法[10-13]將區(qū)間灰數(shù)序列轉化為實數(shù)序列,然后對實數(shù)序列建立灰色預測模型,再反推得到區(qū)間灰數(shù)上下界的模擬值和預測值. 但是,上述研究均是在灰數(shù)取值分布信息未知的前提下進行的.
在灰色系統(tǒng)理論中,作為描述一個灰數(shù)對其取值范圍內不同數(shù)值“偏愛程度”的白化權函數(shù),在區(qū)間灰數(shù)預測中受到了學者們的深入研究. 文獻[14]定義了白化權函數(shù)已知的核與灰度,對已有研究中的核和灰度進行了拓展;文獻[15]在典型白化權函數(shù)已知的前提下,將區(qū)間灰數(shù)序列所蘊含的信息轉換為面積和中點坐標等實數(shù)序列,然后對實數(shù)序列建立灰色預測模型,有效解決了白化權函數(shù)已知的區(qū)間灰數(shù)預測問題;文獻[16]在文獻[15]的基礎上對區(qū)間灰數(shù)的白化過程進行了優(yōu)化,提出了含有遺傳算法的白化權函數(shù)已知的區(qū)間灰數(shù)預測模型;文獻[17]建立了三角白化權函數(shù)已知的區(qū)間灰數(shù)預測模型,并將其運用到黃河寧蒙河段巴彥高勒站的凌期日均流量預測;文獻[18]以灰色異構序列為建模對象,提出了白化權函數(shù)已知的灰色異構數(shù)據(jù)預測模型,并將其運用到災害應急物資需求預測. 前述文獻均是白化權函數(shù)已知的區(qū)間灰數(shù)預測模型,運用白化權函數(shù)對區(qū)間灰數(shù)的分布信息進行了補充,有效提高了模型的預測精度.
現(xiàn)實生活中大量的不確定性信息符合某種規(guī)律分布,而正態(tài)分布是存在最為廣泛的一種,具有普適性[19].由于其可以用來描述不確定信息的取值概率情況,可被視為一種特殊的白化權函數(shù),并運用到區(qū)間灰數(shù)預測模型. 文獻[19]通過正態(tài)分布隨機函數(shù)實現(xiàn)區(qū)間灰數(shù)序列與實數(shù)序列的信息等效轉換,然后對正態(tài)分布隨機白化序列進行建模;文獻[20]結合區(qū)間灰數(shù)上下界與正態(tài)分布參數(shù)之間的轉換關系以及實數(shù)序列之間存在相互影響和相互制約的特點,建立區(qū)間灰數(shù)MGM(1,2)預測模型. 基于此,本文將以正態(tài)分布作為區(qū)間灰數(shù)的取值信息補充,構建正態(tài)分布區(qū)間灰數(shù)預測模型.
模型精度是判別建模有效性的標準之一,為提升灰色預測模型的建模精度,眾多學者對模型初始條件的優(yōu)化進行研究. 關于初始條件優(yōu)化主要有三種方法:①設置不同的初始值. 文獻[21]在傳統(tǒng)灰色預測模型求解初始條件的基礎上,增加修正項ε,對初始條件進行優(yōu)化;文獻[22]結合“新信息優(yōu)先原理”,將x(1)(n)作為初始值從而求得優(yōu)化的初始條件;文獻[23]在文獻[22]的基礎上進行改進,以x(1)(n)+ε 作為初始值求解初始條件. ②構建目標函數(shù). 文獻[24-25]結合模型的時間響應式,構建誤差平方和最小的目標函數(shù),進而求得最優(yōu)初始條件;為體現(xiàn)初始條件優(yōu)化與模型精度檢驗的一致性原則,文獻[26]建立了相對誤差平方和最小的目標函數(shù)對初始條件進行優(yōu)化. ③構建初始條件表達式. 文獻[27]根據(jù)模型的時間響應式,結合“新信息優(yōu)先原理”,假設擬合序列經過原始點x(1)(1)和x(1)(n),求得二者對應的初始條件表達式,并取其均值作為優(yōu)化的初始條件. 前述文獻中的初始條件優(yōu)化方法在一定程度上提高了模型的預測精度,但均忽略了對系統(tǒng)數(shù)據(jù)的充分利用,對于已經具有灰信息的區(qū)間灰數(shù)序列造成了信息浪費,影響建模精度.
綜上所述,本文基于不確定信息取值概率的正態(tài)分布,以非齊次指數(shù)形式變化的區(qū)間灰數(shù)序列為研究對象,建立正態(tài)分布區(qū)間灰數(shù)NGM(1,1)預測模型. 結合正態(tài)分布的參數(shù)特征,將區(qū)間灰數(shù)序列轉化為實數(shù)序列,并對實數(shù)序列建立NGM(1,1)模型. 鑒于初始條件對模型精度的影響,受文獻[27]中初始條件優(yōu)化方法的啟發(fā),在充分利用數(shù)據(jù)信息的前提下,結合新信息優(yōu)先原理對初始條件進行優(yōu)化,最終反推區(qū)間灰數(shù)上下界的預測值.
定義1[19]只知道取值范圍而不知道確切取值的數(shù)稱為灰數(shù),既有下界xL又有上界xU的灰數(shù)稱為區(qū)間灰數(shù),記為?∈[xL,xU],xL<xU.
定義2[19]用來描述一個灰數(shù)?∈[xL,xU]在其取值范圍[xL,xU]內對不同數(shù)值“偏愛”程度的函數(shù),稱為區(qū)間灰數(shù)的白化權函數(shù). 若“偏愛”程度呈現(xiàn)正態(tài)分布特征,則稱為正態(tài)分布白化權函數(shù),如圖1所示.
定義3[19]設連續(xù)型區(qū)間灰數(shù)?∈[xL,xU],若真實值d ∈[xL,xU]的取值概率服從正態(tài)分布,即d~N(μ,σ2),μ 為數(shù)學期望,σ2為方差,則稱?∈[xL,xU]為正態(tài)分布區(qū)間灰數(shù).
圖1 正態(tài)分布白化權函數(shù)Fig.1 Whitening weight function of normal distribution
為NGM(1,1)模型的白化方程.
其中:a 為發(fā)展系數(shù);b 為驅動項;c 為灰色作用量;D 為初始條件.
證明 根據(jù)式(2),在白化方程兩側同乘eat,并進行不定積分,即
則白化方程的解為
則灰色微分方程的時間響應式函數(shù)為
由x^(0)(k)=x(1)(k)-x(1)(k-1)得累減還原式為
以區(qū)間灰數(shù)在取值范圍內的真實值取值概率呈正態(tài)分布作為信息補充,結合正態(tài)分布的參數(shù)特征,將區(qū)間灰數(shù)序列等效轉換為核序列和信息擴散度序列,以NGM(1,1)模型作為基礎模型對實數(shù)序列進行建模.由于模型精度受到初始條件的影響,在已有初始條件優(yōu)化方法的基礎上進行改進,充分利用所有的數(shù)據(jù)信息,求得各點對應的初始條件,并結合新信息優(yōu)先原理對初始條件賦權,進而構建初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型.
為了充分利用數(shù)據(jù)序列信息,本文考慮1-AGO序列中各個分量對預測模型的影響,在假設擬合點與原始點重合的情況下,計算各點對應的初始條件. 此外,基于新信息優(yōu)先原理,賦予新信息對應的初始條件較大的權重,舊信息對應的初始條件較小的權重,以初始條件的加權平均值作為預測序列優(yōu)化的初始條件,進而提升模型的預測性能.
設第k 個初始條件對應的權重為α(k),其中
α(k)的變化滿足α(1)<α(2)<…<α(n),與新信息優(yōu)先原理下的權重設置原則一致,具有有效性.
命題1 綜合考慮全部數(shù)據(jù)序列信息,可得優(yōu)化的初始條件為
證明 根據(jù)式(4),可得
即
結合式(6)及新信息優(yōu)先原理,優(yōu)化的初始條件為
定理3 設B、Y 如定理1所述,則NGM(1,1)模型的白化方程在初始條件優(yōu)化下的解為
則灰色微分方程的時間響應式函數(shù)為
累減還原式為
由定義4可知,結合正態(tài)分布的參數(shù)特征,對正態(tài)分布區(qū)間灰數(shù)白化時,可以實現(xiàn)區(qū)間灰數(shù)信息的等效轉換. 因此,可將正態(tài)分布區(qū)間灰數(shù)序列轉化為核序列和信息擴散度序列.
結合定義5,對實數(shù)序列分別建立初始條件優(yōu)化的NGM(1,1)預測模型,可得其累減還原式分別為:
其中:Dopt、a 和b 為初始條件優(yōu)化的核序列的NGM(1,1)預測模型的參數(shù);D′opt、a′和b′為初始條件優(yōu)化的信息擴散度序列的NGM(1,1)預測模型的參數(shù).
根據(jù)定義4,推導還原得到區(qū)間灰數(shù)的上下界,即
初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型建模步驟如下:
Step1根據(jù)定義4,將區(qū)間灰數(shù)序列轉化為核序列和信息擴散度序列;
Step2根據(jù)定義5,分別建立核序列和信息擴散度序列的NGM(1,1)模型;
Step3結合式(6)~(9),對所建立的兩個NGM(1,1)模型的初始條件進行優(yōu)化;
Step4 根據(jù)式(13)~(14),求得核序列和信息擴散度序列的模擬值并推導區(qū)間灰數(shù)上下界.
為證明本文模型的有效性和實用性,利用所建立的初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型對某航空公司2008—2018年的航空貨運量進行模擬和預測,數(shù)據(jù)源于文獻[29]. 為進一步檢驗模型的建模效果,同時利用文獻[30]中的模型進行建模. 原始數(shù)據(jù)如表1所示.
表1 某航空公司2008—2018年航空貨運量Tab.1 The Air cargo volumes of an airline from 2008 to 2018
以2008—2017年的數(shù)據(jù)進行建模,對2018年的數(shù)據(jù)進行預測,具體步驟如下:Step1根據(jù)定義4,將區(qū)間灰數(shù)序列轉化為核序列和信息擴散度序列,得
Step2根據(jù)定義5,分別建立核序列和信息擴散度序列的NGM(1,1)模型,并結合式(8)~(11)對初始條件進行優(yōu)化,得
Step3再根據(jù)式(13)~(14)推導區(qū)間灰數(shù)上下界的模擬值. 具體數(shù)據(jù)見表2.
表2 航空貨運量的模擬、預測值及誤差Tab.2 Simulated values,forecast values and errors of the air cargo volumes
觀察表2,本文模型的上、下界平均相對誤差分別為2.637%和3.091%,預測誤差分別為0.754%和0.946%,均明顯優(yōu)于文獻[30]中的模型. 這主要是由于在建模方法方面,文獻[30]在缺乏區(qū)間灰數(shù)取值分布信息的情況下將區(qū)間灰數(shù)白化為實數(shù)序列,而本文以“不確定信息廣泛存在正態(tài)分布規(guī)律”作為區(qū)間灰數(shù)的取值信息補充,將區(qū)間灰數(shù)序列等效轉化為實數(shù)序列,“正態(tài)分布”取值信息的補充降低了區(qū)間灰數(shù)的灰性,有利于模型精度的提升;在模型選擇方面,文獻[30]選用擬合齊次指數(shù)增長的DGM(1,1)模型,本文選用既適用于齊次指數(shù)增長,也適用于非齊次指數(shù)增長的NGM(1,1)模型,相比較而言,本文選用的模型具有普適性,有利于數(shù)據(jù)變化規(guī)律的挖掘和發(fā)展趨勢的預測;在模型優(yōu)化方面,文獻[30]未對影響建模精度的初始條件進行優(yōu)化,而本文結合新信息優(yōu)先原理對初始條件進行優(yōu)化,從理論上既能提高建模精度又遵循了灰色系統(tǒng)建模的新信息優(yōu)先原則. 綜上所述,本文的建模方法有利于提升模型預測性能.
區(qū)間灰數(shù)是一種具有灰信息的數(shù)據(jù),與實數(shù)建模相比,區(qū)間灰數(shù)建模更為復雜. 本文在不確定信息廣泛存在正態(tài)分布的背景下,結合正態(tài)分布的參數(shù)特征,實現(xiàn)了區(qū)間灰數(shù)序列到實數(shù)序列的等效轉換,并分別建立實數(shù)序列的NGM(1,1)預測模型. 鑒于初始條件對模型精度的影響,充分利用數(shù)據(jù)序列信息及新信息優(yōu)先原理對其進行優(yōu)化. 最后,將模型應用于某航空公司2008—2018年的航空貨運量預測,結果表明本文所建立的初始條件優(yōu)化的正態(tài)分布區(qū)間灰數(shù)NGM(1,1)模型具有有效性和實用性.