丁 嵐,李樹剛
(上海交通大學(xué)機(jī)械與動力工程學(xué)院,上海 201100)
物聯(lián)網(wǎng)被普遍認(rèn)為將成為2008年全球金融危機(jī)之后經(jīng)濟(jì)發(fā)展新的動力之一,在物聯(lián)網(wǎng)產(chǎn)業(yè)鏈中,射頻識別技術(shù)(RFID)在物聯(lián)網(wǎng)起步階段就有強(qiáng)大的市場需求,成為了市場最為關(guān)注的技術(shù)。要想實現(xiàn)成功的投資,正確計算目標(biāo)企業(yè)的價值是關(guān)鍵。估值模型的可靠性不僅取決于總體正確率,也應(yīng)該考慮各個類別的分類正確率。例如某種模型通過對大量樣本的測試驗證了它的總體正確率很高,可是對于其中一種少數(shù)情況,卻完全無法正確估值,而假設(shè)這種少數(shù)情況恰巧是一種極端風(fēng)險的情況(如企業(yè)利潤大幅降低),那么這個模型的可靠性就大打折扣。而目前的估值方法往往缺少對細(xì)分情況的考慮,以凈現(xiàn)值方法為代表的傳統(tǒng)估值方法為例,其中未來自由現(xiàn)金流量的判斷就存在著隨意性或單一性的缺點。在預(yù)測未來現(xiàn)金流時,無論是以回歸模型、時間序列分析、灰色系統(tǒng)理論為代表的統(tǒng)計方法,還是以模糊方法,進(jìn)化算法、神經(jīng)網(wǎng)絡(luò)方法等為代表的人工智能方法,都是基于單目標(biāo)的方法,即只針對模型的總體準(zhǔn)確率來優(yōu)化,這樣有可能忽略了某些關(guān)鍵類別的可靠性。本文提出了基于NSGAII優(yōu)化神經(jīng)網(wǎng)絡(luò)的雙精度神經(jīng)網(wǎng)絡(luò)利潤預(yù)測模型,準(zhǔn)確度和最小分類精度是優(yōu)化的兩個目標(biāo),以此來降低估值模型的不確定性和風(fēng)險性。我們提煉了28個可能影響企業(yè)利潤的關(guān)鍵因素,把這些因素作為雙精度神經(jīng)網(wǎng)絡(luò)的輸入對企業(yè)不同年限的利潤進(jìn)行預(yù)測,將預(yù)測的利潤值代入實物期權(quán)模型中進(jìn)行短期,中期以及長期的估值。通過對中國RFID企業(yè)估值的仿真結(jié)果表明,改進(jìn)的神經(jīng)網(wǎng)絡(luò)能明顯提高實物期權(quán)方法估值的準(zhǔn)確性。
如圖1所示,我們設(shè)計的一個企業(yè)估值系統(tǒng)主要由三個模塊組成:評估因素、利潤預(yù)測和價值評估。
圖1 企業(yè)估值支持系統(tǒng)結(jié)構(gòu)
在決策模型中,第一步就是建立評估指標(biāo)體系作為系統(tǒng)的輸入。由于估值時需要計算企業(yè)在未來投資期內(nèi)的自由現(xiàn)金流,因此我們將采用基于NSGA-II的雙精度神經(jīng)網(wǎng)絡(luò)對企業(yè)未來的利潤進(jìn)行預(yù)測,最后我們選擇實物期權(quán)的方法來建立企業(yè)估值模型,充分考慮了企業(yè)的資本價值和投資的機(jī)會價值。
在企業(yè)估值過程中,對于企業(yè)財務(wù)狀況的分析是最重要的環(huán)節(jié),然而僅僅依靠企業(yè)財務(wù)信息而不考慮宏觀經(jīng)濟(jì)運(yùn)行的大方向,很有可能做出危險的預(yù)測。因此我們將評估指標(biāo)分為兩類:宏觀經(jīng)濟(jì)指標(biāo)和企業(yè)財務(wù)指標(biāo),得到了如圖2所示的指標(biāo)體系,共28個指標(biāo)。
我們考慮采用最為常用的多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)有3層:輸入層、隱含層、和輸出層。此外對輸出結(jié)果進(jìn)行處理,得到兩個衍生層:未來利潤層和企業(yè)價值層,如圖3所示。
圖2 評估指標(biāo)體系
圖3 決策支持系統(tǒng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖
在該網(wǎng)絡(luò)的進(jìn)化過程中,我們需要考察兩個目標(biāo):最小分類精度和總體正確率。我們希望通過NSGA-II進(jìn)化方法找到能表達(dá)正確率和最小分類精度都很高的個體,因此有兩個目標(biāo)函數(shù):
S代表神經(jīng)網(wǎng)絡(luò)對于輸入樣本的最小分類正確精度,表示各個類別分類正確的概率,A代表總體正確率,表示總體樣本分類正確的概率。以圖4為例,總體樣本40個中,甲類有30個,乙類有10個,第一種分類方法,甲類和乙類的樣本全部分在了甲類,甲類的正確率是30/30=100%,乙類的正確率是0/10=0,最小的分類精度是min(0,100%),故最小分類精度S=0,總體分類精度A=30/40=75%;第二種分類方法中,甲類中有19個分到了甲類,11個分到了乙類,故甲類的分類正確率為19/30=63.3%,同理,乙類的分類正確率是3/10=30%,故S=min(63.3%,30%)=30%,總體的正確率A=(19+3)/40=55%,
從圖4中我們也可以看出,A和S的變化并沒有表現(xiàn)出一致性,這兩個目標(biāo)函數(shù)不存在明確的相關(guān)性,有時候還體現(xiàn)出相互沖突性,因此傳統(tǒng)的多目標(biāo)轉(zhuǎn)化為單目標(biāo)的方法無法有效使用。
圖4 正確率和最小分類精度的示意圖
由于在我們的指標(biāo)體系中,包含了28個指標(biāo),如果不加處理全部作為神經(jīng)網(wǎng)絡(luò)的輸入,比如會是網(wǎng)絡(luò)結(jié)構(gòu)十分復(fù)雜,而且網(wǎng)絡(luò)中的神經(jīng)元均采用S型激勵函數(shù),對于輸入樣本數(shù)據(jù)進(jìn)行預(yù)處理變換后可防止因凈輸入的絕對值過大而使神經(jīng)元輸出飽和,繼而使權(quán)值調(diào)整進(jìn)入誤差曲面的平坦區(qū)。
對于維度太多的問題,我們采用主成分分析的方法來降維處理,主成分分析就是把原有的多個指標(biāo)轉(zhuǎn)化成少數(shù)幾個代表性較好的綜合指標(biāo),這少數(shù)幾個指標(biāo)能夠反映原來指標(biāo)大部分的信息,并且各個指標(biāo)之間保持獨立,避免出現(xiàn)重疊信息,起著降維和簡化數(shù)據(jù)結(jié)構(gòu)的作用。通過主成分分析,保留98%的信息,輸入的數(shù)據(jù)變成由28個變成10個,降維效果很顯著。
接著,為了防止數(shù)據(jù)的過度不均勻,我們對這些數(shù)據(jù)進(jìn)行歸一化處理,歸一化公式為:
設(shè)網(wǎng)絡(luò)有N個輸入節(jié)點,H個隱含層節(jié)點,M個輸出層節(jié)點,隱含層節(jié)點采用S型函數(shù),每個隱含層節(jié)點的輸出為:
其中βh表示隱層節(jié)點上的偏置,WIH代表輸入層與隱含層之間的連接矩陣,X表示輸入的指標(biāo)矩陣。輸出層首先按加權(quán)求和得到一個輸出fm:
其中γm表示輸出節(jié)點上的偏置,WHO代表隱含層與輸出層之間的連接矩陣,V代表隱含層的輸出矩陣。
再采用softmax函數(shù)計算樣本落入第m類的概率om,為節(jié)點的輸出:
最后樣本所在的類C(X)為輸出最大的節(jié)點所代表的類:
我們將前一層輸出的結(jié)果表達(dá)為未來的利潤,為實物期權(quán)法計算企業(yè)價值時提供必要的參數(shù)。
從實物期權(quán)的角度出發(fā),企業(yè)的價值評估應(yīng)該包括兩個部分:資產(chǎn)價值和期權(quán)價值:
Va:貼現(xiàn)現(xiàn)金流(DCF)方法得到的現(xiàn)實資產(chǎn)的折現(xiàn)值,即資產(chǎn)的價值。
Vc:是未來增長機(jī)會的折現(xiàn)值,即期權(quán)的價值。
采用自由現(xiàn)金流量折現(xiàn)法計算目標(biāo)企業(yè)的資產(chǎn)價值時,
其中:
Ci—第i年的凈利潤;
r—無風(fēng)險利率;
S—企業(yè)目前的價值。
在我們運(yùn)用實物期權(quán)原理時評估一個企業(yè)的價值時,期權(quán)價值可以看作我們擁有了在投資末期出售以更比投資初期更高價值出售這個企業(yè)的選擇權(quán),因此我們可以采用因此Black-Scholes看漲期權(quán)模型(簡稱BS模型),S是這個企業(yè)目前的價值,X是投資末期企業(yè)的價值。
其中:
參數(shù)代表的意義和確定方法見表1。
表1 BS公式中各參數(shù)的含義和確定方法
以上可以發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)對未來凈利潤情況的預(yù)測能幫助我們確定DCF方法中的Ci和BS公式中的X,假設(shè)企業(yè)的凈利潤全部累積,有:
綜合得到企業(yè)的估值公式為:
NSGAⅡ是帶精英策略的非支配排序遺傳算法,它是Deb等人在NSGA的基礎(chǔ)上加入快速非支配排序算法、引入精英策略、采用擁擠度和擁擠度比較算子,使得Pareto最優(yōu)解前沿中的個體能均勻地擴(kuò)展到整個Pareto域,保證了種群的多樣性。NSGA-II算法的基本思想為:首先,隨機(jī)產(chǎn)生規(guī)模為的初始種群,非支配排序后通過遺傳算法的選擇、交叉、變異三個基本操作得到第一代子代種群;其次,從第二代開始,將父代種群與子代種群合并,進(jìn)行快速非支配排序,同時對每個非支配層中的個體進(jìn)行擁擠度計算,根據(jù)非支配關(guān)系以及個體的擁擠度選取合適的個體組成新的父代種群;最后,通過遺傳算法的基本操作產(chǎn)生新的子代種群;依此類推,直到滿足程序結(jié)束的條件。
在快速非支配排序過程中值越小排名越優(yōu)先,故實際上考慮的是:
f1=-A和f2=-S,
假設(shè)種群 P,對于 x,y∈ P,若 f1(x)≤ f1(y)且 f2(x)< f2(y),或f1(x)< f1(y)且 f2(x)≤ f2(y),則稱 x支配y。對于每個個體p都有兩個參數(shù)np和Sp,其中np為種群中支配個體p的個體數(shù),Sp為種群中被個體p支配的個體集合。算法的
主要步驟是:
步驟1找到種群中所有np=0的個體,并保存在當(dāng)前集合F1中,故集合F1中的個體沒有被任何其他的個體支配,是Pareto最優(yōu)邊界;
步驟2對當(dāng)前集合F1中的每個個體p,其所支配的個體集合為Sp,遍歷Sp中的每個個體p,執(zhí)行np=np-1,如果np=0,則將個體p保存到集合Q中,故集合Q中的個體僅被集合F1中的個體支配,不被任何F1和Q集合外的個體支配,Q為集合F2;
步驟3重復(fù)上述操作,直到整個種群被分級。
一旦非支配集排序完成后,我們就要計算擁擠度。擁擠度是指種群中給定個體的周圍個體的密度。直觀上可表示為個體i周圍僅包含個體i本身的長方形的邊長的和。如圖5所示。
圖5 擁擠度示意圖
對于雙目標(biāo)排序問題,擁擠度確定方法是:
Fi中的每個個體,邊界的兩個個體擁擠度為無窮,即:
I(d1)=I(dn)=∞
則對于其他個體利用差值法對每個目標(biāo)函數(shù)進(jìn)行擁擠度計算:
其中f(i±1)m表示集合中從第m維來看,與第i個個體的最相鄰的個體的目標(biāo)函數(shù)m的值,分別為目標(biāo)函數(shù)m的最大最小值(m=1,2)。
這樣,通過快速非支配排序以及擁擠度計算,種群中的每個個體i都有兩個屬性:非支配排序和擁擠度。利用這兩個屬性,可以區(qū)分種群中任意兩個個體的支配和非支配關(guān)系,也就是說:如果兩個個體的非支配排序不同,取排序號較小的個體(分層排序時,先被分離出來的個體);如果兩個個體在同一級,取周圍較不擁擠的個體。
由于每一個染色體代表著一個參數(shù)和結(jié)構(gòu)都具體的神經(jīng)網(wǎng)絡(luò),包括權(quán)值和偏置的大小、隱含層節(jié)點數(shù)目,連接情況等,因此染色的編碼可以視為三段。如圖6所示,第一段為參數(shù)部分的編碼,表示所有權(quán)值和偏置的大小,初始化時,輸入層與隱含層之間的參數(shù)在[-5,5]之間隨機(jī)產(chǎn)生,隱含層和輸出層之間的參數(shù)在[-10,10]之間隨機(jī)產(chǎn)生;第二段為隱層節(jié)點的編碼,“0”表示該位置節(jié)點不存在,“1”代表存在,這一段的編碼在初始化時隨機(jī)生成“0”或“1”,但“1”的個數(shù)在最小和最大節(jié)點數(shù)之間,我們設(shè)定最小節(jié)點數(shù)為3,最大節(jié)點數(shù)可以在實驗中靈活設(shè)置;第三位表示連接情況,“0”表示該位置沒有連接,“1”表示有連接,同樣初始化時每個編碼隨機(jī)生成“0”或“1”,并保證隱含層有節(jié)點的位置與前后層的連接不能全為0。
圖6 染色體編碼示意圖
進(jìn)化過程中的基因算子只考慮了突變沒有考慮交叉,因為已有文獻(xiàn)表明交叉操作在遺傳進(jìn)化過程不能幫助優(yōu)化神經(jīng)網(wǎng)絡(luò)。我們考慮了五種突變的情況,一種參數(shù)突變和四種結(jié)構(gòu)突變,發(fā)生的概率均為1/5,如表2所示。
表2 五種突變操作
在我們基于NSGA-II算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的研究中,學(xué)習(xí)算法可以設(shè)計如下:
(1)產(chǎn)生初始種群,染色體表示一個神經(jīng)網(wǎng)絡(luò)的權(quán)值和偏置(實值)、連接和隱層節(jié)點個數(shù)(0/1)。
(2)評價初始種群,將種群中的染色體翻譯成神經(jīng)網(wǎng)絡(luò),計算準(zhǔn)確率和最小分類精度。
(3)快速非支配排序法給種群排序,每個染色體得到一個排名和擁擠距離。
(4)通過錦標(biāo)賽方法來挑選父代,對父代的每個個體進(jìn)行突變操作,以各1/5概率發(fā)生一種參數(shù)突變四種結(jié)構(gòu)突變(加/減隱層節(jié)點,加/減連接數(shù)),產(chǎn)生子代。
(5)評價子代,計算準(zhǔn)確率和最小分類精度。
(6)將子代父代合并在一起用快速非支配排序法計算排名和擁擠度,截去多余的個體,保持種群數(shù)量恒定。
(7)檢查是否達(dá)到終止條件,如沒有則轉(zhuǎn)入步驟4,用新種群替代就舊種群。
從以上步驟可以看出,采用NSGA-II優(yōu)化神經(jīng)網(wǎng)絡(luò),能得到參數(shù)、結(jié)構(gòu)更合適的個體,他們在正確率和最小分類精度上都得到了提高,算法的程序框圖如圖7所示。
圖7 雙精度神經(jīng)網(wǎng)絡(luò)算法程序框圖
在投資者對于RFID企業(yè)進(jìn)行投資時如并購、投融資、交易等,至關(guān)重要的一步就是對企業(yè)有一個可靠的價值評估,從而分析和衡量企業(yè)的公平市場價值并提供有關(guān)信息,便于投資者和管理者做出建議與決策。但是傳統(tǒng)的現(xiàn)金流預(yù)測模型沒有考慮到細(xì)分情況下的精度優(yōu)化,且傳統(tǒng)估值方法忽略了投資機(jī)會選擇的價值,因此估值的效果受到了影響。為此本文設(shè)計了一個集成雙精度神經(jīng)網(wǎng)絡(luò)與實物期權(quán)估值方法相結(jié)合的估值系統(tǒng)。與現(xiàn)有文獻(xiàn)相比,該系統(tǒng)的主要特色體現(xiàn)在:
(1)雙精度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,以準(zhǔn)確度和最小分類精度為進(jìn)化的目標(biāo),基于Pareto邊界法,同時對準(zhǔn)確度和最小分類精度這兩個目標(biāo)進(jìn)行優(yōu)化,強(qiáng)化了模型的抗風(fēng)險性。
(2)采用實物期權(quán)方法,克服了傳統(tǒng)凈現(xiàn)值方法忽略對未來投資機(jī)會價值的缺點。
(3)在進(jìn)化過程中,網(wǎng)絡(luò)的參數(shù)和結(jié)構(gòu)同時參與到變異操作中,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)對于隱層節(jié)點數(shù)的確定沒有明確的規(guī)則,在雙精度神經(jīng)網(wǎng)絡(luò)中,變異算子對每個父代個體均等的發(fā)生參數(shù)突變和結(jié)構(gòu)突變,最后神經(jīng)網(wǎng)絡(luò)在隱層節(jié)點、節(jié)點間的連接等結(jié)構(gòu)設(shè)計上得到了優(yōu)化。
未來的研究主要是對輸出結(jié)果的進(jìn)一步優(yōu)化上,本文主要是搭建了一個分類預(yù)測模型,只能給投資者一個定性的決策支持,還缺乏連續(xù)量化的手段。其次,對于已有的分類結(jié)果,仍需進(jìn)一步提高精度,在實驗對比中,多值Logistic回歸模型的表現(xiàn)也比較優(yōu)秀,未來希望吸收各種預(yù)測手段的優(yōu)勢設(shè)計出一個更可靠的綜合神經(jīng)網(wǎng)絡(luò)。
[1]中國商業(yè)電訊.物聯(lián)網(wǎng)風(fēng)生水起將成下一風(fēng)投熱點[EB、OL].http://www.prnews.cn/press_release/33424.htm,2010-03-30.
[2]馮文權(quán).經(jīng)濟(jì)預(yù)測與決策技術(shù)[M].武漢:武漢大學(xué)出版社,2008.
[3]漢克,維歇恩.商業(yè)預(yù)測[M].北京:清華大學(xué)出版社,2006.
[4]龐素琳.信用評價與股市預(yù)測模型研究及應(yīng)用—統(tǒng)計學(xué)、神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)方法[M].科學(xué)出版社,2005.
[6]馬明,李松.基于遺傳算法優(yōu)化混沌神經(jīng)網(wǎng)絡(luò)的股票指數(shù)預(yù)測[J].商業(yè)研究,2010(11).
[7]張鴻,彥林輝.應(yīng)用混合神經(jīng)網(wǎng)絡(luò)和遺傳算法的期權(quán)價格預(yù)測模型[J].管理工程學(xué)報,2009,(1).
[8]Y.Jin,B.Sendhoff.Pareto-Based Multi Objective Machine Learning:An Overview and Case Studies[J].IEEE Trans.Syst.Man Cybern.C,Appl.Rev.,2008,38(3).
[9]Deb,Kalyanmoy,Pratap,Amrit,Agarwal,Sameer,Meyarivan,T.A Fastand ElitistMulti-ObjectiveGenetic Algorithm NSGA-II[J].IEEE Transactions on Evolutionary Computation,2002,6(2).
[10]P.J.Angeline,G.M.Saunders,J.B.Pollack.An Evolutionary Algo?rithm that Constructs Recurrent Neural Networks[J].IEEE Trans.Neural Netw.,1994,5(1).