胡傳勝 周志國(guó)
摘要:目前對(duì)企業(yè)進(jìn)行量化評(píng)估的研究主要基于企業(yè)特征維度進(jìn)行分析。通過(guò)對(duì)企業(yè)財(cái)務(wù)、營(yíng)運(yùn)等特征進(jìn)行建模,利用各種算法進(jìn)行統(tǒng)計(jì)分析,從而達(dá)到對(duì)企業(yè)量化評(píng)估的目的。這些研究大都基于全量樣本數(shù)據(jù)進(jìn)行評(píng)估,但這種做法忽略了生命周期對(duì)企業(yè)的影響。在不同生命周期階段,企業(yè)具有不同的財(cái)務(wù)、營(yíng)運(yùn)等特征數(shù)據(jù),將這些企業(yè)進(jìn)行無(wú)差別評(píng)估,會(huì)降低企業(yè)量化評(píng)估的準(zhǔn)確性和科學(xué)性?;诖耍恼峦瞥鲆环N基于生命周期的企業(yè)特征量化評(píng)估模型,首先對(duì)企業(yè)的生命周期進(jìn)行分類,然后分別對(duì)不同生命周期階段的企業(yè)進(jìn)行特征量化評(píng)估的方法。這種方法解決了傳統(tǒng)評(píng)估方法對(duì)不同生命周期階段內(nèi)企業(yè)由于實(shí)際業(yè)務(wù)數(shù)據(jù)差異而帶來(lái)的影響和偏差。
關(guān)鍵詞:企業(yè)生命周期;企業(yè)特征量化評(píng)估;XGBoost算法;TOPSIS算法
中圖分類號(hào):TP181? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)09-0086-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
0 引言
企業(yè)生命周期理論廣泛應(yīng)用于企業(yè)管理和規(guī)劃領(lǐng)域,它描述了企業(yè)在不同發(fā)展階段所面臨的挑戰(zhàn)和機(jī)遇。在當(dāng)今競(jìng)爭(zhēng)激烈的市場(chǎng)環(huán)境中,正確評(píng)估企業(yè)現(xiàn)狀、制定匹配決策方案,對(duì)企業(yè)的成功發(fā)展至關(guān)重要。然而,目前現(xiàn)有的企業(yè)評(píng)估模型大都忽視企業(yè)生命周期因素的影響,導(dǎo)致評(píng)估結(jié)果的科學(xué)性和準(zhǔn)確性受到一定的限制[1]。
本研究旨在研發(fā)一種基于生命周期[2]的企業(yè)特征量化評(píng)估模型[3],該模型將通過(guò)結(jié)合生命周期理論和特征量化評(píng)估方法,首先對(duì)企業(yè)進(jìn)行生命周期分類,然后利用特征量化評(píng)估模型對(duì)企業(yè)進(jìn)行評(píng)估分類,實(shí)現(xiàn)精準(zhǔn)、全面的分析企業(yè)現(xiàn)狀,為企業(yè)管理者和決策者提供更具針對(duì)性的管理建議和決策支持。
本方案利用大數(shù)據(jù)AI算法,收集并分析企業(yè)全量數(shù)據(jù),構(gòu)建基于生命周期的企業(yè)特征量化評(píng)估模型。本方案采用XGBoost算法構(gòu)建企業(yè)生命周期模型,結(jié)合熵權(quán)法和TOPSIS算法實(shí)現(xiàn)對(duì)企業(yè)的量化評(píng)估。此外,本文還結(jié)合實(shí)例,驗(yàn)證模型在實(shí)踐中的準(zhǔn)確性和有效性。
本研究的創(chuàng)新之處在于將企業(yè)生命周期理論與企業(yè)評(píng)估方法相結(jié)合,提供了一種更加全面、準(zhǔn)確的企業(yè)評(píng)估模型。該模型不僅可以幫助企業(yè)管理者深入了解企業(yè)現(xiàn)狀,還可以為決策者提供具有針對(duì)性的決策支持。此外,該模型還具有廣泛的應(yīng)用價(jià)值,如企業(yè)投融資管理、市場(chǎng)決策分析等。
1 基于生命周期的企業(yè)特征量化評(píng)估模型
生命周期理論認(rèn)為,生命周期貫穿于企業(yè)生產(chǎn)經(jīng)營(yíng)全過(guò)程。研究表明企業(yè)生命周期主要由初創(chuàng)期、成長(zhǎng)期、成熟期和衰退期四個(gè)階段組成,每個(gè)階段都有其獨(dú)特的特征和需求。本文從模型特征篩選、生命周期分類、特征量化評(píng)估3個(gè)方面展開(kāi)企業(yè)經(jīng)營(yíng)特征評(píng)估,提出了一種基于企業(yè)生命周期的特征量化評(píng)估模型,將企業(yè)先按生命周期分類,規(guī)避由特征數(shù)據(jù)全距過(guò)大而引起的差異,再利用特征量化評(píng)估模型對(duì)企業(yè)進(jìn)行評(píng)估,以提升企業(yè)評(píng)估算法的準(zhǔn)確性和科學(xué)性,為管理者制定精準(zhǔn)決策服務(wù)方案,提供堅(jiān)強(qiáng)數(shù)據(jù)支撐。
1.1 模型特征篩選
評(píng)估模型涉及生命周期分類與企業(yè)量化評(píng)估兩部分,模型數(shù)據(jù)來(lái)源包括工商、司法、電力等多類數(shù)據(jù)源,根據(jù)當(dāng)前主流的生命周期與特征量化評(píng)估研究成果,特征集選取主要從企業(yè)財(cái)務(wù)、信用等幾個(gè)方面進(jìn)行選取。模型特征經(jīng)過(guò)數(shù)據(jù)探查處理后,最終形成模型特征集23個(gè),如表1所示。
1.2 算法原理
分類模型中常用的算法有隨機(jī)森林、SVM、邏輯回歸、XGBoost等算法,本文中企業(yè)生命周期模型采用XGBoost算法進(jìn)行分類預(yù)測(cè),同時(shí)將隨機(jī)森林、SVM兩種算法與XGBoost算法的預(yù)測(cè)分類結(jié)果進(jìn)行比較。XGBoost算法是一種基于Boosting的集成學(xué)習(xí)模型,由多個(gè)弱學(xué)習(xí)器集合而成一個(gè)強(qiáng)學(xué)習(xí)器,通過(guò)對(duì)目標(biāo)函數(shù)進(jìn)行二階泰勒展開(kāi),使模型結(jié)果更加逼近真實(shí)情況,在分類與回歸問(wèn)題上較其他型模型具有更高的精度。
XGBoost模型表達(dá)式如公式(1)所示:
[yi=k=1Kfk(xi),fk∈F ]? ? ? ? (1)
上式中[yi]表示預(yù)測(cè)值;K表示回歸樹(shù)數(shù)量;xi表示第i個(gè)輸入的特征向量;F是回歸樹(shù)集合空間;fk是集合R上的一個(gè)函數(shù),表示基學(xué)習(xí)器的輸出。
對(duì)yi進(jìn)行k次疊加計(jì)算后,得到XGBoost的目標(biāo)函數(shù)如公式(2)所示:
[obj(t)=i=1nl(yi,yi(t)) + i=1tΩ(fi)]
[=i=1nl(yi,yi(t-1)+ft(xi))+Ω(ft)]+constant? ? (2)
上式中[l(yi,yi(t-1)+ft(xi))]是損失函數(shù),用來(lái)計(jì)算真實(shí)值與預(yù)測(cè)值之間的誤差;[Ω(ft)]是正則化項(xiàng),constant是常數(shù)項(xiàng)。
對(duì)上述公式進(jìn)行二階泰勒式展開(kāi)并簡(jiǎn)化計(jì)算,最終得到如公式(3)所示:
[obj*=-12j=1TG2jHj+λ+γT]? ? ? ?(3)
上式中T為 k 次迭代后樹(shù)中葉子結(jié)點(diǎn)個(gè)數(shù);Gj表示當(dāng)前葉子結(jié)點(diǎn)所有樣本一階導(dǎo)數(shù)和;Hj表示當(dāng)前樣本所有二階導(dǎo)數(shù)和;γ為懲罰函數(shù)系數(shù);λ為正則化懲罰項(xiàng)系數(shù)。
1.3 企業(yè)生命周期分類
根據(jù)生命周期理論,雖然企業(yè)在不同生命周期表現(xiàn)出來(lái)不同的特征,但在相同周期內(nèi)具有某些共性。因此利用這些共性可以實(shí)現(xiàn)企業(yè)生命周期分類。研究表明,初創(chuàng)期企業(yè)具有企業(yè)市場(chǎng)占比小、成本高、利潤(rùn)低、現(xiàn)金流轉(zhuǎn)少、組織結(jié)構(gòu)簡(jiǎn)單等特點(diǎn);成長(zhǎng)期企業(yè)具有融資能力和償債能力較強(qiáng)、營(yíng)收和利潤(rùn)增速快等特點(diǎn);成熟期具有市場(chǎng)占有率穩(wěn)定、營(yíng)收和利潤(rùn)均穩(wěn)定、現(xiàn)金流較為充裕、很強(qiáng)的償債能力、組織結(jié)構(gòu)復(fù)雜等特點(diǎn);衰退期具有營(yíng)收和利潤(rùn)均逐年下降、企業(yè)市場(chǎng)份額占比越來(lái)越小、組織結(jié)構(gòu)混亂等特點(diǎn)。
企業(yè)生命周期模型采用XGBoost算法,模型特征集涉及財(cái)務(wù)、信用等幾個(gè)方面。模型數(shù)據(jù)經(jīng)過(guò)ETL處理,去除異常值與缺失值過(guò)多的企業(yè)。為了提高模型的訓(xùn)練效率和泛化能力,本文對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使其近似滿足0-1分布。XGBoost 模型訓(xùn)練時(shí),采用gridsearch網(wǎng)格搜索法進(jìn)行參數(shù)粗調(diào),利用Stratified KFold進(jìn)行10折交叉驗(yàn)證,減少模型評(píng)估誤差,提高模型評(píng)估的準(zhǔn)確性和泛化能力。經(jīng)過(guò)粗調(diào)后,采用控制變量法精調(diào)模型,得到最佳模型參數(shù)。
XGBoost模型評(píng)估標(biāo)準(zhǔn)采用F1值,F(xiàn)1值由準(zhǔn)確率(Precision) 和召回率(Recall) 調(diào)合平均組成。F1的公式如公式(4)所示:
[F1=2×Precision×RecalPrecision+Recal]? ? ? ? ?(4)
為了驗(yàn)證模型的準(zhǔn)確性,預(yù)測(cè)結(jié)果與SVM算法和隨機(jī)森林算法進(jìn)行實(shí)驗(yàn)對(duì)比,從表2實(shí)驗(yàn)結(jié)果可以看出本文提出的XGBoost預(yù)測(cè)模型F1值為0.9618,與SVM和隨機(jī)森林相比,整體評(píng)估預(yù)測(cè)結(jié)果均有顯著提升,表明XGBoost模型算法適用于本數(shù)據(jù)集。
1.4 企業(yè)特征量化評(píng)估
企業(yè)特征量化評(píng)估模型[4]通過(guò)量化企業(yè)特征對(duì)企業(yè)進(jìn)行評(píng)估,能夠全面、客觀了解企業(yè)實(shí)際情況,指導(dǎo)管理者制定準(zhǔn)確的決策分析方案,幫助決策者策劃清晰可持續(xù)差異化服務(wù)決策。本文采用熵權(quán)法結(jié)合TOPSIS算法對(duì)企業(yè)進(jìn)行評(píng)估。熵權(quán)法不需要對(duì)指標(biāo)進(jìn)行主觀賦值,具有計(jì)算簡(jiǎn)單、易于實(shí)現(xiàn)等優(yōu)點(diǎn)。TOPSIS算法能夠充分利用原始數(shù)據(jù)信息,對(duì)企業(yè)經(jīng)營(yíng)現(xiàn)狀進(jìn)行全面評(píng)估,最大程度避免人為主觀性,精準(zhǔn)刻畫(huà)特征指標(biāo)。熵權(quán)法負(fù)責(zé)計(jì)算特征權(quán)重系數(shù),TOPSIS算法負(fù)責(zé)計(jì)算企業(yè)特征量化綜合評(píng)估得分。模型特征集涵蓋財(cái)務(wù)、信用等幾個(gè)方面。
由于企業(yè)特征數(shù)據(jù)存在分布、尺度方面的差異,所以模型數(shù)據(jù)需要進(jìn)行同向歸一化處理,本文采用最大最小歸一化方法進(jìn)行處理。根據(jù)數(shù)據(jù)特征,對(duì)于負(fù)向數(shù)據(jù),如違法、失信、資產(chǎn)負(fù)債率等,采用如公式(5)方法進(jìn)行處理:
[xi=max(xi) - ximax(xi)-min(xi)]? ? ? (5)
對(duì)于正向數(shù)據(jù),如銷售利潤(rùn)率、總資產(chǎn)收益率、專利數(shù)量等,采用如公式(6)方法進(jìn)行處理:
[xij=xij-min(xij)max(xij)-min(xij)]? ? ? ?(6)
同向歸一化后,利用熵權(quán)法計(jì)算模型中每個(gè)特征所占樣本的比重[Pi],如公式(7)所示:
[Pij=Xiji=1mXij]? ? (7)
然后利用比重[Pij]計(jì)算第j個(gè)特征的熵值[E][j]和特征差異系數(shù)[Gj],如公式(8)和(9)所示:
[Ej=1lnmi=1mPijlnPij]? ? ? ?(8)
[Gj=1 - Ej? ]? ? ?(9)
上式中m為樣本總數(shù)。
根據(jù)特征差異系數(shù)[Gj],最終得出每個(gè)特征的權(quán)重系數(shù),如公式(10)所示:
[Wj=Gji=1nGj]? ? ? ? (10)
TOPSIS算法中,同樣需要對(duì)數(shù)據(jù)進(jìn)行同向化與歸一化處理,采用方法同上述熵權(quán)法中最大最小化公式。然后構(gòu)造企業(yè)的n維特征空間正、負(fù)理想解(各指標(biāo)的最優(yōu)解(z+)和最劣解(z-)),如公式(11)和(12)所示:
[? ?z+ = max{z11,z21,...,zn1 },max{z12,z22,...,zn2 },...,]
[max{z1m,z2m,...,znm } =Z+1,Z+2,...,Z+m]? ? ? ?(11)
[z- =min{z11,z21,...,zn1 },min{z12,z22,...,zn2 },...,]
[min{z1m,z2m,...,znm }=Z-1,Z-2,...,Z-m]? ? ? ?(12)
在得到企業(yè)特征最優(yōu)解和最劣解后,計(jì)算每個(gè)企業(yè)到正負(fù)理想解的距離,如公式(13)所示:
[D+i=j=1mωj(Z+j-zij)2,? D-i=j=1mωj(Z-j-zij)2? ]? ?(13)
到此可以結(jié)合[ D+i]和[D-i]計(jì)算每個(gè)企業(yè)的綜合得分,利用公式(14)對(duì)企業(yè)進(jìn)行評(píng)估,判定其綜合優(yōu)劣。
[Ci = D-iD+i+D-i]? ? ? (14)
1.5 模型架構(gòu)
基于生命周期的企業(yè)特征量化模型包括數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)、模型計(jì)算和模型輸出四個(gè)部分,邏輯架構(gòu)如圖1所示:
數(shù)據(jù)源提供模型所需的各種數(shù)據(jù),如工商、稅務(wù)、司法、電力等數(shù)據(jù),通過(guò)數(shù)據(jù)接入層傳輸數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)層處理模型原始數(shù)據(jù),生成入模特征數(shù)據(jù)。其中,ETL實(shí)現(xiàn)多數(shù)據(jù)融合、異常值處理等功能。模型計(jì)算層中,企業(yè)生命周期模型實(shí)現(xiàn)企業(yè)生命周期計(jì)算與分類;企業(yè)特征量化模型中,熵權(quán)法計(jì)算模型特征權(quán)重,TOPSIS算法負(fù)責(zé)實(shí)現(xiàn)量化、計(jì)算各個(gè)生命周期內(nèi)的企業(yè)評(píng)估得分。模型輸出包括企業(yè)生命周期分類、綜合量化評(píng)估得分和排名、綜合評(píng)估報(bào)告等相關(guān)內(nèi)容組成。
2 應(yīng)用案例
基于生命周期的企業(yè)特征量化評(píng)估模型在某大型國(guó)企集團(tuán)內(nèi)部進(jìn)行應(yīng)用。模型所需數(shù)據(jù)由企業(yè)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)組成,形成基本條件、科研能力、信用情況、財(cái)務(wù)狀況4個(gè)維度,共計(jì)23個(gè)模型特征。數(shù)據(jù)經(jīng)過(guò)企業(yè)生命周期模型預(yù)測(cè)后,待評(píng)估企業(yè)中,初創(chuàng)期共有19家,成長(zhǎng)期共有564家,成熟期共有606家,衰退期共有86家。分別對(duì)這四類企業(yè)進(jìn)行評(píng)估預(yù)測(cè),最終得出這四類企業(yè)的綜合得分。企業(yè)綜合評(píng)估后,需要對(duì)企業(yè)進(jìn)行數(shù)據(jù)融合定位,由于預(yù)測(cè)企業(yè)屬于同一個(gè)集團(tuán),數(shù)據(jù)來(lái)源一致,評(píng)估方法一致,所以可以直接利用企業(yè)綜合得分進(jìn)行統(tǒng)一排序,最終得到所有企業(yè)的綜合評(píng)估排名。
本模型在集團(tuán)內(nèi)部對(duì)企業(yè)進(jìn)行量化評(píng)估驗(yàn)證,評(píng)估結(jié)果得到集團(tuán)業(yè)務(wù)人員的高度認(rèn)可,一致表明基于生命周期的企業(yè)特征量化模型評(píng)估結(jié)果真實(shí)可靠,符合集團(tuán)內(nèi)部企業(yè)實(shí)際分布情況,模型評(píng)估準(zhǔn)確度得到驗(yàn)證。
3 結(jié)論
本文提出一種基于生命周期的企業(yè)特征量化的評(píng)估模型,旨在減少由于生命周期不同而導(dǎo)致企業(yè)在財(cái)務(wù)、科研等方面特征數(shù)據(jù)差異而帶來(lái)的評(píng)估誤差,提高企業(yè)評(píng)估的準(zhǔn)確性和科學(xué)性。通過(guò)模型的應(yīng)用與實(shí)踐,驗(yàn)證了模型的正確性和有效性,為企業(yè)評(píng)估模型方面的研究提出了一種切實(shí)可行的方案。
另外本文創(chuàng)新性地將電力數(shù)據(jù)融入企業(yè)特征量化評(píng)估模型中,增加新的特征維度,使模型預(yù)測(cè)準(zhǔn)確度得到了提升。本模型可廣泛應(yīng)用于企業(yè)投融資管理、差異化服務(wù)定制、市場(chǎng)決策分析等業(yè)務(wù)場(chǎng)景,為提升企業(yè)整體競(jìng)爭(zhēng)力提供底層數(shù)據(jù)支撐。
參考文獻(xiàn):
[1] 王士偉.中小型科技創(chuàng)新企業(yè)生命周期各階段的特征及融資政策分析[J].科技進(jìn)步與對(duì)策,2011,28(10):88-91.
[2] 陳志存.基于生命周期理論的企業(yè)財(cái)務(wù)戰(zhàn)略[J].納稅,2023,17(23):79-81.
[3] 奚夢(mèng)緣.中小企業(yè)信用指標(biāo)體系構(gòu)建及評(píng)估模型的最優(yōu)化[D].南京:南京大學(xué),2018.
[4] 朱宗元,蘇為華,王秋霞.新三板融資環(huán)境下中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估[J].統(tǒng)計(jì)與信息論壇,2018,33(10):107-113.
【通聯(lián)編輯:王 力】