王 哲,郭 強(qiáng),劉建國 WANG Zhe, GUO Qiang, LIU Jianguo
(1. 上海理工大學(xué) 復(fù)雜系統(tǒng)科學(xué)研究中心,上海200093;2. 上海財(cái)經(jīng)大學(xué) 會(huì)計(jì)與財(cái)務(wù)研究院,上海200433)
(1. Research Center for Complex Systems Science, University of Shanghai for Science & Technology, Shanghai 200093, China;2. Institute of Accounting and Finance, Shanghai University of Finance and Economics, Shanghai 200433, China)
物流活動(dòng)是人類最基本的社會(huì)經(jīng)濟(jì)活動(dòng)之一,物流業(yè)是興起較晚但發(fā)展相當(dāng)快的一個(gè)產(chǎn)業(yè),對世界各國特別是發(fā)達(dá)國家的國民經(jīng)濟(jì)增長發(fā)揮著重要的支持和帶動(dòng)作用。據(jù)統(tǒng)計(jì),發(fā)達(dá)國家像法國1996 年物流產(chǎn)值高達(dá)15 840 億法郎,德國物流產(chǎn)值高達(dá)1 580 億馬克,日本1995 年物流產(chǎn)值高達(dá)314 690 億日元,而且與日俱增[1],世界范圍內(nèi),不僅發(fā)達(dá)國家物流業(yè)的發(fā)展尤為迅猛,發(fā)展中國家也在逐步的進(jìn)步。我國雖然物流行業(yè)起步較晚,但是人口眾多、土地幅員遼闊,市場潛力巨大,特別是在電商迅猛發(fā)展的刺激下,我國物流業(yè)實(shí)現(xiàn)了跨越式發(fā)展[2]。物流給人們的生活帶來的改變也越來越顯著,無論是網(wǎng)購已經(jīng)成為人們?nèi)粘I钕M(fèi)的一部分;還是國際貿(mào)易、大宗商品的交易越來越便捷都能清晰的表現(xiàn)出來。當(dāng)下,無論是科技革命的發(fā)展還是最近的疫情應(yīng)對中,物流都在其中扮演著重要的角色,這些足以說明物流將會(huì)成為未來拉動(dòng)我國經(jīng)濟(jì)增長的重要助力。正因?yàn)槲锪鳂I(yè)的重要性越來越顯著,對物流行業(yè)的分析也越來越多,研究的目光大多集中在成功的上市公司上。本文以研究上市公司會(huì)計(jì)報(bào)表為基礎(chǔ),先選出了報(bào)表中基本的12 個(gè)指標(biāo),隨后利用隨機(jī)森林的方法進(jìn)行指標(biāo)的篩選,選出了覆蓋80%以上信息的6 個(gè)指標(biāo),接著根據(jù)Pearson 相關(guān)系數(shù)選擇了符合篩選原則的閾值來構(gòu)造公司間的網(wǎng)絡(luò),最后根據(jù)網(wǎng)絡(luò)中心性指標(biāo)從中篩選出重要的上市公司,再進(jìn)行深度剖析。
本文通過Wind 對物流企業(yè)的會(huì)計(jì)報(bào)表進(jìn)行處理,得到了12 個(gè)指標(biāo),隨后用隨機(jī)森林進(jìn)行指標(biāo)的特征重要性評價(jià)。隨機(jī)森林是一種組合分類器,最基本的是決策樹[3]。本文在決策樹的生成過程中,節(jié)點(diǎn)分裂遵循的原則為最大程度降低該節(jié)點(diǎn)的不純度,達(dá)到局部最優(yōu)化。目前大多數(shù)的分裂方法有ID3、C4.5 和CART。ID3 算法指的是信息增益;C4.5 算法指的是信息增益率;CART 算法指的是Gini系數(shù)[4]。ID3 和C4.5 對選擇的節(jié)點(diǎn)可分裂成多個(gè)子節(jié)點(diǎn),但是不支持特征的組合,只能用于分類問題;然而CART 對每個(gè)節(jié)點(diǎn)只會(huì)分裂成兩個(gè)子節(jié)點(diǎn),所以支持特征的組合,可用于分類和回歸問題。本文進(jìn)行的是特征的重要性排序,即組合,因此本文采用CART 分裂算法。Gini系數(shù)是指一個(gè)隨機(jī)樣本被分錯(cuò)的概率,則其公式如下:
其中:pk表示選中樣本屬于k類別的概率,則不屬于k類別的概率便是1-pk。CART 的分類規(guī)則是選用Gini系數(shù)較小的屬性作為分類屬性。
本文基于特征重要性對12 個(gè)指標(biāo)進(jìn)行篩選,并選擇出了涵蓋80%以上信息的6 個(gè)指標(biāo)。
Pearson 相關(guān)系數(shù)是衡量向量相似度的一種方法,即兩個(gè)變量之間的協(xié)方差和標(biāo)準(zhǔn)差的商,其在比較變量相似度方面應(yīng)用較廣。本文采用Pearson 相關(guān)系數(shù)度量不同公司的相關(guān)性,輸出范圍為-1 到+1,0 代表無相關(guān)性,負(fù)值為負(fù)相關(guān),正值為正相關(guān),其公式如下:
由于一籃子指數(shù)內(nèi)的公司同屬于物流行業(yè),故其相似程度較高,直接判斷區(qū)分度不大,所以在這里需要設(shè)置閾值,閾值的設(shè)立本文遵循使其網(wǎng)絡(luò)中拓?fù)浣Y(jié)構(gòu)穩(wěn)定,并且可以很好地反應(yīng)股票網(wǎng)絡(luò)的內(nèi)在性質(zhì)[5],這樣能清晰的看出它們之間的區(qū)別,緊接著根據(jù)相關(guān)系數(shù)構(gòu)造臨邊,就可以進(jìn)一步生成公司間的網(wǎng)絡(luò)[6-7]。
復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)重要性的評價(jià)方法源于圖論和網(wǎng)絡(luò)分析理論,網(wǎng)絡(luò)的分析主要通過各種中心性指標(biāo)來進(jìn)行度量。中心性指標(biāo)由Bavelas 在1948 年首次提出,之后Freeman 在1979 年設(shè)計(jì)了最為經(jīng)典的3 種中心性:度中心性、中介中心性和鄰近中心性[8]。
本文選擇了度中心性作為評價(jià)指標(biāo),度是指在網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)其直接聯(lián)系的節(jié)點(diǎn)的個(gè)數(shù),而度中心性是在網(wǎng)絡(luò)科學(xué)中分析節(jié)點(diǎn)中心性時(shí)最直接的一個(gè)度量指標(biāo)。其表達(dá)為,一個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)度越大就意味著這個(gè)節(jié)點(diǎn)的度中心性越高,那么此時(shí)該節(jié)點(diǎn)在網(wǎng)絡(luò)中就顯得越重要。一個(gè)包含N個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)中,節(jié)點(diǎn)最大可能的度值為N-1,通常為了便于比較而對中心性指標(biāo)作歸一化處理[9],度數(shù)為ki的i節(jié)點(diǎn)的歸一化度中心性定義為:
本文用的數(shù)據(jù)是中證指數(shù)下的滬港深通物流指數(shù)在2015 到2019 年的年報(bào)。選擇滬港深通物流指數(shù),因?yàn)槠渲笖?shù)內(nèi)涵蓋的中國物流上市公司最為全面,并且是由中證指數(shù)有限公司所開發(fā),具有一定權(quán)威性。而年報(bào)是反映公司一年內(nèi)運(yùn)營狀況的重要來源,也是國家要求披露并受監(jiān)督的文件,其價(jià)值巨大。本文將報(bào)表中的數(shù)據(jù)進(jìn)行整理,選出了“每股收益(元)”,“每股凈資產(chǎn)(元)”,“銷售毛利率(%)”,“銷售凈利率(%)”,“凈資產(chǎn)收益率(%)”,“主營業(yè)務(wù)收入增長率(%)”,“凈利潤增長率(%)”,“應(yīng)收賬款周轉(zhuǎn)率(次)”,“存貨周轉(zhuǎn)率(次)”,“流動(dòng)比率(倍)”,“速動(dòng)比率(倍)”,“資產(chǎn)負(fù)債率(%)”組成本文的特征數(shù)據(jù),極少數(shù)的缺失數(shù)據(jù)設(shè)為零,漲跌情況是用0、1 表示,漲跌時(shí)間段是年報(bào)所反映的時(shí)間段,具體如表1所示。
表1 數(shù)據(jù)介紹
本文將經(jīng)過處理的滬港深通物流指數(shù)2015 到2019 年的年報(bào)數(shù)據(jù)用隨機(jī)森林進(jìn)行特征篩選,輸出特征重要性,結(jié)果如圖1所示。
圖1 2015 到2019 年指數(shù)數(shù)據(jù)的特征重要性輸出圖
本文選出的六個(gè)指標(biāo)為:2015 年:主營業(yè)務(wù)收入增長率,應(yīng)收賬款周轉(zhuǎn)率,存貨周轉(zhuǎn)率,流動(dòng)比率,速動(dòng)比率,資產(chǎn)負(fù)債率;2016 年:每股凈資產(chǎn),銷售凈利率,凈資產(chǎn)收益率,流動(dòng)比率,速動(dòng)比率,資產(chǎn)負(fù)債率;2017 年:每股收益,每股凈資產(chǎn),凈資產(chǎn)收益率,主營業(yè)務(wù)收入增長率,存貨周轉(zhuǎn)率,速動(dòng)比率;2018 年:每股收益,銷售凈利率,凈資產(chǎn)收益率,應(yīng)收賬款周轉(zhuǎn)率,存貨周轉(zhuǎn)率,流動(dòng)比率;2019 年:每股凈資產(chǎn),凈資產(chǎn)收益率,主營業(yè)務(wù)收入增長率,應(yīng)收賬款周轉(zhuǎn)率,存貨周轉(zhuǎn)率,流動(dòng)比率。每年選出的6 個(gè)特征均涵蓋了80%以上的信息。
然后,本文又用Pearson 系數(shù)對篩選出的數(shù)據(jù)進(jìn)行矩陣化,得到了Pearson 相關(guān)系數(shù)矩陣。根據(jù)閾值篩選原則,本文得到閾值0.9,得出2015 到2019 年輸出圖,2015 年結(jié)果如圖2 所示。
從圖中得到在2015 年物流行業(yè)有較大影響力的公司為中遠(yuǎn)海發(fā)、中遠(yuǎn)???、中遠(yuǎn)海運(yùn)港口、北部灣港、光匯石油、日照港。
2016 到2019 年得到的有影響力的公司分別為:2016:中遠(yuǎn)海能、東方海外國際、嘉里物流、中遠(yuǎn)海特、中信海直;2017:中遠(yuǎn)??亍⑸钲谌A強(qiáng)、淮河能源、小商品城、鐵龍物流;2018:中遠(yuǎn)???、海豐國際、東方海外國際、韻達(dá)控股、順豐控股;2019 年:寧波港、北部港灣、白云機(jī)場、天津港發(fā)展、順豐控股。從中不難發(fā)現(xiàn)從2016 年和2017 年只有嘉里物流一個(gè)民營企業(yè),到2018 年和2019 年順豐控股、韻達(dá)控股的嶄露頭角,物流行業(yè)的重要企業(yè)呈現(xiàn)出日新月異的變化和發(fā)展,隨著物流行業(yè)整體的大發(fā)展和民營企業(yè)的不斷進(jìn)步,物流行業(yè)整體上發(fā)展還是較為樂觀。
本文研究了2015 到2019 年的滬港深通指數(shù)內(nèi)上市公司的會(huì)計(jì)報(bào)表的數(shù)據(jù)信息,認(rèn)為每個(gè)階段所發(fā)布的會(huì)計(jì)報(bào)表其所反映的上市公司的信息與當(dāng)下其股價(jià)波動(dòng)是有關(guān)聯(lián)的,進(jìn)而能反映出上市公司在行業(yè)內(nèi)的影響力,所以本文對報(bào)表進(jìn)行分析進(jìn)而研究。首先,通過Wind 數(shù)據(jù)庫對報(bào)表進(jìn)行預(yù)處理,從報(bào)表中整理出了基本的12 個(gè)指標(biāo)數(shù)據(jù),其次運(yùn)用了隨機(jī)森林的方法,以報(bào)表時(shí)間內(nèi)的漲跌情況為結(jié)果,輸出涵蓋信息80%以上的6 個(gè)指標(biāo),基于Pearson 相關(guān)系數(shù)結(jié)合閾值0.9 進(jìn)行矩陣化,并生成網(wǎng)絡(luò)圖,然后利用網(wǎng)絡(luò)科學(xué)的知識(shí)進(jìn)行節(jié)點(diǎn)重要性分析,進(jìn)而得到重要節(jié)點(diǎn)。從結(jié)果中不難發(fā)現(xiàn),我國物流上市公司的重要節(jié)點(diǎn)分布從2015 年的純國企到近兩年像順豐控股和韻達(dá)控股這樣優(yōu)秀私企的出現(xiàn)[10],說明我國物流行業(yè)的發(fā)展越來越多元化,私企的聲音也越來越大。
本文提出的基于會(huì)計(jì)報(bào)表和網(wǎng)絡(luò)中心性的對物流行業(yè)的研究,一方面拓寬了對物流行業(yè)研究的視角;另一方面也結(jié)合了機(jī)器學(xué)習(xí)、會(huì)計(jì)知識(shí)和網(wǎng)絡(luò)中心性分析契合當(dāng)下的多學(xué)科結(jié)合發(fā)展的熱潮。當(dāng)然,本文的研究也有不足:首先,本文對網(wǎng)絡(luò)中心性分析存在欠缺,完全可以考慮多個(gè)指標(biāo);其次,對選出的物流企業(yè)完全可以再進(jìn)行更深度的剖析,這也是接下來要進(jìn)行的工作。
圖2 2015 年結(jié)果輸出圖