鄧尚昆, 王晨光, 曹成航, 樊雅婷
(1. 三峽大學(xué) 經(jīng)濟(jì)與管理學(xué)院, 湖北 宜昌 443002; 2. 三峽大學(xué) 金融研究所, 湖北 宜昌 443002)
現(xiàn)代意義上的證券交易起源于1792年美國紐約證券交易所的誕生,從此證券市場日益發(fā)展壯大。在證券市場逐步演變?yōu)橹匾馁Y本市場的同時,形形色色的證券欺詐行為也隨之產(chǎn)生。而其中數(shù)量最大、對證券交易公平性影響最惡劣的犯罪行為莫過于內(nèi)幕交易(Insider Trading)。
各國政府對于證券市場內(nèi)幕交易的打擊與監(jiān)管從未停止。美國政府為此專門成立了“證券交易管理委員會”(SEC,Securities and Exchange Commission),英國政府也專門成立了“審慎監(jiān)管局”(PRA, Prudential Regulation Authority)與“金融行為監(jiān)管局”(FCA,F(xiàn)inancial Conduct Authority);日本政府針對證券市場上內(nèi)幕交易行為也投入了大量的資源用以應(yīng)對,并于1948年5月頒布《證券交易法》。由于內(nèi)幕交易形式的不斷變化,日本在1997年和2013年對證券交易法進(jìn)行了修改與完善。在我國,政府對于內(nèi)幕交易行為采取零容忍的態(tài)度,通過不斷完善相關(guān)法律等手段加強監(jiān)管力度,并于2011年實行了內(nèi)幕信息知情人登記管理制度。
截至2017年底,中國證券市場(不包括香港證券交易所)總市值約7萬億美元,居世界第二位,成為世界金融市場重要的組成部分。然而,每年發(fā)生的眾多內(nèi)幕交易行為給證券市場及市場交易者造成了巨大損失。隨著中國證券市場的不斷發(fā)展,內(nèi)幕交易手段的日益策略化、內(nèi)幕交易主體構(gòu)成的多元化與內(nèi)幕交易形式的多樣化、隱蔽化等特點,如何對內(nèi)幕交易進(jìn)行及時有效的監(jiān)管與防治在未來一段時間內(nèi)仍將是亟需解決的問題。事實上,早期關(guān)于內(nèi)幕交易的理論研究大部分都局限在法學(xué)領(lǐng)域,并沒有引起經(jīng)濟(jì)學(xué)界的廣泛關(guān)注。早期的法律學(xué)者討論的焦點主要是關(guān)于內(nèi)幕交易行為是否是一種公平的行為,以及其是否對外部投資者的利益有所損害,由于缺乏嚴(yán)謹(jǐn)?shù)倪壿嬂碚摽蚣埽荒芙o出對內(nèi)幕交易有效的識別方法。隨著機器學(xué)習(xí)方法的發(fā)展,利用機器學(xué)習(xí)算法從大量數(shù)據(jù)中提取有效信息,并建立內(nèi)幕交易識別模型輔助以往的人工監(jiān)督審查將會成為監(jiān)管方法的新趨勢。
目前,國內(nèi)外學(xué)者關(guān)于內(nèi)幕交易的研究多數(shù)是從法律論證與制度討論等理論層面進(jìn)行,針對內(nèi)幕交易行為,從數(shù)據(jù)挖掘角度進(jìn)行內(nèi)幕交易行為識別的研究較少。其中,在公司治理體系與財務(wù)狀況方面,Scott和John通過內(nèi)部交易變量和公司具體財務(wù)數(shù)據(jù)特征對內(nèi)幕交易行為進(jìn)行甄別,并獲得了60%的內(nèi)幕交易甄別準(zhǔn)確率[1]。Maug[2]從公司治理層面分析了大股東與上市公司管理人員串謀的可能性并指出禁止內(nèi)幕交易可以促使公司價值與中小股東利益的最大化[3];Wu在研究中發(fā)現(xiàn),上市公司股東權(quán)利越大,發(fā)生內(nèi)幕交易行為的概率越大[4];唐其鳴與張云從公司治理層面考慮,發(fā)現(xiàn)企業(yè)治理較好的公司,其內(nèi)幕交易發(fā)生的概率較低,實證結(jié)果也表明內(nèi)幕交易發(fā)生的根本原因之一為公司治理不善[5];在證券市場相關(guān)性指標(biāo)方面,Kyle[6]認(rèn)為內(nèi)幕交易造成股票買賣價差的提高與交易成本的增加,從而使證券市場流動性降低;汪貴浦[7]運用內(nèi)幕交易行為發(fā)生過程中的信息含量建立Logistic二元辨別模型,獲得了70.59%的正確率;孫開連等以內(nèi)幕信息中大戶持股集中度為敏感信息,對內(nèi)幕交易行為的識別進(jìn)行了實證分析與檢驗[8]。王春峰等[9]對回報率、波動性與交易量之間的變化關(guān)系進(jìn)行了實證檢驗,并得出了我國證券市場上存在普遍的、程度較為嚴(yán)重的內(nèi)部知情人通過內(nèi)幕消息來操縱股價與公共信息私有化現(xiàn)象的這一結(jié)論;史永東與蔣賢峰[10]同樣運用了Logistic法,通過換手率與收益率兩個指標(biāo)建立甄別模型,在0.5的閾值下正確率達(dá)到75%;張宗新等[11]選用了收益率、波動率、流動性等作為辨別指標(biāo),分別建立了Logistic模型和決策樹模型對內(nèi)幕交易行為進(jìn)行識別;王春峰等使用信息交易概率作為衡量證券市場信息非對稱程度的指標(biāo),建立了關(guān)于波動性、流動性與信息交易概率之間關(guān)系的回歸模型,其實證結(jié)果表明在中國證券市場中信息交易概率與市場流動性正相關(guān),而與市場波動性負(fù)相關(guān)[12]。張宗新[13]在其之前研究的基礎(chǔ)上又進(jìn)一步采用神經(jīng)網(wǎng)格建立辨別模型并與決策樹模型和Logistic模型進(jìn)行了比較分析;沈冰與趙小康通過超額換手率、累計超額收益率、股價波動持久性、股價信息含量與股權(quán)制衡度五個指標(biāo)利用支持向量機(SVM,Support Vector Machine)建立內(nèi)幕交易識別模型[14]對內(nèi)幕交易行為進(jìn)行識別,這對機器學(xué)習(xí)方法識別內(nèi)幕交易的發(fā)展具有重要的指導(dǎo)意義。
綜合來看,國內(nèi)外學(xué)者在內(nèi)幕交易識別指標(biāo)的選取上各有異同,分別從不同角度運用不同方法建立了辨別模型來加以分析,但在識別指標(biāo)的計算中關(guān)于指標(biāo)時間區(qū)間(時間窗口期的長度)的劃定缺乏嚴(yán)謹(jǐn)?shù)囊罁?jù),且在識別指標(biāo)之間對于識別結(jié)果的貢獻(xiàn)度也無明確的分析和比較。內(nèi)幕交易始發(fā)于內(nèi)幕信息的泄露,而內(nèi)幕信息通常形成于公司內(nèi)部,因此,在內(nèi)幕交易的識別過程中,公司治理層面可以看做是內(nèi)在因素,市場微觀指標(biāo)的變化可以看做是外在表現(xiàn)。本文擬利用機器學(xué)習(xí)中的隨機森林算法,因其具有較高魯棒性、不易過擬合與可快速準(zhǔn)確處理大量數(shù)據(jù)等特點[15],從公司股權(quán)結(jié)構(gòu)、財務(wù)數(shù)據(jù)、治理體系以及證券市場微觀表現(xiàn)方面綜合篩選特征指標(biāo)來對證券市場內(nèi)幕交易樣本進(jìn)行訓(xùn)練與識別。
本文選用2001至2017年證監(jiān)會公布的內(nèi)幕交易案件作為陽性樣本,其中同一上市公司不同時間段內(nèi)多次發(fā)生過內(nèi)幕交易的案件按照多個樣本分別處理,并按照1∶1的數(shù)量選取陰性樣本。為了盡可能排除指標(biāo)外因素的影響(政策、市場、總體行情等),陰性樣本的選取原則為與陽性樣本從屬于同一行業(yè),并且在同一年發(fā)生過同一類重大事件且至今從未被證監(jiān)會處罰過的上市公司。由于證監(jiān)會公布的內(nèi)幕交易案件中部分樣本指標(biāo)的數(shù)據(jù)存在部分缺失、陽性樣本不存在滿足控制變量條件下相應(yīng)的陰性樣本、發(fā)生內(nèi)幕交易但沒有確切記載內(nèi)幕消息公示時間的樣本等原因,為了提高識別模型的準(zhǔn)確度與實際應(yīng)用推廣力,本文經(jīng)剔除不合規(guī)樣本,共篩選出陽性樣本171個,對應(yīng)的陰性樣本共164個,合計共335個樣本。相關(guān)數(shù)據(jù)主要來源于中國證券監(jiān)督管理委員會官網(wǎng)①與東方財富網(wǎng)②。
在利用數(shù)據(jù)特征研究內(nèi)幕交易識別的過程中,首先要選擇識別指標(biāo)。能否從證券市場海量的數(shù)據(jù)中利用可以作為有效識別內(nèi)幕交易的指標(biāo)將影響內(nèi)幕交易識別模型的精度。本研究從我國證券市場上市公司股票微觀表現(xiàn)、財務(wù)數(shù)據(jù)、股權(quán)結(jié)構(gòu)以及治理體系四個方面搜集相應(yīng)數(shù)據(jù)進(jìn)行識別指標(biāo)的計算。然后在控制變量的角度下盡可能找出相同數(shù)量的未發(fā)生內(nèi)幕交易的股票樣本,并收集和計算特征指標(biāo),對部分存在缺失的數(shù)據(jù)采用一定方式填補或刪除,最后完成所有樣本識別指標(biāo)的收集。其中:
(1)在證券市場微觀表現(xiàn)方面,分別從波動性、收益性、流動性與風(fēng)險層面考慮指標(biāo)的選取。其中波動性指標(biāo)通過GARCH模型用股價波動持久性衡量:
(1)
收益性指標(biāo)分別選取樣本股票相對同規(guī)模超額回報率、相對本市場超額回報率、相對同風(fēng)險超額回報率,采用事件窗口期內(nèi)累加求和的計算方式,另外,選用Sigma系數(shù)來衡量收益的波動性。
流動性指標(biāo)選取在不同事件窗口期內(nèi)的總股數(shù)換手率與流通股換手率的均值。風(fēng)險層面選用Beta系數(shù)來衡量。
(2)在上市公司財務(wù)數(shù)據(jù)方面,從每股指標(biāo)的角度上選取市盈率、市凈率與市銷率,從資本結(jié)構(gòu)及其償債能力角度上選取資產(chǎn)負(fù)債率、流動比率與速動比率,從營運能力角度上選取總資產(chǎn)周轉(zhuǎn)率,從成長力的角度上選取營業(yè)收入增長率與總資產(chǎn)增長率,從盈利與收益能力角度上選取凈資產(chǎn)收益率、資產(chǎn)收益率與營業(yè)利潤比率。
表1 指標(biāo)變量的選取
(3)在上市公司股權(quán)結(jié)構(gòu)與治理方面選擇CR5指數(shù)、CR10指數(shù)、Z指數(shù)、H5指數(shù)、H10指數(shù)、年度股東大會會議出席率。其中對于上市公司財務(wù)數(shù)據(jù)與股權(quán)結(jié)構(gòu)治理數(shù)據(jù)指標(biāo)的選取時間段,考慮到財務(wù)報表公示數(shù)據(jù)的滯后性與不同行業(yè)公司運營的差異性,本文統(tǒng)一選取內(nèi)幕交易發(fā)生時間點上一年度末的相應(yīng)數(shù)據(jù)。關(guān)于指標(biāo)變量的選取詳見表1。
對于證券市場微觀指標(biāo)的選取時間段,學(xué)者袁理[16],以及沈冰和趙小康[14]等都采用信息公告日前30個交易日為研究時間段,但選取時間段內(nèi)是否真正發(fā)生完整的內(nèi)幕交易行為對模型的識別重要度較高,證監(jiān)會公布的處罰決定雖然公示了內(nèi)幕交易案件參與人的整個賬戶流水,但對于內(nèi)幕交易的起始期,無論從法律推理上還是在實際案件調(diào)查中都無法準(zhǔn)確判別。若選取事件窗口期過長,影響數(shù)據(jù)的因素也會越多,則可能使建立的模型識別效果較差;反之,若選取事件窗口期過短,則有可能沒有包含內(nèi)幕交易發(fā)生的全部時間段,從而可能在較大程度上降低辨別模型的準(zhǔn)確性與實際操作應(yīng)用性。因此,本文分別選取內(nèi)幕消息公示日期前30、60和90個交易日并對其相應(yīng)的七種時序?qū)傩灾笜?biāo)(Sigma系數(shù)、Beta系數(shù)、換手率、波動率與三種超額累計回報率指標(biāo))進(jìn)行計算,再與其他指標(biāo)一起代入分別建模并進(jìn)行對比檢驗,選出最佳對應(yīng)模型。在實際案件辨別應(yīng)用中,研究者也可以根據(jù)情況分別選擇不同事件窗口期進(jìn)行辨別。通過查找與統(tǒng)計,在公布的內(nèi)幕交易股票樣本中存在指標(biāo)數(shù)據(jù)的缺失。舍棄含有缺失數(shù)據(jù)的樣本造成樣本數(shù)量的減少一般會降低辨別模型的解釋度,但利用含有缺失數(shù)據(jù)的樣本過程中對其缺失數(shù)據(jù)處理不當(dāng)形成的噪聲又會對模型精確度產(chǎn)生干擾。本文借鑒肖亞明等[17]關(guān)于處理分類變量缺失數(shù)據(jù)的思想,采用以下處理原則:對于同一個樣本對應(yīng)不同指標(biāo)數(shù)值缺失較多時予以舍棄;對于同一樣本個別指標(biāo)數(shù)值的缺失,利用其他未缺失該項指標(biāo)的樣本指標(biāo)均值予以代替。相關(guān)數(shù)據(jù)指標(biāo)主要來源于CCER經(jīng)濟(jì)金融數(shù)據(jù)庫③與RESSET銳思金融研究數(shù)據(jù)庫④。
本文利用機器學(xué)習(xí)算法中的隨機森林算法建立內(nèi)幕交易的識別模型。隨機森林是一個包含多個決策樹的分類器,其輸出的類別是由個別樹輸出的類別的眾數(shù)而定,因此不僅克服了大量參數(shù)的選擇問題、擁有較高的魯棒性,而且具有在決定類別時可評估變量的重要性、不易出現(xiàn)過擬合的情況與可快速準(zhǔn)確處理大量數(shù)據(jù)的特點,最早是由Breiman和Cutler提出[15]。
Cutler等[18]認(rèn)為隨機森林算法包括了變量的交互作用并且可以對所有變量進(jìn)行重要性評估,因此無需考慮一般回歸問題如Logistic回歸等面臨的多元共線性的情況,本文將查找到的陽性樣本和陰性樣本與其對應(yīng)的特征指標(biāo)作為隨機森林模型的輸入集從而構(gòu)成內(nèi)幕交易識別模型,內(nèi)幕交易識別模型的流程示意圖見圖1。
圖1 基于隨機森林的內(nèi)幕交易識別流程
(2)
其中K表示有K個類別,pmk表示節(jié)點m中類別k所占的比例。特征Xj在節(jié)點m的重要性,即節(jié)點m分枝前后的GI變化量為:
(3)
其中,GIl與GIr分別表示分枝后兩個新節(jié)點的GI。若特征Xj在決策樹M中出現(xiàn)的節(jié)點在集合M中,則Xj在第i棵數(shù)的重要性為:
(4)
設(shè)隨機森林共有n棵樹,則:
(5)
所求重要性評分歸一化:
(6)
本實驗選定隨機森林參數(shù)ntree為1000,mtry選取5進(jìn)行計算。為了檢測模型的分類識別效果,實驗把所收集得到的樣本隨機分為訓(xùn)練集和預(yù)測集。其中預(yù)測集樣本數(shù)量與訓(xùn)練集樣本數(shù)量之比為3∶7。表2為分別以30、60和90個交易日作為不同事件窗口期建模之后測試數(shù)據(jù)的內(nèi)幕交易判別準(zhǔn)確度實驗結(jié)果。
表2 事件窗口期的選擇與其對應(yīng)的識別準(zhǔn)確度
由表2可知,以重大事件發(fā)生前的60個交易日內(nèi)的證券市場微觀指標(biāo)為依據(jù)組合建立的模型識別準(zhǔn)確度最高,達(dá)到79.17%,相比于選擇為30日、90日時分別高出3.41%和5.13%。這意味著以重大事件發(fā)生前60個交易日左右的時間段內(nèi)的相應(yīng)數(shù)據(jù)指標(biāo)對內(nèi)幕交易的解釋度最大,內(nèi)幕交易在這段時期內(nèi)的發(fā)生率也最高。
隨機森林分類算法通常要在決策時對激進(jìn)和保守的識別之間達(dá)到平衡。本文在內(nèi)幕交易的識別過程中,可以構(gòu)建一種非常激進(jìn)的模型以即使誤判非內(nèi)幕交易樣本為代價來確保盡量不誤判任何一個內(nèi)幕交易樣本;另一方面,如果要保證盡量沒有非內(nèi)幕交易樣本被錯誤地分類,可能要容許難以接受數(shù)目的內(nèi)幕交易樣本通過分類器成為非內(nèi)幕交易樣本。因此,無論哪一種偏激建模在實際識別運用中都難以提高模型整體的識別效率。為了更進(jìn)一步分析模型的識別效果,對于訓(xùn)練集之外的預(yù)測集,本文引入召回率(Recall)與特異性(Specificity)指標(biāo)來度量識別效果:
(7)
(8)
其中TP指真陽性樣本數(shù),F(xiàn)P指假陽性樣本數(shù),TN指真陰性樣本數(shù),F(xiàn)N指假陰性樣本數(shù)。Recall為召回率,反映了內(nèi)幕交易被正確判定的比例占總的正例的比重,Specificity為特異性,反映了非內(nèi)幕交易被正確判定的比例占總的非內(nèi)幕交易樣本的比重,與Recall相對應(yīng)。
由表3可知,在本文已構(gòu)建的識別模型中,在事件窗口期為30個交易日時,模型的召回率為77.55%,特異性為74%,在事件窗口期為60個交易日時,模型的召回率為77.55%,特異性為80.85%;在事件窗口期定為90個交易日時,模型的召回率為82%,特異性為66.67%。
表3 事件窗口期的選擇與其對應(yīng)召回率與特異性結(jié)果
由于內(nèi)幕交易行為對證券市場健康發(fā)展的巨大危害性,監(jiān)管者在進(jìn)行逐個排查前初步運用模型辨別樣本時可能更希望不漏掉發(fā)生了內(nèi)幕交易的樣本。因此,本文識別模型對于內(nèi)幕交易樣本識別的召回率相比模型整體識別(包含內(nèi)幕交易樣本與非內(nèi)幕交易樣本)的正確率更加具有實際參考意義。從此角度來看,在事件窗口期為90個交易日時的辨別模型辨別最優(yōu),其模型的召回率為82%,這意味著對于內(nèi)幕交易樣本的識別率即召回率達(dá)到82%,相比模型整體識別的準(zhǔn)確度高出7.96%,但模型特異性僅為66.67%。相比該模型的召回率與準(zhǔn)確度均有一定差距。由于本文對陰性樣本的選擇是基于一定的假設(shè)(即不考慮發(fā)生了內(nèi)幕交易而未被發(fā)現(xiàn)的情況),若考慮內(nèi)幕交易隱蔽性高的特點,實際內(nèi)幕交易發(fā)生量則可能遠(yuǎn)高于被查處的案件量,因此模型特異性的結(jié)果很可能受實際發(fā)生了內(nèi)幕交易卻沒有被監(jiān)管部門查處,從而被本文誤作為陰性樣本處理所影響。
圖2為以重大事件發(fā)生前的60個交易日內(nèi)的證券市場微觀指標(biāo)為依據(jù)組合建立的隨機森林模型中以Gini指數(shù)度量的指標(biāo)變量對識別模型的貢獻(xiàn)度得分。
圖2 指標(biāo)變量重要性評分
由圖2可以看出,在識別模型的Gini指數(shù)重要性評分中,凈資產(chǎn)收益率指標(biāo)得分最高,累計相對同風(fēng)險超額回報率與總資產(chǎn)周轉(zhuǎn)率指標(biāo)的得分次之,年度股東大會會議的出席率得分最低。一般情況下,公司的自有資本獲取收益的能力隨其凈資產(chǎn)收益率的增高而增高,公司的運營效益也隨其凈資產(chǎn)收益率的增高而更好。進(jìn)一步分析發(fā)現(xiàn),所選樣本中陽性樣本中凈資產(chǎn)收益率的均值為1.33,陰性樣本中凈資產(chǎn)收益率的均值為9.67,其明顯大于陽性樣本的資產(chǎn)收益率。一般情況下,公司的周轉(zhuǎn)速度隨公司總資產(chǎn)周轉(zhuǎn)率的升高而加快,公司的營運能力隨公司總資產(chǎn)周轉(zhuǎn)率的升高而增強。在本文所選取的數(shù)據(jù)集中,總資產(chǎn)周轉(zhuǎn)率陰性樣本均值為136.79,陽性樣本均值為58.59。因此,相比而言未發(fā)生內(nèi)幕交易樣本的總資產(chǎn)周轉(zhuǎn)率較高,這意味著發(fā)生內(nèi)幕交易的上市公司其經(jīng)營效益普遍弱于未發(fā)生內(nèi)幕交易的上市公司。
圖3為以重大事件發(fā)生前的60個交易日內(nèi)的證券市場微觀指標(biāo)為例的包括陰性樣本與陽性樣本在內(nèi)的所有樣本對應(yīng)的相對同規(guī)模超額累計回報率、相對本市場超額累計回報率與相對同風(fēng)險超額累計回報率三者之間的相關(guān)性分析圖。由圖3可以看出,三者之間存在著高度正向線性相關(guān)性。
圖3 指標(biāo)相關(guān)性分析
進(jìn)一步對不同類別樣本的超額累計回報率指標(biāo)數(shù)據(jù)分析發(fā)現(xiàn),發(fā)生內(nèi)幕交易案件的陽性樣本其相對本市場超額累計回報率、相對同規(guī)模超額累計回報率與相對同風(fēng)險超額累計回報率分別為13.51%、13.73%和13.91%,而未發(fā)生內(nèi)幕交易案件的陰性樣本其相對本市場超額累計回報率、相對同規(guī)模超額累計回報率與相對同風(fēng)險超額累計回報率分別為0.95%、0.02%和-0.36%。針對三種累計超額回報率相比而言,發(fā)生內(nèi)幕交易的股票樣本在內(nèi)幕消息公布前的60日內(nèi)普遍比未發(fā)生內(nèi)幕交易的股票獲得更多的超額回報。在發(fā)生內(nèi)幕交易的樣本股票中,大多數(shù)內(nèi)幕消息屬于利好信息,因此在內(nèi)幕信息被泄露后,可能是知曉內(nèi)幕信息的知情人大量買入標(biāo)的股票或是內(nèi)幕信息的逐漸擴散化,這將導(dǎo)致標(biāo)的股票的價格因為資金的入場而上升。隨著重大信息公示日的逐漸來臨,市場上部分敏感投資者也能夠從標(biāo)的股票股價的變化上得出信息從而買進(jìn),使得股票的價格又進(jìn)一步攀升。那么實際上在利好消息未公示之前,市場就已經(jīng)完全、甚至過度“消化”了利多因素,在消息公示之日,內(nèi)幕信息的操縱者往往還會通過媒體等宣傳手段大造聲勢,利用市場投資者對重大信息將帶來的上漲預(yù)期在公告日后繼續(xù)拉抬股價,而后在高位套現(xiàn)離場,獲取更大的超額回報,從而損害廣大投資者的切身利益。
本研究選取了2001年1月1日至2017年5月31日中國證監(jiān)會公開處罰的171個發(fā)生內(nèi)幕交易的上市公司為陽性樣本,采用1比1配對同樣數(shù)量的陰性樣本,并從公司股權(quán)結(jié)構(gòu)、財務(wù)數(shù)據(jù)、治理體系以及證券市場微觀表現(xiàn)方面選取了26個識別指標(biāo),對缺失數(shù)據(jù)進(jìn)行相應(yīng)處理后分別按照不同事件窗口期利用機器學(xué)習(xí)算法隨機森林對內(nèi)幕交易進(jìn)行識別,分別以事件窗口期設(shè)定為30、60和90個交易日下計算的特征指標(biāo)為依據(jù)建模。實驗結(jié)果表明在內(nèi)幕消息公布前的60個交易日內(nèi)識別率最高,識別正確率達(dá)到79.17%,相較于選擇為30日、90日時分別高出3.41%與5.13%。在辨別模型的Gini指數(shù)重要性評分中,凈資產(chǎn)收益率指標(biāo)得分最高,年度股東大會會議的出席率指標(biāo)得分最低。陳國進(jìn)等[19]通過實驗發(fā)現(xiàn)上市公司業(yè)績水平和上市公司內(nèi)部人違規(guī)違法行為之間有密切負(fù)相關(guān)關(guān)系,原因可能是當(dāng)一個上市公司健康發(fā)展時,出于信譽與未來階段繼續(xù)融資的顧慮,公司內(nèi)部人員會自覺約束自身的違法違規(guī)行為。因此,提高上市公司的總體質(zhì)量在保護(hù)廣大中小投資者利益、減少上市公司內(nèi)部人違法違規(guī)方面具有重要的作用。此外,累計相對同風(fēng)險超額回報率指標(biāo)的重要性得分僅次于凈資產(chǎn)收益率,且與相對同規(guī)模超額累計回報率、相對本市場超額累計回報率呈高度正向相關(guān)性。其中,發(fā)生內(nèi)幕交易的股票樣本事件窗口期內(nèi)的累計回報率明顯高于未發(fā)生內(nèi)幕交易的股票樣本。綜上,超額累計回報率與凈資產(chǎn)收益率可以作為監(jiān)督證券市場中上市公司內(nèi)幕交易的兩個重要預(yù)警指標(biāo),在實際內(nèi)幕交易識別的運用中,有關(guān)監(jiān)管部門可以靈活選擇事件窗口期,有側(cè)重地對重要性得分較高的指標(biāo)如凈資產(chǎn)收益率等指標(biāo)進(jìn)行監(jiān)控,以作為預(yù)警提示。在本文提出的模型識別的基礎(chǔ)之上針對性地調(diào)查取證,從而可提高監(jiān)管效率和正確率。
注 釋:
① 中國證券監(jiān)督管理委員會(http://www.csrc.gov.cn/pub/newsite/)
② 東方財富網(wǎng)(http://www.eastmoney.com/)
③ CCER經(jīng)濟(jì)金融數(shù)據(jù)庫(http://www.cerdata.cn/Home/Login.aspx)
④ RESSET銳思金融研究數(shù)據(jù)庫(http://www.resset.cn/)