劉一粟,沙晉明,金 彪,2
1(福建師范大學(xué) 地理科學(xué)學(xué)院,福州 350007)
2(福建師范大學(xué) 軟件學(xué)院,福州 350108)
21世紀(jì)以來,新一代信息化測度持續(xù)發(fā)展,其理論與實踐都有了新的進(jìn)步.現(xiàn)有信息化水平測度體系多為多級指標(biāo),指標(biāo)選取與各級指標(biāo)權(quán)重的確定是一個不可忽視的問題.2015年,歐盟設(shè)計了一套測度歐洲數(shù)字經(jīng)濟與社會進(jìn)步的指標(biāo)體系——歐洲數(shù)字經(jīng)濟與社會進(jìn)步指數(shù)(DESI),跟隨社會發(fā)展,測度范圍進(jìn)行了調(diào)整和擴展[1].馬巖等使用層次分析法和專家打分法(德爾菲法)確定指標(biāo)權(quán)重[2],使用專家打分法并通過增加專家與問卷發(fā)放數(shù)量來提高準(zhǔn)確度[3,4];馬增林等使用波拉特法測度黑龍江農(nóng)業(yè)信息化水平,實際測度使用三個信息部門比重類指標(biāo)[5];朱婕、岳毅蒙等使用熵權(quán)法確定指標(biāo)權(quán)重,而指標(biāo)選取是通過綜合現(xiàn)有研究,總結(jié)分類得出[6,7];灰色關(guān)聯(lián)動態(tài)分析法可以得出影響信息化水平發(fā)展指標(biāo)的重要性排序及其時空動態(tài)變化[8];模糊綜合評價法是一種確定指標(biāo)權(quán)重的有效方法,其中選擇基準(zhǔn)指標(biāo)是關(guān)鍵環(huán)節(jié)[9];國家信息中心的全國信息社會發(fā)展指標(biāo)指標(biāo)考慮全面,分級科學(xué),曾應(yīng)用在全球信息社會發(fā)展水平測度上[10].
新一代信息化水平測度指標(biāo)體系在調(diào)整、擴展測度范圍的同時,指標(biāo)選取與權(quán)重確定仍是一個對測度結(jié)果科學(xué)性、準(zhǔn)確性有直接影響的重要因素.廣泛搜集已有指標(biāo)體系,綜合選取指標(biāo)從廣度上保證了指標(biāo)的全面性;使用專家打分法并增加調(diào)查問卷發(fā)放數(shù)量,能直接、便捷的借鑒已有經(jīng)驗,但在指標(biāo)保留與刪除、具體權(quán)重確定等在客觀性上有所缺失,亟需定量的數(shù)理方法參與到這一過程中來,以得出合理可靠、科學(xué)嚴(yán)謹(jǐn)?shù)男畔⒒綔y度指標(biāo)體系.
國家信息中心隸屬于國家發(fā)展和改革委員會,科研經(jīng)驗豐富,指標(biāo)框架設(shè)計合理,在數(shù)據(jù)獲取方面有得天獨厚的條件,頗具權(quán)威性,因此考慮借鑒此課題的指標(biāo)選取與整體框架,綜合十套信息化水平測度指標(biāo)體系,進(jìn)一步進(jìn)行修正,在具體指標(biāo)選取、權(quán)重確定中采用更多的數(shù)理方法,使相關(guān)指標(biāo)及其權(quán)重的確定更具有說服力.
信息化水平測度指標(biāo)體系的修正需要大量、準(zhǔn)確的數(shù)據(jù)作為支撐.為保證研究的科學(xué)性與準(zhǔn)確性,本文選取國家權(quán)威部門發(fā)布的統(tǒng)計數(shù)據(jù),主要包括《中國統(tǒng)計年鑒2016》[11]、《中國科技年鑒2016》[12]與《中國信息年鑒2016》[13].
為使不同指標(biāo)數(shù)據(jù)均具可比性與同趨化,需進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化.考慮到統(tǒng)計數(shù)據(jù)分布特征,采用maxmin標(biāo)準(zhǔn)化方法得出原統(tǒng)計數(shù)據(jù)的正向標(biāo)準(zhǔn)化數(shù)據(jù),公式如下:
式中,xik為第k地區(qū)第i個指標(biāo)的統(tǒng)計值,n為指標(biāo)個數(shù).
本文以現(xiàn)有諸多信息化水平測度指標(biāo)體系為基礎(chǔ),利用詞云分析、相關(guān)系數(shù)、變異系數(shù)遞進(jìn)式篩選指標(biāo),指標(biāo)分類后進(jìn)行類別內(nèi)部因子分析,確定指標(biāo)體系,使用3種客觀賦權(quán)法確定各指標(biāo)權(quán)重,最后計算各地區(qū)綜合排名、得分并對整體過程進(jìn)行總結(jié)分析.
綜合現(xiàn)有十套信息化測度指標(biāo)體系,得到186個指標(biāo),利用詞云分析提取關(guān)鍵詞并計算其出現(xiàn)頻率,能直觀顯示出186個指標(biāo)中被頻繁提及的指標(biāo).根據(jù)谷尼輿情圖悅picdata.cn熱詞分析工具分析得出熱詞圖詞頻與權(quán)重圖、關(guān)鍵詞詞頻表.
圖1 熱詞詞頻與權(quán)重圖
關(guān)鍵詞詞頻顯示,人均、比重這一類次詞頻最高,說明大多體系都包含了比值類相對指標(biāo).以具有權(quán)威性的國家信息中心發(fā)布的信息社會評測指標(biāo)為主,綜合以上詞頻圖,從十份信息化指標(biāo)體系的186個指標(biāo)中初步選取42個指標(biāo)(見表1),并從以上年鑒中提取、計算出這些指標(biāo)在全國31個省市區(qū)(不包括港、澳、臺)的具體值.
表1 關(guān)鍵詞詞頻表
統(tǒng)計數(shù)據(jù)不同指標(biāo)間可能具有較強的相關(guān)性,與其他指標(biāo)相關(guān)性較大的即視為冗余指標(biāo),可通過相關(guān)系數(shù)的計算予以剔除.計算42個指標(biāo)間的相關(guān)系數(shù),第i個指標(biāo)和第j個指標(biāo)的相關(guān)系數(shù)rij的計算公式:
式中,k為所考慮地區(qū);i、j為不同指標(biāo)(相同指標(biāo)相關(guān)系數(shù)為1);p為研究單元數(shù)量(本文中m=31).
相關(guān)系數(shù)說明指標(biāo)間差異性,變異系數(shù)可說明指標(biāo)內(nèi)部數(shù)據(jù)的離散程度,一般認(rèn)為,離散程度過小的指標(biāo),對不同地區(qū)間差異性的描述意義不大[14-16].對經(jīng)相關(guān)系數(shù)分析后剩余的34個指標(biāo)進(jìn)行變異系數(shù)分析,以進(jìn)一步簡化指標(biāo)體系:
式中,sk表示xik的樣本標(biāo)準(zhǔn)差,k表示具體指標(biāo)表示k指標(biāo)在i單元具體值的算數(shù)平均值.
表2 詞云分析指標(biāo)選取結(jié)果
綜合考慮變異系數(shù)與相關(guān)系數(shù),相關(guān)系數(shù)大于0.8說明兩組數(shù)據(jù)相關(guān)性強、大于0.9說明兩組數(shù)據(jù)相關(guān)性極強.計算42個指標(biāo)內(nèi)部兩兩相關(guān)系數(shù)、每個指標(biāo)與其他42個指標(biāo)相關(guān)系數(shù)范圍,進(jìn)而分別統(tǒng)計41個指標(biāo)中,與目標(biāo)指標(biāo)相關(guān)系數(shù)大于0.8、0.9的個數(shù),用Co1、Co2表示,此結(jié)果越大,說明該指標(biāo)越能被其他指標(biāo)說明,即其冗余性越高,考慮予以刪除.變異系數(shù)度量總體相對變異性,作為一個無量綱數(shù)可以表征總體內(nèi)部離散性.變異系數(shù)過小(本文取0.15),說明該指標(biāo)在研究區(qū)內(nèi)的區(qū)分度較小,考慮刪除指標(biāo).綜合變異系數(shù)(Cv)與相關(guān)系數(shù)的結(jié)果,刪除指標(biāo)如表3所示.
表3 初步刪除指標(biāo)一覽表
參照國家信息中心所制定的信息社會評價指標(biāo)體系,將剩余25個指標(biāo)分為4類,在組內(nèi)分別進(jìn)行因子分析,以進(jìn)一步簡化指標(biāo).
(1)KMO檢驗
標(biāo)準(zhǔn)化后的數(shù)據(jù)能否進(jìn)行因子分析需先進(jìn)行KMO檢驗:
M:所有變量兩兩之間(不包括變量與自身)的偏相關(guān)系數(shù)的平方和;
X和Y的偏相關(guān)系數(shù):X和Z線性回歸得到的殘差RY與Y和Z線性回歸得到的殘差RY之間的簡單相關(guān)系數(shù),Z代表其他所有的變量[17];
N:所有變量兩兩之間(不包括變量與自身)相關(guān)系數(shù)的平方和.
當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)系數(shù)平方和時,KMO值接近1.KMO值越接近于1,說明變量間的相關(guān)性越強,原有變量越適合作因子分析[18,19];反之亦然.對四類指標(biāo)分別進(jìn)行檢驗的結(jié)果如表4.
表4 分類別檢驗表
4類KMO值均大于0.6,適宜進(jìn)行因子分析.
(2) 因子分析
因子分析可在SPSS中進(jìn)行,對其結(jié)果進(jìn)行整理分析四類指標(biāo)分別提取兩個主成分,都可表達(dá)原數(shù)據(jù)85%以上的信息率,旋轉(zhuǎn)成份載荷矩陣各因子貢獻(xiàn)率在0.9以上的多個指標(biāo)能表示出原數(shù)據(jù)絕大部分的信息[20],其余指標(biāo)對整體貢獻(xiàn)過小,相當(dāng)于冗余信息,刪除這一類指標(biāo)對于指標(biāo)體系整體的簡潔、高效具有重要意義,故以載荷矩陣因子貢獻(xiàn)率0.9作為閾值進(jìn)一步篩選指標(biāo).
客觀賦權(quán)法是根據(jù)數(shù)據(jù)特點進(jìn)行賦權(quán),排除了人工干擾,能夠得出各指標(biāo)科學(xué)、準(zhǔn)確的權(quán)重[21],常用的客觀賦權(quán)法有標(biāo)準(zhǔn)離差法、CRITIC法與熵權(quán)法.
指標(biāo)標(biāo)準(zhǔn)差越大,說明其指標(biāo)值的變異程度越大,提供的信息量越大,在綜合評價中所起的作用越大,則其權(quán)重也越大,反之亦然[22].利用標(biāo)準(zhǔn)差計算權(quán)重的公式為:
式中,wj表示j指標(biāo)在指標(biāo)體系中的權(quán)重;δj表示xi的標(biāo)準(zhǔn)差;xi表示j指標(biāo)在各研究單元的具體值表示j指標(biāo)具體值的算數(shù)平均值;m表示研究單元數(shù)量(本文中m=31);n表示指標(biāo)個數(shù).
表5 因子分析保留指標(biāo)
基于指標(biāo)相關(guān)性的指標(biāo)權(quán)重確定方法(criteria importance through inter-criteria correlation)由Diakoulaki提出[23],其中對比強度表示同一個指標(biāo)各個評價方案之間取值差異的大小,標(biāo)準(zhǔn)差越大,不同方案之間取值差異越大;評價指標(biāo)之間的沖突性以指標(biāo)間的相關(guān)性為基礎(chǔ),兩個指標(biāo)之間相關(guān)性越強,沖突性越弱,第j個指標(biāo)與其他指標(biāo)沖突性的量化公式為:
式中,Cj表示j指標(biāo)包含的信息量;δj表示公式(5)中的計算結(jié)果;rij表示指標(biāo)i、j間的相關(guān)系數(shù),具體計算參照公式(2);n表示指標(biāo)個數(shù).
Cj越大,j指標(biāo)包含的信息量越大,該指標(biāo)的相對重要性也就越大,相應(yīng)權(quán)重為:
式中,Wj表示j指標(biāo)在指標(biāo)體系中的權(quán)重;Cj表示公式(6)計算結(jié)果;n表示指標(biāo)個數(shù).
熵權(quán)法是目前社會學(xué)、地理學(xué)、信息論各學(xué)科常用的一種客觀賦權(quán)法,指標(biāo)信息熵與變異程度呈負(fù)相關(guān)關(guān)系,信息熵越小,變異程度越大,包含的信息量越大,對綜合評價的影響越大,反之亦然[24].熵值計算公式為:
式中,m表示研究單元數(shù)量(本文中m=31);n表示指標(biāo)個數(shù);dij表示j指標(biāo)標(biāo)準(zhǔn)化后的具體值時,
式中,Ej為公式(8)中的計算結(jié)果;n表示指標(biāo)個數(shù).
3種客觀賦權(quán)法得出綜合得分與排名情況如圖2和圖3.
由相關(guān)系數(shù)按順序計算熵權(quán)法與標(biāo)準(zhǔn)離差法、熵權(quán)法與CRITIC法、標(biāo)準(zhǔn)離差法與CRITIC的得分、排名折線圖的擬合度,可得以上曲線的擬合程度.
圖2 全國信息化水平得分圖
圖3 全國信息化水平排名圖
表6 結(jié)果擬合程度表
可知,擬合度全部在90%以上,最高達(dá)99.6%,說明客觀賦權(quán)法所得權(quán)重與結(jié)果較為科學(xué)準(zhǔn)確,能通過統(tǒng)計數(shù)據(jù)刻畫全國31個省市區(qū)的信息化發(fā)展水平.
本文立足于2015年國家統(tǒng)計數(shù)據(jù)及現(xiàn)有十套信息化水平測度指標(biāo)體系,針對信息化測度指標(biāo)選取與權(quán)重確定兩大關(guān)鍵環(huán)節(jié)進(jìn)行了修正與重建.收集現(xiàn)有指標(biāo)或者依據(jù)自身經(jīng)驗判斷直接篩選指標(biāo),存在較大主觀性,針對這一問題,文中采用了詞云分析的方法,通過關(guān)鍵詞詞頻篩選指標(biāo),使指標(biāo)選取結(jié)果更為客觀,進(jìn)而使用遞進(jìn)式方法繼續(xù)篩選指標(biāo),利用相關(guān)系數(shù)的范圍刪除冗余指標(biāo),變異系數(shù)衡量指標(biāo)內(nèi)部差異,在因子分析中以對載荷成分矩陣貢獻(xiàn)率作為測度指標(biāo),在分類的基礎(chǔ)上選取能表達(dá)原有指標(biāo)體系至少90%信息的指標(biāo),得出了簡潔高效、可靠合理的指標(biāo)體系;權(quán)重確定方面,針對現(xiàn)有賦權(quán)方法主觀性與難以說明指標(biāo)內(nèi)部信息的問題,文中采用了客觀賦權(quán)法,充分挖掘數(shù)據(jù)的內(nèi)部聯(lián)系與意義,且使用三種客觀賦權(quán)法相互比較,結(jié)果擬合度較高也能說明文中得出指標(biāo)體系的合理性.因此,本文對于將數(shù)理方法與已有經(jīng)驗相結(jié)合進(jìn)行信息化測度指標(biāo)體系修正有重要意義.
本研究后續(xù)將以目前得到的信息化水平測度指標(biāo)體系為起點,豐富從現(xiàn)有指標(biāo)體系得出的指標(biāo)庫,擴展研究的時間尺度,加強數(shù)理方法與已有經(jīng)驗的結(jié)合,進(jìn)一步完善信息化水平測度指標(biāo)體系的修正與分析.
1 European Commission:DESI2015:The digital economy and society index.https://ec.europa.eu/digital-agenda/en/digitaleconomy-and-society-index-desi.[2015-04-07].
2 馬巖,孫紅蕾,鄭建明.流動空間視角下新型城鎮(zhèn)信息化水平測度實證分析.圖書館論壇,2017,37(5):18-26.
3 蘇君華,孫建軍.全國及各省市信息化水平測度.情報科學(xué),2005,23(6):817-822.
4 楊洋.安徽省區(qū)域信息化水平測度及其對經(jīng)濟增長影響的實證研究[碩士學(xué)位論文].合肥:合肥工業(yè)大學(xué),2015.
5 馬增林,王天一,張云峰,等.黑龍江省農(nóng)業(yè)信息化水平測度分析.中國集體經(jīng)濟,2017,(33):22-24.[doi:10.3969/j.issn.1008-1283.2017.33.012]
6 朱婕.江蘇省新型城鎮(zhèn)化和信息化協(xié)調(diào)發(fā)展測度研究[碩士學(xué)位論文].南京:南京大學(xué),2017.
7 岳毅蒙,李江濤.基于改進(jìn)熵權(quán)法的智能手機評價模型.計算機系統(tǒng)應(yīng)用,2017,26(4):203-206.[doi:10.15888/j.cnki.csa.005651]
8 李燚,丁生喜,任海靜.基于灰色關(guān)聯(lián)分析法的青海省信息化與區(qū)域經(jīng)濟發(fā)展分析.價值工程,2017,36(30):55-58.
9 Yang YP,Shan N.Evaluation of shallow groundwater quality in Haikou based on fuzzy comprehensive evaluation method.Ground Water,2017,39(4):20-22,59.
10 國家信息中心.中國信息社會發(fā)展報告2015.北京:國家信息中心,2015.
11 國家統(tǒng)計局.2016中國統(tǒng)計年鑒.北京:中國統(tǒng)計出版社,2016.
12 國家統(tǒng)計局社會科技和文化產(chǎn)業(yè)統(tǒng)計司,科學(xué)技術(shù)部創(chuàng)新發(fā)展司.2016中國科技統(tǒng)計年鑒.北京:中國統(tǒng)計出版社,2016.
13 國家信息中心.中國信息年鑒.北京:《中國信息年鑒》期刊社,2016.
14 陳勇,楊未未.信息化水平測度方法研究.科技情報開發(fā)與經(jīng)濟,2009,19(6):90-92.
15 許慧玲.信息化水平測度及對區(qū)域經(jīng)濟增長影響研究[博士學(xué)位論文].南京:南京農(nóng)業(yè)大學(xué),2008.
16 李美洲,韓兆洲.信息化水平測度——以廣東省為例.科技管理研究,2007,(7):172-175.
17 陳小磊,鄭建明,萬里鵬.信息化水平測度指標(biāo)體系理論研究述評.圖書情報知識,2006,(5):65-70.
18 劉文云,葛敬民.國內(nèi)外信息化水平測度理論研究比較.情報理論與實踐,2004,27(2):144-147.
19 鄭麗琳.信息化水平測度研究綜述.合作經(jīng)濟與科技,2005,(2S):60-61.
20 王愛蘭,張俊山.評美國與日本學(xué)者關(guān)于信息化水平測度的理論與方法——兼論我國國家信息化水平測度指標(biāo)體系的完善.圖書情報工作,2005,49(1):117-120,137.
21 顏惠琴,牛萬紅,韓惠麗.基于主成分分析構(gòu)建指標(biāo)權(quán)重的客觀賦權(quán)法.濟南大學(xué)學(xué)報(自然科學(xué)版),2017,31(6):519-523.
22 楊宇.多指標(biāo)綜合評價中賦權(quán)方法評析.統(tǒng)計與決策,2006,(7):17-19.
23 梁海麗,于洪彬.我國信息化水平指數(shù)測度研究.情報資料工作,1999,(4):4-8.
24 于偉,張鵬.我國信息化水平的空間不均衡、極化特征和收斂性研究.山東財經(jīng)大學(xué)學(xué)報,2016,28(5):92-99.