莫雨
(河北保定 073199)
【關鍵字】大數(shù)據(jù);政策評估;公共政策
公共政策即由公共權力機關所制定的政策。公共政策評估即在特定的政策制度下,評估主體按照一定的評估標準和程序,對公共政策的質(zhì)量和效果,以及構成政策系統(tǒng)的諸要素、環(huán)節(jié)和評價方法進行局部或全面分析,并獲得相關信息與政策結論的過程[1]。政策評估不僅是檢驗政策結果的重要標桿,進行政策調(diào)整的重要依據(jù),也是進行社會資源配置的重要途徑。一項政策如果只實施而不對其進行及時有效的評估,那么很可能會浪費社會資源,不利于維護最廣大人民群眾的根本利益,同時也會有損政府的權威,因此政策評估的作用不可忽視。
當今世界發(fā)展日新月異,計算機,互聯(lián)網(wǎng),物聯(lián)網(wǎng)和人工智能等高科技的迅速發(fā)展使我們進入了一個現(xiàn)代化,數(shù)字化的信息時代。在此大背景下,大數(shù)據(jù)的重要作用逐漸凸顯出來,在萬物互聯(lián)的現(xiàn)在,我們的每一項活動都在創(chuàng)造著數(shù)據(jù)。據(jù)國家信息主任預計,到2025 年為止,中國數(shù)據(jù)總量預計將躍居世界第一,全球占比有望達到27%以上。面對如此豐富的數(shù)據(jù),我們應對其進行充分的利用,快速高效地釋放“數(shù)字紅利”。 政策評估的基礎就是政策信息,政策信息包含政策進行過程中以及政策完成后的所有信息,只有以翔實豐富的信息為基礎,才能保證政策評估順利地進行。而大數(shù)據(jù)就是通過網(wǎng)絡收集而來的龐大的數(shù)據(jù)組,這些數(shù)據(jù)組就是信息。大數(shù)據(jù)產(chǎn)生于各行各業(yè)也存在于各行各業(yè),因此也能夠應用于任何一個行業(yè)和領域。據(jù)此,我們應將大數(shù)據(jù)應用到政策評估中,揚長避短,不斷促進我國治理體系和治理能力現(xiàn)代化。
政策評估往往是基于某一領域的政策進行評估,因此在進行數(shù)據(jù)的采集時應首先確定好政策所在領域,然后進行數(shù)據(jù)的收集。確定好領域后,根據(jù)政策評估所需要信息的時間維度,利用時間鎖定好數(shù)據(jù)范圍。由于政策評估的基本“原料”就是信息,因此應利用爬蟲技術在盡可能多的網(wǎng)站和APP 上搜集數(shù)據(jù),比如,微博,微信,QQ,論壇,抖音,快手,各種新聞網(wǎng)站等,這樣,可以獲得更多人群的信息。
政策結果的客觀性和準確性以大量豐富的信息為基礎,因此采集的數(shù)據(jù)也會比較龐大。在龐大的數(shù)據(jù)庫中,不可避免地會有一些重復或者無效甚至錯誤的信息,為了保證數(shù)據(jù)的準確以及提高后續(xù)建模算法的魯棒性,準確性需要進行數(shù)據(jù)清洗以初步剔除噪聲信息。噪聲信息主要可以分為兩種,一種是離群點信息,這是由于政策評估收集的某些信息比較偏激,不具有代表性,還有一種是缺省值信息,這類信息是由于信息的收集來源比較廣,人群比較大的特點,導致某些數(shù)據(jù)維度的信息存在丟失。對于離群點信息,可以使用分項、回歸、聚類方法剔除出去;對于缺省值信息,可以通過回歸、貝葉斯估計、決策樹方法來填補缺省值信息。這樣,經(jīng)過數(shù)據(jù)清洗后的數(shù)據(jù),才是可用的數(shù)據(jù),才可以分析出有意義有代表性的結論。
政策的推行往往對于特定目標人群才具有意義與影響,而這些目標人群對政策的反饋才會對該政策的完善有意義。所以對于收集到的多條信息,可以通過“年齡”“性別”“職業(yè)”“居住城市”等多方面因素來判斷該信息是否滿足某些政策客體的特征,從而為該信息補充政策客體維度信息。由于每個用戶有可能同時符合多個政策客體的特征,因此對于政策客體的劃分,應采用硬編碼的形式。這種形式能夠方便數(shù)據(jù)擴充,當新的數(shù)據(jù)以及新的政策客體加入時,可以迅速生成新的有用信息。經(jīng)過這樣的信息加工,最后構建的數(shù)據(jù)信息具有政策客體的額外信息,方便產(chǎn)生政策評估的具體結論。
在經(jīng)過數(shù)據(jù)清洗之后,仍會存在由于數(shù)據(jù)緯度高而導致數(shù)據(jù)分析結果沒有意義的現(xiàn)象。在此基礎上需要對這些數(shù)據(jù)進行數(shù)據(jù)選取,針對不同的分析要求,利用專業(yè)背景知識處理數(shù)據(jù),提取出有價值的信息。完成數(shù)據(jù)的選定后,還可以利用特征工程進行進一步加工,比如可以利用方差選擇法、卡方檢驗、互信息法,遞歸特征消除法等方法來進一步進行特征的選擇。若是信息維度較大,影響建模算法的運行速度,可以利用PCA,LDA等方法進行特征降維。
此次步驟中輸出的所有數(shù)據(jù)便是接下步驟中所應用的數(shù)據(jù)。
數(shù)據(jù)分析和數(shù)據(jù)建模是利用大數(shù)據(jù)進行政策評估的整個流程中最為關鍵的一環(huán),直接影響著評估結果的質(zhì)量。在互聯(lián)網(wǎng)中得到的信息都是文本信息,只有對這些文本進行語義上的分析才能夠得到文字表面下所內(nèi)涵的意義,即公眾對政策的看法和思考。在此步驟中,數(shù)據(jù)分析者可以通過多種方法來進行統(tǒng)計分析,比如可以直接通過文本聚類和回歸的方法直接進行統(tǒng)計分析,通過添加的政策客體信息,可以判斷出政策客體對于政策的看法;也可以通過關鍵詞提取,文本再生成的方法,將文本信息進行規(guī)范化表達,再生成知識圖譜,利用知識圖譜來提供政策評估相關信息。
在此步驟中,數(shù)據(jù)分析者可以對所收集到的信息設置關鍵詞,關鍵句等,之后利用聚類分析對相對同質(zhì)的群組進行統(tǒng)計分析。
這一步是將數(shù)據(jù)轉(zhuǎn)化為文字,圖表的過程。在經(jīng)歷過一系列的篩選和分析之后,最終會得到分析結果,分析結果將會以用戶畫像,數(shù)字圖表等形式呈現(xiàn)。最后再由政策評估主體進行專業(yè)分析,得出文字性的有效結論,從而完成由文字到數(shù)字再到文字的過程。
政策評估的流程按照其所進行的時間劃分為實施前評估,實施中評估和實施后評估,即事前評估,事中評估和事后評估。下面筆者將按照政策評估進行的過程分析大數(shù)據(jù)在各階段的實際應用。
公共政策的事前評估又被稱為政策預評估。此階段的主要目的是通過一系列的措施,對政策的實施可能造成的影響和后果進行預測,從而提升政策的質(zhì)量。在政策實施前進行有效的事前評估可以避免資源浪費,提前發(fā)現(xiàn)問題,做好應對方案,甚至防患于未然,在整體上提升政策的效果。
大數(shù)據(jù)在此階段的應用主要是通過收集“客觀性”的數(shù)據(jù)和“主觀性”的數(shù)據(jù)來進行基于對數(shù)據(jù)的分析預測,從而為政策的制定提供信息支持和建議?!翱陀^性”的數(shù)據(jù)指的是對事物本身的固有性質(zhì)進行客觀描述的,而非公眾發(fā)表的主觀意見的數(shù)據(jù)。“主觀性”數(shù)據(jù)則是指由公眾表達的看法和意見,具有強烈主觀性,民眾意愿的數(shù)據(jù)。在某項具體政策中,比如針對我國剛剛出臺的“開放三孩政策”。若針對這一政策進行事前評估,需要收集的“客觀性”數(shù)據(jù)主要有我國近多少年的人口數(shù)量,出生率,死亡率,我國經(jīng)濟發(fā)展情況等數(shù)據(jù)。需要收集的“主觀性”數(shù)據(jù)主要有,公眾當前的生育意愿,對獨生子女政策和“二孩”政策的看法等數(shù)據(jù)。大數(shù)據(jù)對這些“客觀性”的數(shù)據(jù)進行分析,從而為政策制定提供一系列的客觀詳實的事實資料,使政策具有科學支撐,更加具有準確性。對“主觀性”的數(shù)據(jù)分析主要體現(xiàn)在實時監(jiān)測輿情,及時掌握公眾的反饋和意愿。在積極性文本信息中總結經(jīng)驗,在負面性文本信息中及時反思,調(diào)整政策的制定方案,在此基礎上政策會更加符合民意,使政策更加具有“人情味”。
不針對某項具體政策,針對廣泛的政策的出臺,大數(shù)據(jù)具有更加明顯的優(yōu)勢。大數(shù)據(jù)的一個特性就是即時性。通過對生產(chǎn)生活數(shù)據(jù)的日常動態(tài)監(jiān)測,可以發(fā)現(xiàn)某些異常數(shù)據(jù),從而針對這些問題制定有強針對性的政策,避免未來發(fā)生重大問題。通過對民情民意的輿情監(jiān)測可以及時發(fā)現(xiàn)當前公眾關注的實時熱點問題,在此基礎上進行數(shù)據(jù)深挖則會有利于有效解決社會問題,防患于未然。
政策的事中評估又被稱為過程評估。此階段存在的主要目的是及時調(diào)整政策制定和政策執(zhí)行。在事中評估中,可以利用大數(shù)據(jù)全面收集政策實施中的所有相關信息,比如政策實施后各項指標數(shù)據(jù),相關部門落實情況的數(shù)據(jù),以及公眾對政策實施情況的意見和態(tài)度等數(shù)據(jù)資料。
在政策調(diào)整方面,對所收集的全面、廣泛、即時的數(shù)據(jù)進行分析,從而發(fā)現(xiàn)數(shù)據(jù)是否正常。若有異常的數(shù)據(jù)資料則能夠通過這些異常信息發(fā)現(xiàn)政策的問題,以及公眾對政策的關注點所在,從而及時調(diào)整政策的制定,避免“問題政策”的產(chǎn)生,以及及時掌握輿情,避免造成公眾的不滿。例如若想出臺一項交通政策來降低事故發(fā)生率,在政策的實施中則可以利用大數(shù)據(jù)進行即時監(jiān)測和評估??梢允紫壤么髷?shù)據(jù)收集政策實施前和實施中的各種信息,比如某路段的人口流量,車流量,剎車數(shù),事故發(fā)生率等數(shù)據(jù),然后進行前后對比,確定該政策的實施是否有效降低了事故發(fā)生率。若效果不明顯甚至是達到了相反的目的,則需要及時調(diào)整政策。除此之外,還需要對公眾針對此項政策的反饋進行實時監(jiān)控,收集數(shù)據(jù)。若公眾對政策抱有怨言,認為影響了其出行效率等,那么需要及時研究公眾所反饋的問題所在,及時調(diào)整政策,使政策既保證效果又能夠讓公眾感到政策的人性化。
在政策執(zhí)行方面,及時收集政策執(zhí)行的相關數(shù)據(jù),監(jiān)測政策執(zhí)行力度和效果,根據(jù)數(shù)據(jù)分析結果不斷調(diào)整政策執(zhí)行的方式,確保政策能夠落到實處。例如,若是通過在政府公務網(wǎng)站進行政策發(fā)布,則需要實時監(jiān)測該發(fā)布網(wǎng)頁的點擊量,以及瀏覽量,若數(shù)據(jù)低迷則說明此公布方式?jīng)]有到位,需要輔以其他方式進行發(fā)布和施行。
大數(shù)據(jù)可以有效提高公共政策執(zhí)行過程中觸發(fā)感知和反饋能力,對實施過程中的“中梗阻”問題進行分析,及時掌握社會政策執(zhí)行階段的真實情況,保障公共政策的順利實施。[2]
公共政策的事后評估又被稱為結果評估,主要包含兩方面的內(nèi)容,政策的實用性和價值性的評估。
實用性是指政策是否達到了預期目標,是否對社會經(jīng)濟發(fā)展起到了作用。在這一層面,可以通過大數(shù)據(jù)來全面收集政策實施前后的有效數(shù)據(jù),然后對這些數(shù)據(jù)進行建模和分析,并進行政策實施前后的數(shù)據(jù)對比,從而得出政策是否具有實用性的結論。在價值性層面,則需要大數(shù)據(jù)分析人員密切監(jiān)測各個社交網(wǎng)站和APP,及時獲取公眾對政策的反饋,利用數(shù)據(jù)建模來對收集到的信息進行文本文件的分析,將定性的信息定量化,得出公眾對政策的滿意率。最后對滿意率背后所反映的問題進行深究,以期完善政策和總結經(jīng)驗。例如,若想對某項“人才引進政策”進行事后評估,則需要利用大數(shù)據(jù)從兩方面入手。一方面利用龐大的數(shù)據(jù)庫將某地實施該政策前后幾年的數(shù)據(jù)進行收集(比如人口數(shù)量、各年齡段人口占比、經(jīng)濟發(fā)展總量、科技創(chuàng)新獎項、企業(yè)個數(shù)等信息),再進行前后對比,便可得出政策是否有效果的結論。另一方面,利用實時在社交網(wǎng)絡等網(wǎng)站收集到的輿情,進行數(shù)據(jù)分析,研究該政策是否在提升該地人口素養(yǎng)等方面起到了積極作用。
1.大數(shù)據(jù)使政策評估更具客觀性和科學性
從本質(zhì)上來看,大數(shù)據(jù)在公共政策評估中的應用主要是提供數(shù)據(jù),進行數(shù)據(jù)分析。在傳統(tǒng)的政策評估信息收集中,往往采取的是抽樣方法,其所獲得的數(shù)據(jù)信息是有限的,不全面的,并且是局限在某一時間段的信息,無法及時更新。大數(shù)據(jù)所獲得的信息是龐大的,全面的,廣泛的,因此其分析的數(shù)據(jù)是全部數(shù)據(jù)而非只有樣本數(shù)據(jù),對足夠多的數(shù)據(jù)進行研究才會使評估結果更加科學?;趥鹘y(tǒng)的信息采集方法所收集的信息數(shù)據(jù)是固定不變的,而基于互聯(lián)網(wǎng)的大數(shù)據(jù)可以實時進行數(shù)據(jù)采集和分析,能幫助政策評估主體隨時隨地地掌握一手資料,從而使政策評估主體及時掌握政策的進行狀況,為政策評估提供及時有效的數(shù)據(jù)支撐。
2.大數(shù)據(jù)使政策評估更具民主性
在傳統(tǒng)的政策評估中,評估主體主要是政府等體制內(nèi)的工作人員,評估所需要的信息往往也是政府部門提供的。公眾雖然可以通過聽證會等方式表達自己的態(tài)度,但其作用和效果比較微小,并且參與的公眾也比較少,得到的信息就不具有全面性。在大數(shù)據(jù)背景下,每個人都是信息的提供者,每個人在日常生活和互聯(lián)網(wǎng)活動中留下的痕跡都可能成為將來政策評估所收集到的數(shù)據(jù)。這樣,公眾就成為了數(shù)據(jù)的提供者,基于大數(shù)據(jù)的政策評估也就成了針對于廣泛大眾的評估,而不是某一部分人群的評估,從而使評估過程和結果更加具有民主性。
3.大數(shù)據(jù)使政策評估更具全面性
傳統(tǒng)的政策評估的著眼點是政策和結果兩者之間的因果關系,即這項政策的實施有沒有達到其所期望的目的。但大數(shù)據(jù)則可以探索影響政策的各方面因素,不僅僅是政策和結果兩者之間的因果關系,而是眾多因素的相關關系。例如頒布出臺了某項農(nóng)業(yè)政策,想知道糧食產(chǎn)量和政策的實施到底有無關系。若是傳統(tǒng)的數(shù)據(jù)收集方法則會對比政策出臺前后幾年的糧食產(chǎn)量,從而得出結論。但這是不科學的,因為產(chǎn)量很大可能會受到氣候和國內(nèi)外市場的變化影響?;诖髷?shù)據(jù),則可以輕松的全方面收集相關氣候,天氣,市場變化等信息,然后對這些信息數(shù)據(jù)進行分析,得出可視化結論,探索各要素對糧食產(chǎn)量的影響,進而得出全面的評估結論。
4.依據(jù)大數(shù)據(jù)可進行政策預測
在互聯(lián)網(wǎng)中,數(shù)據(jù)是每時每刻都在產(chǎn)生的。通過對這些數(shù)據(jù)的動態(tài)監(jiān)控可以及時發(fā)現(xiàn)異常數(shù)據(jù),從而在這些異常數(shù)據(jù)中發(fā)現(xiàn)隱藏在其背后的問題,進而制定出相關政策避免問題的惡化甚至產(chǎn)生。利用大數(shù)據(jù)進行政策預測是傳統(tǒng)的數(shù)據(jù)收集方式所無法完成的。
5.提高政策評估效率
在大數(shù)據(jù)時代,海量信息來源于互聯(lián)網(wǎng),大數(shù)據(jù)的應用可以促進無紙化、電子化辦公,提升工作效率。并且相對于之前手動翻閱繁重文檔查找資料,大數(shù)據(jù)可節(jié)省大量的人力和財力,只需要幾行代碼便可以輕松完成資料的搜尋工作。
1.數(shù)據(jù)收集困難
大數(shù)據(jù)收集的前提是要產(chǎn)生數(shù)據(jù),且數(shù)據(jù)是存在于網(wǎng)絡中而不是紙質(zhì)文本中。但基于現(xiàn)實,我國許多政府部門還沒有完全實現(xiàn)資料電子存檔,也沒有相對完善的數(shù)據(jù)采集存儲機制和數(shù)據(jù)共享平臺。
2.數(shù)據(jù)噪聲大
大數(shù)據(jù)的數(shù)據(jù)量龐大是其主要優(yōu)點,但是在某種程度上也會造成錯誤或異常數(shù)據(jù)較多,甚至由于互聯(lián)網(wǎng)的開放性,還會造成數(shù)據(jù)不真實。在互聯(lián)網(wǎng)時代,人人都可發(fā)言,甚至某些人會故意發(fā)布一些不實的信息來達到某種目的,這些數(shù)據(jù)都有可能被采集,因此基于缺乏數(shù)據(jù)真實性的政策評估,其結果的客觀性和準確性會大打折扣。
3.公平問題
雖然大數(shù)據(jù)已經(jīng)盡可能多地涵蓋了所有人的發(fā)聲,但終歸有人沒有使用互聯(lián)網(wǎng)。這就會造成提供數(shù)據(jù)的人并非全體公民,而是有能力接觸到網(wǎng)絡,會使用并且愿意使用互聯(lián)網(wǎng)的人。這在一定程度上表明只有提供了數(shù)據(jù)的人才能在該評估中受益,這就會導致出現(xiàn)政策評估結果不公平的問題。
4. 隱私問題
大數(shù)據(jù)雖然為人們帶來諸多便利,但不可回避的是,對數(shù)據(jù)的大規(guī)模收集和分析很有可能會侵犯個人隱私。保護個人隱私也是政府部門的職責,不可為了政策評估而顧此失彼。若在未經(jīng)當事人同意的情況下,數(shù)據(jù)分析者擅自通過技術收集且利用其信息則構成了侵犯隱私的問題。但值得思考的是,向每位當事人征求同意是不科學也是不現(xiàn)實的,這就需要我國盡快完善有關數(shù)據(jù)保護和應用的法律法規(guī),對哪些數(shù)據(jù)政府部門和企業(yè)可直接采用,哪些不可擅自收集作出相應的規(guī)范。
5. 數(shù)據(jù)分析能力較弱
僅僅擁有大量的數(shù)據(jù)并不能夠很好地進行政策評估,重要的是利用科學高效的大數(shù)據(jù)分析技術,對隱藏在數(shù)據(jù)背后的內(nèi)容進行探索。我國數(shù)據(jù)資料雖然很豐富,但由于大數(shù)據(jù)分析是一個全新的研究領域,因此專業(yè)人才較少,面對海量的數(shù)據(jù),如何將其轉(zhuǎn)換為有用信息的能力還比較薄弱。
1.構建政府部門大數(shù)據(jù)采集機制
提升政府工作人員的大數(shù)據(jù)收集意識。只有在思想上意識到其重要性,才會落實到實際行動中去。設置專門的數(shù)據(jù)信息上傳系統(tǒng),并對政府部門的工作人員進行技術培訓,確保每位工作人員都會使用相關軟件進行數(shù)據(jù)的上傳和存檔。對相關領導實施數(shù)據(jù)收集責任制,將收集數(shù)據(jù)的任務落實到人。
2.構建數(shù)據(jù)共享平臺
政府部門和各企業(yè)都會具有各自的數(shù)據(jù)庫,若想獲取大量的數(shù)據(jù)則需要各平臺進行數(shù)據(jù)共享??捎上嚓P政府部門搭線構建數(shù)據(jù)分析平臺,在合法合規(guī),保護公民隱私的情況下,使政府各部門以及政府和企業(yè)間實現(xiàn)數(shù)據(jù)共享。
3.培養(yǎng)大數(shù)據(jù)分析人才
當前世界大數(shù)據(jù)和人工智能發(fā)展如火如荼,我國大數(shù)據(jù)的研究正處于起步階段,與發(fā)達國家相比有一定的差距。我們可以借鑒其他國家的相關理論以及經(jīng)驗,并結合我國實際情況,完善大數(shù)據(jù)科學相關理論體系,健全大數(shù)據(jù)人才培養(yǎng)機制。設立專門基金促進大數(shù)據(jù)研究的發(fā)展,在各大高校開設相關課程,為我國培養(yǎng)更多的大數(shù)據(jù)分析人才。
4.完善數(shù)據(jù)安全相關法律法規(guī)
進行政策評估是政府的職責,保護公民隱私安全也是政府的責任。大數(shù)據(jù)給政策評估帶來了便利,但同時也帶來了有關隱私安全問題的挑戰(zhàn)。政府和一些社會機構、公司,是否可以直接收集公民的數(shù)據(jù),利用所收集的數(shù)據(jù)進行公益性或利益性的分析,以及如何合法地收集公民數(shù)據(jù),如何對公民的數(shù)據(jù)進行保護等問題都亟待解決。這就需要國家有關部門完善保護公民數(shù)據(jù)安全的相關法律法規(guī)。有了法律保障,公民的數(shù)據(jù)便可以得到保護,政府部門和其他機構也能夠按照規(guī)定合法的采集數(shù)據(jù),避免違法情況的產(chǎn)生。
大數(shù)據(jù)由于其強大的包容性可以應用到任何領域。在政策評估領域應用大數(shù)據(jù)可以有效地提供評估所需信息數(shù)據(jù),進而不僅提高評估效率,還可以使評估結果更加具有科學性。但大數(shù)據(jù)的應用也是一把雙刃劍,有利有弊,帶來了諸多急需解決的問題。想要讓大數(shù)據(jù)在政策評估中得到科學的應用,便需要揚長避短。本文對上述問題進行了些許的探討,以期能為各位學者的研究提供思路,拋磚引玉。