張冰燾,趙帥維,李洪輝,謝龍龍,孟子賀
(中國輻射防護(hù)研究院,太原 030006)
隨著核電的發(fā)展,將會(huì)有越來越多的高放廢物產(chǎn)生,而高放廢物的安全處置是核能可持續(xù)發(fā)展和環(huán)境保護(hù)的重大問題[1]。目前大多數(shù)有核國家都傾向于采用由美國國家科學(xué)院首先提出的深地質(zhì)處置方案來進(jìn)行高放廢物處置[2]。中國對于高放廢物處置的相關(guān)研究開展較晚,于1985年由徐國慶等開始了第1個(gè)高放廢物地質(zhì)處置研究課題[3-4]。從此,中國開展了高放廢物地質(zhì)處置的跟蹤調(diào)研、高放廢物地質(zhì)處置規(guī)劃、處置庫場址區(qū)域篩選、地下實(shí)驗(yàn)室場址篩選、工程屏障、核素遷移和安全評(píng)價(jià)等多方面的研究。自21世紀(jì)開始,中國高放廢物地質(zhì)處置相關(guān)的研究開發(fā)工作進(jìn)入了一個(gè)穩(wěn)步發(fā)展的全新階段[3],高放廢物地質(zhì)處置科研從選址、場址評(píng)價(jià)逐漸進(jìn)入為地下實(shí)驗(yàn)室建設(shè)做準(zhǔn)備的階段。
高放廢物深地質(zhì)處置地下實(shí)驗(yàn)室的建設(shè)涉及到許多的問題,在使用的過程中肯定會(huì)涉及到放射性廢物的處置。一旦有關(guān)放射性廢物的處置研究勢必離不開公眾的支持[5-7]。公眾接受性研究是政治學(xué)、心理學(xué)和公共政策等領(lǐng)域中公共輿論與風(fēng)險(xiǎn)治理研究的一大分支,是一項(xiàng)科學(xué)創(chuàng)新與公共管理的交叉研究[5]。地下實(shí)驗(yàn)室的公眾接受性會(huì)對國家未來的核退役治理工程發(fā)展的政策、技術(shù)、經(jīng)濟(jì)性等問題都會(huì)產(chǎn)生影響。國家決策不僅要考慮經(jīng)濟(jì)成本,還要考慮社會(huì)成本,如果公眾對地下實(shí)驗(yàn)室存在較大爭議,甚至引發(fā)沖突,其結(jié)果所造成的巨大社會(huì)影響是政府在進(jìn)行決策時(shí)考慮的主要問題之一[8]。因此,地下實(shí)驗(yàn)室的公眾接受性既影響核退役治理工程的發(fā)展,也影響安全目標(biāo)的制訂,在國外地下室實(shí)驗(yàn)的建設(shè)過程中,公眾的決定占據(jù)了主導(dǎo)地位。如芬蘭、瑞典,在建設(shè)的初期與公眾保持了良好的溝通,項(xiàng)目順利進(jìn)行;相反的是,法國、美國因?yàn)楣姷膹?qiáng)烈反對導(dǎo)致研發(fā)計(jì)劃終止或者延期。因此公眾的參與起到了決定性的作用[9-12]。
由于中國高放廢物地質(zhì)處置地下實(shí)驗(yàn)室工程初步建立,而高放廢物潛在的安全性以及公眾對其的擔(dān)心和影響決定后續(xù)發(fā)展,特別是工程周圍的居民的接受度對其擁有巨大的影響力,他們對高放廢物的認(rèn)知水平將對工程的建設(shè)起到了重要的作用。調(diào)研國內(nèi)、外分析公眾接受性的方法,以及收集有關(guān)公眾接受性的數(shù)據(jù),是目前了解高放廢物地質(zhì)處置地下實(shí)驗(yàn)室建設(shè)公眾接受性的基礎(chǔ)。然后再選擇合適的分析與研究方法總結(jié)影響公眾對高放廢物地質(zhì)處置地下實(shí)驗(yàn)室工程接受度的關(guān)鍵因素,進(jìn)而了解公眾參與的接受程度。這有利于對后續(xù)過程中加強(qiáng)高放廢物知識(shí)的宣傳普及,提高公眾的核應(yīng)急意識(shí),解決由于高放廢物地質(zhì)處置研究室對他們生活、生活環(huán)境中造成問題提供幫助。因此,尋求影響地下實(shí)驗(yàn)室公眾接受性的關(guān)鍵因素,一方面有助于社會(huì)科學(xué)研究者提煉出公共輿論、政策過程和政府回應(yīng)的一般知識(shí);另一方面有助于決策者把握公眾心理,從而制訂出技術(shù)可行、人民滿意的政策,實(shí)現(xiàn)科學(xué)化和民主化[5]。
以網(wǎng)絡(luò)爬蟲(Web crawler)的方式從各大新聞網(wǎng)站上爬取核相關(guān)新聞數(shù)據(jù)進(jìn)行研究,對爬取的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,并進(jìn)行分析、歸納和整理,最終得到公眾接受性關(guān)鍵因素。
爬蟲就是請求網(wǎng)站并提取數(shù)據(jù)的自動(dòng)化程序,本研究采用Scrapy框架來實(shí)現(xiàn)爬蟲,其具體步驟如下:(1)打開一個(gè)網(wǎng)站,找到處理該網(wǎng)站的爬蟲(Spider),并請求第1個(gè)要爬取的網(wǎng)址(Uniform Resource Location,URL)[13];(2)通過調(diào)度器(Scheduler)以請求(Request)的形式進(jìn)行調(diào)度,并請求下一個(gè)要爬取的URL;(3)Scheduler返回下一個(gè)要爬取的URL,同時(shí)下載頁面;(4)頁面下載完畢后,將其發(fā)送給引擎(Engine);(5)將下載的頁面交給Spider處理,并返回爬取到的項(xiàng)目(Item)及新的Request;(6)將返回的Item給項(xiàng)目管道(Item Pipeline),將 新 的Request給Scheduler;(7)重 復(fù) 以 上 步驟,直到Scheduler中沒有更多的Request,關(guān)閉該網(wǎng)站,爬取結(jié)束。
通過以上步驟,一共爬取到11 508條數(shù)據(jù),涉及包括性別、年齡、學(xué)歷、住址、職業(yè)、年收入、對核的了解、對政府和專家的信任程度、知情權(quán)、監(jiān)督權(quán)、參與權(quán)和對核退役的態(tài)度等29個(gè)屬性,如表1所示。
表1 各個(gè)因素指標(biāo)含義Table 1 The meaning of each factor index
根據(jù)表1所得到的網(wǎng)絡(luò)上公眾接受性的指標(biāo)與分類,因素中人口性別、年齡、職業(yè)和家庭收入是通過其他因素等間接影響到公眾的接受性。公眾對于接受程度的判斷結(jié)果是非常主觀的[14]。雖然年齡、性別等客觀因素可能影響到公眾的接受情況,但并不能作為公眾接受性的評(píng)價(jià)標(biāo)準(zhǔn)[15]。因此,對于公眾接受性影響因素當(dāng)中的性別、年齡、職業(yè)和家庭收入的客觀因素進(jìn)行刪除,最終可以構(gòu)建出層次分析模型,如圖1所示。
圖1 網(wǎng)絡(luò)因素的層次分析模型Fig.1 AHP mode of factors in the internet
層次分析法確認(rèn)權(quán)重一般通過專家打分法進(jìn)行打分,但是這種方法個(gè)人主觀性太強(qiáng),不能很好地表示出民眾的意愿。為了更好地結(jié)合網(wǎng)絡(luò)工具,采用大數(shù)據(jù)處理的方法對采集到的數(shù)據(jù)進(jìn)行整理,以確定各個(gè)因素的權(quán)重。
XGBoost(Extreme Gradient Boosting)算 法是基于決策樹的集成機(jī)器學(xué)習(xí)算法,使用梯度上升框架,適用于分類和回歸問題[15]。它可以有效地構(gòu)建增強(qiáng)樹并能夠并行運(yùn)行,假設(shè)有T顆樹,那么模型的輸出值為:
式中:T—樹的數(shù)目;F—樹的集合空間;yi—模型的預(yù)測值;xi—第i個(gè)數(shù)據(jù)點(diǎn)的特征向量,且xi∈R(i=1,2,…,n);ft—第t棵獨(dú)立樹的結(jié)構(gòu),與葉子的權(quán)重向量有關(guān)。每一棵的參數(shù)包括它的結(jié)構(gòu)與葉子結(jié)點(diǎn)的值,不妨將每一顆樹作為參數(shù)來進(jìn)行優(yōu)化,目標(biāo)函數(shù)可改寫為:
采用前向分布算法把學(xué)習(xí)過程分解為先學(xué)習(xí)第一顆樹,然后基于學(xué)習(xí)好的第一顆樹再去學(xué)習(xí)第二棵樹,以此類推,直到通過第t?1顆樹來學(xué)習(xí)第T顆樹為止。即要找到這樣一個(gè)樹,使下面的目標(biāo)函數(shù)最?。?/p>
在一個(gè)基學(xué)習(xí)器(CART)中,影響其復(fù)雜度的因素主要有葉子結(jié)點(diǎn)數(shù)、葉子的權(quán)值,因此樹復(fù)雜度函數(shù)Ω(ft)可以寫為:
問題轉(zhuǎn)換為使得目標(biāo)函數(shù)Obj(T)最小
解得
代入目標(biāo)函數(shù)得
XGBoost算法從根的節(jié)點(diǎn)開始,用遞歸的方法選擇樹結(jié)構(gòu)的最優(yōu)特征,以此對訓(xùn)練數(shù)據(jù)進(jìn)行分割[16]。信息增益最大的分割為該節(jié)點(diǎn)的最優(yōu)分割,其計(jì)算如公式
式中:中括號(hào)第1項(xiàng)—左子樹分?jǐn)?shù);第2項(xiàng)—右子樹分?jǐn)?shù);第3項(xiàng)—不分割時(shí)的分?jǐn)?shù);γ—加入新葉子節(jié)點(diǎn)引入的復(fù)雜度代價(jià),當(dāng)Gain<0時(shí),放棄分割[17]。
XGBoost根據(jù)結(jié)構(gòu)分?jǐn)?shù)的增益情況,計(jì)算出選擇哪個(gè)特征作為分割點(diǎn),而這個(gè)特征的重要性就是它在所有樹中出現(xiàn)的次數(shù)之和[18]。也就是說一個(gè)屬性越多地被用來在模型中構(gòu)建決策樹,它的重要性就相對越高,相應(yīng)的對結(jié)果的預(yù)測影響更高。
以是否同意所在的地區(qū)被選定為高放廢物處置庫建設(shè)區(qū)為類別標(biāo)簽,同意為1,反對為0,訓(xùn)練集和測試集的數(shù)據(jù)比例按照7:3進(jìn)行劃分。最終XGBoost模型相關(guān)性能指標(biāo)結(jié)果如表2所示。由 表2可 見,XGBoost模 型 的AUC達(dá) 到 了91.22%,預(yù)測效果良好。Accuracy(ACC)代表模型準(zhǔn)確率,XGBoost模型的ACC為82.18%,表示模型具有良好的準(zhǔn)確率。Recall和Precision分別代表查全率及精確率,F(xiàn)1-score代表F1得分。這三個(gè)指標(biāo)都在80%以上,代表模型預(yù)測精度好,結(jié)果的可信度較高。
表2 XGBoost模型性能指標(biāo)Table 2 Performance index of XGBoost mode
由于集成模型中的XGBoost仍然屬于樹模型,對于樹模型可以判斷每個(gè)特征變量對模型的貢獻(xiàn)程度,從而判斷哪些特征變量對于是否同意所在的地區(qū)被選定為高放廢物處置庫建設(shè)區(qū)的影響更為顯著,其結(jié)果如圖2所示。
圖2 因素的特征重要性Fig.2 The characteristic importance of factors
圖2顯示了每個(gè)特征變量對模型的貢獻(xiàn)程度,通過程度的強(qiáng)弱來表示每種因素的權(quán)重,最終筆者通過以下公式確定每個(gè)因素的權(quán)重。
式中:q—子因素對模型的貢獻(xiàn)程度,Q—該子因素所對應(yīng)的主要因素的貢獻(xiàn)程度,V—該子因素的權(quán)重,以此可以計(jì)算出每個(gè)因素的權(quán)重。根據(jù)構(gòu)建好的公眾接受性評(píng)價(jià)指標(biāo)體系,建立評(píng)價(jià)指標(biāo)集。
一級(jí)指標(biāo):
U={V1;V2;V3;V4}={認(rèn)知水平;信任水平;感知風(fēng)險(xiǎn);感知利益}
二級(jí)指標(biāo):
V1={V11;V12;V13;V14;V15;V16;V17}={是否了解核泄漏;是否了解核污染;是否了解核;是否了解核電;是否了解核能;是否了解核技術(shù);是否了解核退役};
V2={V21;V22;V23}={對當(dāng)?shù)卣男湃?;對核事故防范的信任;對企業(yè)和科學(xué)家的信任};
V3={V31;V32;V34;V35;V36;V37;V38}={建造高放廢物處理地區(qū)的位置;遏制本地經(jīng)濟(jì)的發(fā)展;參與權(quán);對本地生態(tài)環(huán)境的破壞;對本地居民造成心理負(fù)擔(dān);監(jiān)督權(quán);生命安全;知情權(quán)};
V4={V41;V42;V43;V44;V45;V46}={對 發(fā)展核退役工程持何種態(tài)度;補(bǔ)償收入得到提高;提供更多的就業(yè)機(jī)會(huì);促進(jìn)本地經(jīng)濟(jì)發(fā)展;基礎(chǔ)服務(wù)設(shè)施得到提高;引進(jìn)人才}。
通過上述方式,進(jìn)而計(jì)算各因素權(quán)重值,得出U的具體權(quán)重為:
U={V1;V2;V3;V4}={0.176;0.268;0.315;0.241}
設(shè)Vi各因素的權(quán)重分配為:
建立公眾接受性的評(píng)語集S={S1;S2;S3;S4;S5}[14]。其中S1為非常差,S2為較差,S3為一般,S4為較高,S5為非常高,如表3所示。
表3 公眾接受性評(píng)語等級(jí)Table 3 The comment grade of public acceptance
如果rij(i=1,2,…,m;j=1,2,…,n)可以用來表示指標(biāo)vi對第j級(jí)評(píng)語vj的隸屬程度,根據(jù)調(diào)查結(jié)果,并進(jìn)行整理分析,則
因此,根據(jù)rij值就可以得到各因素對不同評(píng)價(jià)的隸屬程度所組成行向量元rij,根據(jù)行向量元rij,可以得到相應(yīng)的評(píng)價(jià)矩陣。對于研究不同因素的權(quán)重值,通過以下公式:
形成相應(yīng)的評(píng)價(jià)向量Bi,所得的Bi組成矩陣B,即
根據(jù)指標(biāo)權(quán)重集U={V1;V2;V3;V4},得到向量Bv的具體公式:
根據(jù)計(jì) 算得出Bv=(0.060,0.338,0.097,0.431,0.074)。為了得到具體的結(jié)果,將評(píng)語集S={S1;S2;S3;S4;S5}設(shè)分值并組成一個(gè)列向量W=[W1,W2,W3,W4,W5]T。分值定為每個(gè)等級(jí)范圍的中值,即W=[95,85,70,50,20]T,具體公式:
式中:Bi—評(píng)價(jià)向量jW—分值向量;G—綜合評(píng)價(jià)分?jǐn)?shù)。根據(jù)公式計(jì)算可以得出:認(rèn)知水平G1=60.753;信任水平G2=56.050;感知風(fēng)險(xiǎn)G3=58.770;感知利益G4=63.529;公眾接受性G=59.537。根據(jù)評(píng)價(jià)結(jié)果可以得到相應(yīng)的網(wǎng)絡(luò)上公眾接受性水平,具體情況見表4。
表4 網(wǎng)絡(luò)群眾的公眾接受性評(píng)價(jià)結(jié)果Table 4 The evaluation results of Internet public acceptance
從分析該結(jié)果可以得出,網(wǎng)絡(luò)公眾的整體接受性處于較差水平。其中感知風(fēng)險(xiǎn)和信任水平的公眾接受性水平較低,說明網(wǎng)絡(luò)上公眾接受性受到個(gè)人狀況的影響較大,另外總體對政府部門、科學(xué)信任以及處理能力信任的水平不夠高。感知利益的公眾接受處于一般水平,這可能是由于網(wǎng)絡(luò)上的群眾并非是選址區(qū)域的受益方,導(dǎo)致感知利益方面上與選址區(qū)域群眾可能存在差異。認(rèn)知水平的公眾接受性處于一般水平,說明網(wǎng)絡(luò)群眾整體對核的相關(guān)知識(shí)不太了解,從而造成對專家和政府的能力還不是十分信任。
通過對網(wǎng)絡(luò)上公眾接受性進(jìn)行研究,得到了以下的結(jié)論。
通過爬蟲爬取網(wǎng)絡(luò)上與核相關(guān)的信息評(píng)論,借鑒已有相關(guān)文獻(xiàn)的基礎(chǔ)上和通過數(shù)據(jù)整理歸納知識(shí),建立公眾接受性的層次結(jié)構(gòu)模型。通過該模型的識(shí)別,信任水平、認(rèn)知水平、感知利益、感知風(fēng)險(xiǎn)是影響網(wǎng)民公眾接受性的主要因素。
根據(jù)網(wǎng)絡(luò)上高放廢物深地質(zhì)處置公眾接受性的主要影響因素,建立了由4個(gè)一級(jí)指標(biāo)和29個(gè)二級(jí)指標(biāo)所組成的高放廢物深地質(zhì)處置公眾接受性的評(píng)價(jià)指標(biāo)體系。采用層次分析法建立模型,并通過XGBoost算法對每一項(xiàng)評(píng)價(jià)指標(biāo)賦予權(quán)重值,結(jié)合模糊層次綜合評(píng)價(jià)法對高放廢物深地質(zhì)處置公眾接受性進(jìn)行綜合評(píng)價(jià),得到評(píng)價(jià)結(jié)果為59.537分,根據(jù)所建立的公眾接受性的評(píng)語等級(jí),可以得出,網(wǎng)絡(luò)上高放廢物深地質(zhì)處置的公眾接受性處于較差水平。
通過所得的評(píng)價(jià)結(jié)果對網(wǎng)絡(luò)群眾高放廢物深地質(zhì)處置公眾接受性進(jìn)行綜合分析,網(wǎng)絡(luò)上高放廢物深地質(zhì)處置在多個(gè)方面存在著不足,其中信任水平和感知風(fēng)險(xiǎn)處于較差水平,而認(rèn)知水平和感知利益僅僅處于一般水平,說明網(wǎng)絡(luò)上公眾對于高放廢物深地質(zhì)處置的信任不足,認(rèn)知不夠。根據(jù)這些不足,可以加強(qiáng)有關(guān)高放廢物深地質(zhì)處置知識(shí)的普及,建立該領(lǐng)域?qū)<摇⒄?、環(huán)保局等新聞發(fā)布制度,提升高放廢物深地質(zhì)處置的相關(guān)技術(shù)和管理水平,進(jìn)而為提高網(wǎng)絡(luò)上高放廢物深地質(zhì)處置的公眾接受性提供依據(jù)。