閃四清,林 蕭,張 瞳
(1.北京航空航天大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100191;2.城市運(yùn)行應(yīng)急保障模擬技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100191)
?
基于UGC的城市災(zāi)害損失動(dòng)態(tài)評(píng)估模型
閃四清1,2,林蕭1,2,張瞳1,2
(1.北京航空航天大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100191;2.城市運(yùn)行應(yīng)急保障模擬技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100191)
摘要:針對(duì)當(dāng)前災(zāi)害損失評(píng)估面臨的災(zāi)害評(píng)估持續(xù)時(shí)間長(zhǎng),災(zāi)害損失信息不完整,上報(bào)環(huán)節(jié)多等問(wèn)題,擬采用語(yǔ)義分析、文本挖掘、情感分析、特征詞匹配等方法,在對(duì)城市災(zāi)害發(fā)生時(shí)UGC特征分析的基礎(chǔ)上,設(shè)計(jì)基于UGC的城市災(zāi)害損失評(píng)估指標(biāo)體系,構(gòu)建災(zāi)害動(dòng)態(tài)、持續(xù)監(jiān)測(cè)分析算法,研究災(zāi)害損失的增量式評(píng)估過(guò)程,為災(zāi)害應(yīng)急響應(yīng)決策提供支持。并選取了天津港大爆炸的實(shí)際數(shù)據(jù),對(duì)基于UGC的城市災(zāi)害損失動(dòng)態(tài)評(píng)估模型進(jìn)行了驗(yàn)證,實(shí)證了該模型的有效性。
關(guān)鍵詞:應(yīng)急管理;城市災(zāi)害;用戶生成內(nèi)容;災(zāi)害損失評(píng)估;動(dòng)態(tài)評(píng)估
在人口增長(zhǎng)、技術(shù)進(jìn)步以及經(jīng)濟(jì)社會(huì)結(jié)構(gòu)不斷變化的過(guò)程中,往往伴隨著環(huán)境的惡化,極端氣候、特大事故和巨大災(zāi)難的不斷出現(xiàn),這些災(zāi)害給人類(lèi)帶來(lái)了極大的損失,對(duì)人類(lèi)的生命、生產(chǎn)、安全和發(fā)展帶來(lái)了前所未有的挑戰(zhàn)。因此面臨越來(lái)越嚴(yán)重的自然災(zāi)害和特大事故的威脅,防災(zāi)減災(zāi)工作和災(zāi)情評(píng)估工作的重要性日顯突出,特別是對(duì)大城市,這些工作尤其重要。城市作為經(jīng)濟(jì)文化、人口高度聚集區(qū),同時(shí)也是各類(lèi)事故和自然災(zāi)害易發(fā)、頻發(fā)區(qū)域。比如2014年12月31日上海外灘擁擠踩踏事故、2015年8月12日天津港大爆炸等災(zāi)害,對(duì)城市人民群眾生命財(cái)產(chǎn)造成了巨大傷害和損失。有效進(jìn)行防災(zāi)減災(zāi)以及災(zāi)后求援、災(zāi)情評(píng)估等就變得十分重要,在災(zāi)害發(fā)生后對(duì)災(zāi)情進(jìn)行綜合評(píng)估或?qū)m?xiàng)評(píng)估,可為救災(zāi)和災(zāi)后重建提供依據(jù)。災(zāi)情評(píng)估的目的是更加全面系統(tǒng)地掌握災(zāi)情,為部署和實(shí)施減災(zāi)工作提供依據(jù)。然而如何有效地對(duì)災(zāi)情進(jìn)行評(píng)估卻是一個(gè)難題,在我國(guó)災(zāi)情評(píng)估領(lǐng)域尚未形成較為完善的理論,評(píng)估方法多處于研究階段,信息來(lái)源缺乏。與此同時(shí),截至2015年6月,中國(guó)網(wǎng)民規(guī)模達(dá)6.68億,半年共計(jì)新增網(wǎng)民1 894萬(wàn)人;互聯(lián)網(wǎng)普及率為48.8%,較2014年底提升了0.9個(gè)百分點(diǎn)。通過(guò)這一個(gè)廣闊的平臺(tái),每一位用戶都可以把自己的見(jiàn)聞和感想通過(guò)文字、聲音、圖片或者視頻的形式發(fā)布在網(wǎng)絡(luò)上,形成用戶生成內(nèi)容(user generated content,UGC)。因此在互聯(lián)網(wǎng)時(shí)代如何通過(guò)互聯(lián)網(wǎng)上的信息為災(zāi)害災(zāi)情評(píng)估提供依據(jù),如何從新的角度來(lái)審視傳統(tǒng)的自然災(zāi)害災(zāi)情評(píng)估具有極大的現(xiàn)實(shí)意義。
如何有效地對(duì)災(zāi)害災(zāi)情進(jìn)行評(píng)估是科學(xué)開(kāi)展災(zāi)害管理的基礎(chǔ),當(dāng)前災(zāi)情評(píng)估主要分為災(zāi)前預(yù)評(píng)估、災(zāi)中應(yīng)急評(píng)估、災(zāi)后綜合評(píng)估,以及區(qū)域?yàn)?zāi)情評(píng)估。數(shù)據(jù)來(lái)源主要有社會(huì)經(jīng)濟(jì)數(shù)據(jù)、基礎(chǔ)地理數(shù)據(jù)、災(zāi)區(qū)現(xiàn)場(chǎng)數(shù)據(jù)和遙感影像數(shù)據(jù)。因此評(píng)估方式主要集中在地方填報(bào)、現(xiàn)場(chǎng)調(diào)查、遙感監(jiān)測(cè)和模型模擬。當(dāng)前災(zāi)害評(píng)估在流程方面所面臨的主要問(wèn)題是災(zāi)害評(píng)估持續(xù)時(shí)間長(zhǎng),需要通過(guò)層層上報(bào)的形式,環(huán)節(jié)過(guò)多;現(xiàn)場(chǎng)信息滯后且不完整,災(zāi)區(qū)現(xiàn)場(chǎng)數(shù)據(jù)需要通過(guò)地方填報(bào)的方式獲取,數(shù)據(jù)可靠性也有待于檢驗(yàn);基礎(chǔ)數(shù)據(jù)陳舊且不能有效反映災(zāi)情,社會(huì)經(jīng)濟(jì)數(shù)據(jù)和基礎(chǔ)地理數(shù)據(jù)更新不足。這些問(wèn)題增加了救災(zāi)決策的風(fēng)險(xiǎn),也增加了對(duì)災(zāi)害災(zāi)情進(jìn)行實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè)評(píng)估的難度,災(zāi)區(qū)災(zāi)害損失評(píng)估的真實(shí)情況就難以及時(shí)、準(zhǔn)確地到達(dá)災(zāi)害管理決策層手中,直接導(dǎo)致無(wú)法及時(shí)地、有針對(duì)性地、有效地開(kāi)展應(yīng)急響應(yīng)和災(zāi)害救援工作。
針對(duì)上述問(wèn)題,在互聯(lián)網(wǎng)時(shí)代和自媒體蓬勃發(fā)展的大背景下,通過(guò)對(duì)網(wǎng)絡(luò)社交媒體和城市突發(fā)災(zāi)害事件相關(guān)的用戶生成內(nèi)容的特點(diǎn)進(jìn)行研究,挖掘這些用戶生成內(nèi)容和突發(fā)災(zāi)害災(zāi)情的信息相關(guān)模式,結(jié)合用戶生成內(nèi)容的特點(diǎn)和規(guī)律構(gòu)建基于UGC的城市災(zāi)害損失動(dòng)態(tài)評(píng)估指標(biāo)框架,并應(yīng)用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和文本挖掘方法(如語(yǔ)義分析、主題識(shí)別、情感分析和特征詞匹配等)對(duì)評(píng)估指標(biāo)進(jìn)行提取,并利用提取的指標(biāo)構(gòu)建基于UGC的城市災(zāi)害損失動(dòng)態(tài)評(píng)估模型,對(duì)災(zāi)害的具體損失進(jìn)行分級(jí)。利用2015年8月12日天津港大爆炸的實(shí)際新浪微博數(shù)據(jù),對(duì)基于UGC的城市災(zāi)害損失動(dòng)態(tài)評(píng)估模型進(jìn)行驗(yàn)證,并對(duì)實(shí)驗(yàn)?zāi)P徒Y(jié)果進(jìn)行討論。
1文獻(xiàn)綜述
1.1城市災(zāi)害學(xué)
對(duì)城市突發(fā)災(zāi)害的研究,主要集中在災(zāi)害風(fēng)險(xiǎn)評(píng)估、防災(zāi)減災(zāi)、應(yīng)急管理績(jī)效評(píng)估、損失評(píng)估等方面。張明媛等[1]從風(fēng)險(xiǎn)具有的不確定性和復(fù)雜性入手,將城市災(zāi)害綜合風(fēng)險(xiǎn)看作是基于危險(xiǎn)性和易損性的不確定系統(tǒng),通過(guò)判斷風(fēng)險(xiǎn)確定的和不確定的影響因素,基于集對(duì)分析思想,建立了城市災(zāi)害綜合風(fēng)險(xiǎn)評(píng)價(jià)模型。燕群等[2]從城市防災(zāi)規(guī)劃的需要出發(fā),定義了基于防災(zāi)規(guī)劃的城市自然災(zāi)害風(fēng)險(xiǎn)分析與評(píng)估的內(nèi)涵,針對(duì)城市防災(zāi)規(guī)劃的特點(diǎn)和自然災(zāi)害風(fēng)險(xiǎn)分析的評(píng)價(jià)目標(biāo),構(gòu)建基于防災(zāi)規(guī)劃的城市自然災(zāi)害評(píng)估模型與評(píng)估流程。吳建安[3]對(duì)我國(guó)城市面對(duì)的突發(fā)自然災(zāi)害形勢(shì)和特點(diǎn)進(jìn)行了分析,認(rèn)為我國(guó)城市自然災(zāi)害風(fēng)險(xiǎn)高,具有災(zāi)害形勢(shì)復(fù)雜、救災(zāi)工作難度大的特點(diǎn)。張明媛等[4]考慮到城市自然災(zāi)害綜合風(fēng)險(xiǎn)評(píng)估過(guò)程的繁瑣,提出了一種基于事例推理(case-based reasoning,CBR)思想的風(fēng)險(xiǎn)評(píng)估方法。張永領(lǐng)等[5]以上海市18個(gè)區(qū)縣的人口和社會(huì)經(jīng)濟(jì)數(shù)據(jù)為基礎(chǔ)構(gòu)建了45個(gè)自然災(zāi)害社會(huì)脆弱性指標(biāo),并用主成分分析法選擇了16個(gè)獨(dú)立性強(qiáng)的重要指標(biāo)作為自然災(zāi)害社會(huì)脆弱性的評(píng)價(jià)指標(biāo),采用TOPSIS方法對(duì)上海市18個(gè)區(qū)縣的自然災(zāi)害社會(huì)脆弱性進(jìn)行了評(píng)價(jià)。陳娟[6]通過(guò)研究地方政府應(yīng)對(duì)城市自然災(zāi)害應(yīng)急管理績(jī)效評(píng)估機(jī)制,概述城市自然災(zāi)害應(yīng)急管理績(jī)效評(píng)估機(jī)制相關(guān)的概念及其意義,深入分析地方政府應(yīng)對(duì)城市自然災(zāi)害績(jī)效評(píng)估機(jī)制存在的主要問(wèn)題,并提出完善地方政府應(yīng)對(duì)城市自然災(zāi)害應(yīng)急管理績(jī)效評(píng)估機(jī)制的建議。姜乃力等[7]對(duì)遼寧省城市自然災(zāi)害強(qiáng)度進(jìn)行綜合評(píng)價(jià),劃分風(fēng)險(xiǎn)等級(jí),最終利用ArcGIS技術(shù)繪制風(fēng)險(xiǎn)評(píng)價(jià)圖。劉嚴(yán)萍等[8]指出社會(huì)參與減災(zāi)救災(zāi)的重要性,使得全球范圍內(nèi)的學(xué)者都在探索減災(zāi)救災(zāi)過(guò)程中有效社會(huì)參與的組織管理方法。竇玉丹等[9]將數(shù)據(jù)挖掘技術(shù)中的粗糙集理論、遺傳算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合,嘗試解決地震災(zāi)害損失評(píng)估問(wèn)題。謝云霞等[10]對(duì)城市洪澇易損性進(jìn)行評(píng)價(jià),提出以反映指標(biāo)復(fù)雜度的分維作為指標(biāo)權(quán)重的思路,同時(shí)考慮評(píng)價(jià)標(biāo)準(zhǔn)邊界值的模糊性,基于集對(duì)分析原理建立分形模糊集對(duì)評(píng)價(jià)模型。
1.2災(zāi)害損失評(píng)估
災(zāi)害評(píng)估是指災(zāi)害對(duì)于社會(huì)、生態(tài)和人類(lèi)造成變化的一種價(jià)值上的判斷,并以評(píng)估的理論和方法為出發(fā)點(diǎn),結(jié)合災(zāi)害的實(shí)際情況建立指標(biāo)系統(tǒng)、規(guī)則系統(tǒng)和模型系統(tǒng)。有關(guān)災(zāi)害損失評(píng)估的理論研究十分廣泛,并且對(duì)于不同的災(zāi)種其研究的重點(diǎn)也不盡相同。王桂枝等[11]以2012年7月北京特大暴雨為例嘗試改進(jìn)單部門(mén)損失傳導(dǎo)投入產(chǎn)出模型,通過(guò)引入多部門(mén)直接損失值,推導(dǎo)其他關(guān)聯(lián)部門(mén)的因?yàn)?zāi)間接損失。黃敏等[12]提出了工業(yè)企業(yè)停減產(chǎn)損失評(píng)估方法,并以蘆山7.0級(jí)地震為例評(píng)估行政區(qū)域工業(yè)企業(yè)停減產(chǎn)損失值。文世勇等[13]提出了赤潮災(zāi)害經(jīng)濟(jì)損失評(píng)估指標(biāo)體系,并且建立了赤潮災(zāi)害經(jīng)濟(jì)損失評(píng)估模型,還提出了赤潮災(zāi)害損失評(píng)估的技術(shù)流程。牛海燕等[14]根據(jù)1990—2007年的臺(tái)風(fēng)災(zāi)情資料,選取代表性指標(biāo),嘗試構(gòu)建了臺(tái)風(fēng)災(zāi)情評(píng)估模型,并對(duì)沿海省市的臺(tái)風(fēng)災(zāi)害損失及其與致災(zāi)因子的關(guān)系進(jìn)行分析評(píng)價(jià)。襲祝香等[15]利用1961—2012年吉林省逐日降水資料、暴雨災(zāi)情資料、逐年GDP和人口資料,采用灰色關(guān)聯(lián)度分析方法建立重大暴雨過(guò)程指數(shù)及災(zāi)損指數(shù),利用相關(guān)分析法對(duì)重大暴雨過(guò)程造成損失的影響因素進(jìn)行探討,采用多元回歸法建立了重大暴雨過(guò)程影響損失評(píng)估模型。吳紅華等[16-17]基于模糊數(shù)學(xué)和灰色系統(tǒng)理論提出了一種新的災(zāi)害損失評(píng)估方法,并證明了該方法具有客觀性和較高的精度。此外還對(duì)災(zāi)害損失評(píng)估的新途徑進(jìn)行了探索,根據(jù)模糊數(shù)學(xué)的理論,將區(qū)間數(shù)概念用于解決模糊綜合評(píng)價(jià)對(duì)象某些屬性的不確定性問(wèn)題,在此基礎(chǔ)上建立了區(qū)間數(shù)模糊綜合評(píng)判的數(shù)學(xué)模型以用于災(zāi)害損失評(píng)估。劉偉東等[18]針對(duì)近20年北京地區(qū)發(fā)生的大風(fēng)和暴雨災(zāi)害,應(yīng)用灰色關(guān)聯(lián)度方法,計(jì)算北京地區(qū)近20年的19例大風(fēng)和暴雨災(zāi)害的災(zāi)情評(píng)估指標(biāo)與關(guān)聯(lián)度,并進(jìn)行損失評(píng)估和比較。段華明[19]分析了防災(zāi)減災(zāi)和應(yīng)急措施的成效與不足,研究了社會(huì)學(xué)視閾中的災(zāi)害損失評(píng)估。張眉等[20]引入模糊綜合評(píng)價(jià)模型計(jì)算浙江省1983—2007年共53個(gè)臺(tái)風(fēng)案例的影響評(píng)價(jià)指數(shù),運(yùn)用均值-標(biāo)準(zhǔn)差分級(jí)法對(duì)浙江省歷史臺(tái)風(fēng)災(zāi)害影響強(qiáng)度進(jìn)行等級(jí)劃分,并將該指數(shù)與實(shí)際農(nóng)田損失面積進(jìn)行了回歸分析,擬合農(nóng)田損失面積預(yù)評(píng)估模型。
1.3用戶生成內(nèi)容
用戶生成內(nèi)容指由用戶原創(chuàng)的文字、圖片、聲音、視頻等內(nèi)容,主要發(fā)布在微博、博客、視頻分享網(wǎng)站、維基、在線問(wèn)答、SNS 等社會(huì)化媒體上。隨著互聯(lián)網(wǎng)的不斷深入變革、移動(dòng)互聯(lián)網(wǎng)的不斷興起以及自媒體時(shí)代的到來(lái),越來(lái)越多的個(gè)性化內(nèi)容、異構(gòu)內(nèi)容將為學(xué)術(shù)和工業(yè)界帶來(lái)更多機(jī)遇與挑戰(zhàn)。
在UGC用戶分類(lèi)、關(guān)系、動(dòng)因和行為的研究方面,尹麗英[21]將社會(huì)化媒體中用戶生成內(nèi)容的主要?jiǎng)右驓w納為社會(huì)、個(gè)體和技術(shù)3個(gè)層面,結(jié)合需要層次理論、雙因素理論和期望理論等激勵(lì)理論,針對(duì)社會(huì)化媒體中UGC的不同用戶群設(shè)計(jì)相應(yīng)的激勵(lì)措施。謝佳琳等[22]以微博用戶為調(diào)查對(duì)象,采用結(jié)構(gòu)方程建模方法進(jìn)行實(shí)證分析,研究發(fā)現(xiàn)感知娛樂(lè)性、預(yù)期互惠關(guān)系和主觀規(guī)范對(duì)用戶生成意愿存在顯著影響。汪旭暉等[23]研究UGC互動(dòng)效用與用戶品牌態(tài)度的關(guān)系,分析了人際易感性在其中的調(diào)節(jié)作用。關(guān)于內(nèi)容的監(jiān)督、管理與評(píng)價(jià)方面的研究,主要涉及到文本挖掘相關(guān)技術(shù)的應(yīng)用。費(fèi)仲超等[24]設(shè)計(jì)一套基于自然語(yǔ)言理解的互聯(lián)網(wǎng)UGC文本主觀觀點(diǎn)分析系統(tǒng)WSAM,該系統(tǒng)能挖掘出用戶主觀觀點(diǎn)所蘊(yùn)含的關(guān)注對(duì)象和主觀成分。史偉等[25]從語(yǔ)義的角度,運(yùn)用構(gòu)建模糊情感本體的方法,對(duì)中文在線評(píng)論情感分析進(jìn)行研究。王文等[26]提出了一種新的情感分析方法,并且以新浪微博為例證明該方法對(duì)情感傾向判斷的準(zhǔn)確率提高了約5%。關(guān)于利用用戶生成內(nèi)容來(lái)進(jìn)行實(shí)際預(yù)測(cè)的研究,其涉及的領(lǐng)域十分廣泛,都旨在利用用戶生成內(nèi)容的豐富信息。BOLLEN等[27]將情緒分為5類(lèi),利用格蘭杰因果檢驗(yàn)發(fā)現(xiàn)公眾情緒與道瓊斯平均指數(shù)(DJIA)之間存在著明顯的關(guān)聯(lián),且公眾情緒的時(shí)間序列可作為股指變化的自變量。
2評(píng)估模型
2.1評(píng)估指標(biāo)框架
基于UGC的城市災(zāi)害動(dòng)態(tài)評(píng)估指標(biāo)框架的提出主要是基于兩個(gè)方面:①是傳統(tǒng)災(zāi)害損失評(píng)估指標(biāo)及其側(cè)重點(diǎn);②是互聯(lián)網(wǎng)UGC的實(shí)際特點(diǎn)。前者的評(píng)估指標(biāo)體系結(jié)構(gòu)十分豐富,也較為成熟,災(zāi)害頻發(fā)讓其逐步改善,其科學(xué)性和現(xiàn)實(shí)意義重大,指導(dǎo)性強(qiáng)。因此筆者所提出的評(píng)估指標(biāo)框架部分來(lái)源于傳統(tǒng)災(zāi)害損失評(píng)估指標(biāo)體系。對(duì)于后者來(lái)講,現(xiàn)階段UGC主要側(cè)重于對(duì)事件的傳播,沒(méi)有豐富的災(zāi)害評(píng)估信息,且信息分散。但是UGC優(yōu)勢(shì)在于對(duì)突發(fā)災(zāi)害反應(yīng)的及時(shí)性,對(duì)于應(yīng)急管理決策者來(lái)講,如果能夠及時(shí)獲得與災(zāi)害相關(guān)的第一手信息,并將其與傳統(tǒng)災(zāi)害評(píng)估方法結(jié)合,必然能夠優(yōu)勢(shì)互補(bǔ),為應(yīng)急決策提供依據(jù)。
筆者所提出的評(píng)估指標(biāo)框架主要分為兩個(gè)方面:直接損失指標(biāo)和情感折算損失指標(biāo),具體評(píng)估指標(biāo)框架如圖1所示。
圖1 基于UGC的城市災(zāi)害動(dòng)態(tài)損失評(píng)估框架
對(duì)城市災(zāi)害相關(guān)的UGC內(nèi)容進(jìn)行信息分析,并按提取算法對(duì)損失評(píng)估指標(biāo)進(jìn)行獲取之后,再對(duì)評(píng)估框架中的各個(gè)指標(biāo)進(jìn)行權(quán)重設(shè)置,然后對(duì)災(zāi)害損失進(jìn)行動(dòng)態(tài)分總體評(píng)估。
2.2評(píng)估指標(biāo)算法
不同指標(biāo)根據(jù)其特點(diǎn)的不同應(yīng)采取不同的評(píng)估算法,筆者所針對(duì)的是文本類(lèi)UGC,因此評(píng)估指標(biāo)算法主要基于語(yǔ)義分析、主題識(shí)別、文本挖掘、情感分析、特征詞匹配等方法。
2.2.1直接損失指標(biāo)的人員損失
災(zāi)害發(fā)生后,與災(zāi)害相關(guān)的UGC常常會(huì)帶有個(gè)人對(duì)災(zāi)害的一個(gè)見(jiàn)聞上的描述,比如身邊有多少人受傷,財(cái)物有什么損失等,對(duì)含有這些信息的UGC內(nèi)容是直接損失指標(biāo)提取的關(guān)鍵,這些信息往往在內(nèi)容中比較明顯,大多數(shù)并不需要從語(yǔ)義上去理解。因此對(duì)于直接損失指標(biāo)主要采取關(guān)鍵詞匹配的方法,分別設(shè)置相應(yīng)的匹配模式進(jìn)行匹配,并對(duì)匹配結(jié)果數(shù)量進(jìn)行權(quán)重處理,因?yàn)樵跒?zāi)害發(fā)生后的時(shí)間段內(nèi),對(duì)直接損失指標(biāo)的UGC內(nèi)容描述存在滯后性,筆者加入了時(shí)間權(quán)重對(duì)得分進(jìn)行修正,最終得到各個(gè)指標(biāo)的相應(yīng)評(píng)估值。為了避免重復(fù)計(jì)算,首先剔除重復(fù)的UGC,然后通過(guò)語(yǔ)義相似度的方法,利用TFIDF對(duì)參與直接損失指標(biāo)計(jì)算的UGC進(jìn)行融合和剔除。以死亡人數(shù)為例,筆者采取的方式是針對(duì)特定時(shí)間的某一條UGC,通過(guò)關(guān)鍵詞對(duì)其內(nèi)容是否含有“count+人死亡”、“死亡+count”等與匹配模式相匹配的信息。然后對(duì)得到的具體數(shù)據(jù)按照如式(1)進(jìn)行計(jì)算,具體的匹配模式如表1所示,其中wordvec=[死亡,受傷,失蹤],weighttime為時(shí)間權(quán)重,weightp為人員損失權(quán)重。
scorep=countp×weighttime×weightp
(1)
2.2.2直接損失指標(biāo)的財(cái)物損失
與人員損失評(píng)估方法類(lèi)似,財(cái)物損失指標(biāo)的評(píng)估方式也采用關(guān)鍵詞匹配的方法,計(jì)算公式如式(2)所示,具體匹配模式如表2所示,其中objectvec=[房屋,道路,車(chē)輛,…],wordvec=[損毀,倒塌,損壞,陷入,…],weighttime為時(shí)間權(quán)重,weightt為財(cái)物損失權(quán)重。
scoret=countt×weighttime×weightt
(2)
表2 財(cái)物損失匹配模式表
2.2.3情感折算損失指標(biāo)的事件關(guān)注度
災(zāi)害的發(fā)生往往隨著時(shí)間的推移其關(guān)注度也會(huì)發(fā)生變化,發(fā)生的一瞬間其損失開(kāi)始形成,但是其關(guān)注度主要體現(xiàn)在與該災(zāi)害緊密相連的人,因此UGC的數(shù)量比較少,伴隨著時(shí)間的遞進(jìn),關(guān)注度會(huì)越來(lái)越高,可能會(huì)逐步轉(zhuǎn)移至災(zāi)害發(fā)生的原因或者救援上來(lái)。可見(jiàn)災(zāi)害的損失并不完全與其關(guān)注度在時(shí)間上存在著正相關(guān),然而如果從縱向來(lái)講,不同災(zāi)害關(guān)注度的高低,在時(shí)間上確實(shí)存在一定的正相關(guān)性。為了動(dòng)態(tài)地對(duì)災(zāi)害損失進(jìn)行評(píng)估,必須把時(shí)間因素考慮進(jìn)來(lái),這樣才能有效地對(duì)災(zāi)害損失進(jìn)行動(dòng)態(tài)評(píng)估,同時(shí)又能保證評(píng)估的有效性。因此事件關(guān)注度指標(biāo),主要分為事件持續(xù)時(shí)間指標(biāo)和事件UGC數(shù)指標(biāo)兩類(lèi)。其中事件持續(xù)時(shí)間指標(biāo)主要是用于區(qū)別不同災(zāi)害在同一時(shí)間段的損失,評(píng)估方式主要是在設(shè)置定時(shí)機(jī)制的基礎(chǔ)上,如以temp_t=[1 h,2 h,…,24 h]的設(shè)定下,采用直接計(jì)算的方式,運(yùn)算在災(zāi)害發(fā)生后特定temp_t[n]下的事件UGC數(shù)量,其中weightUGC_temp_t為事件持續(xù)時(shí)間指標(biāo)權(quán)重。增量計(jì)算公式如下所示:
(3)
事件UGC數(shù)為主要描述自然災(zāi)害關(guān)注度的硬性指標(biāo),動(dòng)態(tài)評(píng)估過(guò)程中主要計(jì)算災(zāi)害發(fā)生后到評(píng)估時(shí)段所有與災(zāi)害相關(guān)UGC數(shù)量的得分,其中weightUGC_ALL_t為事件UGC數(shù)指標(biāo)權(quán)重。計(jì)算公式如下所示:
score=countALL_t×weightUGC_ALL_t
(4)
2.2.4情感折算損失指標(biāo)的情感折算損失
災(zāi)害發(fā)生后,與災(zāi)害相關(guān)的UGC內(nèi)容往往包含著大量的個(gè)人情感信息,如恐懼、同情、擔(dān)心、傷心等,這些對(duì)于具體災(zāi)害的情感信息往往也攜帶著災(zāi)害損失的相關(guān)情況,如何將這些情感進(jìn)行量化,是提取情感折算損失指標(biāo)的主要內(nèi)容。筆者將情緒主要分為正面情緒和負(fù)面情緒,為了對(duì)這兩種情緒進(jìn)行量化,采取傳統(tǒng)的情感分析方法,通過(guò)對(duì)情感詞進(jìn)行匹配賦值的方式來(lái)評(píng)估其情感得分,同時(shí)還將描述這兩種情緒的詞分為評(píng)價(jià)性詞語(yǔ)和情感詞語(yǔ)兩類(lèi)??紤]到情緒程度的強(qiáng)弱問(wèn)題,將情感副詞分成了6類(lèi):最、非常、更、中性、不足、相反,對(duì)不同程度的情感副詞賦予不同的權(quán)重,從而與情感詞結(jié)合起來(lái)對(duì)UGC情感進(jìn)行評(píng)估。考慮到不同UGC文本的長(zhǎng)短不同,筆者將UGC按照“,”進(jìn)行分割,分別計(jì)算UGC每一段的情感值,然后進(jìn)行匯總,并以此獲得總情感得分、情感平均得分和情感得分方差3種類(lèi)型的情感得分,從而對(duì)于不同情況采用不同的指標(biāo)計(jì)算得分。其中weightemotion_p為正面情感得分權(quán)重,weightemotion_n為負(fù)面情感得分權(quán)重,總情感得分計(jì)算公式如下所示:
scoreemotion_total=scoreemotion_p×weightemotion_p-scoreemotion_n×weightemotion_n
(5)
2.3評(píng)估流程
基于UGC的城市災(zāi)害動(dòng)態(tài)評(píng)估流程主要包括數(shù)據(jù)獲取和數(shù)據(jù)分析兩個(gè)部分,當(dāng)城市災(zāi)害發(fā)生后,事件源的相關(guān)信息隨后便通過(guò)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)大量傳播,微博、微信、論壇、博客等平臺(tái)上產(chǎn)生大量與災(zāi)害相關(guān)的UGC。通過(guò)數(shù)據(jù)采集引擎和設(shè)定的定時(shí)機(jī)制對(duì)災(zāi)害相關(guān)UGC數(shù)據(jù)進(jìn)行采集;通過(guò)分析和計(jì)算對(duì)評(píng)估指標(biāo)框架中的相關(guān)指標(biāo)進(jìn)行提取;然后按照評(píng)估模型對(duì)該時(shí)段內(nèi)的災(zāi)害損失進(jìn)行評(píng)估,產(chǎn)生定時(shí)評(píng)估報(bào)告,推送給應(yīng)急決策者,隨著災(zāi)害發(fā)生后時(shí)間的推移,定時(shí)機(jī)制也不斷改變,作用于數(shù)據(jù)采集引擎循環(huán)之前的過(guò)程,從而動(dòng)態(tài)地產(chǎn)生災(zāi)害損失評(píng)估。具體評(píng)估流程如圖2所示。
圖2 災(zāi)害評(píng)估流程圖
3案例研究
3.1數(shù)據(jù)來(lái)源
針對(duì)2015年8月12日天津港大爆炸事件,筆者以“天津爆炸”、“天津塘沽爆炸”、“2015年8月12日天津大爆炸”為主題搜索詞,通過(guò)新浪提供的微博API接口,對(duì)相同微博去重處理后,抓取了8月12日到8月25日兩周內(nèi)微博,共10 421條,抓取字段有作者、微博、時(shí)間、點(diǎn)贊數(shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù),并按照評(píng)估指標(biāo)框架對(duì)微博進(jìn)行分析計(jì)算。圖3所示為8月13—25日抓取的微博數(shù)量分布圖。
圖3 微博數(shù)量分布圖
從圖3可以看到,爆炸發(fā)生后,與爆炸相關(guān)的微博UGC數(shù)量大量產(chǎn)生,在第一天達(dá)到峰值,隨后有減弱的趨勢(shì),這主要是因?yàn)榇舜伪òl(fā)生在深夜,第二天白天對(duì)爆炸的傳播起到了很大的傳播作用,隨著時(shí)間的推移,救援和責(zé)任追究也使得與爆炸有關(guān)的UGC有了較大的增加。因此考慮到爆炸的持續(xù)時(shí)間較短,為了更好地反映爆炸帶來(lái)的情感損失折算,筆者主要對(duì)爆炸發(fā)生后24 h內(nèi)的數(shù)據(jù)進(jìn)行分析處理。所采用的情緒詞和情感副詞信息分別如表3和表4所示。
表3 情緒詞表
表4 情感副詞表
3.2實(shí)驗(yàn)結(jié)果
3.2.1動(dòng)態(tài)評(píng)估
爆炸相關(guān)UGC內(nèi)容所帶有的情感信息往往隨著事態(tài)發(fā)展而不斷地變化,爆炸發(fā)生時(shí)負(fù)面情緒往往是驚恐、害怕、恐懼等情感比較強(qiáng)烈,隨后會(huì)逐漸往可憐、悲傷、傷感發(fā)展。而正面情緒往往在爆炸發(fā)生前比較平淡,隨后會(huì)往團(tuán)結(jié)、感動(dòng)、贊揚(yáng)等積極性情感發(fā)展。
筆者以1 h為定時(shí)機(jī)制,對(duì)天津爆炸發(fā)生后24 h正負(fù)情感指標(biāo)進(jìn)行動(dòng)態(tài)評(píng)估,其UGC正負(fù)情感折算損失如圖4所示。由圖4可以看出,在爆炸發(fā)生的1~2 h負(fù)面情感折算指標(biāo)值異常之高,而正面情感折算指標(biāo)值卻比較低和平緩,同時(shí)在隨后2 h內(nèi)負(fù)面情感折算指標(biāo)值下降得十分明顯,主要原因是爆炸發(fā)生時(shí)間比較晚,3~4 h后約為凌晨3點(diǎn),多數(shù)人都已經(jīng)熟睡,爆炸事件信息的傳播受到了影響。在5 h后負(fù)面情感折算指標(biāo)值開(kāi)始攀升,正面情感折算指標(biāo)值也小幅度上升,負(fù)面情感折算指標(biāo)值上升的主要原因是白天到來(lái),事件信息傳播效果開(kāi)始變好,正面情感折算指標(biāo)值上升主要是人們的同情和祈福等正面情緒開(kāi)始形成。隨著時(shí)間的推移正負(fù)情感折算指標(biāo)值都趨于小幅波動(dòng)。
圖4 動(dòng)態(tài)情感正負(fù)情感折算損失
圖5所示為動(dòng)態(tài)情感損失總折算結(jié)果,可以看到爆炸的主要損失集中在爆炸發(fā)生后的幾個(gè)小時(shí)內(nèi),通過(guò)趨勢(shì)線可發(fā)現(xiàn),情感損失折算呈遞減趨勢(shì),整個(gè)過(guò)程與爆炸損失波動(dòng)過(guò)程契合。
圖5 動(dòng)態(tài)情感損失總折算結(jié)果
3.2.2增量評(píng)估
增量評(píng)估主要是對(duì)爆炸發(fā)生后到具體評(píng)估的某個(gè)時(shí)間之間的損失總值,這個(gè)指標(biāo)對(duì)于爆炸的損失評(píng)估十分重要,增量正負(fù)情感折算損失值如圖6所示,可以看到,爆炸正負(fù)情感損失折算都呈遞增的趨勢(shì),增量負(fù)面情感折算損失隨著時(shí)間的推移其斜率逐漸變小,說(shuō)明負(fù)面情感折算損失的增長(zhǎng)速度逐漸減緩,而增量正面情感折算損失的斜率隨時(shí)間逐漸增加,可見(jiàn)正面情感折算損失增長(zhǎng)速度是逐漸增加的,最終兩者有相交的趨勢(shì)。這符合實(shí)際爆炸情況,即單位時(shí)間損失逐漸減少,一定時(shí)間內(nèi)總損失逐漸增加的情況。
圖6 增量正負(fù)情感折算
圖7所示為增量情感總折算結(jié)果,可以發(fā)現(xiàn)損失逐漸增加,但是增加速度逐漸變慢,總損失最終有沿直線向上變化的趨勢(shì),即總損失最終固定在某一點(diǎn),這與實(shí)際情況是相符的。但是前12個(gè)小時(shí)的損失增長(zhǎng)速度較快,說(shuō)明了深夜對(duì)爆炸損失信息的滯后效果明顯。
圖7 增量總折算結(jié)果
4結(jié)論
考慮到傳統(tǒng)災(zāi)害損失評(píng)估持續(xù)時(shí)間長(zhǎng),災(zāi)害損失信息的上報(bào)環(huán)節(jié)多,災(zāi)害損失信息不完整的缺點(diǎn),結(jié)合飛速發(fā)展的互聯(lián)網(wǎng)平臺(tái),利用其數(shù)據(jù)量大、及時(shí)性的特點(diǎn),收集并分析個(gè)體所發(fā)表的與災(zāi)害相關(guān)的UGC數(shù)據(jù),根據(jù)其特點(diǎn)建立基于UGC的城市災(zāi)害動(dòng)態(tài)評(píng)估模型,最終將這些相關(guān)信息轉(zhuǎn)化成災(zāi)害損失具體評(píng)估值。并通過(guò)實(shí)例驗(yàn)證了模型的有效性,可作為傳統(tǒng)災(zāi)害評(píng)估方式的一個(gè)重要補(bǔ)充。
參考文獻(xiàn):
[1]張明媛,袁永博,周晶,等.城市自然災(zāi)害風(fēng)險(xiǎn)分析新方法[J].大連理工大學(xué)學(xué)報(bào),2010,50(5):706-711.
[2]燕群,蒙吉軍,康玉芳,等.基于防災(zāi)規(guī)劃的城市自然災(zāi)害風(fēng)險(xiǎn)分析與評(píng)估研究進(jìn)展[J].地理與地理信息科學(xué),2011,27(6):78-83,95.
[3]吳建安.我國(guó)城市自然災(zāi)害與應(yīng)急管理體系研究[J].價(jià)值工程,2012,31(17):307-308.
[4]張明媛,劉妍,袁永博,等.城市自然災(zāi)害綜合風(fēng)險(xiǎn)評(píng)估問(wèn)題研究[J].防災(zāi)減災(zāi)工程學(xué)報(bào),2012,32(2):176-180.
[5]張永領(lǐng),游溫嬌.基于TOPSIS的城市自然災(zāi)害社會(huì)脆弱性評(píng)價(jià)研究:以上海市為例[J].災(zāi)害學(xué),2014,29(1):109-114.
[6]陳娟.地方政府應(yīng)對(duì)城市自然災(zāi)害應(yīng)急管理績(jī)效評(píng)估機(jī)制研究[J].科技促進(jìn)發(fā)展,2014(6):105-110.
[7]姜乃力,馮曉琳,高航,等.遼寧省城市自然災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià)及綜合減災(zāi)對(duì)策研究[J].資源開(kāi)發(fā)與市場(chǎng),2013,29(5):475-477.
[8]劉嚴(yán)萍,王震.城市自然災(zāi)害風(fēng)險(xiǎn)應(yīng)急管理多元參與體制架構(gòu)設(shè)計(jì)[J].河北聯(lián)合大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2014(2):165-168.
[9]竇玉丹,袁永博,張明媛,等.基于粗糙遺傳BP網(wǎng)絡(luò)的震害損失評(píng)估模型研究[J].工程管理學(xué)報(bào),2010,24(1):29-32.
[10]謝云霞,王文圣.城市洪澇易損性評(píng)價(jià)的分形模糊集對(duì)評(píng)價(jià)模型[J].深圳大學(xué)學(xué)報(bào)(理工版),2012,29(1):12-17.
[11]王桂芝,李霞,陳紀(jì)波,等.基于IO模型的多部門(mén)暴雨災(zāi)害間接經(jīng)濟(jì)損失評(píng)估:以北京市“7·21”特大暴雨為例[J].災(zāi)害學(xué),2015,30(2):94-99.
[12]黃敏,王健,袁一凡,等.工業(yè)企業(yè)地震災(zāi)害停減產(chǎn)損失評(píng)估方法研究:以蘆山7.0級(jí)地震為例[J].災(zāi)害學(xué),2015,30(1):171-174.
[13]文世勇,宋旭,田原原,等.赤潮災(zāi)害經(jīng)濟(jì)損失評(píng)估技術(shù)方法[J].災(zāi)害學(xué),2015,30(1):25-28.
[14]牛海燕,劉敏,陸敏,等.中國(guó)沿海地區(qū)臺(tái)風(fēng)災(zāi)害損失評(píng)估研究[J].災(zāi)害學(xué),2011,26(3):61-64.
[15]襲祝香,紀(jì)玲玲,張碩,等.吉林省重大暴雨過(guò)程影響損失評(píng)估模型的建立[J].氣象與環(huán)境學(xué)報(bào),2014(5):141-145.
[16]吳紅華.災(zāi)害損失評(píng)估的灰色模糊綜合方法[J].自然災(zāi)害學(xué)報(bào),2005,14(2):115-118.
[17]吳紅華,李正農(nóng).災(zāi)害損失評(píng)估的區(qū)間數(shù)模糊綜合評(píng)判方法[J].自然災(zāi)害學(xué)報(bào),2006,15(6):149-153.
[18]劉偉東,扈海波,程叢蘭,等.灰色關(guān)聯(lián)度方法在大風(fēng)和暴雨災(zāi)害損失評(píng)估中的應(yīng)用[J].氣象科技,2007,35(4):563-566.
[19]段華明.社會(huì)學(xué)視閾中的災(zāi)害損失評(píng)估研究[J].廣州大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2014(6):19-24.
[20]張眉,金有杰,王倩,等.基于模糊綜合評(píng)價(jià)法的浙江省臺(tái)風(fēng)災(zāi)害農(nóng)田損失評(píng)估分析[J].湖北農(nóng)業(yè)科學(xué),2014,53(20):5002-5006.
[21]尹麗英.用戶生成內(nèi)容動(dòng)因分析及激勵(lì)設(shè)計(jì):以新浪微博為例[J].數(shù)字圖書(shū)館論壇,2015(6):38-44.
[22]謝佳琳,張晉朝.用戶在線生成內(nèi)容意愿影響因素研究[J].信息資源管理學(xué)報(bào),2014(1):69-77.
[23]汪旭暉,李璐琳.基于在線品牌社群的UGC互動(dòng)效用對(duì)用戶品牌態(tài)度的影響:人際易感性的調(diào)節(jié)作用[J].現(xiàn)代情報(bào),2015,35(7):24-28.
[24]費(fèi)仲超,朱鯤鵬,魏芳,等.WSAM:互聯(lián)網(wǎng)UGC文本主觀觀點(diǎn)挖掘系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(5):90-94.
[25]史偉,王洪偉,何紹義,等.基于語(yǔ)義的中文在線評(píng)論情感分析[J].情報(bào)學(xué)報(bào),2013,32(8):860-867.
[26]王文,王樹(shù)鋒,李洪華,等.基于文本語(yǔ)義和表情傾向的微博情感分析方法[J].南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(6):733-738.
[27]BOLLEN J,MAO H N,ZENG X J.Twitter mood predicts the stock market[J].Journal of Computational Science,2011,1(2):1-8.
SHAN Siqing:Prof.; School of Economics and Management,Beihang University,Beijing 100191,China.
[編輯:王志全]
文章編號(hào):2095-3852(2016)01-0001-07
文獻(xiàn)標(biāo)志碼:A
收稿日期:2015-10-26.
作者簡(jiǎn)介:閃四清(1965-),男,北京人,北京航空航天大學(xué)經(jīng)濟(jì)管理學(xué)院教授;博士生導(dǎo)師.
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(71471008);國(guó)家自然科學(xué)基金重點(diǎn)資助項(xiàng)目(91224007).
中圖分類(lèi)號(hào):X915.5
DOI:10.3963/j.issn.2095-3852.2016.01.001
Dynamic City Disaster Loss Assessment Model Based on User Generated Content
SHAN Siqing,LIN Xiao,ZHANG Tong
Abstract:The purpose of this article is from the perspective of UGC to dynamic modeling cities' disaster losses.Current disaster assessment facing long duration,reporting link losses disaster information,disaster loss information is not complete and other issues,this paper intends to use methods of semantic analysis,text mining,sentiment analysis,word matching feature,on the basis of analysising the features of urban disaster UGC,design evaluation system of urban disaster losses based UGC to build disaster dynamically and continuously monitoring and analysis algorithms,disaster loss incremental assessment process for disaster emergency response decision support.This paper selects the actual data Tianjin Port explosion of dynamic assessment model of urban disaster losses UGC based on verified,empirical evidence that the model is valid.
Key words:emergency management; city disaster; UGC; disaster damage assessment; dynamic assessment