張 偉,陳曉慧,李 鋒
(1. 信息工程大學(xué) 地理空間信息學(xué)院,河南 鄭州 450001;2. 地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710000)
淺析地理輿情的概念及相關(guān)技術(shù)
張 偉1,2,陳曉慧1,2,李 鋒1
(1. 信息工程大學(xué) 地理空間信息學(xué)院,河南 鄭州 450001;2. 地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710000)
分別從地理輿情的基礎(chǔ)理論、技術(shù)支撐、概念解析、分類(lèi)定義及框架體系等方面,對(duì)地理輿情進(jìn)行了系統(tǒng)的介紹,以期能研究地理輿情的體系框架,為大數(shù)據(jù)時(shí)代地理輿情的網(wǎng)絡(luò)環(huán)境研究打下基礎(chǔ)。
地理輿情;概念;可視分析
隨著科學(xué)技術(shù)的不斷發(fā)展進(jìn)步,尤其是以互聯(lián)網(wǎng)、移動(dòng)互聯(lián)、物聯(lián)網(wǎng)組成的泛在網(wǎng)絡(luò)為代表的Web2.0時(shí)代的到來(lái),網(wǎng)絡(luò)空間的用戶數(shù)正處于一個(gè)高速增長(zhǎng)的
時(shí)期。網(wǎng)絡(luò)媒體已被公認(rèn)是繼報(bào)紙、廣播、電視之后的“第四媒體”,網(wǎng)絡(luò)成為反映社會(huì)輿情的主要載體之一。大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)輿情表現(xiàn)為廣泛、快速、互動(dòng)、自由等特性,掌握不好也具有危害性[1,2]。因此,利用網(wǎng)絡(luò)媒體進(jìn)行網(wǎng)絡(luò)輿情分析已經(jīng)得到了廣泛的關(guān)注。本文介紹和研究了大數(shù)據(jù)時(shí)代地理輿情研究的理論依據(jù)和技術(shù)支撐,以期為地理空間信息科學(xué)的研究領(lǐng)域拓展奠定基礎(chǔ)。
從研究領(lǐng)域來(lái)看,地理輿情的研究方向是地理學(xué)、社會(huì)學(xué)和情報(bào)學(xué)交叉學(xué)科的研究領(lǐng)域,不屬于某個(gè)單一領(lǐng)域,是多領(lǐng)域的結(jié)合;從分析方法來(lái)看,地理輿情還涉及統(tǒng)計(jì)數(shù)學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域。因此,地理輿情的理論基礎(chǔ)見(jiàn)表1。
表1 地理輿情的理論基礎(chǔ)
①地理學(xué)的基礎(chǔ)理論,為地理輿情的研究范圍提供依據(jù),為地理輿情的客體研究提供理論支撐。尤其是空間認(rèn)知理論,為地理輿情的可視化提供了參考,地理語(yǔ)義的認(rèn)知是地理輿情分析概念模型構(gòu)建的基本依據(jù)。②社會(huì)學(xué)的基礎(chǔ)理論,為地理輿情的分析提供方法依據(jù)。傳統(tǒng)輿情分析過(guò)程一般包括收集、處理、分析、總結(jié)等,在此基礎(chǔ)上地理輿情分析過(guò)程可分為數(shù)據(jù)獲取、信息抽取、統(tǒng)計(jì)分析、可視化分析等。社會(huì)心理學(xué)的理論為輿情的情感分析提供依據(jù)。③情報(bào)學(xué)的基礎(chǔ)理論,為地理輿情的歸宿提供理論依據(jù)。地理輿情是主體對(duì)客體的主觀情感進(jìn)行分析,挖掘主體之間的關(guān)系、客體的分布、發(fā)展、變化的規(guī)律。地理輿情是人們(主體)對(duì)客體的主觀認(rèn)識(shí)的客觀反映。當(dāng)然,情報(bào)學(xué)中的一些標(biāo)準(zhǔn)規(guī)范、分析方法等也給地理輿情分析提供了依據(jù)。
大數(shù)據(jù)時(shí)代,地理輿情分析往往采用基于網(wǎng)絡(luò)的形式獲取數(shù)據(jù),其最大優(yōu)點(diǎn)是自由性。因此,地理輿情分析需要通過(guò)數(shù)據(jù)挖掘[3]、自然語(yǔ)言處理[4]、可視分析[5,6]等關(guān)鍵技術(shù),實(shí)現(xiàn)對(duì)地理輿情的實(shí)時(shí)獲取、統(tǒng)計(jì)分析、可視化表達(dá)和預(yù)測(cè)判斷等,如表2所示。
表2 地理輿情分析的技術(shù)支撐
數(shù)據(jù)挖掘技術(shù)為地理輿情分析的數(shù)據(jù)處理提供了技術(shù)支撐。地理輿情中主客體都要進(jìn)行特征化描述,對(duì)主體的關(guān)系進(jìn)行關(guān)聯(lián)分析,客體的發(fā)展過(guò)程進(jìn)行演變分析及趨勢(shì)分析,客體的事件分布可以用數(shù)據(jù)挖掘的聚類(lèi)分析進(jìn)行聚類(lèi)表示。自然語(yǔ)言處理技術(shù)為地理輿情分析的信息處理提供技術(shù)支持。命名實(shí)體識(shí)別是自然語(yǔ)言處理中一個(gè)關(guān)鍵技術(shù)。自然語(yǔ)言處理中信息抽取、關(guān)系抽取、自動(dòng)文摘等技術(shù)是地理輿情中進(jìn)行地名事件識(shí)別、主客體關(guān)系分析、事件過(guò)程標(biāo)注的基礎(chǔ)。地理輿情分析,除統(tǒng)計(jì)分析外,還要依靠可視分析進(jìn)行人機(jī)交互,挖掘更高級(jí)別的推理成果。地理輿情的可視分析不僅是“可視化-分析”的過(guò)程,而是“分析-可視化-分析”的一個(gè)循環(huán)過(guò)程。地理輿情分析目的是為了得到主客體相互關(guān)系及其發(fā)展規(guī)律,并預(yù)測(cè)發(fā)展趨勢(shì)。
地理輿情是以地理學(xué)、社會(huì)學(xué)、情報(bào)學(xué)等理論為基礎(chǔ),數(shù)據(jù)挖掘、自然語(yǔ)言處理、可視分析等技術(shù)為支撐,人(民眾)為主體,具有地理空間屬性的對(duì)象或事件為客體,在一定的社會(huì)空間(包括虛擬網(wǎng)絡(luò)空間)內(nèi),獲取主體對(duì)具有地理空間特征的現(xiàn)象或事件的發(fā)生、發(fā)展和變化的態(tài)度、情緒、意見(jiàn)的主觀表現(xiàn),并分析具有空間、時(shí)間以及視覺(jué)特征的關(guān)于主客體關(guān)系及發(fā)展規(guī)律(分布和趨勢(shì))的情報(bào),如圖1所示。
圖1 地理輿情定義結(jié)構(gòu)圖
地理輿情的特點(diǎn)為:
1)時(shí)空關(guān)聯(lián)性。地理輿情研究對(duì)象是具有時(shí)空特征的輿論情報(bào),具體表現(xiàn)為時(shí)空事件的主觀態(tài)度、相互關(guān)系及其發(fā)展規(guī)律。
2)實(shí)時(shí)動(dòng)態(tài)性。地理輿情其本質(zhì)是一個(gè)情報(bào)產(chǎn)品,具有情報(bào)的實(shí)時(shí)性與動(dòng)態(tài)性,隨時(shí)間變化而不斷發(fā)生變化。
3)主觀不確定性。地理輿情研究的主體是人本身,信息來(lái)源是人的主觀表現(xiàn),因此具有主觀情感特征。
4)可視性和預(yù)測(cè)性。地理輿情分析的目的是提供可視化的情報(bào)產(chǎn)品,預(yù)測(cè)地理輿情的發(fā)展走向,輔助決策。
地理輿情按照內(nèi)容可分為:環(huán)境輿情、資源輿情、人口輿情、土地輿情、城鎮(zhèn)輿情、水利輿情和交通輿情等[7],如表3;按照性質(zhì)可分為:政治輿情、經(jīng)濟(jì)輿情、軍事輿情、文化輿情、社會(huì)輿情和生態(tài)輿情等,如表4。
地理輿情的基本要素包括地理輿情對(duì)象(GO)、地理輿情事件(GE)、地理輿情過(guò)程(GP)和地理輿情屬性(GA),是一個(gè)四元組{GO,GE,GP,GA}集合。地理輿情分析模型設(shè)計(jì)主要從數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、功能應(yīng)用4個(gè)方面進(jìn)行模塊化設(shè)計(jì)。以地理輿情的概念模型為基礎(chǔ),對(duì)地理輿情的內(nèi)容、分析手段及產(chǎn)品表現(xiàn)進(jìn)行規(guī)范,如圖2。
表3 按內(nèi)容分類(lèi)的地理輿情
表4 按性質(zhì)分類(lèi)的地理輿情
圖2 邏輯框架圖
大數(shù)據(jù)時(shí)代,測(cè)繪保障已經(jīng)不是簡(jiǎn)單的提供數(shù)據(jù)服務(wù),而是將數(shù)據(jù)轉(zhuǎn)化為信息,從信息中提取知識(shí),最終為用戶提供智能服務(wù)。地理輿情是通過(guò)對(duì)樣本數(shù)據(jù)進(jìn)行分析而得出具有時(shí)空特征及發(fā)展規(guī)律的情報(bào)產(chǎn)品,是測(cè)繪在人文社會(huì)空間和網(wǎng)絡(luò)空間的典型應(yīng)用。隨著科技的不斷發(fā)展,無(wú)論從網(wǎng)絡(luò)安全分析、研究領(lǐng)域的拓展,還是測(cè)繪保障的需求,地理輿情都是大數(shù)據(jù)時(shí)代地理空間信息科學(xué)領(lǐng)域研究的重要內(nèi)容。
[1] 陸鋒,張恒才.大數(shù)據(jù)與廣義GIS[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2014,39(6):645-654
[2] 李清泉,李德仁.大數(shù)據(jù)GIS[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2014,39(6):641-644
[3] Han J W,Kamber M.數(shù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2004
[4] 張素香.信息抽取中關(guān)鍵技術(shù)的研究[D].北京:北京郵電大學(xué),2007
[5] Keim D, Andrienko G, Fekete J, et al. Visual Analytics: Definition, Process, and Challenges[C].In: Kerren A, Berlin,2008
[6] 華一新,曹亞妮,李響.地理空間可視分析及其研究方向綜述[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2012,29(4):235-239
[7] 陳俊勇.地理國(guó)情監(jiān)測(cè)的學(xué)習(xí)札記[J].測(cè)繪學(xué)報(bào),2012, 41(5):633-635
P208
B
1672-4623(2016)03-0005-02
10.3969/j.issn.1672-4623.2016.03.002
張偉,博士,工程師,研究方向?yàn)樽鲬?zhàn)環(huán)境學(xué)。
2015-01-12。
項(xiàng)目來(lái)源:國(guó)家自然科學(xué)基金資助項(xiàng)目(41301428);地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室重點(diǎn)基金資助項(xiàng)目(SKLGIE2014-Z-4-1)。