国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

熵權(quán)法在中國國際關(guān)系可視化分析中的應(yīng)用

2023-06-25 03:40陳思杭王文宏曾夢(mèng)緣宋文明姜思羽
現(xiàn)代信息科技 2023年4期
關(guān)鍵詞:國際關(guān)系自然語言處理數(shù)據(jù)可視化

陳思杭 王文宏 曾夢(mèng)緣 宋文明 姜思羽

摘? 要:近年來全球局勢(shì)緊張,大國關(guān)系愈發(fā)錯(cuò)綜復(fù)雜,對(duì)當(dāng)前國際形勢(shì)進(jìn)行研究分析已成為各國政府的重要使命。采用大數(shù)據(jù)與數(shù)據(jù)挖掘等技術(shù),對(duì)中國與別國于各領(lǐng)域的往來數(shù)據(jù)進(jìn)行采集,并通過NLP、熵權(quán)法等方法對(duì)所得數(shù)據(jù)做分析處理,最后以數(shù)據(jù)可視化技術(shù)將其呈現(xiàn),以直觀展示中國國際關(guān)系的變化,令更多民眾了解國家外交之動(dòng)態(tài)與大國之風(fēng)采。其數(shù)據(jù)結(jié)果呈現(xiàn)方式多樣,為促進(jìn)民眾了解當(dāng)前國際形勢(shì)及中國國際關(guān)系提供了一定研究思路。

關(guān)鍵詞:國際關(guān)系;數(shù)據(jù)分析;數(shù)據(jù)可視化;爬蟲技術(shù);自然語言處理

中圖分類號(hào):TP391? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2023)04-0177-04

Application of Entropy Weight Method in Visualization Analysis of China's International Relations

CHEN Sihang1, WANG Wenhong1, ZENG Mengyuan1, SONG Wenming2, JIANG Siyu1

(1.School of Information Science and Technology, Guangdong University of Foreign Studies, Guangzhou? 510006, China;

2.Guangzhou Automobile Group Co., Ltd., Guangzhou? 510623, China)

Abstract: In recent years, the global situation has become increasingly tense, and the relations between major countries have become increasingly complex. It has become an important mission of national governments to study and analyze the current international situation. This paper uses big data, data mining and other technologies, collects the communication data between China and other countries in various fields, analyzes and processes the obtained data through NLP, entropy weight method and other methods. Finally, it visually shows the change of China's international relations with data visualization technology, which makes more people understand the dynamic of national diplomacy and great power of country. The data results are presented in various ways, which provides some research ideas for promoting the public to understand the current international situation and China's international relations.

Keywords: international relations; data analysis; data visualization; crawler technology; natural language processing

0? 引? 言

邁入21世紀(jì),當(dāng)今世界正由“信息時(shí)代”逐步轉(zhuǎn)向“數(shù)據(jù)時(shí)代”[1],隨著全球關(guān)系的日益緊密,國家貿(mào)易交易金額、投資額等海量數(shù)據(jù)不斷累積,一系列數(shù)據(jù)清晰反映了國際關(guān)系的動(dòng)態(tài)變化。而近年來伴隨著新冠疫情復(fù)雜嚴(yán)峻的發(fā)展態(tài)勢(shì)[2]、俄烏戰(zhàn)爭爆發(fā)等一系列國際事件的影響,國際形勢(shì)不穩(wěn)定性、不確定性大幅增加,大國關(guān)系更趨錯(cuò)綜復(fù)雜,國與國之間的貿(mào)易、經(jīng)濟(jì)和文化等發(fā)展情況多元且不可測,其不穩(wěn)定性與可塑性均有所上升。對(duì)國際交往中的海量數(shù)據(jù)進(jìn)行合理分析,可清晰地掌握各國國際關(guān)系及當(dāng)前國際形勢(shì),并幫助相關(guān)從業(yè)人員在處理有關(guān)事務(wù)時(shí)作出更為準(zhǔn)確的判斷。對(duì)此,本文基于自然語言處理與大數(shù)據(jù)技術(shù),結(jié)合數(shù)據(jù)挖掘與數(shù)據(jù)可視化方法,對(duì)中國與其他各國在政治、經(jīng)濟(jì)、文化等六大領(lǐng)域的往來數(shù)據(jù)[3]進(jìn)行采集與分析,并將相關(guān)結(jié)果以可視化形式動(dòng)態(tài)呈現(xiàn),使數(shù)據(jù)豐富立體化,旨在展示中國國際關(guān)系變化情況,同時(shí)更直觀地觀察各國與中國在經(jīng)濟(jì)、文化等方面的聯(lián)系密切程度,令更多群眾了解國家外交之動(dòng)態(tài)與大國之風(fēng)采,系統(tǒng)主體框架如圖1所示,具體實(shí)現(xiàn)過程如下:首先利用Python所提供的BeautifulSoup等相關(guān)庫,對(duì)國別區(qū)域與全球治理數(shù)據(jù)平臺(tái)、外交部官網(wǎng)等相關(guān)網(wǎng)站的文本及數(shù)值數(shù)據(jù)進(jìn)行采集,并對(duì)所獲數(shù)據(jù)通過Python及Excel等工具進(jìn)行數(shù)據(jù)清洗與預(yù)處理;隨后對(duì)于所得數(shù)據(jù)利用熵權(quán)法等算法進(jìn)行國家合作度評(píng)分、話題熱度指數(shù)等計(jì)算;最后采用詞云圖、氣泡圖等方式進(jìn)行文本數(shù)據(jù)可視化,通過繪制餅圖、折線圖、儀表盤等方式對(duì)數(shù)值型數(shù)據(jù)進(jìn)行可視化呈現(xiàn)。

1? 相關(guān)研究

國際關(guān)系歷來是相關(guān)領(lǐng)域?qū)W者重點(diǎn)研究的議題,對(duì)國際關(guān)系展開研究,有利于我國了解國際形勢(shì),把握自身國際地位,在國際交往中掌握主動(dòng)權(quán)。然而其復(fù)雜性、不確定性以及龐大的數(shù)據(jù)量也為相關(guān)的研究分析帶來巨大挑戰(zhàn)。近年來,基于國際關(guān)系分析的研究多以文本或研究報(bào)告的形式展示,各學(xué)者研究角度亦有所不同。南京師范大學(xué)薛浩男等以網(wǎng)絡(luò)新聞文本為數(shù)據(jù)源,結(jié)合信息計(jì)算與地理視角,力圖將國際關(guān)系與地理學(xué)相融合,對(duì)國際關(guān)系進(jìn)行分析[4]。吉林大學(xué)齊嘯天則利用大數(shù)據(jù)分析技術(shù),將大數(shù)據(jù)研究與國際政治預(yù)測相結(jié)合,通過文獻(xiàn)梳理、實(shí)例分析及比較研究等方法對(duì)國際關(guān)系及國際形勢(shì)作出研判預(yù)測[5]。北京郵電大學(xué)王駿提出了基于文本挖掘的國際關(guān)系網(wǎng)絡(luò)研究,通過文本挖掘從大規(guī)模文本中構(gòu)建國際關(guān)系網(wǎng)絡(luò),同時(shí)利用可視化技術(shù)對(duì)所構(gòu)建的網(wǎng)絡(luò)進(jìn)行分析與展示[6]。綜上所述,當(dāng)前有關(guān)國際關(guān)系的研究已經(jīng)取得一定成果,但目前從可視化角度出發(fā)對(duì)相關(guān)結(jié)果進(jìn)行分析展示的研究仍相對(duì)較少,因此本文立足于國際關(guān)系分析與可視化技術(shù),力圖將分析所得數(shù)據(jù)與可視化展示相結(jié)合,打造良好呈現(xiàn)效果。

2? 模型和算法

本文采用熵權(quán)法進(jìn)行國別合作度評(píng)分計(jì)算。熵權(quán)法是一種客觀賦權(quán)方法[7],在具體使用過程中,該算法根據(jù)各指標(biāo)數(shù)據(jù)的分散程度,利用信息熵計(jì)算出各指標(biāo)的熵權(quán),再根據(jù)各指標(biāo)對(duì)熵權(quán)進(jìn)行一定的修正,從而得到較為客觀的指標(biāo)權(quán)重;因此,結(jié)合熵權(quán)法與國家信息中心所供評(píng)分標(biāo)準(zhǔn)[8],可對(duì)中國與其他各國的合作度作出評(píng)價(jià)。

國別合作度評(píng)分是考量中國和其他國家關(guān)系的重要指標(biāo),能夠直觀地體現(xiàn)兩國之間的關(guān)系,合作度評(píng)分越高,則兩國關(guān)系越緊密,如評(píng)分20以下為其他關(guān)系,評(píng)分90以上則為戰(zhàn)略協(xié)作伙伴關(guān)系等。對(duì)于國別合作度的評(píng)分計(jì)算,結(jié)合國家信息中心大數(shù)據(jù)發(fā)展部[9]提供的國別合作度測評(píng)指標(biāo),本文決定采用“投資合作”“會(huì)議報(bào)道”“文件項(xiàng)目”“貿(mào)易合作”等10項(xiàng)指標(biāo)評(píng)價(jià)中國與其他國家合作度綜合評(píng)分。首先,將歸一化后的指標(biāo)數(shù)據(jù)按式(1)計(jì)算概率:

(1)

其中,pij表示第i個(gè)數(shù)據(jù)的第j項(xiàng)指標(biāo)所對(duì)應(yīng)的概率,rij表示第i個(gè)數(shù)據(jù)的第j項(xiàng)指標(biāo)所對(duì)應(yīng)的歸一化結(jié)果,n表示數(shù)據(jù)的數(shù)量。

而為了更好地確定各指標(biāo)的權(quán)重,本文采用信息熵來描述各指標(biāo)含量的不確定性,按式(2)計(jì)算信息熵:

(2)

其中,Ej表示第j項(xiàng)指標(biāo)的信息熵,pij表示第i個(gè)數(shù)據(jù)的第j項(xiàng)指標(biāo)所對(duì)應(yīng)的概率,n表示數(shù)據(jù)的數(shù)量。

為提高數(shù)據(jù)的抗干擾能力,本文對(duì)所得信息熵按式(3)計(jì)算冗余度:

Dj=1-Ej? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)

其中,Dj表示第j項(xiàng)指標(biāo)的冗余度,Ej表示第j項(xiàng)指標(biāo)的信息熵。得到冗余度后,按式(4)計(jì)算權(quán)重:

(4)

其中,Wj表示第j項(xiàng)指標(biāo)的權(quán)重,Dj表示第j項(xiàng)指標(biāo)的冗余度,m表示指標(biāo)的數(shù)量。以中國與新加坡國別合作度為例,本文對(duì)相關(guān)指標(biāo)進(jìn)行權(quán)重計(jì)算,并對(duì)權(quán)重排名前5的指標(biāo)進(jìn)行展示,如表1所示。

最后,依據(jù)式(5)求出合作度綜合得分:

(5)

其中,aij表示第i個(gè)數(shù)據(jù)的第j項(xiàng)指標(biāo)所對(duì)應(yīng)的數(shù)值,Wj表示第j項(xiàng)指標(biāo)所對(duì)應(yīng)的權(quán)重,m表示指標(biāo)的數(shù)量。綜合得分越高,說明該國家與中國的國際關(guān)系越密切。

3? 數(shù)據(jù)可視化

本文參考國別區(qū)域與全球治理數(shù)據(jù)平臺(tái)所構(gòu)建的數(shù)據(jù)分類模式,分別從政治、經(jīng)濟(jì)、文化等六大領(lǐng)域?qū)χ袊鴩H關(guān)系展開分析,并對(duì)所得文本及數(shù)值型數(shù)據(jù)以詞云圖、折線圖、氣泡圖等形式進(jìn)行可視化呈現(xiàn)。

此處以新加坡與中國國際關(guān)系有關(guān)數(shù)據(jù)為例進(jìn)行部分指標(biāo)可視化展示,其中,“投資合作”指標(biāo)和“旅游與文化”指標(biāo)采用折線圖的可視化方式,“會(huì)議報(bào)道”和“文件項(xiàng)目”指標(biāo)采用詞云圖的可視化方式,“貿(mào)易合作”指標(biāo)采用氣泡圖和折線圖相結(jié)合的可視化方式。本文選用10個(gè)指標(biāo)進(jìn)行熵權(quán)法計(jì)算,最終采用儀表盤的形式將國別合作度評(píng)分結(jié)果進(jìn)行可視化。

3.1? “投資合作”和“旅游與文化”指標(biāo)

“投資合作”指標(biāo)是中新國別合作度綜合評(píng)分計(jì)算的重要指標(biāo)之一,如圖2所示,本文通過熱度指數(shù)計(jì)算得到一定時(shí)間區(qū)間內(nèi)中新兩國之間與“通信”相關(guān)的投資合作熱度指數(shù)的變化,并采用折線圖的方式進(jìn)行呈現(xiàn)。與此同時(shí),本文將熱度指數(shù)進(jìn)行歸一化,以更好地將其作為評(píng)價(jià)指標(biāo)之一帶入熵權(quán)法的合作度評(píng)分計(jì)算中。

如圖3所示,本文將中新兩國自1994年至2016年以來的旅客入境情況繪制成折線圖,一方面實(shí)現(xiàn)數(shù)據(jù)可視化展示,另一方面該數(shù)據(jù)也屬于國別合作度評(píng)分中“旅游與文化”這一指標(biāo)的一部分,從圖中可看出從1994年至2016年中新經(jīng)濟(jì)“旅客入境”數(shù)量總體呈上升趨勢(shì),進(jìn)而得出中新旅游業(yè)發(fā)展關(guān)系密切的結(jié)論。

3.2? “會(huì)議報(bào)道”和“文件項(xiàng)目”指標(biāo)

TF-IDF算法是一種用于信息檢索與數(shù)據(jù)挖掘的統(tǒng)計(jì)方法,其中TF表示詞頻,IDF表示逆文本頻率指數(shù),該算法用以評(píng)估一字詞對(duì)于一個(gè)文件集或一個(gè)語料庫中的其中一份文件的重要程度[10],字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時(shí)會(huì)隨著它在語料庫中出現(xiàn)的頻率成反比下降。TF-IDF算法對(duì)使用熵權(quán)法計(jì)算合作度評(píng)分中確定“會(huì)議報(bào)道”和“文件項(xiàng)目”這兩個(gè)指標(biāo)的權(quán)重有著重要作用。本文將前期所采集到的中國與其他國家在經(jīng)濟(jì)、文化、政治等方面的有關(guān)文章使用Python所供jieba庫進(jìn)行分詞與去除停用詞后最終得到有效詞語,再通過TF-IDF算法進(jìn)行計(jì)算,將得到的詞語按TF-IDF值進(jìn)行排序。

圖4為中國與新加坡兩國在經(jīng)濟(jì)類別中TF-IDF值排名前50的詞語,從圖中可以看出,中新兩國經(jīng)濟(jì)在“通信”“信息”與“創(chuàng)新”等關(guān)鍵詞中交流密切,聯(lián)系緊密。

3.3? “貿(mào)易合作”指標(biāo)

本文采用“時(shí)間軸”和“比例氣泡圖”相結(jié)合的方式對(duì)“貿(mào)易合作”指標(biāo)的相關(guān)數(shù)據(jù)進(jìn)行呈現(xiàn)。圖5展示了中國與新加坡兩國間進(jìn)出口產(chǎn)品的占比情況,氣泡越大,則占比越大,該可視化方式有利于直觀地展示在同一年內(nèi)不同類型產(chǎn)品所占比例的情況。經(jīng)過觀察可知,該數(shù)據(jù)具有差異性和可對(duì)比性,有利于增大“貿(mào)易合作”指標(biāo)的權(quán)重。

點(diǎn)擊圖5氣泡圖中的任意氣泡,即可呈現(xiàn)該類產(chǎn)品從1993年至2021年的出口總額變化情況,圖6為中新兩國經(jīng)濟(jì)“藝術(shù)品”出口總額變化圖,從中可看出在此二十余年間兩國在該類產(chǎn)品的最高出口總額出現(xiàn)于2010年,約為225億美元。

3.4? 熵權(quán)法——國別合作度評(píng)分

通過采用熵權(quán)法進(jìn)行計(jì)算,本文得出中新兩國間的國別合作度綜合評(píng)分為60.84分,并判定中新關(guān)系為“戰(zhàn)略伙伴關(guān)系”,其詳細(xì)結(jié)果如表2所示。由結(jié)果可知,經(jīng)過熵權(quán)法計(jì)算所得國別合作度評(píng)分相比多元線性回歸方法的計(jì)算結(jié)果更接近國家信息中心所供的標(biāo)準(zhǔn)參考[9],因此其結(jié)果更具備參考價(jià)值。

如圖7所示,本文采用“儀表盤”的可視化方式,生動(dòng)地對(duì)中新關(guān)系進(jìn)行展示。

4? 結(jié)? 論

本文基于熵權(quán)法等相關(guān)算法,以國別區(qū)域與全球治理數(shù)據(jù)平臺(tái)等官方網(wǎng)站所得數(shù)據(jù)為數(shù)據(jù)源,對(duì)中國國際關(guān)系展開可視化分析。結(jié)合國家信息中心所供的國別合作度指數(shù)進(jìn)行比對(duì),本文所用方法對(duì)于國別合作度評(píng)分等計(jì)算具有一定參考意義。同時(shí),本文以詞云圖等多種方式實(shí)現(xiàn)可視化呈現(xiàn),為幫助普通群眾與相關(guān)領(lǐng)域研究者快速了解當(dāng)前國際形勢(shì)及中國國際關(guān)系提供了較好的研究思路。

參考文獻(xiàn):

[1] 大數(shù)據(jù)時(shí)代:數(shù)字政府建設(shè)成為新趨勢(shì) [N].社會(huì)科學(xué)報(bào),2019-06-13(1).

[2] 中國社會(huì)科學(xué)院國際形勢(shì)報(bào)告(2022) [J].拉丁美洲研究,2022,44(3):159.

[3] 外交領(lǐng)域的突破與創(chuàng)新 [J].人民論壇,2017(2):39.

[4] 薛浩男.基于新聞文本的國際關(guān)系時(shí)空信息獲取與分析方法研究 [D].南京:南京師范大學(xué),2021.

[5] 齊嘯天.大數(shù)據(jù)分析方法對(duì)傳統(tǒng)國際政治預(yù)測的改進(jìn) [D].長春:吉林大學(xué),2021.

[6] 王駿.基于文本挖掘的國際關(guān)系網(wǎng)絡(luò)研究 [D].北京:北京郵電大學(xué),2013.

[7] 邵俊,倪楓,劉姜,等.基于熵權(quán)法的軟件開發(fā)項(xiàng)目進(jìn)度風(fēng)險(xiǎn)影響因素分析研究 [J].項(xiàng)目管理技術(shù),2022,20(10):7-10.

[8] 王彤. 基于熵權(quán)法的QS園林公司財(cái)務(wù)風(fēng)險(xiǎn)評(píng)價(jià)研究 [D].遼寧:沈陽工業(yè)大學(xué),2022.

[9] 于施洋,王璟璇,楊道玲.數(shù)說“一帶一路”國別合作度 [J].中國投資,2018(19):106.

[10] 張明陽,劉盼盼,文申平.基于TF-IDF分類算法的電磁態(tài)勢(shì)情報(bào)分發(fā) [J].航天電子對(duì)抗,2022,38(4):31-35.

作者簡介:陳思杭(2001—),女,漢族,廣東潮州人,助教,學(xué)士學(xué)位,研究方向:軟件工程;通訊作者:姜思羽(1992年—),女,滿族,黑龍江齊齊哈爾人,講師,博士,研究方向:人工智能。

收稿日期:2022-12-01

基金項(xiàng)目:廣東省哲學(xué)社會(huì)科學(xué)規(guī)劃一般項(xiàng)目(GD22CTS02)

猜你喜歡
國際關(guān)系自然語言處理數(shù)據(jù)可視化
大數(shù)據(jù)時(shí)代背景下本科教學(xué)質(zhì)量動(dòng)態(tài)監(jiān)控系統(tǒng)的構(gòu)建
可視化:新媒體語境下的數(shù)據(jù)、敘事與設(shè)計(jì)研究
基于組合分類算法的源代碼注釋質(zhì)量評(píng)估方法
我國數(shù)據(jù)新聞的發(fā)展困境與策略研究
基于R語言的大數(shù)據(jù)審計(jì)方法研究
布雷頓森林體系崩潰的原因和對(duì)國際關(guān)系的影響
“霸權(quán)秩序”的國際關(guān)系多維度視角探析
淺議英聯(lián)邦諸王國的主權(quán)沿革
擔(dān)和平崛起大國形象,建和平穩(wěn)定中日關(guān)系
面向機(jī)器人導(dǎo)航的漢語路徑自然語言組塊分析方法研究