国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智慧交通互聯(lián)網(wǎng)態(tài)勢(shì)感知平臺(tái)研究

2023-01-12 00:30孫中賢呂梓逸孟憲達(dá)詹世源
關(guān)鍵詞:信息量交通維度

劉 濱,孫中賢,呂梓逸,孟憲達(dá),陳 莉,詹世源

(1.河北科技大學(xué)經(jīng)濟(jì)管理學(xué)院,河北石家莊 050018;2.河北科技大學(xué)大數(shù)據(jù)與社會(huì)計(jì)算研究中心,河北石家莊 050018;3.北京交通大學(xué)經(jīng)濟(jì)管理學(xué)院,山東威海 264401;4.河北高速公路集團(tuán)有限公司承德分公司,河北承德 067000;5.中國(guó)人民解放軍空軍預(yù)警學(xué)院,湖北武漢 430019)

截至2022年6月,中國(guó)網(wǎng)民規(guī)模達(dá)10.51億,網(wǎng)絡(luò)新聞?dòng)脩粢?guī)模為7.88億,網(wǎng)民人均每周上網(wǎng)時(shí)長(zhǎng)為29.5 h[1],網(wǎng)絡(luò)和現(xiàn)實(shí)世界形成了事件和場(chǎng)景等多點(diǎn)映射、態(tài)勢(shì)演變“同頻共振”的關(guān)系。而與百姓生活密切相關(guān)的交通行業(yè)具有規(guī)律性和突發(fā)性并存、關(guān)聯(lián)對(duì)象多、輻射面廣等特點(diǎn),是網(wǎng)絡(luò)媒體內(nèi)容的重要來(lái)源,也是產(chǎn)業(yè)數(shù)字化的主要戰(zhàn)場(chǎng)。可見(jiàn),構(gòu)建智慧交通互聯(lián)網(wǎng)態(tài)勢(shì)感知平臺(tái)(以下簡(jiǎn)稱“平臺(tái)”),是實(shí)現(xiàn)交通強(qiáng)國(guó)戰(zhàn)略的重要舉措。

目前,隨著物聯(lián)網(wǎng)技術(shù)[2]和人工智能(artificial intelligence,AI)[3]在交通領(lǐng)域的落地,人們?cè)谲囕v特征(車牌、顏色、廠商標(biāo)志等)識(shí)別、違法行為(遮擋車牌、開(kāi)車打手機(jī)、不系安全帶等)識(shí)別、交通信號(hào)配時(shí)、車路協(xié)同、無(wú)人駕駛等方面取得了一系列成果[4-5],但互聯(lián)網(wǎng)賦能交通的研究則相對(duì)匱乏,處于數(shù)據(jù)豐富、需求多樣、不缺落地支撐,但代表性案例較少的狀態(tài)。

1 問(wèn)題與挑戰(zhàn)

“互聯(lián)網(wǎng)+”交通的目標(biāo)之一,是通過(guò)對(duì)海量、活躍度高、時(shí)效性強(qiáng)的網(wǎng)絡(luò)數(shù)據(jù)獲取和分析,并利用數(shù)據(jù)可視化技術(shù)[6-8]形成數(shù)據(jù)驅(qū)動(dòng)力,提升百姓生活的便捷度和舒適度,提高相關(guān)決策分析的客觀度和精準(zhǔn)度。學(xué)術(shù)界和產(chǎn)業(yè)界進(jìn)行了大量研究和實(shí)踐,成果豐富,但問(wèn)題和挑戰(zhàn)依然存在[9-10]。

場(chǎng)景1 交通事件的脈絡(luò)梳理。當(dāng)需要了解某交通事件(撞車、超載、塌陷等)的發(fā)展脈絡(luò)時(shí),搜索引擎傾向于推薦最新、熱度高、網(wǎng)民興趣度高的內(nèi)容[11-12],而閱讀量低、傳播面窄、影響度低的內(nèi)容則被置后或被噪聲淹沒(méi),某些敏感內(nèi)容在發(fā)出后不久會(huì)被撤回、屏蔽或刪除,如上原因,導(dǎo)致閱讀者觀察或追蹤事件完整脈絡(luò)的成本非常高。

場(chǎng)景2 查詢某類交通信息。司機(jī)想要了解出行路線上的管制和阻路等信息時(shí),導(dǎo)航軟件經(jīng)常出現(xiàn)路況更新不及時(shí)等問(wèn)題;當(dāng)需要按照時(shí)間、地域等維度對(duì)某類交通信息進(jìn)行梳理時(shí),例如了解某市上個(gè)季度的某類交通事件情況時(shí),則需要從大量網(wǎng)絡(luò)碎片信息中提煉和總結(jié),效率低且信息不完整。

場(chǎng)景3 觀察特定區(qū)域的交通態(tài)勢(shì)?,F(xiàn)有的交通大數(shù)據(jù)平臺(tái)以流量監(jiān)控居多,當(dāng)需要對(duì)互聯(lián)網(wǎng)態(tài)勢(shì)進(jìn)行綜合觀察時(shí),只能通過(guò)關(guān)鍵詞+搜索引擎的方式,無(wú)法對(duì)特定區(qū)域與交通相關(guān)的新聞、事件、公告等進(jìn)行全面、特定維度、主維度+輔助維度交叉式的觀察和分析。例如:哪些地市發(fā)生了交通類事件、哪些事件上了官方媒體或門戶站點(diǎn)、百度貼吧里正在議論哪些地區(qū)的交通事件、哪些媒體在進(jìn)行追蹤報(bào)道、在具體事件上媒體報(bào)道的傾向性等,難于支撐對(duì)交通態(tài)勢(shì)的全局掌控能力。

面對(duì)上述問(wèn)題和挑戰(zhàn),必須對(duì)內(nèi)容最活躍、語(yǔ)義最復(fù)雜、覆蓋面和服務(wù)面最廣的網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行全面獲取和深入解析,讓互聯(lián)網(wǎng)真正賦能、賦更多能于交通領(lǐng)域。平臺(tái)建設(shè)的主要需求歸納如下:

1)全面及時(shí)獲取網(wǎng)絡(luò)信息。鑒于網(wǎng)絡(luò)噪聲大、媒體品質(zhì)良莠不齊[13]的特點(diǎn),需綜合考慮權(quán)威性、嚴(yán)肅性和影響力,構(gòu)建覆蓋官方媒體、交通系統(tǒng)、門戶站點(diǎn)、電子刊物、論壇、百度貼吧6類媒體的“全”媒體信息源體系。

2)“立體式”態(tài)勢(shì)觀察與分析。支持用戶在某個(gè)具體維度上“上卷”和“下鉆”,例如觀察熱點(diǎn)事件時(shí),能在全省、省本級(jí)、地市三級(jí)地理維度靈活切換;支持以某個(gè)維度為主維度,進(jìn)行維度交叉分析。例如,調(diào)閱石家莊市(地理維度)過(guò)去一個(gè)月(時(shí)間維度)在新浪網(wǎng)(媒體維度)上的交通新聞,以及事件本身的性質(zhì)分析(正向、中性、負(fù)面)。

3)適度的AI技術(shù)支持。合理應(yīng)用自然語(yǔ)言處理(natural language processing,NLP)領(lǐng)域的聚類、分類、極性分析等算法[14-18],對(duì)海量?jī)?nèi)容進(jìn)行處理和分析,提高態(tài)勢(shì)感知的準(zhǔn)確性和智能性;合理應(yīng)用數(shù)據(jù)可視化技術(shù),優(yōu)化布局、色彩、元素和組件等在內(nèi)的UI設(shè)計(jì),以便從海量數(shù)據(jù)里迅速發(fā)現(xiàn)線索、輔助觀察和研判,提升人機(jī)交互[19-21]效率。

2 平臺(tái)功能框架與技術(shù)框架

2.1 功能框架

基于主要需求分析,給出平臺(tái)的功能框架,如圖1所示。平臺(tái)包括前端和管理監(jiān)測(cè)后臺(tái)2個(gè)部分,主要功能模塊包括地理視角(前端)、媒體視角(前端)、內(nèi)容視角(前端)、數(shù)據(jù)分析(前端)、后臺(tái)管理系統(tǒng)(后臺(tái))與數(shù)據(jù)監(jiān)測(cè)(后臺(tái))。

圖1 智慧交通互聯(lián)網(wǎng)態(tài)勢(shì)感知平臺(tái)功能框架Fig.1 Functional framework of intelligent transportation internet situational awareness platform

2.1.1 主版面(前端)

該版面主要欄目:①基于地圖的GIS,給出各地市挖掘出來(lái)價(jià)值信息數(shù)量、各極性正向(綠色)、中性(黃色)和負(fù)向(紅色)信息的數(shù)量、熱度Topn的信息;②媒體視角,給出官方媒體、門戶站點(diǎn)、自媒體等6類媒體信息量和信息量曲線、總量占比、數(shù)量Topn的媒體和各類媒體最新的Topn條信息;③內(nèi)容視角,對(duì)信息按照交通運(yùn)輸、安全運(yùn)行、高速站點(diǎn)和運(yùn)營(yíng)聚焦4類進(jìn)行劃分,給出每類下的信息量和信息量曲線、數(shù)量Topn的媒體、Topn條最新信息;④實(shí)時(shí)動(dòng)態(tài)和熱點(diǎn)聚焦,給出從所有媒體中最新篩選出來(lái)Topn信息和熱度Topn信息;⑤熱門標(biāo)簽,通過(guò)熱詞提取和降噪技術(shù),給出當(dāng)前篩選出的信息中最熱門的Topn個(gè)關(guān)鍵詞,以及貢獻(xiàn)度(關(guān)聯(lián)度)Topn的媒體和其上的相關(guān)信息數(shù)量。通過(guò)頁(yè)面頂部的標(biāo)簽切換,看到全省、省本級(jí)和11個(gè)地市的相關(guān)信息。

2.1.2 地理視角(前端)

該版面以地理為主維度,對(duì)海量媒體信息進(jìn)行挖掘,發(fā)現(xiàn)并呈現(xiàn)和河北省、省本級(jí)、省內(nèi)各地級(jí)市、縣的交通相關(guān)信息,支持在地理維度上進(jìn)行“上卷”和“下鉆”,并和其他維度交叉分析。主要欄目:①媒體信息,對(duì)該區(qū)域交通領(lǐng)域新聞的來(lái)源進(jìn)行匯總,通過(guò)比較各類來(lái)源發(fā)布的信息量,為用戶進(jìn)行媒體選擇提供參考;②實(shí)時(shí)新聞,該區(qū)域發(fā)生的最新新聞,給出Topn新聞的地理位置(例如滄州市的新聞會(huì)標(biāo)注滄州、吳橋、河間等)、來(lái)源(例如滄州新聞網(wǎng)等)與時(shí)間;③熱門信息,根據(jù)用戶對(duì)新聞的點(diǎn)擊量與評(píng)論量對(duì)新聞熱度進(jìn)行評(píng)判與排序,對(duì)一定時(shí)間內(nèi)排名靠前的新聞進(jìn)行展示,便于快速掌握地區(qū)行業(yè)熱點(diǎn);④基于地圖的GIS欄目,同主版面。

2.1.3 媒體視角(前端)

該版面以媒體為主維度,對(duì)海量媒體信息進(jìn)行挖掘,發(fā)現(xiàn)并呈現(xiàn)和河北省、省本級(jí)、省內(nèi)各地級(jí)市、縣的交通相關(guān)信息,支持在媒體維度上進(jìn)行“上卷”和“下鉆”,并和其他維度交叉分析。主要欄目:①官方媒體,給出來(lái)自光明網(wǎng)、人民網(wǎng)、河北新聞網(wǎng)、石家莊新聞網(wǎng)等國(guó)家和地方級(jí)媒體的最新Topn條新聞、媒體指數(shù)(該媒體信息量在全部信息量的比值)Topn的媒體;②門戶,給出來(lái)自新浪、網(wǎng)易、百度新聞、本地寶等的綜合類門戶和交通部、交通廳、滄州市交通局等系統(tǒng)內(nèi)門戶站點(diǎn)的、最新的Topn新聞、媒體指數(shù)Topn的站點(diǎn);③電子刊物,給出來(lái)自人民日?qǐng)?bào)、燕趙晚報(bào)、參考消息、張家口晚報(bào)等國(guó)家和地方級(jí)電子刊物的最新Topn新聞、媒體指數(shù)Topn的刊物;④自媒體,給出來(lái)自交通論壇、天涯論壇、貓撲網(wǎng)、河北吧、河北交警吧、張家口吧等論壇和百度貼吧等最新的Topn信息、媒體指數(shù)Topn的論壇或百度貼吧;⑤媒體綜合,給出信息總量、監(jiān)測(cè)站點(diǎn)數(shù)、各極性信息數(shù)、最新Topn的媒體信息,以及各類媒體對(duì)信息的貢獻(xiàn)數(shù)和占比。

2.1.4 內(nèi)容視角(前端)

該版面以內(nèi)容類別為主維度,對(duì)海量媒體信息進(jìn)行挖掘,發(fā)現(xiàn)并呈現(xiàn)和河北省、省本級(jí)、省內(nèi)各地級(jí)市、縣的交通相關(guān)信息,支持在類別維度上進(jìn)行“上卷”和“下鉆”,并和其他維度交叉分析。主要欄目:①交通運(yùn)輸,匯總對(duì)鐵路、公路、水路及航空運(yùn)輸基礎(chǔ)設(shè)施的布局及修建信息,或汽車、客車等運(yùn)載工具運(yùn)用相關(guān)的新聞信息;②運(yùn)營(yíng)聚焦,匯總交通領(lǐng)域項(xiàng)目搭建與服務(wù)創(chuàng)造等相關(guān)管理工作的新聞信息;③安全運(yùn)行,匯總為保障交通安全而展開(kāi)的培訓(xùn)、講座、倡議、規(guī)章等相關(guān)活動(dòng)信息,以及違反交通規(guī)則產(chǎn)生的交通事故等新聞信息;④高速站點(diǎn),匯總高速路相關(guān)的最新信息,如開(kāi)放時(shí)間、收費(fèi)標(biāo)準(zhǔn)等。

2.1.5 綜合管理系統(tǒng)(后端)

對(duì)全媒體數(shù)據(jù)源體系進(jìn)行監(jiān)測(cè),通過(guò)分析系統(tǒng)每日抓取的信息量與數(shù)據(jù)量,確保算法能夠?qū)Ω鲾?shù)據(jù)源的數(shù)據(jù)進(jìn)行及時(shí)獲取與理解,同時(shí)對(duì)抓取的信息進(jìn)行收集,便于檢索使用。主要欄目:①數(shù)據(jù)概覽,給出監(jiān)測(cè)站點(diǎn)數(shù)、抓取的數(shù)據(jù)日增量、從中提煉出的信息日增量變化情況;②媒體,管理基于6類媒體構(gòu)建的“全媒體體系”,動(dòng)態(tài)調(diào)整每類媒體的網(wǎng)站種子庫(kù)(其中,官方媒體泛指政府部門所設(shè)置的網(wǎng)站,如人民網(wǎng)、新華網(wǎng)、河北新聞網(wǎng)等;交通系統(tǒng)指交通領(lǐng)域的網(wǎng)站,如交通部、交通廳、交通局的網(wǎng)站等;門戶網(wǎng)站指輻射面廣、影響度大的綜合性網(wǎng)站,如新浪、網(wǎng)易、百度新聞等;電子刊物指以電子版形式存在的定期發(fā)行的刊物,如中國(guó)青年報(bào)、河北青年報(bào)、燕趙都市報(bào)等;自媒體指論壇和百度貼吧,如網(wǎng)頁(yè)社區(qū)、西陸論壇、華聲在線、秦皇島交通吧、河北交通吧等);③信息&數(shù)據(jù),逐條展示爬取上來(lái)的原始數(shù)據(jù)(新聞、貼子等)和信息(AI算法篩選出來(lái)的數(shù)據(jù)),支持原文跳轉(zhuǎn)、內(nèi)容編輯、極性(在算法判斷的結(jié)果上)修正、關(guān)鍵詞修正等,即支持對(duì)AI結(jié)果進(jìn)行人工修正,提高信息提取的準(zhǔn)確性;④爬蟲管理,支持對(duì)目標(biāo)網(wǎng)站的XPATH、正則表達(dá)式等進(jìn)行動(dòng)態(tài)修改,以對(duì)網(wǎng)站改版進(jìn)行及時(shí)響應(yīng),也可以對(duì)關(guān)鍵詞進(jìn)行增刪和修改,即支持自主靈活地從海量?jī)?nèi)容中篩選目標(biāo)內(nèi)容。

2.1.6 運(yùn)行監(jiān)測(cè)(后端)

包括平臺(tái)運(yùn)行情況、網(wǎng)絡(luò)數(shù)據(jù)采集情況、分析情況、信息提取等。主要欄目:①最新資訊,滾動(dòng)展示(每次7條)最新篩選出的新聞或帖子等,給出標(biāo)題、來(lái)源、信息類型和時(shí)間;②Topn媒體,給出信息量前n的媒體以及信息數(shù)量;③各類媒體數(shù)據(jù)情況,對(duì)平臺(tái)抓取的數(shù)據(jù)總量、篩選后的信息量,以及每日數(shù)據(jù)與信息的增長(zhǎng)量進(jìn)行統(tǒng)計(jì),并進(jìn)行內(nèi)容聚類;④基礎(chǔ)運(yùn)行指標(biāo)觀察,從內(nèi)容視角對(duì)分析的數(shù)據(jù)進(jìn)行分類,展示所分析的數(shù)據(jù)中交通事故、路況信息、安全生產(chǎn)、運(yùn)營(yíng)聚焦4類信息的占比情況,從數(shù)據(jù)源所屬類別進(jìn)行分類,展示該類別媒體近1周內(nèi)分析的數(shù)據(jù)量變化曲線。

2.2 技術(shù)框架

圖2給出了平臺(tái)的3個(gè)主體部分:網(wǎng)絡(luò)信息獲取、內(nèi)容理解與分析、Web端開(kāi)發(fā)語(yǔ)言的技術(shù)框架。

圖2 智慧交通互聯(lián)網(wǎng)態(tài)勢(shì)感知平臺(tái)技術(shù)框架Fig.2 Technological framework of intelligent transportation internet situational awareness platform

2.2.1 網(wǎng)絡(luò)信息獲取

根據(jù)媒體資源庫(kù)中的網(wǎng)站種子,實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)資訊的自適應(yīng)采集、內(nèi)容提取和篩選,形成價(jià)值信息。該部分的構(gòu)建與部署采用SpringBoot+Docker,使用Java語(yǔ)言開(kāi)發(fā),應(yīng)用WebMagic框架實(shí)現(xiàn)多線程分布式抓取,WebMagic結(jié)構(gòu)分為下載器(Downloader)、頁(yè)面解析器(PageProcessor)、調(diào)度器(Scheduler)、業(yè)務(wù)邏輯處理器(Pipeline)4大組件,并由Spider將它們彼此組織起來(lái),這4大組件對(duì)應(yīng)爬蟲生命周期中的下載、處理、管理和持久化等功能[22]。Downloader通過(guò)URL將網(wǎng)頁(yè)下載,主要是進(jìn)行相應(yīng)的偽裝處理以模擬瀏覽器訪問(wèn)、下載網(wǎng)頁(yè),項(xiàng)目使用Apache Httpclient作為下載器;PageProcessor負(fù)責(zé)解析頁(yè)面,抽取有用信息以及發(fā)現(xiàn)新的鏈接,項(xiàng)目借助Jsoup作為解析器,可直接解析URL地址、HTML文本內(nèi)容等;Scheduler負(fù)責(zé)待抓取URL的管理和已抓取URL的去重,項(xiàng)目主要采用Redis進(jìn)行分布式管理,以增強(qiáng)系統(tǒng)的可用性,在URL去重方面,Redis去重速度很快,且不占用爬蟲服務(wù)器的資源,可以處理更大數(shù)據(jù)量的數(shù)據(jù)爬取;Pipeline負(fù)責(zé)抽取結(jié)果的處理,包括計(jì)算、持久化到文件、數(shù)據(jù)庫(kù)等,項(xiàng)目在進(jìn)行開(kāi)發(fā)時(shí)采用了MySQL與MongoDB數(shù)據(jù)庫(kù),這2個(gè)數(shù)據(jù)庫(kù)定位均為持久化的主存儲(chǔ),可以更好地保存數(shù)據(jù)。

2.2.2 內(nèi)容理解與分析

對(duì)清洗后的數(shù)據(jù)進(jìn)行處理,采取聚類、分類、時(shí)序挖掘和極性分析等AI算法從中提煉出有價(jià)值的信息,并按特定維度進(jìn)行梳理。該部分的構(gòu)建與部署采用SpringBoot+Docker,使用Java語(yǔ)言開(kāi)發(fā),SpringBoot是很好的微服務(wù)開(kāi)發(fā)框架,具有自動(dòng)配置、內(nèi)置servlet容器等優(yōu)點(diǎn)。相較于傳統(tǒng)的虛擬化方式,應(yīng)用容器引擎Docker具有更快速的啟動(dòng)時(shí)間、更高效的利用系統(tǒng)資源、更高效的虛擬化等優(yōu)點(diǎn)。系統(tǒng)的認(rèn)證與授權(quán)采用SpringSecurity框架。對(duì)象關(guān)系映射(ORM)采用MyBatis框架,不僅可以更好地與Spring進(jìn)行集成,還提供對(duì)象關(guān)系映射標(biāo)簽,支持對(duì)象關(guān)系組件維護(hù)。數(shù)據(jù)層代碼生成采用MyBatisGenerator,可以進(jìn)行實(shí)體類、實(shí)體映射文件、接口的自動(dòng)生成。數(shù)據(jù)庫(kù)采用Redis與MongoDB,其中Redis數(shù)據(jù)庫(kù)主要用于頁(yè)面緩存,MongoDB是一種文檔型數(shù)據(jù)庫(kù),適用于處理大而復(fù)雜的數(shù)據(jù)。靜態(tài)資源服務(wù)器采用占用內(nèi)存更少、并發(fā)能力更強(qiáng)的Nginx。對(duì)象存儲(chǔ)采用MinIO組件,在減少出錯(cuò)機(jī)會(huì)、提高正常運(yùn)行時(shí)間的同時(shí),表現(xiàn)出卓越的讀寫性能。物理分頁(yè)插件采用PageHelper,以插件的形式對(duì)Mybatis執(zhí)行的流程進(jìn)行強(qiáng)化,后端只需提供Select查詢返回?cái)?shù)據(jù),插件進(jìn)行自動(dòng)分頁(yè)。文檔生成工具采用無(wú)依賴、易于瀏覽的Swagger-UI,允許任何人都可以可視化API資源并與之交互。

2.2.3 Web端開(kāi)發(fā)

對(duì)挖掘出來(lái)的價(jià)值信息進(jìn)行展示,支持全局、維度交叉、維度“上卷”和“下鉆”等分析,并采用數(shù)據(jù)可視化技術(shù)提高人機(jī)交互效率。該部分前端框架采用Vue實(shí)現(xiàn),通過(guò)MVVM模式(Model-View-ViewModel,其中View為視圖層,ViewModel為業(yè)務(wù)邏輯層,Model為數(shù)據(jù)層)實(shí)現(xiàn)數(shù)據(jù)的雙向綁定,減少DOM操作,更高效地實(shí)現(xiàn)視圖和數(shù)據(jù)的交互[23]。在單個(gè)Web頁(yè)面開(kāi)發(fā)應(yīng)用時(shí),vue-router 提供路由管理的功能,將每個(gè)路徑映射到對(duì)應(yīng)的組件,并通過(guò)路由進(jìn)行組件之間的切換;而組件之間是獨(dú)立的,組件之間(尤其是兄弟組件之間)進(jìn)行通信需要有相應(yīng)的規(guī)則進(jìn)行管理,Vuex是用來(lái)管理組件之間通信的一個(gè)插件,以集中式存儲(chǔ)管理應(yīng)用所有組件狀態(tài),并以相應(yīng)的規(guī)則保證狀態(tài)以一種可預(yù)測(cè)的方式發(fā)生變化;在進(jìn)行數(shù)據(jù)請(qǐng)求時(shí),Vue不支持Ajax請(qǐng)求,對(duì)原生的Ajax使用非常繁瑣,為便于實(shí)現(xiàn)Ajax請(qǐng)求的發(fā)送,借助Axios對(duì)原生Ajax封裝,用于瀏覽器的HTTP客戶端;在進(jìn)行數(shù)據(jù)交換時(shí),系統(tǒng)將每個(gè)用戶的數(shù)據(jù)以cookie的形式寫給用戶各自瀏覽器,并利用Js-cookie對(duì)cookie進(jìn)行管理;前端UI框架主要采用了組件API方法、屬性等封裝較為完善的Element和V-charts。

3 平臺(tái)實(shí)現(xiàn)與運(yùn)行

3.1 平臺(tái)前端

前端主要功能界面如圖3所示。

圖3 智慧交通互聯(lián)網(wǎng)態(tài)勢(shì)感知平臺(tái)前端主要頁(yè)面Fig.3 Front-end main pages of intelligent transportation internet situational awareness platform

圖3 a)—圖3 d)為平臺(tái)主版面(首頁(yè))、媒體視角、內(nèi)容視角和地理視角頁(yè)面,頁(yè)面采用左中右橫向滿屏布局,綜合運(yùn)用地圖、二維表、折線圖等插件,合理而不復(fù)雜,用戶能夠按照日常閱讀習(xí)慣,快速發(fā)現(xiàn)主要內(nèi)容;將城市級(jí)地理緯度、時(shí)間維度、媒體維度、極性維度、熱點(diǎn)維度進(jìn)行組合;將顏色與語(yǔ)義進(jìn)行關(guān)聯(lián),正向、中性、負(fù)向分別與綠色、黃色、紅色進(jìn)行關(guān)聯(lián),符合用戶習(xí)慣認(rèn)知的顏色-極性識(shí)別。

圖3 a)給出的首頁(yè)包括媒體視角、內(nèi)容視角的最新信息與媒體指數(shù),其中最新信息展示信息的標(biāo)題、發(fā)布時(shí)間與資訊極性,媒體指數(shù)展示站點(diǎn)名稱、發(fā)布的信息量以及信息量的占比情況,可以根據(jù)媒體類別、信息內(nèi)容對(duì)信息進(jìn)行篩選。根據(jù)不同媒體類別、不同信息內(nèi)容的每日捕獲增量,可形成相應(yīng)的信息變化曲線。實(shí)時(shí)新聞與熱點(diǎn)動(dòng)態(tài)不僅標(biāo)注了新聞標(biāo)題,同時(shí)標(biāo)注了信息來(lái)源、所屬城市、發(fā)布時(shí)間、內(nèi)容的資訊極性信息,使用戶可以在短時(shí)間獲取更多的信息。熱門標(biāo)簽是根據(jù)河北省交通相關(guān)的最新新聞,統(tǒng)計(jì)新聞內(nèi)容中關(guān)鍵詞出現(xiàn)的頻率,展示出現(xiàn)頻率較高的關(guān)鍵詞作為熱門標(biāo)簽,通過(guò)對(duì)新聞內(nèi)容進(jìn)行高度濃縮和精簡(jiǎn)處理,更直觀地反映河北省交通領(lǐng)域的最新熱點(diǎn)。此外,首頁(yè)可以從地理緯度對(duì)信息進(jìn)行篩選,通過(guò)選擇對(duì)應(yīng)的城市,看到對(duì)應(yīng)城市的信息量、信息量變化曲線、實(shí)時(shí)動(dòng)態(tài)、熱點(diǎn)聚焦、熱門標(biāo)簽等相關(guān)信息。

圖3 b)是媒體視角頁(yè),從信息來(lái)源角度將信息源分為官方媒體、門戶、社交媒體、電子刊物4類,分別展示各類信息源的最新信息、媒體指數(shù)、資訊極性、進(jìn)行分析的信息量以及監(jiān)測(cè)站點(diǎn)數(shù),并對(duì)各類媒體分析的信息量與總信息量的占比情況進(jìn)行統(tǒng)計(jì)。

圖3 c)是內(nèi)容視角頁(yè),將交通相關(guān)信息從內(nèi)容角度分為交通運(yùn)輸、運(yùn)營(yíng)聚焦、安全運(yùn)行、高速站點(diǎn)4類,分別展示各類的最新信息、媒體指數(shù)、資訊極性、信息量以及占比情況。

圖3 d)是地理視角頁(yè),在進(jìn)行實(shí)時(shí)新聞與熱門新聞的展示時(shí),增加展示信息所在的地級(jí)市的功能,更清晰地展現(xiàn)出各地級(jí)市的媒體信息情況。

3.2 平臺(tái)后端

后端主要功能界面如圖4所示。

圖4 智慧交通互聯(lián)網(wǎng)態(tài)勢(shì)感知平臺(tái)后端主要頁(yè)面Fig.4 Back-end main pages of intelligent transportation internet situational awareness platform

圖4 a)是媒體數(shù)據(jù)源庫(kù),可對(duì)官方媒體、交通系統(tǒng)、門戶站點(diǎn)、電子刊物、論壇和百度貼吧每一類下的網(wǎng)站種子列表、XPath、正則表達(dá)式等進(jìn)行維護(hù);圖4 b)是信息列表,即從基礎(chǔ)數(shù)據(jù)中挖掘出來(lái)的符合平臺(tái)要求的資訊,可以查看標(biāo)題、信息URL、觸發(fā)其進(jìn)行分類的有效關(guān)鍵詞等相關(guān)信息;圖4 c)是關(guān)鍵詞列表,用戶可以通過(guò)對(duì)其維護(hù),設(shè)定感興趣的內(nèi)容,輔助算法提升篩選效率;圖4 d)是數(shù)據(jù)實(shí)時(shí)監(jiān)測(cè)頁(yè)面,每5 min刷新一次數(shù)據(jù),通過(guò)對(duì)源數(shù)據(jù)、媒體數(shù)據(jù)、Top數(shù)據(jù)源、數(shù)據(jù)分布情況進(jìn)行分析,以及對(duì)最新新聞與熱點(diǎn)新聞的滾動(dòng)展示,動(dòng)態(tài)展示出后臺(tái)數(shù)據(jù)的抓取、篩選和分析情況。例如,2022-11-15,當(dāng)天截止到16:49,爬取了3 004條網(wǎng)絡(luò)資訊,分析出37條信息。

平臺(tái)上線后,以365 d*24 h方式運(yùn)行,對(duì)670個(gè)站點(diǎn)自動(dòng)進(jìn)行周期性掃描,其中:官方媒體52個(gè)、門戶站點(diǎn)214個(gè)、交通系統(tǒng)媒體51個(gè)、電子刊物65個(gè)、論壇42個(gè)、百度貼吧161個(gè),在2021-02-22~2022-11-15期間,抓取并分析數(shù)據(jù)2 429 364條,篩選出信息9 698條。按極性分:正向信息903條,中性信息8 657條,負(fù)向信息138條;按地域分:河北省本級(jí)1 440條,11個(gè)地級(jí)市中邢臺(tái)和邯鄲分別以1 089條和1 087條位居前2位。以2022-07-21~2022-07-25期間為例,系統(tǒng)每日捕獲數(shù)據(jù)量與來(lái)源媒體總量如圖5所示,信息日增近1 000條,來(lái)自于媒體庫(kù)中約89%的媒體。

圖5 2022-07-21~2022-07-27平臺(tái)每日爬取數(shù)據(jù)及來(lái)源媒體的數(shù)量Fig.5 2022-07-21~2022-07-27 daily new information volume and information source media volume of the platform

4 結(jié) 語(yǔ)

本文結(jié)合河北省推進(jìn)“城市路網(wǎng)、高速路網(wǎng)、互聯(lián)網(wǎng)”三網(wǎng)融合,建設(shè)智慧交通的時(shí)代背景,針對(duì)互聯(lián)網(wǎng)賦能交通代表性案例較少的客觀實(shí)際,設(shè)計(jì)并實(shí)現(xiàn)了智慧交通互聯(lián)網(wǎng)媒體感知平臺(tái),綜合多種AI算法對(duì)海量網(wǎng)絡(luò)媒體數(shù)據(jù)進(jìn)行獲取、理解和分析,從中挖掘出適用于交通領(lǐng)域的價(jià)值信息。

經(jīng)過(guò)上線運(yùn)行,設(shè)計(jì)的智慧交通互聯(lián)網(wǎng)媒體感知平臺(tái)初步達(dá)到了利用互聯(lián)網(wǎng)為交通領(lǐng)域進(jìn)行“自動(dòng)化、敏捷化和智能化”賦能的目標(biāo);同時(shí),平臺(tái)支持對(duì)媒體資源庫(kù)、數(shù)據(jù)獲取規(guī)則、信息提取方法等進(jìn)行動(dòng)態(tài)調(diào)整,操作靈活性和用戶自主性較強(qiáng)。

未來(lái)將推動(dòng)本平臺(tái)與城市路網(wǎng)和高速路網(wǎng)領(lǐng)域相關(guān)平臺(tái)的對(duì)接,實(shí)現(xiàn)數(shù)據(jù)協(xié)同、業(yè)務(wù)協(xié)同和技術(shù)協(xié)同,在多樣性更強(qiáng)、數(shù)據(jù)量更多、覆蓋面更廣的數(shù)據(jù)集上進(jìn)一步研發(fā)和優(yōu)化算法,推動(dòng)本研究在更多交通領(lǐng)域的實(shí)際場(chǎng)景中落地,讓互聯(lián)網(wǎng)更好地賦能智慧交通。

猜你喜歡
信息量交通維度
理解“第三次理論飛躍”的三個(gè)維度
重磅!廣東省發(fā)文,全面放開(kāi)放寬落戶限制、加大住房供應(yīng)……信息量巨大!
認(rèn)識(shí)黨性的五個(gè)重要維度
繁忙的交通
淺論詩(shī)中“史”識(shí)的四個(gè)維度
小小交通勸導(dǎo)員
走出初中思想品德課的困擾探討
讓多媒體技術(shù)在語(yǔ)文課堂飛揚(yáng)
人生三維度
閱讀理解三則