李若楠 劉沖
摘? 要? 隨著新媒介、大數(shù)據(jù)技術(shù)的進(jìn)步,融媒體、大數(shù)據(jù)技術(shù)的概念也逐漸應(yīng)用到城市建設(shè)領(lǐng)域,城市全媒體建設(shè)因此也成為一個趨勢和新熱點(diǎn)。文章結(jié)合正在建設(shè)發(fā)展中的雄安新區(qū),系統(tǒng)分析在構(gòu)建雄安新區(qū)文化資源傳播系統(tǒng)過程中要用到的技術(shù),以及相關(guān)功能模塊的展現(xiàn)。
關(guān)鍵詞? 雄安新區(qū);文化資源數(shù)據(jù)庫;大數(shù)據(jù);輿情分析;可視化
中圖分類號? G2? ? ? 文獻(xiàn)標(biāo)識碼? A? ? ? 文章編號? 2096-0360(2019)03-0027-02
隨著“文化資源數(shù)字化國家行動”的開展以及媒體融合的不斷演進(jìn),各地方紛紛掀起了數(shù)字化文化建設(shè)的熱潮。雄安新區(qū)歷史文化資源豐富,文化底蘊(yùn)深厚,將其悠久的歷史文化資源進(jìn)行數(shù)字化傳播亦是潮流。因此媒體融合趨勢下,雄安新區(qū)融媒體數(shù)字化傳播勢在必行。
目前學(xué)術(shù)界關(guān)于雄安新區(qū)融媒體數(shù)字化傳播的研究和實(shí)踐項(xiàng)目較少。因此本文以對雄安新區(qū)文化資源傳播系統(tǒng)的研究為課題,研究雄安新區(qū)融合新型的信息技術(shù)手段,包括大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、人工智能技術(shù)等,以融媒體數(shù)字化傳播系統(tǒng)為載體進(jìn)行創(chuàng)新驅(qū)動,打造具有雄安新區(qū)特色的文化資源數(shù)字化平臺。讓用戶以一種新的視角、新的體驗(yàn)、新的方式去認(rèn)識雄安新區(qū)的歷史文化資源。
1? 雄安文化資源數(shù)據(jù)庫展示平臺
雄安特色的文化資源數(shù)據(jù)庫模型的建立,首先對具有雄安特色的、有價值的文化信息資源,以文字、圖像、聲音、視頻等為載體進(jìn)行收集、處理、分析、評價與存儲;之后,按一定標(biāo)準(zhǔn)、原則、規(guī)范、流程進(jìn)行數(shù)字化操作;采用數(shù)字采集、數(shù)字處理、數(shù)字存儲、數(shù)字傳播等數(shù)字技術(shù)將文化資源轉(zhuǎn)化、再現(xiàn)成可共享、可再生的數(shù)字形態(tài);最后以新視角進(jìn)行解讀,以新方式進(jìn)行保存。平臺的實(shí)施是以數(shù)字化集成軟硬件系統(tǒng)平臺為核心的文化資源數(shù)字化基礎(chǔ)工程,也是為了建立雄安文化資源數(shù)字化信息資源庫和數(shù)據(jù)共享服務(wù)平臺。該平臺的建立,充分應(yīng)用了各種IT新技術(shù)將文化資源轉(zhuǎn)化為數(shù)字化形態(tài),向社會提供文化產(chǎn)品和服務(wù),使文化資源得到永久的保存和保護(hù),凸顯文化資源的歷史價值。
2? 基于大數(shù)據(jù)輿情分析的融媒體智能化信息傳播云平臺
將雄安新區(qū)資源實(shí)體通過影像數(shù)據(jù)采集手段,建立起實(shí)物三維或模型數(shù)據(jù)庫。采用網(wǎng)絡(luò)輿情信息采集系統(tǒng)對傳統(tǒng)媒體網(wǎng)絡(luò)版、新聞網(wǎng)站、論壇、博客的相關(guān)信息進(jìn)行全天候定向抓取,抓取數(shù)據(jù)后,進(jìn)行預(yù)處理,包括格式轉(zhuǎn)換、數(shù)據(jù)清理和數(shù)據(jù)統(tǒng)計(jì),將最終數(shù)據(jù)存入雄安新區(qū)融媒體數(shù)字化數(shù)據(jù)庫。
通過大數(shù)據(jù)的篩選整合,利用地理優(yōu)勢,實(shí)時更新內(nèi)容,追蹤熱點(diǎn)。利用百度、谷歌、奇虎等搜索引擎進(jìn)行雄安相關(guān)熱點(diǎn)消息的補(bǔ)充,并進(jìn)行關(guān)鍵詞、關(guān)注度、轉(zhuǎn)載率等數(shù)據(jù)的統(tǒng)計(jì)分析。此外,在網(wǎng)絡(luò)社交平臺如BBS、博客、微博、QQ群、新聞跟帖中打撈出雄安的故事,為用戶進(jìn)行智能推薦。新興秒拍、微視頻等新媒介也直接作用于移動輿論場,并與微博微信無縫結(jié)合,促使一些雄安新區(qū)的熱點(diǎn)事件在極短時間內(nèi)快速傳播。基于輿情分析、輿論監(jiān)控和導(dǎo)向,讓用戶以全新的視角閱讀新聞,而不再是碎片化、片面的了解雄安。
數(shù)據(jù)可視化是利用圖形、圖像處理、計(jì)算機(jī)視覺以及用戶界面,通過表達(dá)、建模以及對立體、表面、屬性以及動畫的顯示,對數(shù)據(jù)加以可視化解釋。因此我們對通過利用python爬蟲技術(shù)爬取到的新聞做了簡單的可視化處理,通過把新聞數(shù)據(jù)可視化,將數(shù)據(jù)匯總形成可視化圖表,借助于圖形化手段如餅圖、柱形圖、詞云等,清晰有效地傳達(dá)與溝通信息,讓用戶可以更加清晰、直觀的了解雄安新區(qū)政治、經(jīng)濟(jì)、文化等方面的情況。
3? 技術(shù)分析
1)數(shù)據(jù)分析處理技術(shù)。在大數(shù)據(jù)的處理采集過程中,會有成千上萬的用戶同時來進(jìn)行訪問和操作,對于數(shù)據(jù)庫的要求較高。為了避免這種并發(fā)數(shù)高的現(xiàn)象,就需要在采集端部署數(shù)據(jù)庫MySQL等大量數(shù)據(jù)庫進(jìn)行支撐。在進(jìn)行導(dǎo)入時,也就是預(yù)處理,最重要的就是要對海量數(shù)據(jù)進(jìn)行有效的分析。因此,我們把來自前端的數(shù)據(jù)導(dǎo)入一個大型的分布式存儲集群中,以達(dá)到效果。在進(jìn)行統(tǒng)計(jì)分析的過程中,我們主要采用分布式數(shù)據(jù)庫來對存儲的海量數(shù)據(jù)進(jìn)行分析和相應(yīng)的匯總。最后,在大數(shù)據(jù)挖掘中,也就是所謂在現(xiàn)有的數(shù)據(jù)上面進(jìn)行基于各種算法的計(jì)算,算法的復(fù)雜性決定了它的重要性。通過這步,我們可以實(shí)現(xiàn)高級別數(shù)據(jù)分析的需求。
2)數(shù)據(jù)爬蟲采集技術(shù)。在雄安新區(qū)信息獲取方面本系統(tǒng)采用Python數(shù)據(jù)爬蟲采集技術(shù),對搜索引擎的文字、圖片、音頻及視頻進(jìn)行采集,主要是采集要素、提取關(guān)鍵詞、建立全文索引、自動去除重復(fù)信息、結(jié)構(gòu)化轉(zhuǎn)換、分區(qū)存儲等,抓取數(shù)據(jù)后,進(jìn)行預(yù)處理,包括格式轉(zhuǎn)換、數(shù)據(jù)清理和數(shù)據(jù)統(tǒng)計(jì),將最終數(shù)據(jù)存入雄安新區(qū)融媒體數(shù)字化數(shù)據(jù)庫。
采用Python Web框架,利用具有分布式抓取系統(tǒng)結(jié)構(gòu)(主從式、對等式)等技術(shù)的網(wǎng)絡(luò)爬蟲Python Web從指定的URL入口爬取數(shù)據(jù)信息,并對這些數(shù)據(jù)信息進(jìn)行信息清洗和選取,去重去噪,最終提取出純文本數(shù)據(jù)作為信息預(yù)處理的數(shù)據(jù)來源。采集流程如下。
(1)從特定的URL鏈接入手,進(jìn)行訪問測試。采集的網(wǎng)址的獲取一般有兩種渠道:一種是通過URL鏈接制定,也就是默認(rèn)鏈接訪問,比如有影響力的門戶、論壇、垂直行業(yè)網(wǎng)站等;另一種是通過元搜索的形式在搜索引擎系統(tǒng)中獲得。
(2)通過設(shè)置URL參數(shù)進(jìn)行頁面的動態(tài)采集設(shè)置。爬取數(shù)據(jù)信息、爬取內(nèi)容數(shù)量、爬取頁面總數(shù)等。也可以通過Robot.txt指定的爬取規(guī)則進(jìn)行合理的爬取設(shè)置。
(3)通過采集代碼爬取到頁面的HTML等相關(guān)頁面信息后,通過數(shù)據(jù)分析代碼,進(jìn)行頁面的解析。可以通過Python的第三方庫,如BeautifulSoup庫等提供的解析器從HTML代碼或者Joson數(shù)據(jù)結(jié)構(gòu)中解析出發(fā)布時間、題目、摘要、正文、點(diǎn)擊量、互動內(nèi)容等頁面的基本信息,在這個過程中,力圖去掉重復(fù)記錄的信息。Python數(shù)據(jù)爬蟲能實(shí)現(xiàn)各種爬蟲框架,能方便高效的下載網(wǎng)頁。
4? 研究價值
開發(fā)和建設(shè)雄安新區(qū)融媒體文化資源傳播平臺將帶來四個方面的價值。第一,可作為專屬雄安新區(qū)的數(shù)據(jù)庫,為雄安新區(qū)的旅游、文化等諸多方面提供數(shù)據(jù)分析,可滿足日益增長的信息量需求,提高城市知名度,順應(yīng)雄安新區(qū)的發(fā)展趨勢,響應(yīng)國家政策。第二,具有與時俱進(jìn)的內(nèi)容,具有創(chuàng)新性和先進(jìn)性,利于傳統(tǒng)文化轉(zhuǎn)化為社會主義先進(jìn)文化的有機(jī)部分,順應(yīng)時代發(fā)展與創(chuàng)新趨勢,使社會主義先進(jìn)文化深入人心,宣傳習(xí)近平新時代中國特色社會主義思想,對雄安新區(qū)的傳統(tǒng)文化產(chǎn)生積極的傳播效果,擴(kuò)大雄安新區(qū)的影響力,增強(qiáng)民族文化自信。第三,為實(shí)現(xiàn)雄安新區(qū)資源數(shù)字化傳播平臺提供借鑒的同時,為文化資源數(shù)字化傳播與文化創(chuàng)意傳承提供示范,開創(chuàng)文化資源數(shù)字化傳播與文化創(chuàng)意傳承新模式。第四,利用媒介融合的方式給傳統(tǒng)文化傳播帶來了新機(jī)遇,在傳承城市文脈的同時彰顯了雄安新區(qū)的特色,為雄安新區(qū)的旅游產(chǎn)業(yè)帶來新的發(fā)展機(jī)遇,具有開發(fā)城市旅游的利用價值。
5? 結(jié)束語
雄安新區(qū)文化資源傳播系統(tǒng)的研發(fā)為雄安新區(qū)的融媒體建設(shè)提供了借鑒,并從技術(shù)領(lǐng)域提供了合理的方案。在合理分析媒體融合趨勢的前提下,充分將雄安文化傳播與新媒體的發(fā)展更好地結(jié)合起來。通過對雄安新區(qū)信息資源的匯聚整合,經(jīng)過加工分析處理,為雄安新區(qū)輿情監(jiān)控和輿論導(dǎo)向服務(wù)。研究構(gòu)建本系統(tǒng)為開展文化創(chuàng)意與文化資源數(shù)字化傳播應(yīng)用提供示范,提升文化創(chuàng)意技術(shù)集成能力與文化資源數(shù)字化傳播應(yīng)用服務(wù)效果。區(qū)域特色文化資源數(shù)字化傳播在未來的文化產(chǎn)業(yè)發(fā)展中將發(fā)揮越來越重要的作用,加強(qiáng)對文化資源數(shù)字化傳播的研究不僅十分必要,而且對弘揚(yáng)我國優(yōu)秀傳統(tǒng)文化,促進(jìn)文化產(chǎn)業(yè)經(jīng)濟(jì)效益提高,正確對待文化產(chǎn)業(yè)帶來的社會影響等有迫切的現(xiàn)實(shí)意義。因此,要充分將文化傳播與新媒體的發(fā)展融合起來,推動雄安新區(qū)文化建設(shè)走上數(shù)字化建設(shè)、全媒體發(fā)展的新道路。
參考文獻(xiàn)
[1]李實(shí),等.互聯(lián)網(wǎng)+旅游:創(chuàng)意旅游、旅游融資及平臺整合[J].科技與產(chǎn)業(yè),2016,16(2):34-40,45.
[2]胡家強(qiáng),吳峰.基于三維視覺的室內(nèi)景觀虛擬設(shè)計(jì)方法研究[J].現(xiàn)代電子技術(shù),2018,41(19):40-43,48.
[3]董大偉.傳統(tǒng)媒體與新媒體如何融合互動[N].學(xué)習(xí)時報,2018-09-21(003).
[4]鄭佳武.論融媒體時代電視媒體的突圍[J].出版廣角,2018(16):64-66.