波士頓大學(xué)
近年來,隨著社會(huì)經(jīng)濟(jì)的高速發(fā)展,人們的生活水平得到大幅度提升,尤其是在計(jì)算機(jī)信息技術(shù)的全面推行中,人們的生活方式和生產(chǎn)方式都發(fā)生了較大的變化,網(wǎng)絡(luò)已經(jīng)與人們的生活密不可分?,F(xiàn)如今,網(wǎng)絡(luò)已經(jīng)成為人們發(fā)聲的重要平臺(tái),網(wǎng)絡(luò)輿情大數(shù)據(jù)的傳播有著一定的特征,需要對(duì)其進(jìn)行有效的監(jiān)督和管理,為此應(yīng)當(dāng)充分發(fā)揮人工智能技術(shù)的作用,有效挖掘網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征,轉(zhuǎn)變傳統(tǒng)的監(jiān)管模式,采用先進(jìn)的思維方式,構(gòu)建完善的數(shù)據(jù)挖掘系統(tǒng),從而營造健康的網(wǎng)絡(luò)環(huán)境。
(1)網(wǎng)絡(luò)輿情傳播渠道比較廣泛,信息量較為龐大,而且網(wǎng)絡(luò)輿情信息具有交互性和即時(shí)性,并且能夠?qū)崿F(xiàn)自主性傳播;(2)網(wǎng)絡(luò)輿情屬于“微傳播”,呈現(xiàn)出病毒性傳播形式,傳播速度非常快,而且覆蓋的面積十分廣泛,能夠造成極大的影響;(3)網(wǎng)絡(luò)輿情傳播具有動(dòng)態(tài)性,能夠?qū)崿F(xiàn)全方位的傳播,體現(xiàn)了綜合性、立體式傳播特征;(4)網(wǎng)絡(luò)輿情傳播具有一定的突發(fā)性,信息很容易發(fā)酵,其傳播呈現(xiàn)出幾何裂變特征;(5)網(wǎng)絡(luò)輿情傳播的指向非常明確,而且大部分屬于泛娛樂化傳播;(6)網(wǎng)絡(luò)輿情傳播體現(xiàn)了網(wǎng)民利益的選擇性,而且能夠形成線上和線下的互動(dòng),傳播成本比較低[1]。
基于人工的網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播中,需要應(yīng)用科學(xué)的網(wǎng)絡(luò)輿情數(shù)據(jù)采集技術(shù),其作用在于確定輿情的主題,采集初始信息,為后續(xù)的特征挖掘工作奠定扎實(shí)基礎(chǔ)。比如說,利用網(wǎng)絡(luò)爬蟲于網(wǎng)絡(luò)中的各個(gè)平臺(tái)抓去敏感點(diǎn)和信息熱點(diǎn),如微博、微信、貼吧等平臺(tái)。當(dāng)前使用較多的爬蟲程序有主題爬蟲系統(tǒng)、通用爬蟲系統(tǒng)和深度爬蟲系統(tǒng)等,不同的爬蟲程序有著不同的技術(shù)優(yōu)勢,能夠針對(duì)網(wǎng)絡(luò)輿情的特點(diǎn)來進(jìn)行全面采集[2]。
在進(jìn)行爬蟲程序的初步網(wǎng)絡(luò)輿情數(shù)據(jù)采集之后,為了滿足數(shù)據(jù)特征分析的要求,還需要對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理??赏ㄟ^預(yù)處理模塊去除網(wǎng)頁信息中的重復(fù)內(nèi)容,消除噪聲,進(jìn)行科學(xué)的文本處理工作,最終得到數(shù)據(jù)的文本向量集。在文本預(yù)處理階段,可以通過中文分詞技術(shù),將數(shù)據(jù)轉(zhuǎn)變?yōu)樵~集合,去除集合中設(shè)定的限制詞,統(tǒng)計(jì)每一個(gè)單詞的出現(xiàn)頻率,生成倒排索引文件,完成文本預(yù)處理工作;在特征選擇階段,則要根據(jù)倒排索引文件,來實(shí)施特征選擇工作,進(jìn)行降維處理,獲取特征詞匯集合;在文本向量化階段,要統(tǒng)計(jì)特征詞匯集中每一個(gè)特征詞的出現(xiàn)頻率及其所占比例,完成文本向量。
在網(wǎng)絡(luò)輿情智能分析挖掘技術(shù)應(yīng)用中,需要跟蹤熱門的網(wǎng)絡(luò)輿情話題,并對(duì)其進(jìn)行文本傾向分析。話題識(shí)別任務(wù)是利用預(yù)處理模塊獲得的文本向量集來進(jìn)行同類型文檔的匯總,并識(shí)別出其中的熱門話題;話題跟蹤任務(wù)則是通過向量化文本相似度的計(jì)算來進(jìn)行處理,做好話題歸類工作。需要統(tǒng)計(jì)話題的點(diǎn)贊次數(shù)、評(píng)論次數(shù)、轉(zhuǎn)發(fā)次數(shù)等;文本傾向型分析則需要挖掘出文本信息中的各個(gè)觀點(diǎn)、情感語義等,以對(duì)文本信息的正負(fù)情感進(jìn)行科學(xué)的判斷。
網(wǎng)絡(luò)信息傳感提取模塊是網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征挖掘系統(tǒng)中的重要組成部分,其功能主要在于獲取初始信息。在此模塊中,能夠提供大量的網(wǎng)絡(luò)傳感信息流,為網(wǎng)絡(luò)輿情數(shù)據(jù)傳播特征挖掘系統(tǒng)的正常運(yùn)行奠定扎實(shí)基礎(chǔ),為其后續(xù)工作的開展提供可靠的信息資源。在系統(tǒng)運(yùn)行過程中提取模塊部分,可有效鏈接輸入端接口電路和客戶端網(wǎng)絡(luò)數(shù)據(jù)傳感器,從而獲取初始網(wǎng)絡(luò)信息數(shù)據(jù),并且要對(duì)這些信息數(shù)據(jù)的節(jié)點(diǎn)進(jìn)行編號(hào),其初始編碼和地址編碼都由中央控制器來加以管理。在獲取相關(guān)編碼之后,還需要充分發(fā)揮數(shù)據(jù)儲(chǔ)存器的作用,有效儲(chǔ)存動(dòng)態(tài)數(shù)據(jù),一般情況下,常見的處理方式是無線射頻技術(shù),可利用傳輸電流、CAN傳輸總線、RS485傳輸串口來保障人工智能網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征挖掘系統(tǒng)主控區(qū)域信號(hào)的正常傳輸。挖掘系統(tǒng)中提取模塊的硬件設(shè)計(jì)包含了中央控制器、輸入接口電路、繼電器控制電路、無線射頻傳輸電路、地址編碼電路、FLASH儲(chǔ)存器、RS485串口電路和CAB總線等內(nèi)容[3]。提取模塊硬件設(shè)計(jì)的核心在于要處理好順向電流指向性電路節(jié)點(diǎn)端口的設(shè)計(jì),需要根據(jù)實(shí)際情況來選擇相適應(yīng)的控制系統(tǒng)結(jié)構(gòu)??沙浞职l(fā)揮數(shù)據(jù)傳感器的作用,利用多線程緩沖性路徑接口來獲取核心的數(shù)據(jù),設(shè)立明確的主控區(qū)域來管理各部分的運(yùn)行狀況,確保此系統(tǒng)的穩(wěn)定性。相關(guān)技術(shù)人員,可利用提取模塊中的傳感器來建立基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情映射子集,對(duì)其進(jìn)行科學(xué)的管理。
在人工智能網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征挖掘系統(tǒng)中,中央控制器中有多個(gè)內(nèi)部元件組成,其呈多條帶狀數(shù)據(jù)分布形式。要有效監(jiān)控不同的輿情大數(shù)據(jù),需要充分考慮網(wǎng)絡(luò)輿情的點(diǎn)擊量和訪問次數(shù),這就要利用多條帶交互接口設(shè)計(jì)方式來正常提取日常情形下的輿情數(shù)據(jù),并且在提取的同時(shí),讀入、讀出這些數(shù)據(jù),提高網(wǎng)絡(luò)輿情數(shù)據(jù)的處理效果。網(wǎng)路輿情數(shù)據(jù)形式具有多樣性,可以是文字、圖片,也可以是視頻或是其他類型,可針對(duì)不同的類型來設(shè)置相應(yīng)的數(shù)據(jù)接口,以滿足于當(dāng)下不同的輿情數(shù)據(jù)形式,有效提取和傳輸網(wǎng)絡(luò)輿情數(shù)據(jù)。在中央控制器獲取網(wǎng)絡(luò)輿情數(shù)據(jù)之后,需要于其內(nèi)部進(jìn)行有效的數(shù)據(jù)傳輸工作,構(gòu)建完善的傳輸結(jié)構(gòu),充分發(fā)揮FLASH儲(chǔ)存器的作用,通過其內(nèi)部的傳輸接口來傳輸數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)傳輸?shù)膶I(yè)化,并且發(fā)布相關(guān)的指令,利用64位來進(jìn)行指令傳導(dǎo)。
在網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征挖掘系統(tǒng)中,其提取模塊能夠讀取大量的網(wǎng)絡(luò)數(shù)據(jù)信息,但是并未充分發(fā)揮人工智能技術(shù),不可對(duì)這些網(wǎng)絡(luò)輿情數(shù)據(jù)信息進(jìn)行科學(xué)的、智能化的分析,未與人工智能分析技術(shù)相結(jié)合,這不利于挖掘系統(tǒng)水平的提升。為此,應(yīng)當(dāng)將人工智能分析技術(shù)融入提取模塊中,在基礎(chǔ)網(wǎng)絡(luò)的支持下,拓展局域網(wǎng)絡(luò),通過增設(shè)人工智能入網(wǎng)協(xié)議來實(shí)現(xiàn)基礎(chǔ)網(wǎng)絡(luò)和局域網(wǎng)絡(luò)之間的對(duì)接,為網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征挖掘系統(tǒng)的發(fā)展提供基礎(chǔ)保障??苫谄渚W(wǎng)絡(luò)需求,來應(yīng)用適宜的網(wǎng)絡(luò)藍(lán)本,采用隨機(jī)網(wǎng)絡(luò)代碼,使之與人工智能網(wǎng)絡(luò)協(xié)議載波同步,轉(zhuǎn)變網(wǎng)絡(luò)屬性,實(shí)現(xiàn)有效的對(duì)接。這并不是一個(gè)簡單的工作,具有一定的復(fù)雜性,屬于二維判定??勺裱欢ǖ淖兓瓌t來控制數(shù)據(jù)傳輸信號(hào),當(dāng)其進(jìn)入到人工智能局域網(wǎng)絡(luò)中,信號(hào)源會(huì)發(fā)生一定的變化,可通過傳輸協(xié)議,于系統(tǒng)中直接提取模塊中的信息,利用中央控制區(qū)來進(jìn)行相應(yīng)的管理[4]。
在增設(shè)人工智能網(wǎng)絡(luò)協(xié)議之后,可于局域網(wǎng)中對(duì)網(wǎng)絡(luò)輿情數(shù)據(jù)進(jìn)行科學(xué)的分析,實(shí)施輿情二次語義處理。首先,應(yīng)當(dāng)先對(duì)網(wǎng)絡(luò)輿情數(shù)據(jù)進(jìn)行一次處理。處理內(nèi)容主要在于基于人工智能,采集網(wǎng)絡(luò)輿情相關(guān)數(shù)據(jù),去除網(wǎng)頁中的重復(fù)信息以及進(jìn)行良好的去噪工作,通過文本特征來進(jìn)行初始化操作,獲取輿情文本數(shù)據(jù),具體操作流程如下:首先對(duì)網(wǎng)絡(luò)輿情信息進(jìn)行去重去噪處理,然后根據(jù)網(wǎng)絡(luò)輿情特征進(jìn)行相應(yīng)的選擇,實(shí)施文本向量化,根據(jù)分析處理結(jié)果來判斷此網(wǎng)絡(luò)輿情數(shù)據(jù)是否符合代碼準(zhǔn)入標(biāo)準(zhǔn),如若是符合則可以啟動(dòng)延時(shí),如若是不符合則延時(shí)時(shí)間消耗完畢。在進(jìn)行一次處理之后,還需要再實(shí)施二次處理,二次處理主要在于分析挖掘處理,可消除特征延時(shí)性時(shí)間序列模型。其目的在于對(duì)網(wǎng)絡(luò)輿情數(shù)據(jù)進(jìn)行特征分析,高度識(shí)別網(wǎng)絡(luò)輿情數(shù)據(jù)的相關(guān)信息并跟蹤話題,對(duì)輿情數(shù)據(jù)的導(dǎo)向進(jìn)行科學(xué)評(píng)估和分析,可通過適宜的算法來整合信息文本向量,挖掘出網(wǎng)絡(luò)輿情的相關(guān)特征,找到其中的關(guān)聯(lián)性。
總之,21世紀(jì)是一個(gè)信息化時(shí)代,網(wǎng)絡(luò)輿情大數(shù)據(jù)的傳播給人們帶來了便捷,與此同時(shí)也存在一定的負(fù)面影響,為了有效管理網(wǎng)絡(luò)輿情,應(yīng)當(dāng)充分利用人工智能技術(shù),來挖掘網(wǎng)絡(luò)輿情大數(shù)據(jù)傳播特征,并對(duì)其進(jìn)行科學(xué)把控。