李 泉 李 萌 成洪權(quán) 蔣林秀 肖舒婷 王極可
(1.武漢大學(xué)政治與公共管理學(xué)院 武漢 430072;2.武漢大學(xué)測(cè)繪學(xué)院 武漢 430072;3.武漢大學(xué)計(jì)算機(jī)學(xué)院 武漢 430072)
微博作為Web2.0時(shí)代的產(chǎn)物,為人們發(fā)布信息、發(fā)表觀點(diǎn)提供了較為自由的社交場(chǎng)景。輿情(Public Opinion)即公眾輿論,是指公眾對(duì)于各種社會(huì)現(xiàn)象、問(wèn)題從信念、態(tài)度、意見(jiàn)和情緒等角度所作出的表達(dá)[1]。微博作為重要的輿論場(chǎng),諸多社會(huì)問(wèn)題均在微博中得以反應(yīng)。我國(guó)城市化的快速發(fā)展促使大批非城市戶籍人口涌入城市。大城市因其豐富的就業(yè)機(jī)會(huì)和資源吸引大量外來(lái)務(wù)工人員,然而,一線城市高昂的生活成本成為困擾他們的難題之一。為降低居住成本,他們紛紛選擇群租方式,群租房亦日漸成為大都市生活形態(tài)中一個(gè)揮之不去的組成部分,“蝸居”、“鴿子籠”、“房中房”成為大城市居住空間中的一種新形態(tài)。不容忽視的是,在享受群租房低廉租金的同時(shí),外來(lái)人員還必須面對(duì)群租所帶來(lái)的一系列安全風(fēng)險(xiǎn)。而每一起突發(fā)事件都會(huì)成為輿情爆點(diǎn),引發(fā)人們的熱烈探討。
群租房作為社區(qū)管理的重大隱患之一,迫切需要政府采取有效措施加以規(guī)范與管理。不過(guò)從實(shí)踐效果來(lái)看,群租房治理卻陷入困境。北京、上海、廣州等國(guó)內(nèi)一線城市紛紛出臺(tái)出租房屋條例和規(guī)定,限制乃至取締群租。政府各部門也先后多次開(kāi)展集中整治群租房行動(dòng)。各地政府的每一次整治行為便會(huì)引發(fā)社會(huì)媒體的廣泛關(guān)注。然而,面對(duì)眾多的自媒體討論,要全面了解民眾對(duì)群租房的看法與態(tài)度存在諸多挑戰(zhàn)。圍繞群租房整治行動(dòng),一部分群體抨擊政府整治行動(dòng)的強(qiáng)硬、粗暴,忽視弱勢(shì)群體利益,而另一部分群體又強(qiáng)烈支持政府各項(xiàng)整治行動(dòng)以消除群租房帶來(lái)的社會(huì)風(fēng)險(xiǎn)。目前圍繞群租房整體輿論趨勢(shì)的研究鮮有學(xué)者涉及。因此,本文期望利用大數(shù)據(jù)爬取技術(shù),對(duì)社交領(lǐng)域使用用戶最多的新浪微博中關(guān)于群租房的討論進(jìn)行爬取,并借助文本聚類分析和情感分析整體分析網(wǎng)絡(luò)輿情,探尋治理群租房所面臨的宏觀輿論環(huán)境。
截至目前,學(xué)者已經(jīng)對(duì)群租房相關(guān)問(wèn)題進(jìn)行大量研究,主要研究群租房概念、群租房產(chǎn)生的問(wèn)題以及群租房治理對(duì)策等。目前比較一致的觀點(diǎn)認(rèn)為群租是一種租賃關(guān)系[2]。群租雖然為大城市低收入階層提供了居住場(chǎng)所,但無(wú)序的群租行為也帶來(lái)大量的治理問(wèn)題。學(xué)者對(duì)于群租房引發(fā)的問(wèn)題探討主要集中在群租房引起的社會(huì)安全[3]、消防安全[4-8]、鄰里矛盾[9]、物業(yè)管理困難[10-11]等方面。面對(duì)群租帶來(lái)的一系列治理問(wèn)題,實(shí)務(wù)界和學(xué)界對(duì)群租房的治理路徑也進(jìn)行了探析。從政府實(shí)際行為看,運(yùn)動(dòng)式治理是政府治理群租房的主要手段[6,12]。但運(yùn)動(dòng)式治理面臨著治理成本高、效率低,難以達(dá)到根治效果[15]。從學(xué)者們的建議看,多中心治理[13]、協(xié)同治理[14]是治理群租房較有效的方式。雖然學(xué)者已經(jīng)意識(shí)到群租房存在的社會(huì)問(wèn)題,并探討了群租房治理方式,但是,目前還沒(méi)有學(xué)者對(duì)群租房輿情進(jìn)行過(guò)研究。黑格爾曾言“無(wú)論哪個(gè)時(shí)代,公共輿論總是一支巨大的力量”,微博輿情可以較大程度的反映民眾心聲,是政府治理不可忽視的重要部分。民眾對(duì)群租房治理問(wèn)題持怎樣的態(tài)度、觀點(diǎn),直接影響著群租房治理成效。
目前,學(xué)者對(duì)微博輿情的研究多集中在新聞傳播、管理學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域。計(jì)算機(jī)科學(xué)領(lǐng)域?qū)ξ⒉┹浨槲谋痉治龅难芯慷嗍且运惴橹螢槲⒉┹浨樾畔@取[15]、關(guān)鍵詞提取[16]、文本聚類[17]、情感分析[18]、輿情可視化[19-20]等提供方法論基礎(chǔ),本文是建立在這些方法基礎(chǔ)之上的。對(duì)群租房問(wèn)題引發(fā)的輿情的研究鮮有學(xué)者涉及,微博輿情文本分析及其可視化方法已日漸成熟?;诩榷狳c(diǎn)“群租房”進(jìn)行的微博輿情文本分析也是一種新的研究視角和研究問(wèn)題。將文本聚類、微博輿情分析方法運(yùn)用到對(duì)群租房微博輿情的分析中既是將微博輿情文本分析方法用于公共治理研究的有益實(shí)踐,也拓展了研究途徑,豐富了群租房治理問(wèn)題的研究方法。
本文利用網(wǎng)絡(luò)數(shù)據(jù)爬取技術(shù)提取微博輿情數(shù)據(jù),挖掘社會(huì)民眾對(duì)群租房治理的態(tài)度,嘗試分析群租房治理過(guò)程中展現(xiàn)出來(lái)的社會(huì)輿論特點(diǎn),建構(gòu)治理的輿論大背景。微博輿情數(shù)據(jù)具體搜集情況如下:
雖然新浪微博提供了開(kāi)放的API,但是其提供的API當(dāng)中的話題搜索高級(jí)API,能夠搜索到的微博信息只有503條,并不滿足研究的需求。故我們采用自行爬取的方法對(duì)微博平臺(tái)進(jìn)行關(guān)鍵字的爬取。本文通過(guò)使用Python開(kāi)源框架Scrapy,以“群租房”為關(guān)鍵詞,采用深度優(yōu)先的策略對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行爬取,以下是爬取關(guān)鍵字的偽代碼:
在爬取過(guò)程中遇到了三個(gè)問(wèn)題:(1)微博需要登錄后才能瀏覽相應(yīng)的搜索結(jié)果;(2)微博設(shè)置了搜索結(jié)果顯示的上限,限定為1000條,而與群租房有關(guān)的微博數(shù)量超過(guò)十萬(wàn)條;(3)微博的Web端采用了動(dòng)態(tài)獲取的方式加載信息,加大了信息獲取難度。
為解決這三大問(wèn)題,我們采取了以下應(yīng)對(duì)措施。
針對(duì)登錄問(wèn)題,我們采用模擬登錄的方式解決。一般而言,模擬登錄有兩種方式:一是在程序中向網(wǎng)站發(fā)出登錄請(qǐng)求,也就是提交包含登錄信息的表單(用戶名、密碼等),然后從響應(yīng)中得到Cookie,以后在訪問(wèn)其他頁(yè)面時(shí)也帶上這個(gè)Cookie,這種方式可以打開(kāi)只有登錄后才能看到的頁(yè)面。但是該也會(huì)遇到諸如反爬加密、驗(yàn)證碼等一系列復(fù)雜而且麻煩的問(wèn)題。第二種方式是使用無(wú)頭瀏覽器訪問(wèn),在Python中可以使用Selenium庫(kù)來(lái)調(diào)用瀏覽器,從而達(dá)到模擬人為登錄的操作,登錄之后獲取到Cookie就能進(jìn)行爬取工作。考慮到第一種方式的弊端,本文采取了第二種方式進(jìn)行模擬登錄。
針對(duì)微博搜索上限限定的問(wèn)題,實(shí)際處理中采用高級(jí)搜索功能,按照時(shí)間跨度進(jìn)行搜索。將時(shí)間跨度調(diào)整到適當(dāng)?shù)拇笮?,使得每次搜索顯示的條數(shù)在1000條以內(nèi),通過(guò)對(duì)不同時(shí)間跨度的搜索,得到所有的微博信息。針對(duì)微博動(dòng)態(tài)加載問(wèn)題,通過(guò)采取爬取微博Wap端,而不是Web端來(lái)解決。微博的Wap端沒(méi)有采用動(dòng)態(tài)加載的方式,可以直接獲取所有的微博信息。通過(guò)以上解決方案,我們能夠利用Python對(duì)新浪微博進(jìn)行關(guān)鍵詞爬取。但自2018年開(kāi)始,微博的反爬機(jī)制會(huì)自動(dòng)識(shí)別爬蟲(chóng)程序,對(duì)爬取所用的賬號(hào)甚至是IP限制訪問(wèn),因此每次爬取速度不宜過(guò)快。再加上在爬取的過(guò)程中,也有一定概率被識(shí)別成爬蟲(chóng),需要重新定向到登錄頁(yè)面。這都導(dǎo)致對(duì)微博爬取的過(guò)程耗時(shí)長(zhǎng),成功率較低。鑒于以上情況,我們爬取了2011至2018年所有時(shí)間段的部分?jǐn)?shù)據(jù),重點(diǎn)針對(duì)北京群租房大火事件等一些特殊時(shí)間節(jié)點(diǎn)進(jìn)行了多次爬取。最終成功獲取了2011年至2018年1月以“群租房”為關(guān)鍵字的16294條微博信息,作為后續(xù)研究的輿情數(shù)據(jù)。
本文主要采用R語(yǔ)言分析工具進(jìn)行微博輿情分析。隨著R版本的逐漸成熟和穩(wěn)定,R在行業(yè)里的應(yīng)用得到了飛速發(fā)展。R語(yǔ)言可在Windows、Mac OS、Linux等多種操作系統(tǒng)使用,擁有強(qiáng)大的數(shù)據(jù)分析功能和豐富的數(shù)據(jù)可視化效果。實(shí)驗(yàn)中運(yùn)用R主要進(jìn)行中文文本分析,包括聚類分析與情感分析[21]。
3.2.1 文本聚類分析 聚類分析是指將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過(guò)程,目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)來(lái)分類。聚類的各指標(biāo)之間具有一定的相關(guān)關(guān)系,常見(jiàn)的聚類有層次聚類與非層次聚類。本文的聚類主要是利用R語(yǔ)言結(jié)合K-means算法對(duì)中文分詞之后的詞語(yǔ)進(jìn)行主題詞聚類,挖掘分詞之間的共現(xiàn)關(guān)系。中文分詞主要利用R語(yǔ)言編程軟件,主要利用開(kāi)源包jiebaR中的segment函數(shù)對(duì)文本進(jìn)行分詞,并利用tibble包的as_data_frame函數(shù)將分詞了的文本轉(zhuǎn)化為標(biāo)準(zhǔn)化格式,以備后期文本聚類分析使用。
利用K-means算法進(jìn)行文本聚類分析的主要流程如圖1所示:
圖1 K-means聚類流程
K-means聚類的優(yōu)化目標(biāo)是使優(yōu)化目標(biāo)函數(shù)(損失函數(shù))的平方誤差最小,其計(jì)算式如下:
其中χ表示簇中散點(diǎn)的位置,ωk表示第k個(gè)簇,u(ωk)表示第k個(gè)簇的中心點(diǎn),RSSk是第k個(gè)簇的損失函數(shù),RSS表示整體的損失函數(shù)。優(yōu)化目標(biāo)就是選擇恰當(dāng)?shù)挠涗洑w屬方案,使得整體的損失函數(shù)最小。k的選值可以引入結(jié)構(gòu)風(fēng)險(xiǎn)對(duì)模型的復(fù)雜度進(jìn)行懲罰,或者按遞增的方式選擇k,求出相應(yīng)的誤差值,通過(guò)尋求拐點(diǎn)來(lái)確定最優(yōu)k值。由于文本聚類時(shí)采用的是文件、詞頻構(gòu)成的TF-IDF權(quán)值矩陣,一般不采用歐式距離,通常采用余弦距離對(duì)相似度進(jìn)行度量以求取聚類中心。
3.2.2 情感分析 情感分析又稱情感分類(Sentiment Classification)、評(píng)論挖掘(Review Mining)或意見(jiàn)挖掘(Opinion Mining),通過(guò)自動(dòng)分析商品、服務(wù)、人物等研究對(duì)象的相關(guān)評(píng)論文本內(nèi)容,發(fā)現(xiàn)評(píng)論者對(duì)該研究對(duì)象的褒貶態(tài)度和意見(jiàn)[22]。而網(wǎng)絡(luò)用戶情感分析則主要針對(duì)社會(huì)化媒體產(chǎn)生的評(píng)論信息進(jìn)行自動(dòng)情感分析。我們利用挖掘的微博用戶評(píng)論的文本文件,借助R語(yǔ)言分析工具,根據(jù)清華大學(xué)李軍等人的中文褒貶義詞典,將微博評(píng)論按照正面、負(fù)面詞性進(jìn)行分類,以此了解網(wǎng)絡(luò)用戶對(duì)“群租房”的態(tài)度和情感傾向。在數(shù)據(jù)分析實(shí)驗(yàn)中,微博輿情情感分析的主要流程包括:輿情數(shù)據(jù)中文分詞→特征提取→特征選擇→分類。通過(guò)結(jié)合情感詞庫(kù),該過(guò)程可以獲得較好的情感詞統(tǒng)計(jì)結(jié)果。
自媒體時(shí)代,微博為公眾賦予了充分的話語(yǔ)權(quán),微博也因其獨(dú)有的便攜性、匿名性和共享自由成為網(wǎng)絡(luò)輿情的重要發(fā)源地[23]。對(duì)微博輿情的分析主要從三個(gè)方面進(jìn)行:(1)群租房微博數(shù)據(jù)處理和討論概況;(2)群租房微博文本內(nèi)容分析;(3)群租房微博情感分析。
利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)對(duì)群租房信息進(jìn)行扒取,共獲得16294條數(shù)據(jù)。對(duì)爬取到的數(shù)據(jù)為空白的無(wú)效數(shù)據(jù)進(jìn)行刪除,對(duì)獲取數(shù)據(jù)的時(shí)間、ID、內(nèi)容等進(jìn)行篩選后的重復(fù)數(shù)據(jù)進(jìn)行刪除,共獲得14053條數(shù)據(jù)。為了了解群租房輿情熱點(diǎn)分布情況,對(duì)群租房微博數(shù)量按照月份進(jìn)行統(tǒng)計(jì),如圖2所示:
圖2 群租房微博輿情月度討論數(shù)量走勢(shì)
由圖2可知,人們對(duì)群租房的討論峰值集中在2013年7月、2013年12月、2014年5月、2016年12月、2017年8月、2017年11-12月,結(jié)合附表1可發(fā)現(xiàn)輿情爆發(fā)的時(shí)間節(jié)點(diǎn)與關(guān)于群租房的重大社會(huì)事件是緊密相關(guān)的。進(jìn)一步對(duì)歸類的微博輿情熱點(diǎn)問(wèn)題進(jìn)行匯總,可以得到群租房微博熱點(diǎn)問(wèn)題占比圖如圖3所示。從中可以看出,群租房所造成的諸如公共安全與消防安全問(wèn)題是人們討論最多的話題(超過(guò)半數(shù)),且群租房導(dǎo)致的社會(huì)問(wèn)題中消防安全問(wèn)題是人們最關(guān)注的問(wèn)題。微博輿情中對(duì)城市租房需求、租房市場(chǎng)混亂和政府治理措施的討論占比均接近15%,說(shuō)明這三類問(wèn)題也是民眾普遍關(guān)注的問(wèn)題。
圖3 群租房微博熱點(diǎn)問(wèn)題占比圖
為明確群租需求與群租社會(huì)問(wèn)題的主要內(nèi)容,我們嘗試?yán)糜?jì)量工具R的詞頻統(tǒng)計(jì)和聚類功能對(duì)微博輿情中具體內(nèi)容進(jìn)行分析。
4.2.1 群租房微博輿情文本詞頻分析 將群租房微博輿情數(shù)據(jù)進(jìn)行清洗和格式轉(zhuǎn)換后,利用統(tǒng)計(jì)工具R對(duì)微博輿情內(nèi)容進(jìn)行詞頻統(tǒng)計(jì),得出如圖4所示的2011-2018年群租房高頻詞統(tǒng)計(jì)結(jié)果。
圖4 2011年-2018年微博輿情文本詞頻統(tǒng)計(jì)(前15)
從圖4可以看出,在群租房微博輿情文本中:租房、北京、群租、消防、整治、租客、房屋、隔斷、安全隱患、中介、違法、治理、房東、消防安全、拆除、整改、排查、記者、居民、上海、調(diào)查、地下室、死亡等詞匯出現(xiàn)的頻次較高。從這些高頻詞可以看出,群租房輿情探討主要集中在:涉及的行為主體、群租現(xiàn)象的高發(fā)地、群租房帶來(lái)的主要問(wèn)題以及政府針對(duì)群租房的作為。
雖然各年度微博討論整體內(nèi)容趨于一致,但是高頻詞匯詞頻的增減與排序變化可以從另一個(gè)側(cè)面反映出微博輿情中探討群租房問(wèn)題發(fā)生的變化。例如,“火災(zāi)”等詞的排序變化可從側(cè)面反映出某一年份火災(zāi)在微博中被探討的熱度情況,2017年的火災(zāi)頻次創(chuàng)新高,反映出2017年的火災(zāi)引發(fā)人們廣泛關(guān)注,引發(fā)網(wǎng)民熱議。政府治理行動(dòng)的相關(guān)詞匯,如治理、整治、檢查等出現(xiàn)頻次也反映出了政府治理力度的強(qiáng)弱變化。同時(shí),在對(duì)微博輿情熱點(diǎn)問(wèn)題進(jìn)行匯總時(shí),我們也發(fā)現(xiàn),雖然群租房存在的社會(huì)問(wèn)題在其他城市也有體現(xiàn),但是政府治理引起人們探討最多的是北京市。因此,我們著重對(duì)北京市群租房的整治行動(dòng)所引起的社會(huì)輿情進(jìn)行分析。圖3中2011年-2012年高頻詞中并未出現(xiàn)明顯帶有政府整治群租房措施的詞匯。雖然北京市從2009年便開(kāi)始了群租房的整治行動(dòng),但還停留在初步探索階段。到2013年-2014年,出現(xiàn)取締(2013年348次)、治理(2013年376次、2014年544次)、整治(2014年654次)等詞匯且頻次較高,這與北京市在這兩年出臺(tái)大量群租房政策并且實(shí)施大量群租房整治行動(dòng)緊密相關(guān)。2015-2017年,政府對(duì)群租房的整治工作亦沒(méi)有松懈,從詞頻中也有反映,都維持在300次左右。2015年-2016年主要采取實(shí)行逐處掛賬督辦、規(guī)范租房市場(chǎng)、促進(jìn)民眾監(jiān)督對(duì)群租房進(jìn)行治理,整治類詞頻次數(shù)并未發(fā)生較大變化。到2017年,群租房消防問(wèn)題大爆發(fā)(大興區(qū)群租房起火死亡人數(shù)19人)促使北京市再次開(kāi)展“安全隱患大排查大清理大整治”專項(xiàng)行動(dòng),政府對(duì)群租房的整治力度進(jìn)一步加強(qiáng)。從詞頻中的表現(xiàn)則是“整治”這一詞匯2017年出現(xiàn)673次,2018年1月的數(shù)據(jù)中整治出現(xiàn)88次。
4.2.2 群租房微博輿情聚類分析 通過(guò)微博文本內(nèi)容的詞頻統(tǒng)計(jì)分析,可以發(fā)現(xiàn)群租房產(chǎn)生的社會(huì)問(wèn)題與政府整治群租房行動(dòng)是網(wǎng)民熱議的重點(diǎn)話題。為探索“問(wèn)題—行動(dòng)”之間是否存在相關(guān)關(guān)系,我們對(duì)分詞文本進(jìn)行聚類分析。選取詞頻次數(shù)大于15、詞匯相關(guān)系數(shù)大于0.8的詞匯進(jìn)行共現(xiàn)聚類探索,聚類分析的結(jié)果如圖5所示。圖5中的點(diǎn)表示聚類詞匯,連線的粗細(xì)表示詞與詞之間的關(guān)系,連線越粗表明這些詞共現(xiàn)的頻次越高聯(lián)系也越緊密。由圖5可知,微博輿情內(nèi)容出現(xiàn)5個(gè)明顯聚點(diǎn)。其中,最中心的聚點(diǎn)聚集的貢獻(xiàn)詞匯最多,包括整治行動(dòng)主體——公安部門、派出所、消防大隊(duì)、城管等詞,整治措施——宣傳、排查、拆除、整改、檢查、執(zhí)法、清理等詞,整治區(qū)域——街道、社區(qū),以及整治原因——隱患、期貨、火災(zāi)等詞,相關(guān)系數(shù)達(dá)到0.9以上,這些貢獻(xiàn)詞與北京市展開(kāi)的群租房專項(xiàng)行動(dòng)具有強(qiáng)烈的一致性,可見(jiàn)網(wǎng)民對(duì)政府整治群租房行動(dòng)高度關(guān)注。此外,分散于中心集簇的四個(gè)小聚點(diǎn)主要呈現(xiàn)群租房存在的問(wèn)題,共同出現(xiàn)的高頻詞包括:電氣、電水壺、充電器、線路、插座等詞,這些詞反映出群租房?jī)?nèi)存在的亂拉電線等現(xiàn)象,大量的易燃物品如煙頭、充電器、老式電水壺等物品,這些都是引發(fā)火災(zāi)的潛在隱患。此外,針孔攝像頭、偷拍、偷窺等詞共現(xiàn)率也較高,反映出群租房潛在的公共安全問(wèn)題。
圖5 2011-2018年微博輿情總體聚類圖
以上文本詞頻和聚類分析展現(xiàn)了網(wǎng)民對(duì)群租房話題的關(guān)注度,在微博討論中,重點(diǎn)內(nèi)容涵蓋群租房產(chǎn)生的社會(huì)問(wèn)題、政府對(duì)群租房整治舉措、以及外來(lái)人口住房需求等。另外,群租房是否應(yīng)該存在也一直為社會(huì)輿論激烈討論。群眾既有從弱勢(shì)群體的關(guān)懷角度支持群租房的存在,也有從社會(huì)治安穩(wěn)定角度對(duì)其表示擔(dān)憂,為探究微博輿情反映出來(lái)的對(duì)群租房的情感態(tài)度,需要進(jìn)一步通過(guò)情感分析進(jìn)行探索。
本文將2011-2018年的微博文本按月份進(jìn)行拆分,通過(guò)計(jì)算每個(gè)月的微博文本中正向情感詞與負(fù)向情感詞,對(duì)整月的文本情感貢獻(xiàn)的差值繪圖,得到2011-2018年微博文本的整體情感傾向,具體如圖6所示,其中橫軸代表時(shí)間,從2011年1月至2018年1月共81個(gè)月,排列順序從1至81;縱軸表示情感傾向,數(shù)值等于積極情感詞數(shù)減去消極情感詞數(shù)。從中可以看出,近八年來(lái),公眾的情感差值基本維持在較負(fù)面消極的水平。導(dǎo)致這種現(xiàn)象的原因主要有三個(gè),一是大部分群租房都存在違法行為,政府取締群租房引發(fā)群租房群體的住房焦慮;二是群租房事故頻發(fā),給群租租房者、房東抑或是鄰里帶來(lái)很大困擾;三是長(zhǎng)期以來(lái)有關(guān)群租房的負(fù)面新聞不斷,這使得公眾對(duì)群租房的整體印象較差。雖說(shuō)公眾情感整體呈現(xiàn)較為負(fù)面的水平,但仍有部分月份呈現(xiàn)出積極的情感傾向,這多與政府的治理舉措有關(guān)。政府在治理群租房的過(guò)程中并非僅僅是運(yùn)動(dòng)式搜索、取締,也會(huì)進(jìn)行諸如群租房整改、打擊黑中介、群租房安全知識(shí)宣傳與消防安全檢查等行為,這些行為本質(zhì)上對(duì)租客與業(yè)主雙向利好,因此會(huì)引發(fā)群眾積極的評(píng)論。除此之外,政府在整治群租房過(guò)程中并非只堵不疏,如2017年7月住建部等九部委下發(fā)了《關(guān)于在人口凈流入的大中城市加快發(fā)展住房租賃市場(chǎng)的通知》,積極推行租購(gòu)?fù)瑱?quán)、試點(diǎn)商改租、大力治理群租房。這些舉措得到群眾較大支持,在圖中呈現(xiàn)出正面的情感傾向。加快大中城市住房租賃市場(chǎng)發(fā)展讓更多底層人民租得起正常的住房更是解決群租房問(wèn)題最根本的措施,獲得較多積極評(píng)價(jià)。政府對(duì)群租房的治理雖具有一定成效,但目前房租如房?jī)r(jià)一般居高不下,高額房租使他們不得不選擇群租房,群租房整體狀況仍舊堪憂,輿情整體呈現(xiàn)出較為負(fù)面的傾向。
圖6 2011-2018年微博文本情感趨勢(shì)圖
同時(shí),我們也詳細(xì)分析2011-2018年每個(gè)月的微博。通過(guò)計(jì)算每行微博文本中正向情感詞與負(fù)向情感詞,對(duì)整月的文本情感貢獻(xiàn)的差值進(jìn)行繪圖,得到每月公眾的情感傾向,如圖7、圖8所示。總體來(lái)看,從2011年至2014年公眾的整體情感差值基本都是維持在極度負(fù)面的水平,說(shuō)明該時(shí)段群租房問(wèn)題引發(fā)問(wèn)題比較顯著,而政府治理的成效有限。從2014年起公眾的整體情感傾向則逐漸往正向積極的情感態(tài)度轉(zhuǎn)變,盡管仍然呈現(xiàn)出波動(dòng)態(tài)勢(shì),但總體趨勢(shì)中有積極情緒出現(xiàn)。
對(duì)微博輿情正向情緒出現(xiàn)較明顯的月份進(jìn)行解讀發(fā)現(xiàn),政府得到的舉措會(huì)引發(fā)較多人的支持。如2015年10月,廣州首次明確住房租賃標(biāo)準(zhǔn),租房簽約將有范本可依。2016年1月廣州出租房有明確標(biāo)準(zhǔn),出租人必須網(wǎng)上備案。這些對(duì)群租房的合法規(guī)制,獲得較多積極評(píng)論。另外,政府對(duì)群租房的治理不斷加強(qiáng)群租區(qū)域安全檢查與宣傳也引發(fā)了較多的積極評(píng)論。而對(duì)微博輿情負(fù)向情緒的峰度進(jìn)行解讀發(fā)現(xiàn),群租房重大安全隱患事件會(huì)引發(fā)較高的輿論負(fù)向情緒。在對(duì)群租房的討論中對(duì)輿情起引導(dǎo)作用的主要是新聞媒體,公眾多是參與評(píng)論者。從圖7、圖8中可以明顯看出群租房輿情中有三處明顯的輿情低峰:2013年11至12月、2014年11至12月、2017年9月。對(duì)2013年11至12月輿情低峰的微博輿情單獨(dú)查閱發(fā)現(xiàn):主要有兩個(gè)大事件導(dǎo)致了微博輿情較嚴(yán)重的負(fù)面情緒,分別是青島某群租房于11月15日發(fā)生大火和北京市對(duì)群租房進(jìn)行全面整治過(guò)程中爆出的群租房擁擠危險(xiǎn)頻發(fā)等新聞,如“北京一處‘群租房’被拆:地下室竟隔出307個(gè)房間”等。對(duì)2014年11至12月的群租房輿情進(jìn)行內(nèi)容解讀,發(fā)現(xiàn)主要是“情侶出租屋內(nèi)吵架點(diǎn)燃床單致合租2女生死亡”這一事件激發(fā)了較強(qiáng)的負(fù)面情緒。而2017年9月的負(fù)面情緒則是由“北京大興火災(zāi)27死傷 3D還原著火公寓結(jié)構(gòu)”這則新聞引發(fā),之后政府采取的強(qiáng)制搬遷措施也引發(fā)群眾較多不滿與焦慮情緒。通過(guò)對(duì)上述微博輿情低峰時(shí)期進(jìn)行分析,發(fā)現(xiàn)群租房熱點(diǎn)事件與整體情感傾向存在明顯的對(duì)應(yīng)關(guān)系,這說(shuō)明通過(guò)微博輿情的分析能夠?qū)狳c(diǎn)事件進(jìn)行預(yù)測(cè),這對(duì)于政府監(jiān)控?zé)狳c(diǎn)事件防止群體性事件的發(fā)生大有裨益,而群租房微博輿情監(jiān)控與預(yù)測(cè)的實(shí)現(xiàn)則有待進(jìn)一步的研究與完善。
圖7 2011-2014年微博文本每月情感趨勢(shì)
圖8 2015-2018年微博文本每月情感趨勢(shì)圖
本文利用R語(yǔ)言分析工具,結(jié)合詞頻分析、聚類分析和情感分析等方法,對(duì)北京市群租房的微博輿情狀況進(jìn)行了研究,討論了微博網(wǎng)民對(duì)群租房話題的關(guān)注度與情感傾向。通過(guò)研究發(fā)現(xiàn)2011-2018年網(wǎng)絡(luò)對(duì)群租房的關(guān)注呈波動(dòng)趨勢(shì)且與群租房熱點(diǎn)事件密切相關(guān),而2013、2014、2017年相關(guān)話題的討論最多,分析發(fā)現(xiàn)討論的具體話題包括群租房產(chǎn)生的社會(huì)安全、消防治安問(wèn)題,政府對(duì)群租房的整治行動(dòng)與措施等,揭示出群租房背后反映的中低收入住房群體焦慮現(xiàn)狀。通過(guò)情感分析發(fā)現(xiàn)網(wǎng)民雖然認(rèn)為群租房存在有其必然性,但由于群租房容易導(dǎo)致諸多安全隱患,所以大眾普遍認(rèn)為對(duì)群租房的整治也必不可少,其中民眾對(duì)政府的安全教育、消防檢查、發(fā)展租賃市場(chǎng)保障租戶權(quán)益等持支持態(tài)度。但整體而言,微博網(wǎng)民的情感趨勢(shì)為負(fù)向,反映出在這一治理領(lǐng)域基本的社會(huì)情緒。
本文的創(chuàng)新之處在于通過(guò)大數(shù)據(jù)爬取和R語(yǔ)言分析手段在宏觀層面分析政府治理群租房所面對(duì)的輿論環(huán)境,為政府開(kāi)展治理行動(dòng)奠定輿論基礎(chǔ),增加政府對(duì)群租房治理的行動(dòng)信心,使政府行為真正成為民之所向。同時(shí)本文的分析方法也為群租房問(wèn)題的研究提供了新的視角,有利于更全面地分析群租房問(wèn)題。此外,本文仍存在一定的不足之處,文中對(duì)群租房微博輿情的分析僅對(duì)群租房折射出的社會(huì)問(wèn)題、政府治理難題進(jìn)行了一定程度的分析,并對(duì)民眾對(duì)政府行為持積極態(tài)度的方面進(jìn)行了分析,但對(duì)于如何因地制宜治理群租房還需要全面深入的研究與探索。
附件:
附件1 北京市群租房微博輿情重大事件統(tǒng)計(jì)