閆盈盈
[摘 ? ?要] 創(chuàng)新性地提出了政府公文公告主題研究方法?;趧?dòng)態(tài)主題模型(Dynamic Topic Models,DTM),學(xué)習(xí)不同時(shí)間段政府公文公告數(shù)據(jù)的文檔-主題分布和主題-詞語(yǔ)分布的信息,通過統(tǒng)計(jì)分析與可視化分析,展示政府公文公告的主題及主題下詞語(yǔ)演化情況。選取貴州省人民政府網(wǎng)站和貴陽(yáng)市人民政府網(wǎng)站的公文公告數(shù)據(jù),選擇2017年7月至2018年7月的數(shù)據(jù)進(jìn)行分析,實(shí)驗(yàn)結(jié)果表明,本文提出的方法能夠有效幫助公眾理解政府發(fā)文的主題情況及關(guān)鍵詞語(yǔ)內(nèi)容。
[關(guān)鍵詞] 政府; 公文公告;DTM;主題分析; 演化
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 21. 067
[中圖分類號(hào)] TP391 ? [文獻(xiàn)標(biāo)識(shí)碼] ?A ? ? ?[文章編號(hào)] ?1673 - 0194(2020)21- 0151- 05
1 ? ? ?引 ? ?言
目前,全球已進(jìn)入大數(shù)據(jù)時(shí)代,每?jī)赡昊ヂ?lián)網(wǎng)上的數(shù)據(jù)會(huì)翻一番,未來,數(shù)據(jù)將會(huì)成為全球最有價(jià)值的資產(chǎn),政府?dāng)?shù)據(jù)作為鉆石富礦,占據(jù)中國(guó)數(shù)據(jù)總量80%以上的份額[1]。激活沉睡在檔案袋、文件夾里的政府?dāng)?shù)據(jù)資源,實(shí)現(xiàn)政府?dāng)?shù)據(jù)資源價(jià)值變現(xiàn),將驅(qū)動(dòng)地方政府實(shí)現(xiàn)經(jīng)濟(jì)發(fā)展轉(zhuǎn)型,提升社會(huì)治理能力、公共服務(wù)能力,增進(jìn)民生福祉,推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。利用大數(shù)據(jù)方法和手段激活政府?dāng)?shù)據(jù)價(jià)值,提升政府治理能力越來越成為政府部門、政府大數(shù)據(jù)研究者的使命和研究焦點(diǎn)。
近年來,我國(guó)學(xué)者對(duì)政府?dāng)?shù)據(jù)進(jìn)行了大量的探索[2-6],然而,這些探索大多采用CNKI為數(shù)據(jù)源,利用傳統(tǒng)的數(shù)學(xué)統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析和處理,通過可視化的方法揭示政府的政策、主題、范圍、傾向等狀況。顯然,基于文獻(xiàn)的研究屬于間接政府?dāng)?shù)據(jù)研究,一定程度上,直接的政府?dāng)?shù)據(jù)研究更能夠揭示政府的工作狀況。此外,在文本、圖像、視頻等數(shù)據(jù)處理方面,機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、概率圖模型、深度學(xué)習(xí)等主流的大數(shù)據(jù)分析與挖掘方法被廣泛應(yīng)用在各行各業(yè)的數(shù)據(jù)分析實(shí)踐中。但很少有研究聚集在政府公文公告方面。因此,本文利用動(dòng)態(tài)主題模型(DTM)[7],揭示了不同層級(jí)政府在公文公告主題方面的區(qū)別與聯(lián)系,有利于公眾更加清晰地了解政府公文公告的主題演化趨勢(shì)與主題詞選擇傾向。
2 ? ? ?政府公文公告
政府公文公告的主題分析包括兩個(gè)過程,數(shù)據(jù)獲取與預(yù)處理、動(dòng)態(tài)主題提取。首先,從政府網(wǎng)站爬取公文公告數(shù)據(jù)形成語(yǔ)料庫(kù),利用文本預(yù)處理方法對(duì)抓取的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗獲得較為規(guī)整的文本語(yǔ)料;其次,通過動(dòng)態(tài)主題模型從文本語(yǔ)料庫(kù)中提取時(shí)序主題信息,完成統(tǒng)計(jì)分析。
2.1 ? 數(shù)據(jù)獲取與預(yù)處理
使用網(wǎng)絡(luò)爬蟲的方法從“貴州省人民政府”網(wǎng)站、“貴州省貴陽(yáng)市人民政府”網(wǎng)站按照一定的規(guī)則,批量抓取已公布的公文公告數(shù)據(jù),主要抓取標(biāo)題和正文內(nèi)容,形成規(guī)模較大的語(yǔ)料庫(kù)。爬蟲分為兩個(gè)模塊,頁(yè)面抓取和數(shù)據(jù)清洗。頁(yè)面抓取模塊通過初始URL,向?qū)γ娴姆?wù)器發(fā)送請(qǐng)求,獲取頁(yè)面的靜態(tài)或動(dòng)態(tài)代碼。數(shù)據(jù)清洗模塊通過解析DOM樹或其他方面,將需要的數(shù)據(jù)從頁(yè)面代碼中清洗出來,并獲取下一個(gè)爬取的URL,開始新的數(shù)據(jù)抓取與預(yù)處理。
2.2 ? 動(dòng)態(tài)主題提取
通過動(dòng)態(tài)主題模型獲取動(dòng)態(tài)時(shí)序主題。主題模型是一類無監(jiān)督的機(jī)器學(xué)習(xí)算法,能夠挖掘大規(guī)模文檔集中潛在的主題信息,本質(zhì)為一種主題聚類方法,將一篇文章表示為若干主題的概率集合,一個(gè)主題表示為若干詞語(yǔ)的概率集合,將相似度較高的文檔聚集在一個(gè)主題之內(nèi)[8]。動(dòng)態(tài)時(shí)序主題模型是在傳統(tǒng)主題模型[9]的基礎(chǔ)上引入了時(shí)間特征。
將省級(jí)、市級(jí)的政府公文公告數(shù)據(jù)分別按照一定的時(shí)間段劃分。通過動(dòng)態(tài)主題模型DTM,可以獲得每一個(gè)層級(jí),每個(gè)時(shí)間片的主題分布、主題-詞語(yǔ)分布,通過統(tǒng)計(jì)分析,可以得到各主題信息和各主題下詞語(yǔ)的信息?;谥黝}以及詞語(yǔ)信息,可以實(shí)現(xiàn)深度的政府公文公告數(shù)據(jù)挖掘與分析。
3 ? ? ?DTM主題模型
DTM模型是一種無監(jiān)督的動(dòng)態(tài)時(shí)序主題模型。其基本思想分為兩個(gè)部分。首先,將整體時(shí)間按照一定的時(shí)間段大小進(jìn)行劃分,將文檔集合中的文檔根據(jù)其內(nèi)在的時(shí)間戳信息劃分到相應(yīng)的時(shí)間片中。其次,對(duì)每一個(gè)時(shí)間片中的文檔子集通過LDA進(jìn)行主題挖掘得到主題隨時(shí)間動(dòng)態(tài)演化的情況。每一個(gè)時(shí)間片上的分布結(jié)果根據(jù)之前一個(gè)時(shí)間片的主題訓(xùn)練結(jié)果進(jìn)行動(dòng)態(tài)變化。概率圖模型如圖1所示。
圖中符號(hào)解釋如表1所示。
采用EM算法進(jìn)行參數(shù)推斷,需要推斷的參數(shù)包括超參數(shù)αi、隱變量φk,i、ηd,i、以及每個(gè)詞語(yǔ)的主題標(biāo)識(shí)zd,n,i。具體推斷過程見文獻(xiàn)[6]。另外一種較為簡(jiǎn)潔的方法是基于Gibbs采樣的方法[10]。
4 ? ? ?實(shí)驗(yàn)
4.1 ? 數(shù)據(jù)集選取與分析
爬取貴州省與貴陽(yáng)市人民政府網(wǎng)站的所有公文公告數(shù)據(jù),并以“半年”為一個(gè)時(shí)間片進(jìn)行劃分統(tǒng)計(jì),如圖2所示。
從圖2可以發(fā)現(xiàn):
(1)貴州省每半年發(fā)布公文公告的數(shù)據(jù)量在500篇上下浮動(dòng),需要特別說明的是2011以前的數(shù)據(jù)為2056篇,該節(jié)點(diǎn)是對(duì)2010年12月31日以前的所有數(shù)據(jù)進(jìn)行計(jì)數(shù)統(tǒng)計(jì)。
(2)貴陽(yáng)市2017年上半年之前的數(shù)據(jù)數(shù)量多為個(gè)位數(shù),甚至為0,可推測(cè)貴陽(yáng)市人民政府網(wǎng)站公布的公文公告數(shù)據(jù)具有一定的時(shí)效,會(huì)不定期的清理和更換,僅保留最新一年左右的數(shù)據(jù)。因此,由于貴陽(yáng)市2017下半年的數(shù)據(jù)量過小,不能夠繼續(xù)用于不同層級(jí)的公文公告關(guān)聯(lián)分析研究。
(3)對(duì)比2017年下半年至2018年上半年的貴州省與貴陽(yáng)市人民政府網(wǎng)站的公文公告數(shù)據(jù),貴陽(yáng)市的發(fā)文數(shù)量遠(yuǎn)高于貴州省,尤其是貴陽(yáng)市2018年的上半年的數(shù)據(jù)屬于陡增趨勢(shì)。
本文選取2017年下半年與2018年上半年的數(shù)據(jù)作為主題提取與分析的數(shù)據(jù)集。將數(shù)據(jù)劃分為T=4個(gè)時(shí)間片,每個(gè)時(shí)間片為一個(gè)季度。每個(gè)時(shí)間片的統(tǒng)計(jì)信息如圖3所示。
本文選取2017年下半年與2018年上半年的數(shù)據(jù)作為主題提取與分析的數(shù)據(jù)集。將數(shù)據(jù)劃分為T=4個(gè)時(shí)間片,每個(gè)時(shí)間片為一個(gè)季度。每個(gè)時(shí)間片的統(tǒng)計(jì)信息如圖3所示。
從圖3可以發(fā)現(xiàn),貴陽(yáng)市的發(fā)文數(shù)量遠(yuǎn)高于貴州省的發(fā)文數(shù)量,可猜測(cè)貴陽(yáng)市會(huì)積極響應(yīng)貴州省的發(fā)文號(hào)令,推動(dòng)貴陽(yáng)市經(jīng)濟(jì)社會(huì)水平不斷向前發(fā)展。數(shù)據(jù)集文檔詞語(yǔ)信息如表3所示。
從表3可以發(fā)現(xiàn),貴州省政府公文公告的平均文檔詞語(yǔ)高于貴陽(yáng)市,但是平均詞語(yǔ)密度略低于貴陽(yáng)市。這表明,貴州省的公文公告篇幅較長(zhǎng),貴陽(yáng)市略短,在詞語(yǔ)密度方面,貴陽(yáng)市同一詞語(yǔ)的使用頻率要大于貴州省。
在公文公告數(shù)據(jù)集上運(yùn)行DTM模型。超參數(shù)的設(shè)置采用經(jīng)驗(yàn)值,設(shè)置超參數(shù)α=0.01,δ=a=σ=0.05,主題值K=6。
4.2 ? 實(shí)驗(yàn)結(jié)果與分析
由于DTM是無監(jiān)督模型,因此沒有明確的類標(biāo)簽。該研究用topic 0~topic 5分別表示貴州省公文公告數(shù)據(jù)的6個(gè)類標(biāo)簽。通過DTM模型學(xué)習(xí)得到各時(shí)間片的文檔-主題分布ηd,i,計(jì)算得到貴州省公文公告數(shù)據(jù)在各時(shí)間片的主題分布比例,如圖4所示。
為了近一步了解各類標(biāo)簽的具體含義,結(jié)合DTM模型學(xué)習(xí)得到的各時(shí)間片的主題-詞語(yǔ)分布φk,i,列出了隨著時(shí)間變化的各主題下Top 10詞語(yǔ)信息,如表4所示。
根據(jù)表4,可以看出:貴州省公文公告數(shù)據(jù)主題大致分為“產(chǎn)業(yè)發(fā)展”、“政務(wù)公開”、“生態(tài)改革”、“人員招聘”“建設(shè)規(guī)劃”以及“發(fā)展服務(wù)”。
結(jié)合圖4,可以得出如下結(jié)論:
(1)貴州省針對(duì)“人員招聘”和“建設(shè)規(guī)劃”的發(fā)文數(shù)量較少,其他四類主題的發(fā)文數(shù)量相差不多。
(2)在2017年三季度,貴州省政府較為注重“生態(tài)改革”,主要針對(duì)全省各市、貴安新區(qū)的住房、生態(tài)、廁所改造和管理提出了管理和實(shí)施意見,表達(dá)了貴州省對(duì)“大生態(tài)”建設(shè)的積極響應(yīng)。
(3)在2017年四季度,占比較大的為“政務(wù)公開”,主要與政務(wù)服務(wù)中的審批、網(wǎng)上辦事、信息公開、項(xiàng)目投資與交易有關(guān)。該主題在2018年二季度的焦點(diǎn)由投資服務(wù)變?yōu)樗聪嚓P(guān)的政務(wù)服務(wù)。
(4)在2018年一季度,貴州省工作重點(diǎn)在“產(chǎn)業(yè)發(fā)展”方面,目的在積極響應(yīng)國(guó)家精準(zhǔn)扶貧的號(hào)召,重點(diǎn)支持和發(fā)展綠色農(nóng)業(yè)、節(jié)能工業(yè)的任務(wù)。
(5)“人員招聘”公文公告主要是貴州省發(fā)布的公務(wù)員人員招聘公告,主要包括組織領(lǐng)導(dǎo)、職務(wù)職位,報(bào)考資格、培訓(xùn)等事項(xiàng)要求。
(6)在“建設(shè)規(guī)劃”主題中,前兩個(gè)季度主要針對(duì)貴州省的住房問題、土地問題進(jìn)行規(guī)劃與管理,后兩個(gè)季度主要針對(duì)學(xué)校、林木進(jìn)行總體規(guī)劃與保護(hù)。
(7)“發(fā)展服務(wù)”公文公告主要在倡導(dǎo)企業(yè)利用大數(shù)據(jù)技術(shù)手段進(jìn)行改革創(chuàng)新,推動(dòng)醫(yī)療、旅游、養(yǎng)老等服務(wù)的社會(huì)服務(wù),促進(jìn)經(jīng)濟(jì)發(fā)展。在2017年三季度,主要以旅游和醫(yī)療為主。在2018年二季度,轉(zhuǎn)移為以養(yǎng)老和旅游為主。
貴陽(yáng)市公文公告數(shù)據(jù)在各時(shí)間片的主題趨勢(shì)如圖5所示。
貴陽(yáng)市各主題下的Top 10關(guān)鍵詞,如表5所示。
根據(jù)表5,貴陽(yáng)市公文公告數(shù)據(jù)主題大致分為“企業(yè)信息”“行政處罰”“項(xiàng)目招標(biāo)“采購(gòu)中標(biāo)”“財(cái)政預(yù)算”“采購(gòu)項(xiàng)目”。
結(jié)合圖5,發(fā)現(xiàn)招投標(biāo)類公告占據(jù)了貴陽(yáng)市政府公文公告數(shù)據(jù)的半壁江山,說明貴陽(yáng)市政府在該期間具有較大的招標(biāo)需求。結(jié)合貴陽(yáng)市公文公告數(shù)據(jù)的文檔主題標(biāo)簽、部分?jǐn)?shù)據(jù)集內(nèi)容以及貴陽(yáng)市人民政府網(wǎng)站,該研究發(fā)現(xiàn)topic 2(項(xiàng)目招標(biāo))、topic 3(采購(gòu)中標(biāo))、topic 5(采購(gòu)項(xiàng)目)的區(qū)別如下。
(1)“項(xiàng)目招標(biāo)”主題主要為貴陽(yáng)市省政府發(fā)布的關(guān)于各市區(qū)縣在道路設(shè)計(jì)、景觀提升、棚戶區(qū)改造、扶貧搬遷工程、農(nóng)田建設(shè)、醫(yī)院新院區(qū)、電梯設(shè)備采購(gòu)等項(xiàng)目建設(shè)方面的招標(biāo)公告,公告中詳細(xì)說明了招標(biāo)具備的條件、招標(biāo)人、代建單位、投標(biāo)文件、投標(biāo)保證金、聯(lián)系方式、日期等招標(biāo)內(nèi)容。
(2)“采購(gòu)中標(biāo)”主題側(cè)重在中標(biāo)結(jié)果的公示方面,主要為項(xiàng)目名稱、采購(gòu)方式、采購(gòu)日期、評(píng)審時(shí)間、評(píng)審地點(diǎn)、委員會(huì)、采購(gòu)聯(lián)系人、中標(biāo)供應(yīng)商、采購(gòu)代理機(jī)構(gòu)等信息。由于“貴陽(yáng)市公共資源交易中心”是貴陽(yáng)市招投標(biāo)的主要負(fù)責(zé)單位,同時(shí)也是貴陽(yáng)市政府公文公告數(shù)據(jù)的信息來源單位之一,因此“公共資源”、“交易中心”的出現(xiàn)概率較大。
(3)“采購(gòu)項(xiàng)目”主題側(cè)重在采購(gòu),因此在四個(gè)時(shí)間片,采購(gòu)出現(xiàn)的概率最大。采購(gòu)招投標(biāo)分為兩類,采購(gòu)招標(biāo)和采購(gòu)合同,在采購(gòu)招標(biāo)中,涉及到指標(biāo)文件、投標(biāo)供應(yīng)商、投標(biāo)保證金、采購(gòu)代理機(jī)構(gòu)等信息;在采購(gòu)合同公告中,存在項(xiàng)目名稱、采購(gòu)方式、技術(shù)要求、合同金額、供應(yīng)商、產(chǎn)品類型(服務(wù))、合同簽訂時(shí)間等內(nèi)容。在topic 5中,前兩個(gè)時(shí)間片的文檔有較大的概率為采購(gòu)合同類別,而后兩個(gè)時(shí)間片有較多的公文公告屬于采購(gòu)招標(biāo)內(nèi)容。
除此之外,從topic 0的關(guān)鍵字可以發(fā)現(xiàn)內(nèi)容為企業(yè)信息和人員信息。該研究在topic 0的基礎(chǔ)上,結(jié)合貴陽(yáng)市人民政府網(wǎng)站信息,發(fā)現(xiàn)topic 0展示來源于貴陽(yáng)市資源交易中心的中標(biāo)公示信息,內(nèi)容均為中標(biāo)候選企業(yè)信息,尤其是企業(yè)項(xiàng)目管理機(jī)構(gòu)人員的信息,包括姓名、職稱、執(zhí)業(yè)資格、證書等信息。結(jié)合貴陽(yáng)市公文公告數(shù)據(jù)主題趨勢(shì),2017年三季度無該主題的公文公告數(shù)據(jù),在2018年二季度,該主題下公文公告數(shù)據(jù)達(dá)到最多。
從“行政處罰”主題可以看出,包括的關(guān)鍵詞有“依法”“監(jiān)督”“責(zé)任”“住房”“房屋”“審查”“當(dāng)事人”“依法”等詞語(yǔ)。根據(jù)該主題隨時(shí)間的演變情況,可以發(fā)現(xiàn),前兩個(gè)季度公文公告數(shù)據(jù)側(cè)重在監(jiān)督審查,后兩個(gè)季度側(cè)重在房屋和住房問題的監(jiān)管、處罰,這與2018年貴陽(yáng)市大力開展住房監(jiān)管,形成房屋規(guī)范的實(shí)際情況相一致。
topic4的主題為“建設(shè)支出”,出現(xiàn)了大量與財(cái)政相關(guān)的關(guān)鍵字,例如“萬元”“預(yù)算”“支出”“經(jīng)費(fèi)”“審計(jì)”等詞語(yǔ),除此之外也出現(xiàn)了“建設(shè)”“發(fā)展”“服務(wù)”“項(xiàng)目”“信息”“企業(yè)”“生產(chǎn)”等詞語(yǔ)。在2017年的兩個(gè)季度,“檢查”出現(xiàn)概率較高,表明在這期間,關(guān)于財(cái)政預(yù)算方面的檢查項(xiàng)目、管理是貴陽(yáng)市政府關(guān)注的重點(diǎn),這與年末財(cái)政總結(jié)和核查密不可分。在2018年的兩個(gè)季度中,關(guān)鍵詞“審計(jì)”有較高的出現(xiàn)概率,結(jié)合貴陽(yáng)市公文公告數(shù)據(jù),發(fā)現(xiàn)在該段時(shí)間內(nèi),貴陽(yáng)市各區(qū)各縣的審計(jì)機(jī)關(guān)分別在推進(jìn)審計(jì)工作方面發(fā)布了公文公告,包括“黨建與審計(jì)工作深度融合”“深化經(jīng)濟(jì)責(zé)任審計(jì)”“主題教育”“扶貧攻堅(jiān)”等內(nèi)容。
結(jié)合利用DTM發(fā)現(xiàn)的貴州省與貴陽(yáng)市的公文公告數(shù)據(jù)主題以及主題詞信息,該研究發(fā)現(xiàn):貴州省的主題范圍較為總體和全局,通過產(chǎn)業(yè)發(fā)展、政務(wù)服務(wù)、生態(tài)改革、人員招聘、建設(shè)規(guī)劃等公文公告指導(dǎo)和推進(jìn)貴州省綜合規(guī)劃與發(fā)展,而貴陽(yáng)市的主題比較具體和集中,招投標(biāo)項(xiàng)目、行政處罰、行政預(yù)算等均為項(xiàng)目建設(shè)情況內(nèi)容。在主題內(nèi)容的關(guān)聯(lián)度方面,關(guān)鍵詞“發(fā)展”“建設(shè)”“生產(chǎn)”“企業(yè)”、“服務(wù)”“管理”出現(xiàn)在兩個(gè)層級(jí)的多個(gè)主題中,表明“生產(chǎn)建設(shè)”與“服務(wù)管理”工作是貴陽(yáng)市和貴州省的重中之重。
5 ? ? ?結(jié) ? ?語(yǔ)
該研究利用動(dòng)態(tài)主題模型DTM挖掘貴州省和貴陽(yáng)市公文公告數(shù)據(jù)集的主題演化與詞語(yǔ)演化信息,并在此基礎(chǔ)上進(jìn)行公文公告主題分析研究,有助于公眾了解貴州省與貴陽(yáng)市公文公告數(shù)據(jù)主題分布和發(fā)文內(nèi)容,同時(shí)可給政府工作提供可參考的統(tǒng)計(jì)基礎(chǔ)。進(jìn)一步的工作為建立跨層級(jí)公文公告主題挖掘新模型,從層級(jí)關(guān)系和時(shí)間關(guān)系探索國(guó)家、省、市、區(qū)、縣政府公文公告數(shù)據(jù)的主題關(guān)聯(lián)與區(qū)別,挖掘政府工作存在優(yōu)勢(shì)與問題,輔助政府決策,同時(shí)也會(huì)研究針對(duì)跨層級(jí)公文公告主題分析結(jié)果量化指標(biāo)。
主要參考文獻(xiàn)
[1]九次方.九次方大數(shù)據(jù)使命:激活政府?dāng)?shù)據(jù)價(jià)值,構(gòu)建全球數(shù)據(jù)生態(tài)[EB/OL].[2018-05-09].http://www.sohu.com/a/230919267_1000543
87.
[2]湯志偉,郭雨暉.我國(guó)開放政府?dāng)?shù)據(jù)的利用:基于CNKI的系統(tǒng)性文獻(xiàn)綜述[J].情報(bào)雜志,2018,37(7).
[3]袁冰潔,羅賢春,李伶思,等.我國(guó)政務(wù)信息資源研究熱點(diǎn)主題領(lǐng)域與趨勢(shì)[J].現(xiàn)代情報(bào),2016,36(12):133-138.
[4]胡吉明,張曉娟,譚婧.我國(guó)政府信息資源研究的主題結(jié)構(gòu)與演化態(tài)勢(shì)[J].信息資源化管理學(xué)報(bào),2018(3).
[5]張敏,吳郁松,霍朝光.我國(guó)電子政務(wù)的研究熱點(diǎn)與研究趨勢(shì)分析[J].情報(bào)雜志,2015(2):137-141.
[6]楊蘭蓉,潁潁.2015年國(guó)際電子政務(wù)研究的主題與趨勢(shì)——基于社會(huì)科學(xué)引文索引(SSCI)數(shù)據(jù)庫(kù)分析[J].現(xiàn)代情報(bào),2016,36(11):140-145.
[7]David M Blei, John D Lafferty. Dynamic Topic Models[C]//Proceedings of the 23rd International Conference on Machine Learning,2006:113-120.
[8]Jelodar Hamed,Wang Yongli,Yuan Chi,et al.Latent Dirichlet allocation (LDA) and Topic Modeling:Models,Applications,a Survey[J].Multimedia Tools and Applications,2018,78.
[9]Blei D M,Ng A Y,Jordan M I. Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003.
[10]Chen J,Zhu J,Wang Z,et al. Scalable Inference for Logistic-Normal Topic Models[C]//Proceedings of the 26th Internatconal Conference on Neural Information Processing Systems,Volume2,2013:2445-2453.