摘? ?要:為了監(jiān)控用戶端數(shù)據(jù)負(fù)荷水平,按照電子政務(wù)信息提取框架的處置需求,設(shè)計了用戶行為管理模塊數(shù)據(jù)挖掘驅(qū)動單元的連接,完成用戶行為特征提取系統(tǒng)的硬件環(huán)境搭建。采用關(guān)聯(lián)電子政務(wù)用戶行為特征樹,存儲各類待挖掘的電子政府系統(tǒng)訪問數(shù)據(jù),完成系統(tǒng)軟件設(shè)計。實驗結(jié)果表明,與基于k-means的提取系統(tǒng)相比,應(yīng)用提出的特征提取系統(tǒng)后,電子政務(wù)用戶端的數(shù)據(jù)負(fù)荷水平明顯下降,用戶端主體的數(shù)據(jù)負(fù)荷壓力得到良好的監(jiān)控,從而提供了公眾對電子政務(wù)系統(tǒng)的滿意度。
關(guān)鍵詞:電子政務(wù);數(shù)據(jù)挖掘;用戶端數(shù)據(jù);特征提取;用戶行為
中圖分類號:TP399? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A
Design of E-government User Behavior Feature
Extraction System Based on Data Mining
ZHANG Hua?
(Shannxi Academy of Governance,Shannxi Province Party School of CPC,Xi'an,Shannxi 710068,China)
Abstract:In order to monitor the data load level of users,according to the disposal requirements of e-government information extraction framework,the connection of data mining driver unit of user behavior management module is designed to complete the hardware environment construction of user behavior feature extraction system. By using the behavior characteristic tree of the associated e-government users,the access data of various e-government systems to be mined are stored,and the system software design is completed. The experimental results show that,compared with the K-means based extraction system,the data load level of e-government users is significantly reduced after the application of the proposed feature extraction system,and the data load pressure of users is well monitored,thus providing public satisfaction with the e-government system.
Key words:e-government;data mining;client data;feature extraction;user behavior
電子政府利用電子信息及通訊科技,并由政府向市民提供資訊及公共服務(wù)。更廣泛地講,電子政務(wù)是在公共部門使用和應(yīng)用信息通信技術(shù),以簡化和整合工作流程,從而有效管理數(shù)據(jù)和信息,增強公共服務(wù)交付以及擴大參與和溝通的交互渠道。近年來,許多研究者關(guān)注電子政務(wù)的發(fā)展趨勢、電子政務(wù)服務(wù)的度量和各種電子政務(wù)模式的部署,以幫助政府實現(xiàn)這些目標(biāo)?;ヂ?lián)網(wǎng)在電子政務(wù)平臺中扮演著重要的角色,促進了電子服務(wù)的普及[1]。
電子政務(wù)成功的關(guān)鍵在于公眾的信任,即對電子政務(wù)系統(tǒng)的采納程度。通過分析用戶行為特征,得到用戶的偏好,可以幫助電子政務(wù)系統(tǒng)解決當(dāng)前存在的問題,并更好地服務(wù)于公眾[2],滿足公眾的需求,高效率解決公眾面臨的問題。數(shù)據(jù)庫在處理增量數(shù)據(jù)方面面臨許多挑戰(zhàn),比如難以分析、識別和解釋大量數(shù)據(jù),這些問題可以通過數(shù)據(jù)挖掘技術(shù)得以解決,該技術(shù)能夠提取新知識、按需檢索和預(yù)測,從而做出決策。
隨著信息通信技術(shù)的不斷發(fā)展,如何協(xié)調(diào)電子政務(wù)用戶端主體的數(shù)據(jù)負(fù)荷壓力成為了亟待解決的問題。為緩解上述情況,基于k-means處理系統(tǒng)按照電子政務(wù)用戶細(xì)分標(biāo)準(zhǔn),平均相鄰提取節(jié)點之間的數(shù)據(jù)傳輸量,再聯(lián)合相關(guān)用戶層設(shè)備,建立用戶行為特征提取的數(shù)據(jù)庫。但這種系統(tǒng)所占用的數(shù)據(jù)用戶負(fù)荷過高,很難實現(xiàn)傳輸數(shù)據(jù)的快速轉(zhuǎn)存。數(shù)據(jù)挖掘可以定義為從大型數(shù)據(jù)集中提取隱藏數(shù)據(jù)的過程,被廣泛應(yīng)用于各種環(huán)境和領(lǐng)域。利用數(shù)據(jù)挖掘技術(shù),可以對數(shù)據(jù)進行預(yù)測、分類、過濾和聚類?;诖?,引入數(shù)據(jù)挖掘原理,在挖掘驅(qū)動單元、行為特征樹等軟硬件結(jié)構(gòu)的支持下,設(shè)計一種新型的用戶行為特征提取系統(tǒng),并通過實驗對比的方式,突出說明該系統(tǒng)的實際應(yīng)用價值。
為了改進電子政務(wù)中的數(shù)據(jù)管理以及電子政務(wù)系統(tǒng)的用戶行為特征提取,人們做了大量的研究工作,主要集中在數(shù)據(jù)挖掘方法方面。文獻(xiàn)[3]提出了基于K-means算法的電子政務(wù)用戶細(xì)分模型,該模型系統(tǒng)地闡釋了構(gòu)建用戶細(xì)分模型,并進行實證分析,但是該模型在電子政務(wù)用戶端數(shù)據(jù)量檢測方面存在明顯不足,即無法準(zhǔn)確監(jiān)控用戶行為特征。文獻(xiàn)[4]提出了一種基于決策樹索引方法的DNA模型,同時描述了各種索引方法類型。該研究依賴于DNA數(shù)據(jù)集,并提出了一個模型以找到一種有效的方式來檢索、插入、刪除元素、最小化空間、查詢大小等。使用冗余數(shù)據(jù)生成了復(fù)雜的規(guī)則,以滿足內(nèi)存瓶頸的要求。此外,還將實驗結(jié)果與另一種算法索引方法進行了比較。文獻(xiàn)[5]提出了一種基于智能卡的分布式數(shù)據(jù)庫的用戶行為識別模型。智能卡的數(shù)據(jù)包括識別信息,該識別信息由生物特征、屬性和一些個人信息組成。文獻(xiàn)[6]提出了基于關(guān)鍵詞的搜索系統(tǒng),致力于提高搜索任務(wù)的性能并有效地管理數(shù)據(jù)庫,使用了數(shù)據(jù)挖掘算法索引數(shù)據(jù)庫以及圖形和模式方法的聚類技術(shù)。文獻(xiàn)[7]提出并討論了數(shù)據(jù)挖掘方法對使用Java編程語言從在線電子服務(wù)生成的大量數(shù)據(jù)的有效性,提出了一個將申訴補償納入電子政務(wù)框架的模式。該模型計算了數(shù)據(jù)挖掘技術(shù)中已解決的分類數(shù)據(jù)、檢測和跟蹤等不同應(yīng)用的學(xué)習(xí)效率成本。文獻(xiàn)[8]提出了一個用于優(yōu)化電子政務(wù)中數(shù)據(jù)挖掘的原型,重點從數(shù)據(jù)庫中檢索信息。在上述研究的基礎(chǔ)上,建立了數(shù)據(jù)挖掘模型,設(shè)計一種新型的用戶行為特征提取系統(tǒng),并通過實驗對比的方式,突出說明該系統(tǒng)的實際應(yīng)用價值,從而以更高的準(zhǔn)確性和更快的訪問方法讀取電子政務(wù)系統(tǒng)用戶端更精確的數(shù)據(jù)。
1? ?數(shù)據(jù)挖掘
數(shù)據(jù)挖掘有時被稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Databases,KDD),可以定義為在大量數(shù)據(jù)中通過提取知識然后對其進行分析的過程,數(shù)據(jù)挖掘是大數(shù)據(jù)技術(shù)與人工智能技術(shù)相結(jié)合的產(chǎn)物。數(shù)據(jù)挖掘的第一個主要任務(wù)是分類,該分類用于按類別值(標(biāo)簽或目標(biāo))對對象進行分類[9-10]。因此,每個對象都屬于一個特定的類,例如常見的決策樹,它是公共的類。人們提出了許多分類算法來管理數(shù)據(jù),如Quinlan、CHART、FACT、k-means等。分類方法的主要思想是獲得最大的準(zhǔn)確度,以預(yù)測數(shù)據(jù)庫中每種情況的正確分類。聚類是數(shù)據(jù)挖掘方法的第二項任務(wù),被稱為無監(jiān)督學(xué)習(xí),它是在一個群集中與其他群集不同的實體??偠灾?,分類方法和聚類方法都可以用于分析數(shù)據(jù)管理,然后將分析后的數(shù)據(jù)作為一個循環(huán)[11]進行傳遞用于測量,如圖1所示。
數(shù)據(jù)挖掘是指借助算法隱藏搜索功能、獲取信息執(zhí)行參量的過程,由無指導(dǎo)處置行為、有指導(dǎo)處置行為兩大基本類型組成。無指導(dǎo)數(shù)據(jù)挖掘是在既定屬性條件中,尋找某項特定關(guān)系的信息利用手段,包含估值、分類、預(yù)測等;有指導(dǎo)數(shù)據(jù)挖掘可利用現(xiàn)有信息參量建立固定化模型,再聯(lián)合特定屬性描述條件,對待處理數(shù)據(jù)的連接能力進行判斷與分析。在不考慮特殊干預(yù)行為的情況下,關(guān)聯(lián)規(guī)則和聚類效果是區(qū)分有指導(dǎo)數(shù)據(jù)挖掘行為、無指導(dǎo)數(shù)據(jù)挖掘行為的最直接條件。
2? ?硬件執(zhí)行環(huán)境設(shè)計
用戶行為特征提取系統(tǒng)硬件執(zhí)行環(huán)境由政府信息提取框架、用戶行為管理模塊、數(shù)據(jù)挖掘驅(qū)動單元三部分組成,具體搭建方法如下。
2.1? ?政府信息提取框架
政府信息提取框架是用戶行為特征提取系統(tǒng)的必要連接條件,由媒介、門戶網(wǎng)站、用戶服務(wù)器、行為管理服務(wù)器等多個結(jié)構(gòu)共同組成,如圖2所示。
2.2? ?用戶行為管理模塊
用戶行為管理模塊是隸屬于政府信息提取框架的重要物理元件,由系統(tǒng)管理層、用戶通信層、行為特征采集層三個單元結(jié)構(gòu)共同組成。管理層包含一個系統(tǒng)主服務(wù)器、一個挖掘主機、一個節(jié)點提取設(shè)備和一個用戶服務(wù)器。在電子政務(wù)系統(tǒng)正常運轉(zhuǎn)的情況下,系統(tǒng)主服務(wù)器可按照挖掘主機中的數(shù)據(jù)排列方式,向用戶服務(wù)器傳達(dá)必要的特征提取指令[12-13]。用戶通信層包含多個行為管理機,直接與用戶服務(wù)器相連,主要負(fù)責(zé)記錄及監(jiān)控電子政府環(huán)境下用戶端主體的傳輸行為。行為特征采集層包含行為儀表、管理主機及用戶執(zhí)行設(shè)備。管理主機作為用戶行為管理模塊的核心搭建設(shè)備,可直接驅(qū)動行為儀表的特征提取行為,并將未完全轉(zhuǎn)化的數(shù)據(jù)信息傳輸至下級執(zhí)行設(shè)備中,以便于后續(xù)數(shù)據(jù)挖掘操作的順利實施[14-15]。用戶行為管理模塊結(jié)構(gòu)如圖3所示。
2.3? ?數(shù)據(jù)挖掘驅(qū)動單元
數(shù)據(jù)挖掘驅(qū)動單元以BCM2046芯片作為核心搭建元件,能夠按照電子政務(wù)系統(tǒng)環(huán)境下用戶端主體的傳輸需求,記載固定提取時間內(nèi)用戶行為特征的主要變化趨勢。39VF200A芯片作為BCM2046元件的輔助執(zhí)行結(jié)構(gòu),能與用戶行為管理模塊的TPI管理主機相連,一方面轉(zhuǎn)接信息提取框架中的數(shù)據(jù)傳輸任務(wù),另一方面將既定的用戶行為轉(zhuǎn)化為特征樹存儲結(jié)構(gòu)。挖掘電阻可為數(shù)據(jù)挖掘驅(qū)動單元分得一定量的傳輸電壓,并可聯(lián)合驅(qū)動元件,將未完全消耗的用戶數(shù)據(jù)傳輸至其他應(yīng)用結(jié)構(gòu)中[16-17]。
3? ?系統(tǒng)軟件執(zhí)行環(huán)境設(shè)計
在系統(tǒng)硬件執(zhí)行環(huán)境的基礎(chǔ)上,按照電子政務(wù)系統(tǒng)用戶行為特征樹設(shè)計、待挖掘數(shù)據(jù)存儲、提取數(shù)據(jù)信息處理的流程,完成系統(tǒng)軟件執(zhí)行環(huán)境搭建,軟、硬間結(jié)合實現(xiàn)基于數(shù)據(jù)挖掘的用戶行為特征提取系統(tǒng)設(shè)計。
3.1? ?用戶行為特征樹構(gòu)建
用戶行為特征樹以特征節(jié)點作為起始搭建結(jié)構(gòu),能夠按照用戶的行為特征標(biāo)準(zhǔn),確定滿足一級傳輸需求提取節(jié)點的具體數(shù)量級水平,再聯(lián)合挖掘處置權(quán)限,排列系統(tǒng)中所有待處理信息。這種行為特征結(jié)構(gòu)的數(shù)量級體積較小,能夠?qū)⒋鎯Φ耐诰驍?shù)據(jù)細(xì)化成多個層次主體,并按照既定傳輸標(biāo)準(zhǔn),將所有特征信息反饋回用戶數(shù)據(jù)庫,進而保證后續(xù)提取指令的順利實施。電子政務(wù)系統(tǒng)用戶行為特征樹結(jié)構(gòu)如4所示。
3.2? ?待挖掘數(shù)據(jù)存儲
待挖掘數(shù)據(jù)存儲是電子政務(wù)系統(tǒng)用戶行為特征提取處理的必要執(zhí)行條件,能夠根據(jù)傳輸節(jié)點的固有承載能力,建立必要的數(shù)據(jù)挖掘標(biāo)準(zhǔn)。在電子政務(wù)系統(tǒng)用戶行為特征數(shù)據(jù)的支持下,請求處理層中的挖掘節(jié)點,可直接伸入電子政務(wù)環(huán)境并從中提取滿足用戶行為特征的信息參量。數(shù)據(jù)存儲層作為中間處理結(jié)構(gòu),可利用各關(guān)聯(lián)存儲節(jié)點,將現(xiàn)有信息參量整合成既定形式,進而滿足后續(xù)提取傳輸需求。特征收集層直接面對電子政務(wù)系統(tǒng)用戶行為的待提取數(shù)據(jù)參量,能夠承接來自數(shù)據(jù)存儲層的信息挖掘指令,并將所有節(jié)點組織都排列成固定的傳輸結(jié)構(gòu),以便于后續(xù)系統(tǒng)處置指令的順利實施。待挖掘數(shù)據(jù)存儲原理如圖5所示。
3.3? ?提取數(shù)據(jù)信息處理
提取數(shù)據(jù)信息處理是用戶行為特征提取系統(tǒng)構(gòu)建的末尾應(yīng)用環(huán)節(jié),可按照電子政務(wù)環(huán)境下挖掘處置的操作原理,調(diào)度特征收集層中的待存儲數(shù)據(jù)。在確保用戶行為特征樹得到足量匹配數(shù)據(jù)的前提下,聯(lián)合待挖掘數(shù)據(jù)存儲結(jié)構(gòu),提取數(shù)據(jù)挖掘驅(qū)動單元中的參量信息,再根據(jù)用戶行為管理模塊的執(zhí)行需求,建立必要的提取處理標(biāo)準(zhǔn),流程如圖6所示。在整個處理過程中,電子政務(wù)系統(tǒng)信息提取框架始終保持相對良好的信息調(diào)度能力,可融合系統(tǒng)內(nèi)所有的待挖掘數(shù)據(jù),并將其整合成提取處理所必須的信息應(yīng)用結(jié)構(gòu)。至此,完成基于數(shù)據(jù)挖掘的軟件執(zhí)行環(huán)境搭建,聯(lián)合相關(guān)硬件運行設(shè)備,完成新型用戶行為特征提取系統(tǒng)的構(gòu)建。
4? ?系統(tǒng)性能驗證
為驗證基于數(shù)據(jù)挖掘的電子政務(wù)用戶行為特征提取系統(tǒng)的實用性,設(shè)計如下對比實驗。選取一輸出狀態(tài)良好的電子政府系統(tǒng)設(shè)備作為實驗對象,分別記錄實驗組、對照組提取系統(tǒng)影響下,用戶端數(shù)據(jù)負(fù)荷的具體變化情況,其中實驗組主機搭載提出的用戶行為特征提取系統(tǒng),對照組主機搭載k-means處理系統(tǒng)。
4.1? ?實用環(huán)境搭建
選取穩(wěn)定時段電子政務(wù)系統(tǒng)的訪問用戶為研究對象,通過系統(tǒng)主服務(wù)器挖掘用戶服務(wù)器端的數(shù)據(jù)負(fù)荷,更改接入電子政府系統(tǒng)設(shè)備的提取系統(tǒng)類型,控制其他影響因素始終保持不變,在既定監(jiān)測時間內(nèi),分別記錄實驗組、對照組系統(tǒng)作用下,用戶端數(shù)據(jù)負(fù)荷水平的具體變化。
4.2? ?用戶端數(shù)據(jù)負(fù)荷
以50 min作為實驗時長,分別記錄在該段時間內(nèi),應(yīng)用實驗組、對照組提取系統(tǒng)后,用戶端數(shù)據(jù)負(fù)荷水平的具體變化情況如表1、表2所示。
分析表1可知,前20 min的實驗時間內(nèi),實驗組用戶端數(shù)據(jù)負(fù)荷水平始終保持穩(wěn)定趨勢,從第25 min開始,用戶端數(shù)據(jù)負(fù)荷水平平開始逐漸下降,整個實驗過程中的最大數(shù)值僅達(dá)到5.0 MB。
分析表2可知,在整個實驗過程中,對照組用戶端數(shù)據(jù)負(fù)荷水平始終保持下降、上升交替出現(xiàn)的變化趨勢,全局最大值達(dá)到8.8 MB,遠(yuǎn)高于實驗組極值5.0 MB。
將本研究提出提出方法與傳統(tǒng)的k-means方法的用戶端數(shù)據(jù)量進行對比,結(jié)果如圖7所示。由該圖可以看出,提出方法在降低用戶端數(shù)據(jù)負(fù)載方面具有突出的優(yōu)勢,而且,對于基于k-means方法的電子政務(wù)系統(tǒng),用戶端數(shù)據(jù)波動較大,因而穩(wěn)定性有所欠缺;而提出方法的用戶端數(shù)據(jù)無明顯波動,穩(wěn)定性較好。綜上可知,基于數(shù)據(jù)挖掘的用戶行為特征提取系統(tǒng),具備控制用戶端數(shù)據(jù)負(fù)荷水平的能力。
5? ?結(jié)? ?論
電子政務(wù)通過創(chuàng)建采用數(shù)據(jù)挖掘技術(shù)而非傳統(tǒng)技術(shù)的模型,改善了政府與公民之間的互動方式。挖掘模型處理質(zhì)量數(shù)據(jù)、數(shù)據(jù)量以及對電子服務(wù)的在線透明訪問。介紹了有關(guān)政府和數(shù)據(jù)挖掘技術(shù)的概況。電子政務(wù)系統(tǒng)是整合型的系統(tǒng)架構(gòu),是用以整合政府的所有機關(guān)網(wǎng)站的媒介,以提供外部民眾與政府內(nèi)部人員線上單點接觸的平臺。通過電子政府系統(tǒng),可以建立政府與政府、政府與公民、政府與企業(yè)之間的互聯(lián)互通,提供行政效率。提出了基于數(shù)據(jù)挖掘的電子政務(wù)用戶行為特征提取方法,當(dāng)公眾訪問電子政府系統(tǒng)時,可以有效地監(jiān)測用戶端數(shù)據(jù)量,從而更精確地達(dá)到公眾訪問電子政務(wù)系統(tǒng)的目的,使電子政府能夠有的放矢地服務(wù)于公眾。通過與傳統(tǒng)的基于k-means方法相比,提出方法在用戶端數(shù)據(jù)量方面具有較好的穩(wěn)定性,同時可以明顯降低用戶端數(shù)據(jù)量負(fù)荷水平。
參考文獻(xiàn)
[1]? ? 石春琦. 智能卡、大數(shù)據(jù)與信息安全芯片的市場規(guī)模與發(fā)展趨勢[J]. 集成電路應(yīng)用,2016,33(10):23-26.
[2]? ? 趙揚.基于用戶行為分析的視頻點播系統(tǒng)優(yōu)化技術(shù)研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2014.
[3]? ? 張向宏,唐冉. 基于K-means算法的電子政務(wù)用戶細(xì)分模型研究[J]. 商場現(xiàn)代化,2009(5):372-374.
[4]? ? 梁棟,張鳳琴,陳大武,等. 一種基于決策樹和遺傳算法-BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型[J]. 中國科技論文,2015,10(2):169-174.
[5]? ? 孫喬,付蘭梅,鄧卜僑. 一種面向大數(shù)據(jù)處理的高效分布式數(shù)據(jù)庫聚類算法[C]// 2016電力行業(yè)信息化年會論文集,2016.
[6]? ? GHIGE P M,KABRA R R.Relational keyword search system[J].International Journal of Engineering Research and General Science,2014,2(6):36-39.
[7]? ? 肖嫻. 基于JAVA的貴州省電子政務(wù)辦公系統(tǒng)設(shè)計與實現(xiàn)[D]. 廈門:廈門大學(xué),2017.
[8]? ? 李幸麗,杜培軍,張華鵬. 電子政務(wù)中的數(shù)據(jù)挖掘及其應(yīng)用[J]. 科技資訊,2006(6):164-166.
[9]? ? 段堯清. 基于多類型分類器裝袋技術(shù)的數(shù)據(jù)分類模型研究[J]. 情報科學(xué),2019,37(4):59-65.
[10]? 吳明興,沈瑾,王麗亞,等. 基于Web挖掘的產(chǎn)品功能可用性評價方法[J]. 工業(yè)工程與管理,2015(5):104-110.
[11]? 姜華,周克江. 一類多粒度近似周期關(guān)聯(lián)規(guī)則問題的挖掘研究[J]. 計算技術(shù)與自動化,2019,38(01):118-121.
[12]? 王曙霞,胡瑞敏,梁意文,等. 云服務(wù)器中的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的研究與設(shè)計[J]. 現(xiàn)代電子技術(shù),2016,39(6):49-52.
[13]? 孟令明,喬冬晨,盧恩勝. 數(shù)據(jù)遷移技術(shù)在松遼委電子政務(wù)系統(tǒng)的應(yīng)用[J]. 東北水利水電,2014,32(7):69-70.
[14]? 蔡璐. 數(shù)據(jù)挖掘技術(shù)在特色資源庫中的應(yīng)用[J]. 計算技術(shù)與自動化,2018,37(03):137-140.
[15]? 易萬,羅晶,李勇,等. 基于自編碼神經(jīng)網(wǎng)絡(luò)建立的搜索信息模型[J]. 計算技術(shù)與自動化,2015,34(02):117-121.
[16]? 宋憲明. 基于數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的用戶重購行為的研究[D]. 濟南:山東大學(xué),2016.
[17]? 呂海燕,周立軍,張杰. 大數(shù)據(jù)背景下教育數(shù)據(jù)挖掘在學(xué)生在線學(xué)習(xí)行為分析中的應(yīng)用研究[J]. 計算技術(shù)與自動化,2017,36(01):136-140.