李川 王智
摘 要: 針對(duì)網(wǎng)絡(luò)教育信息系統(tǒng)中信息檢索的實(shí)時(shí)性和準(zhǔn)確度不高的問題,提出基于教育信息資源最短路徑調(diào)度的信息關(guān)聯(lián)定位挖掘方法。構(gòu)建網(wǎng)絡(luò)教育信息系統(tǒng)中的信息資源的分布式存儲(chǔ)結(jié)構(gòu)模型,采用關(guān)聯(lián)規(guī)則的候選概念格結(jié)點(diǎn)分配策略進(jìn)行信息關(guān)聯(lián)定位的信息素導(dǎo)引,提取網(wǎng)絡(luò)教育信息系統(tǒng)中的所有對(duì)象信息的頻繁項(xiàng)集特征,實(shí)現(xiàn)信息關(guān)聯(lián)定位挖掘。仿真結(jié)果表明,采用該方法進(jìn)行信息關(guān)聯(lián)定位挖掘的準(zhǔn)確度較高、時(shí)間開銷較小,具有較好的應(yīng)用可靠性。
關(guān)鍵詞: 網(wǎng)絡(luò)教育信息系統(tǒng); 信息檢索; 挖掘方法; 關(guān)聯(lián)定位
中圖分類號(hào): TN711?34; TP391.9 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)10?0058?04
Abstract: Since real?time performance and accuracy of the information retrieval in the network education information system is not high enough, a information relevance positioning mining method based on the shortest path scheduling of educational information resources is proposed. The distributed storage structure model of information resources in the network education information system is built. The candidate concept lattice node distribution strategy in the relevance rules is adopted to make the pheromone guide of information relevance positioning, so as to extract frequent item?set features of all objects in the network education information system and realize information relevance positioning mining. The simulation results show that the proposed method is of high accuracy and low time cost for information relevance positioning mining, and has good application reliability.
Keywords: network education information system; information retrieval; mining method; relevance positioning
0 引 言
網(wǎng)絡(luò)教育信息系統(tǒng)是處理網(wǎng)絡(luò)教育中的學(xué)生學(xué)籍信息、課程信息、教師信息、學(xué)科科研信息以及后勤管理信息等方面的大規(guī)模數(shù)據(jù)管理信息系統(tǒng)。網(wǎng)絡(luò)教育信息系統(tǒng)處理的數(shù)據(jù)信息規(guī)模龐大,對(duì)信息管理的集成度較高,更新速度較快,信息集成的復(fù)雜度較高,需要對(duì)網(wǎng)絡(luò)教育信息系統(tǒng)進(jìn)行信息關(guān)聯(lián)定位,提高網(wǎng)絡(luò)教育信息系統(tǒng)的信息檢索和資源調(diào)度的效率[1]。研究網(wǎng)絡(luò)教育的信息管理系統(tǒng)優(yōu)化設(shè)計(jì)及信息定位挖掘方法,在正規(guī)網(wǎng)絡(luò)教育的運(yùn)行秩序、提高網(wǎng)絡(luò)教育的工作質(zhì)量方面具有重要意義[2?3]。本文提出基于教育信息資源最短路徑調(diào)度的信息關(guān)聯(lián)定位挖掘方法,通過對(duì)定位挖掘方法的優(yōu)化算法設(shè)計(jì),提高網(wǎng)絡(luò)教育信息系統(tǒng)的信息定位挖掘性能,展示了本文方法的優(yōu)越性。
1 信息資源的分布式存儲(chǔ)結(jié)構(gòu)模型
為了實(shí)現(xiàn)網(wǎng)絡(luò)教育信息系統(tǒng)中的信息關(guān)聯(lián)定位挖掘,需要構(gòu)建網(wǎng)絡(luò)教育信息系統(tǒng)的信息資源分布式存儲(chǔ)結(jié)構(gòu)模型,其總體結(jié)構(gòu)模型如圖1所示。
結(jié)合圖1所示網(wǎng)絡(luò)教育信息系統(tǒng)的信息關(guān)聯(lián)定位挖掘總體結(jié)構(gòu)模型,進(jìn)行數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)模型構(gòu)建。在網(wǎng)絡(luò)教育信息關(guān)聯(lián)數(shù)據(jù)庫模型中,教育信息系統(tǒng)虛擬機(jī)的負(fù)載量為[Mh],信息關(guān)聯(lián)定位挖掘的負(fù)載開銷表示為:
定義1 設(shè)給定網(wǎng)絡(luò)教育信息系統(tǒng)中的信息關(guān)聯(lián)定位的頻繁項(xiàng)集為三元組[T=(D,I,R)],其中[D]為事務(wù)項(xiàng)集t中泊松分布集合,[I]為屬性集合,[R]為最小支持?jǐn)?shù)概率,[R?D×I],若直接挖掘到頻繁項(xiàng)集的序貫采樣關(guān)系與事務(wù)項(xiàng)集中的本體模型對(duì)應(yīng),則此數(shù)據(jù)集中每項(xiàng)事務(wù)項(xiàng)集壓縮到存儲(chǔ)系統(tǒng)的概念格為一個(gè)概念分布子空間,概念格的圖形表示為Hasse圖[4]。由此構(gòu)建信息資源的分布式存儲(chǔ)結(jié)構(gòu)模型,通過對(duì)信息關(guān)聯(lián)數(shù)據(jù)的頭表和AT?Tree的創(chuàng)建[5],得到網(wǎng)絡(luò)教育信息系統(tǒng)中不確定事務(wù)數(shù)據(jù)集D,頻繁項(xiàng)集X的對(duì)結(jié)點(diǎn)的關(guān)聯(lián)強(qiáng)度為expSN(X), 定義為:
3 信息關(guān)聯(lián)定位挖掘?qū)崿F(xiàn)
3.1 教育信息資源最短路徑調(diào)度
在上述進(jìn)行了網(wǎng)絡(luò)教育資源的信息關(guān)聯(lián)定位關(guān)聯(lián)規(guī)則設(shè)計(jì)的基礎(chǔ)上,進(jìn)行信息關(guān)聯(lián)定位挖掘方法的改進(jìn)設(shè)計(jì)。本文提出一種基于教育信息資源最短路徑調(diào)度的信息關(guān)聯(lián)定位挖掘方法,教育信息資源最短路徑調(diào)度采用的是約束概念格區(qū)間調(diào)度模型,得到教育信息資源最短路徑關(guān)系約束集為:
輸入:提取的約束關(guān)聯(lián)規(guī)則數(shù)據(jù)庫D;頻繁1項(xiàng)集D的支持度閾值minsup;網(wǎng)絡(luò)教育資源最短路徑調(diào)度的約束條件P;
輸出:網(wǎng)絡(luò)教育信息關(guān)聯(lián)定位的約束概念格Hasse圖,時(shí)間復(fù)雜度為[Ni×O(Ni)]。
3.2 信息關(guān)聯(lián)定位挖掘?qū)崿F(xiàn)算法描述
根據(jù)教育信息資源最短路徑調(diào)度結(jié)果,提取網(wǎng)絡(luò)教育信息系統(tǒng)中的所有對(duì)象信息的頻繁項(xiàng)集特征,在最小期望支持?jǐn)?shù)約束下,網(wǎng)絡(luò)教育信息系統(tǒng)樣本數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則優(yōu)先級(jí)屬性列表見表1。
在頻繁模式樹中提取網(wǎng)絡(luò)教育信息系統(tǒng)中的所有對(duì)象信息的頻繁項(xiàng)集特征,設(shè)網(wǎng)絡(luò)教育信息系統(tǒng)概念格結(jié)點(diǎn)可表示為[C(A,B),P]。其中:[P]為事務(wù)項(xiàng)集中非頻繁項(xiàng),且滿足[P(A,B)=.T.](邏輯值為真),[A∈ρ(G)]稱為最小期望支持?jǐn)?shù),[B∈ρ(M)]稱為事務(wù)項(xiàng)集處理后的關(guān)聯(lián)定位內(nèi)涵,在上述構(gòu)建的約束條件下進(jìn)行信息關(guān)聯(lián)定位挖掘,實(shí)現(xiàn)算法描述為:
算法:網(wǎng)絡(luò)教育信息系統(tǒng)信息關(guān)聯(lián)定位挖掘算法
輸入:初始化參量值,新建的頭表,以及數(shù)據(jù)挖掘的約束指標(biāo)參量集
輸出:信息關(guān)聯(lián)定位挖掘的期望支持?jǐn)?shù)二維表
根據(jù)新建的頭表在全局樹上挖掘頻繁模式,結(jié)果是一個(gè)0,1值的二維表形式,其中0表示挖掘的信息數(shù)據(jù)不滿足最小期望支持集,1表示挖掘定位信息結(jié)果滿足最小期望支持集。
4 實(shí)驗(yàn)測(cè)試分析
為了測(cè)試本文設(shè)計(jì)的信息關(guān)聯(lián)度行為挖掘方法在實(shí)現(xiàn)網(wǎng)絡(luò)教育信息系統(tǒng)的數(shù)據(jù)檢索挖掘在時(shí)間性能和精確度方面的優(yōu)越性,進(jìn)行實(shí)驗(yàn)測(cè)試分析。實(shí)驗(yàn)中選擇5個(gè)算法進(jìn)行性能測(cè)試比較,分別為文獻(xiàn)[2]中的BP神經(jīng)網(wǎng)絡(luò)挖掘IMBP?Mine算法、文獻(xiàn)[3]的決策樹挖掘方法DT?mine、文獻(xiàn)[4]的粒子群挖掘方法PSO?Mine、以及文獻(xiàn)[5]的近似挖掘策略MBP和文獻(xiàn)[6]的冗余關(guān)聯(lián)IMBP;測(cè)試中采用網(wǎng)絡(luò)教育信息系統(tǒng)中學(xué)生管理信息、課程管理信息和教師管理信息3個(gè)數(shù)據(jù)集進(jìn)行了測(cè)試,Student,Course和Teacher,得到挖掘的準(zhǔn)確度對(duì)比和時(shí)間開銷對(duì)比如圖3和圖4所示。
分析上述仿真結(jié)果得知,采用本文方法進(jìn)行網(wǎng)絡(luò)教育信息系統(tǒng)信息關(guān)聯(lián)定位挖掘的時(shí)間開銷較小,挖掘的準(zhǔn)確度較高,隨著最小期望支持度閾值的增大,各種算法進(jìn)行挖掘的運(yùn)行時(shí)間隨之增大,但本文方法的運(yùn)行時(shí)間總體小于傳統(tǒng)方法,研究結(jié)果展示了本文方法的優(yōu)越性。
5 結(jié) 語
針對(duì)傳統(tǒng)方法一直存在挖掘精度低的問題,提出基于教育信息資源最短路徑調(diào)度的信息關(guān)聯(lián)定位挖掘方法,并進(jìn)行了實(shí)驗(yàn)分析。結(jié)果表明,采用該方法進(jìn)行網(wǎng)絡(luò)教育信息系統(tǒng)中的信息關(guān)聯(lián)定位挖掘的準(zhǔn)確度較高、時(shí)間開銷較小,具有較好的應(yīng)用可靠性,展示了本文方法較好的適用價(jià)值。
參考文獻(xiàn)
[1] 周麗燕,王立洪.長記憶多項(xiàng)式回歸模型的置信域估計(jì)[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),2014,37(1):31?44.
[2] ZHANG Q Y, WANG R C, SHA C, et al. Node correlation clustering algorithm for wireless multimedia sensor networks based on overlapped FoVs [J]. Journal of China University of Posts and Telecommunications, 2013, 20(5): 37?44.
[3] 王婷,宋俊德,宋美娜.一種基于關(guān)聯(lián)規(guī)則挖掘的IP定位方法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,45(4):657?662.
[4] 馬炳先,崔紀(jì)鵬,張正明.面向組合的Web服務(wù)間數(shù)據(jù)關(guān)聯(lián)定位方法研究[J].計(jì)算機(jī)科學(xué),2014,41(8):130?134.
[5] 賀文嬌.基于特征值和灰度關(guān)聯(lián)的雙機(jī)關(guān)聯(lián)定位[J].電訊技術(shù),2016,56(4):424?429.
[6] 胡綠慧.基于寬幅跳躍關(guān)聯(lián)定位的大型數(shù)據(jù)庫入侵檢測(cè)[J].科技通報(bào),2014(12):232?234.