国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

海量教育多媒體數(shù)據(jù)高效分類存儲(chǔ)技術(shù)研究

2017-05-09 22:16袁琰星郭獻(xiàn)洲
現(xiàn)代電子技術(shù) 2017年8期
關(guān)鍵詞:數(shù)據(jù)檢索

袁琰星+郭獻(xiàn)洲

摘 要: 為了提高教育多媒體數(shù)據(jù)庫(kù)的訪問(wèn)能力和信息檢索能力,需要進(jìn)行數(shù)據(jù)的分類高效存儲(chǔ)技術(shù)設(shè)計(jì),提出一種語(yǔ)義指向性C均值數(shù)據(jù)聚類的海量教育多媒體數(shù)據(jù)分類高效存儲(chǔ)技術(shù)。首先進(jìn)行教育媒體數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)分析,計(jì)算數(shù)據(jù)存儲(chǔ)的聚類中心和屬性類別集分類控制閾值;然后采用語(yǔ)義指向性特征提取方法作為數(shù)據(jù)存儲(chǔ)的信息素導(dǎo)引,對(duì)提取的語(yǔ)義指向性特征通過(guò)C均值聚類進(jìn)行優(yōu)化分類存儲(chǔ);最后進(jìn)行仿真實(shí)驗(yàn)分析。結(jié)果表明,采用該方法進(jìn)行海量教育多媒體數(shù)據(jù)的分類存儲(chǔ),能提高數(shù)據(jù)庫(kù)的吞吐量,數(shù)據(jù)檢索的召回率等指標(biāo)。

關(guān)鍵詞: 海量數(shù)據(jù); 教育多媒體數(shù)據(jù)庫(kù); 分類存儲(chǔ); 數(shù)據(jù)檢索

中圖分類號(hào): TN911?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)08?0042?04

Research on efficient classification and storage technology of mass data

in educational multimedia

YUAN Yanxing1, GUO Xianzhou2

(1. Guangdong Polytechnic of Water Resources and Electric Engineering, Guangzhou 510925, China;

2. Hebei University of Technology, Tianjin 300401, China)

Abstract: In order to improve the addressing and information retrieval abilities of education multimedia database, it is necessary to develop the efficient data classification storage technology. An education multimedia mass data classification storage technology of the semantic directivity mean value C data clustering is proposed. The data storage structure of the educational media database is analyzed. The cluster center of data storage and classification control threshold of attributes category set are calculated. The semantic directivity feature extraction method is adopted as the pheromone guidance of the data storage to conduct optimization classification storage of the extracted semantic directivity characteristics in combination with mean value C clustering. The simulation analysis results show that the method for the classification storage of education multimedia mass data can improve the throughput of the database, and the recall rate of data retrieval.

Keywords: massive data; education multimedia database; classification storage; data retrieval

0 引 言

隨著教育多媒體數(shù)據(jù)存儲(chǔ)技術(shù)的發(fā)展,大量的多媒體教育數(shù)據(jù)通過(guò)教育信息管理系統(tǒng)的數(shù)據(jù)庫(kù)進(jìn)行分布式存儲(chǔ)和傳輸,教師和學(xué)生在進(jìn)行信息檢索對(duì)只需要通過(guò)相關(guān)的指令進(jìn)行多媒體教育資源的調(diào)度和查詢,方便教學(xué)應(yīng)用[1]。海量教育多媒體數(shù)據(jù)主要包括了多媒體課件、圖片、教學(xué)音視頻等信息,需要對(duì)海量教育多媒體數(shù)據(jù)進(jìn)行分類高效存儲(chǔ)設(shè)計(jì),提高教育多媒體數(shù)據(jù)的管理和調(diào)度能力,傳統(tǒng)方法中對(duì)數(shù)據(jù)庫(kù)海量教育多媒體數(shù)據(jù)的挖掘是建立在多媒體數(shù)據(jù)庫(kù)的信息檢索統(tǒng)計(jì)特征提取的基礎(chǔ)上[2?3],通過(guò)語(yǔ)義和關(guān)鍵詞的訪問(wèn)和檢索進(jìn)行信息索引和標(biāo)注,方法可靠簡(jiǎn)單,但是效率不高,對(duì)教育多媒體數(shù)據(jù)有效存儲(chǔ)的層次性建模性能不好[4]。對(duì)此,本文提出一種語(yǔ)義指向性C均值數(shù)據(jù)聚類的海量教育多媒體數(shù)據(jù)分類高效存儲(chǔ)技術(shù),進(jìn)行數(shù)據(jù)庫(kù)存儲(chǔ)的優(yōu)化設(shè)計(jì),得出有效性結(jié)論。

1 教育多媒體數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)分析

1.1 教育多媒體數(shù)據(jù)的量化特征編碼

為了實(shí)現(xiàn)對(duì)海量教育多媒體數(shù)據(jù)的優(yōu)化分類存儲(chǔ)設(shè)計(jì),需要進(jìn)行教育多媒體數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)分析,采用網(wǎng)格拓?fù)浣Y(jié)構(gòu)進(jìn)行數(shù)據(jù)庫(kù)的分布式存儲(chǔ)網(wǎng)格設(shè)計(jì)[5]。海量教育多媒體數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)的分布式結(jié)構(gòu)主要分為水平結(jié)構(gòu)、垂直結(jié)構(gòu)、左對(duì)角線結(jié)構(gòu)、右對(duì)角線結(jié)構(gòu)等,如圖1所示。

根據(jù)圖1所示的教育多媒體數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),設(shè)置4個(gè)檢索通道進(jìn)行海量教育多媒體數(shù)據(jù)的訪問(wèn)設(shè)計(jì),圖中,,和分別表示待檢索教育多媒體數(shù)據(jù)的鄰域內(nèi)的碼矢,采用語(yǔ)義自相關(guān)函數(shù)分析方法進(jìn)行教育多媒體數(shù)據(jù)的近鄰點(diǎn)模糊聚類中心計(jì)算,構(gòu)建多媒體數(shù)據(jù)的向量量化特征編碼模型[6],把當(dāng)作聚類中心的優(yōu)化索引值,初始化多媒體數(shù)據(jù)庫(kù)中教育數(shù)據(jù)的梯度信息檢索水平集函數(shù),通過(guò)海量教育多媒體數(shù)據(jù)準(zhǔn)確挖掘和檢測(cè),實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的有效訪問(wèn)。在進(jìn)行4個(gè)檢索通道的語(yǔ)義信息素提取中,提取海量教育多媒體數(shù)據(jù)特征分布梯度圖,得到數(shù)據(jù)庫(kù)的分布式調(diào)度輸入向量值分別為,,和,表示為:

(1) 式中,為初始化的聚類中心嵌入維數(shù),數(shù)據(jù)庫(kù)存儲(chǔ)分布空間特征分布區(qū)域和,采用海量教育多媒體數(shù)據(jù)的特征序列訓(xùn)練重構(gòu)方法進(jìn)行向量量化編碼,設(shè)置初始化碼書(shū){,};設(shè)置多媒體數(shù)據(jù)分布的權(quán)重響應(yīng)為;多媒體數(shù)據(jù)的向量量化編碼的初始值為。令為訓(xùn)練序列,教育多媒體數(shù)據(jù)庫(kù)存儲(chǔ)通道的頻率計(jì)數(shù)初始值設(shè)定為。

對(duì)輸入的教育多媒體數(shù)據(jù)進(jìn)行穩(wěn)態(tài)周期性分解控制,得到訓(xùn)練向量模式為;計(jì)算教育多媒體數(shù)據(jù)的時(shí)域向量與全部分類存儲(chǔ)節(jié)點(diǎn)所連權(quán)向量的距離為:

(2)

式中,,最后得到教育多媒體數(shù)據(jù)的量化特征編碼輸出為:

(3)

式中,在聚類中心初始值確定的情況下,通過(guò)教育多媒體數(shù)據(jù)的量化特征編碼,提高分類存儲(chǔ)的效率。

1.2 數(shù)據(jù)存儲(chǔ)的聚類中心計(jì)算

在上述進(jìn)行了教育多媒體數(shù)據(jù)的量化特征編碼的基礎(chǔ)上,進(jìn)行教育多媒體數(shù)據(jù)優(yōu)化分類存儲(chǔ)的聚類中心計(jì)算,設(shè)教育多媒體數(shù)據(jù)庫(kù)中的海量數(shù)據(jù)的采樣幅度為,計(jì)算輸入教育多媒體數(shù)據(jù)庫(kù)中的訓(xùn)練向量碼書(shū)冗余信息為,采用高斯隨機(jī)模型表示數(shù)據(jù)中的統(tǒng)計(jì)特征,存儲(chǔ)節(jié)點(diǎn)分布的最小距離的節(jié)點(diǎn)為,海量教育多媒體數(shù)據(jù)時(shí)間序列為, ,根據(jù)Takens嵌入定理[7],得到數(shù)據(jù)優(yōu)化分類存儲(chǔ)的最小嵌入維數(shù)為;在給定的海量教育多媒體數(shù)據(jù)分布的權(quán)重指數(shù)下,的屬性值為。構(gòu)建教育多媒體數(shù)據(jù)庫(kù)的初始級(jí)碼元,,計(jì)算教育多媒體數(shù)據(jù)的干擾信息參量估計(jì)值,,得到教育多媒體數(shù)據(jù)的最佳碼書(shū)為:

(4)

式中:是第n條數(shù)據(jù)存儲(chǔ)通道上的區(qū)域分布特征;為第n條數(shù)據(jù)存儲(chǔ)路徑擴(kuò)展時(shí)延,由此得到數(shù)據(jù)存儲(chǔ)的聚類的區(qū)域分布函數(shù)為:

(5)

數(shù)據(jù)集合中含有個(gè)樣本,計(jì)算輸入存儲(chǔ)節(jié)點(diǎn)的量化編碼統(tǒng)計(jì)平均失真為:

(6)

現(xiàn)在把教育多媒體數(shù)據(jù)的語(yǔ)義信息集合分為c類,其中1

(7)

式中,為教育多媒體數(shù)據(jù)的模糊聚類中心的第個(gè)語(yǔ)義特征指向性分布矢量。

2 數(shù)據(jù)的分類高效存儲(chǔ)改進(jìn)實(shí)現(xiàn)

2.1 數(shù)據(jù)屬性類別集分類控制閾值計(jì)算

本文提出一種語(yǔ)義指向性C均值數(shù)據(jù)聚類的海量教育多媒體數(shù)據(jù)分類高效存儲(chǔ)技術(shù)。在此需要進(jìn)行海量教育多媒體數(shù)據(jù)的屬性類別集分類控制閾值計(jì)算,假設(shè)海量教育多媒體數(shù)據(jù)檢索區(qū)域中文本信息的特征分布序列為,,對(duì)教育多媒體數(shù)據(jù)的量化編碼信息進(jìn)行區(qū)域分塊設(shè)計(jì),采用模板匹配方法進(jìn)行存儲(chǔ)信息窗口加權(quán)控制[8]如下:

(8)

在上述進(jìn)行數(shù)據(jù)庫(kù)存儲(chǔ)分布的加權(quán)控制中,在橫向和豎向兩個(gè)梯度方向?qū)逃嗝襟w數(shù)據(jù)的聚類編碼樣本進(jìn)行自組織神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到數(shù)據(jù)屬性類別集分類控制閾值的計(jì)算結(jié)果為:

(9)

式中,q,p分別是教育多媒體數(shù)據(jù)庫(kù)中的編碼數(shù)據(jù)的向量量化的梯度特征差異性語(yǔ)義信息素特征,采用自適應(yīng)聚類編碼加權(quán),通過(guò)屬性類別集分類控制閾值進(jìn)行數(shù)據(jù)分配的有效性判斷。

2.2 語(yǔ)義指向性特征提取

確定海量教育數(shù)據(jù)優(yōu)化分類存儲(chǔ)的特征窗口大小N,進(jìn)行語(yǔ)義指向性特征提取,得到輸出的加權(quán)向量為: (10)

采用一個(gè)1×N的窗口來(lái)遍歷被檢索教育多媒體數(shù)據(jù)的視頻和圖像等多媒體數(shù)據(jù)信息集合,進(jìn)行多屬性類別集分類控制閾值判決,得到屬性類別集分類的語(yǔ)義特征聚類中心,即:

(11)

式中,表示中分類存儲(chǔ)的訓(xùn)練樣本長(zhǎng)度,用歐氏距離表示。

通過(guò)對(duì)教育多媒體數(shù)據(jù)中的有用文本進(jìn)行語(yǔ)義指向性特征提取,各自判決的文本的信息素TLX,TLY,文本信息素的語(yǔ)義特征提取的判決式為:

(12)

設(shè)海量教育多媒體數(shù)據(jù)集中語(yǔ)義相關(guān)信息特征總數(shù)為X,在最小窗口下語(yǔ)義指向性聚焦的沖激響應(yīng)函數(shù)為,向量量化的梯度差異性分布的最小距離為:

(13)

建立Markov模型,提取教育多媒體數(shù)據(jù)庫(kù)海量教育多媒體數(shù)據(jù)序列的高階譜特征進(jìn)行信息融合,設(shè)教育多媒體數(shù)據(jù)所屬類別的對(duì)象集合為第個(gè)存儲(chǔ)節(jié)點(diǎn)處的概念格,數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)的傳遞路徑有P條,由此得到輸出的語(yǔ)義指向性特征輸出為:

(14)

(15)

式中:為海量教育多媒體數(shù)據(jù)的信息索引的邊界溢出估計(jì)值;為概念格結(jié)點(diǎn)的信息融合中心加權(quán)系數(shù);為多媒體數(shù)據(jù)非線性時(shí)間序列的時(shí)頻特征;為自相關(guān)函數(shù)。

2.3 基于模糊C均值聚類的數(shù)據(jù)優(yōu)化分類存儲(chǔ)

最后采用模糊C均值聚類對(duì)提取的語(yǔ)義特征進(jìn)行指向性聚類分析,實(shí)現(xiàn)數(shù)據(jù)的優(yōu)化分類存儲(chǔ),設(shè)和為數(shù)據(jù)的語(yǔ)義特征判別屬性集合,海量教育多媒體數(shù)據(jù)的模糊C均值聚類空間矩陣為:

3 仿真實(shí)驗(yàn)分析

實(shí)驗(yàn)中采用C++和Matlab 7混合編程實(shí)現(xiàn)教育多媒體數(shù)據(jù)庫(kù)海量數(shù)據(jù)的優(yōu)化分類存儲(chǔ)設(shè)計(jì),對(duì)數(shù)據(jù)時(shí)間序列進(jìn)行特征訓(xùn)練,訓(xùn)練集頻帶為5~120 kHz,數(shù)據(jù)庫(kù)存儲(chǔ)帶寬變化范圍為1~10 dB,對(duì)教育多媒體數(shù)據(jù)訪問(wèn)的初始頻率 Hz,終止頻率Hz,在數(shù)據(jù)存儲(chǔ)空間中的信息干擾強(qiáng)度為,最大分類搜索半徑,數(shù)據(jù)存儲(chǔ)空間的嵌入維數(shù),語(yǔ)義特征提取的指向性聚類中心初始值為,最大迭代次數(shù)為,模糊C均值聚類的屬性類別判別閾值,根據(jù)上述仿真參量設(shè)計(jì),采用不同方法進(jìn)行數(shù)據(jù)分類存儲(chǔ)分析,得到數(shù)據(jù)庫(kù)的吞吐量和進(jìn)行教育多媒體數(shù)據(jù)庫(kù)訪問(wèn)的數(shù)據(jù)召回率對(duì)比結(jié)果如圖2和圖3所示。

分析上述仿真結(jié)果得知,采用本文方法進(jìn)行海量教育多媒體數(shù)據(jù)的分類存儲(chǔ),具有較高的數(shù)據(jù)吞吐性能和數(shù)據(jù)召回率,說(shuō)明數(shù)據(jù)存儲(chǔ)和訪問(wèn)的效率得到提升,具有優(yōu)越性。

4 結(jié) 語(yǔ)

本文研究了海量教育多媒體數(shù)據(jù)的優(yōu)化存儲(chǔ)設(shè)計(jì)問(wèn)題,提出一種語(yǔ)義指向性C均值數(shù)據(jù)聚類的海量教育多媒體數(shù)據(jù)分類高效存儲(chǔ)技術(shù)。研究結(jié)果表明,采用該方法進(jìn)行海量教育多媒體數(shù)據(jù)的分類存儲(chǔ),能提高數(shù)據(jù)庫(kù)的吞吐量,數(shù)據(jù)檢索的召回率等指標(biāo),具有較高的應(yīng)用價(jià)值,性能優(yōu)于傳統(tǒng)方法。

參考文獻(xiàn)

[1] 官亞勤,趙學(xué)勝,王鵬飛,等.基于切片原理的海量點(diǎn)云并行簡(jiǎn)化算法[J].計(jì)算機(jī)應(yīng)用,2016,36(7):1793?1796.

[2] 周煜,張萬(wàn)兵,杜發(fā)榮,等.散亂點(diǎn)云數(shù)據(jù)的曲率精簡(jiǎn)算法[J].北京理工大學(xué)學(xué)報(bào),2010,30(7):785?789.

[3] 胡志勝,于敬武,束濤.一種結(jié)合了柵格化和特征判斷的點(diǎn)云壓縮方法[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,34(8):958?962.

[4] 章登義,吳文李,歐陽(yáng)黜霏.基于語(yǔ)義度量的RDF圖近似查詢[J].電子學(xué)報(bào),2015,43(7):1320?1328.

[5] AMERIJCKX Christophe, VERLEYSEN Michel, THISSEN Philippe. Image compression by self?organized Kohonen maps [J]. IEEE transactions on neural networks, 1998, 9(5): 1287?1292.

[6] 高志春,陳冠瑋,胡光波,等.傾斜因子K均值優(yōu)化數(shù)據(jù)聚類及故障診斷研究[J].計(jì)算機(jī)與數(shù)字工程,2014,42(1):14?18.

[7] MASSA J S, WALLACE A M, BULLER G S, et al. Laser depth measurement based ontime?correlated single?photon counting [J]. Optics letters, 1997, 22(8): 543?545.

[8] DANESHPANAH M, JAVIDI B, WATSON E A. Three dimensional object recognition with photon counting imagery in the presence of noise [J]. Optics Express, 2010, 18(25):26450?26460.

猜你喜歡
數(shù)據(jù)檢索
高速公路省級(jí)清分結(jié)算平臺(tái)高效數(shù)據(jù)檢索應(yīng)用探究
智能圖書(shū)館云檢索系統(tǒng)設(shè)計(jì)分析
本刊進(jìn)入的國(guó)內(nèi)外數(shù)據(jù)檢索/文獻(xiàn)服務(wù)機(jī)構(gòu)
一種基于Hadoop平臺(tái)的分布式數(shù)據(jù)檢索系統(tǒng)
本刊進(jìn)入的國(guó)內(nèi)外數(shù)據(jù)檢索/文獻(xiàn)服務(wù)機(jī)構(gòu)
瞿方梅《史記三家注補(bǔ)正》校讀釋例
本刊進(jìn)入的國(guó)內(nèi)外數(shù)據(jù)檢索/文獻(xiàn)服務(wù)機(jī)構(gòu)
基于Web Service的城建檔案信息共享平臺(tái)
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
基于Web的數(shù)據(jù)庫(kù)檢索系統(tǒng)研究