国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)

2021-12-28 02:32保海軍
關(guān)鍵詞:檢索系統(tǒng)檢索聚類(lèi)

保海軍

(青海民族大學(xué) 計(jì)算機(jī)學(xué)院,青海 西寧 810007)

自從自然語(yǔ)言進(jìn)入計(jì)算機(jī)檢索系統(tǒng)以來(lái),就因其不受不同職業(yè)、不同知識(shí)背景、不同檢索經(jīng)驗(yàn)的影響等特點(diǎn)受到終端用戶(hù)的青睞,由于中文文獻(xiàn)的標(biāo)題是中文文獻(xiàn)內(nèi)容的集中體現(xiàn),它反映了文獻(xiàn)的中心思想,因此需要進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索.隨著數(shù)據(jù)庫(kù)信息處理技術(shù)的發(fā)展,結(jié)合對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言參數(shù)分析,建立中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的特征分析模型.再結(jié)合大數(shù)據(jù)信息處理技術(shù),實(shí)現(xiàn)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索.最后結(jié)合對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言參數(shù)分析,通過(guò)中文數(shù)據(jù)庫(kù)自然語(yǔ)言參數(shù)分布式融合處理,實(shí)現(xiàn)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索,研究中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)設(shè)計(jì)方法,對(duì)提高中文數(shù)據(jù)庫(kù)的整合和檢索能力方面具有重要意義[1].

當(dāng)前,對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索建立在嵌入式Linux平臺(tái)中,采用交叉組件控制,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的系統(tǒng)分析模型,結(jié)合對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的信息采集和融合處理,實(shí)現(xiàn)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的交叉融合控制[2].在傳統(tǒng)方法中,對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的檢索方法主要有基于融合聚類(lèi)的中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索方法和基于模糊度聚類(lèi)的中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索方法等[3],建立中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的交叉總線控制模型,文獻(xiàn)[4]提出基于混沌序列的中文數(shù)據(jù)庫(kù)自然語(yǔ)言分組檢索方法,結(jié)合混沌加密算法,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言分組檢測(cè)模型,實(shí)現(xiàn)數(shù)據(jù)庫(kù)檢索.文獻(xiàn)[5]提出基于隨機(jī)線性密鑰重置的中文數(shù)據(jù)庫(kù)自然語(yǔ)言分組檢索方法,采用向量量化分解和融合編碼方法進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言匹配檢索.

但是,上述兩種方法進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的效果不理想,本文提出基于機(jī)器學(xué)習(xí)的中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)設(shè)計(jì)方法.首先采用字典存儲(chǔ)機(jī)制構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言的優(yōu)化分布結(jié)構(gòu)模型,結(jié)合對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)結(jié)構(gòu)分析,然后通過(guò)模糊度匹配和機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索過(guò)程中的優(yōu)化分類(lèi)和模糊度語(yǔ)義特征分析,采用機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索過(guò)程中的迭代融合和自適應(yīng)控制.最后進(jìn)行仿真測(cè)試分析,展示了本文方法在提高中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索查準(zhǔn)性能方面的優(yōu)越性能.

1 中文數(shù)據(jù)庫(kù)自然語(yǔ)言存儲(chǔ)結(jié)構(gòu)模型和大數(shù)據(jù)特征分析

1.1 中文數(shù)據(jù)庫(kù)自然語(yǔ)言存儲(chǔ)結(jié)構(gòu)模型

為了實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的系統(tǒng)設(shè)計(jì),先結(jié)合雙向參考控制和模糊度檢索的方法,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的分塊組合控制模型.再結(jié)合語(yǔ)義相似度融合和數(shù)據(jù)庫(kù)自然語(yǔ)言快速檢索方法,建立中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的信息處理終端.最后采用專(zhuān)家系統(tǒng)識(shí)別方法,實(shí)現(xiàn)對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的語(yǔ)義檢測(cè)和數(shù)據(jù)綜合管理[6],得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的總體結(jié)構(gòu)模型,如圖1所示.

圖1 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的總體結(jié)構(gòu)

用嵌入式的B/S構(gòu)架方法,進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)的程序控制,結(jié)合字典序排序存儲(chǔ)機(jī)制,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的優(yōu)化存儲(chǔ)結(jié)構(gòu)模型[7].中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)節(jié)點(diǎn)分布如圖2所示.

根據(jù)圖2的中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)節(jié)點(diǎn)分布可知,每一個(gè)存儲(chǔ)節(jié)點(diǎn)均與其他4個(gè)節(jié)點(diǎn)相連接,說(shuō)明節(jié)點(diǎn)的存儲(chǔ)性能較高,處理效果較好.基于數(shù)據(jù)存儲(chǔ)和分布式聚類(lèi)[8],得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的規(guī)則集,如圖3所示.

AEBDCABCDE(a,b,c,d,e)(a,b,c,d,e)(a,b,c,d,e)(a,b,c,d,e)(a,b,c,d,e)圖2 中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)節(jié)點(diǎn)圖3 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的規(guī)則集

根據(jù)上述圖3可知,中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的規(guī)則集呈五角星分布,五個(gè)節(jié)點(diǎn)相互連接,連接性能較強(qiáng).根據(jù)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)節(jié)點(diǎn)和規(guī)則集分布設(shè)計(jì),構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)結(jié)構(gòu)模型.

1.2 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索數(shù)據(jù)融合

采用字典存儲(chǔ)機(jī)制構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言的優(yōu)化分布結(jié)構(gòu)模型,結(jié)合對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)結(jié)構(gòu)分析,通過(guò)模糊度匹配和機(jī)器學(xué)習(xí)算法,得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言分布階數(shù)為r,在會(huì)話(huà)組件中,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的會(huì)話(huà)協(xié)議[9],得到在檢索模式ks引導(dǎo)下,得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的關(guān)聯(lián)特征分布集為

(1)

其中,t(t1,t2,t3)為模糊綜合聚類(lèi)的維數(shù),z為中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索樣本長(zhǎng)度,m為采樣樣本序列,使用Observer協(xié)處理器構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的匹配模型,對(duì)文件OT采用語(yǔ)義度分析,得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的元素組合參數(shù)F(xt),當(dāng)滿(mǎn)足

(2)

其中,ht為機(jī)器學(xué)習(xí)長(zhǎng)度,hc為回歸分布參數(shù),在中文數(shù)據(jù)庫(kù)自然語(yǔ)言的存儲(chǔ)節(jié)點(diǎn)h(g)集中,得到邊緣特征分布集滿(mǎn)足ht

(3)

其中,cd=c1d,c2d,…,cnd表示在i個(gè)最近鄰特征分布集中,中文數(shù)據(jù)庫(kù)自然語(yǔ)言的數(shù)據(jù)中密集子圖,g(ai,bi)為最近鄰特征分布集,fi為中文數(shù)據(jù)庫(kù)自然語(yǔ)言的聯(lián)合自相關(guān)匹配集[10].

2 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索算法

時(shí)間復(fù)雜度是指執(zhí)行當(dāng)前算法所消耗的時(shí)間,空間復(fù)雜度是指執(zhí)行當(dāng)前算法需要占用多少內(nèi)存空間.對(duì)于機(jī)器學(xué)習(xí)算法來(lái)講,其算法本身所占用的存儲(chǔ)空間較少,運(yùn)行時(shí)間較短.因此,采用機(jī)器學(xué)習(xí)算法對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索進(jìn)行研究.

2.1 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的特征聚類(lèi)

構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言分布關(guān)聯(lián)規(guī)則集,用機(jī)器學(xué)習(xí)算法得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的控制時(shí)間為T(mén)n,采用多表連接和語(yǔ)義匹配[11],得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言的最優(yōu)特征解集合.

(4)

式中,β為中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的關(guān)聯(lián)屬性集,δ為中文數(shù)據(jù)庫(kù)自然語(yǔ)言的模糊匹配系數(shù),且δ∈[0,1],R為關(guān)聯(lián)規(guī)則系數(shù),K為檢測(cè)統(tǒng)計(jì)特征量,U為語(yǔ)義相鄰參數(shù),得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言分布集ded的屬性值為ded{0,1,2,…,n},通過(guò)對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的關(guān)聯(lián)屬性挖掘,采用表結(jié)構(gòu)屬性檢索方法和云計(jì)算進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言的自適應(yīng)特征匹配,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言的節(jié)點(diǎn)檢索分布模型.

uk=mk(bk,vk)+ck,

(5)

(6)

(7)

式中,hr(ct)為m×n階中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的關(guān)聯(lián)規(guī)則信息,hr(bt)為二階機(jī)器學(xué)習(xí)的維數(shù).設(shè)定gk{1,2,…,n}為統(tǒng)計(jì)分布集,利用上述線性機(jī)器學(xué)習(xí)模型,進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的特征聚類(lèi),從而提升自然語(yǔ)言檢索的查準(zhǔn)率,其表達(dá)式為

(8)

其中,hn11和hn15分別表示一次機(jī)器學(xué)習(xí)到n次學(xué)習(xí)的模糊度,hm11和hm15表示對(duì)應(yīng)的聚類(lèi)中心收斂系數(shù),ste和sto表示聯(lián)合自相關(guān)系數(shù)[12].

2.2 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索輸出

用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索過(guò)程中的迭代融合和自適應(yīng)控制,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的模糊參數(shù)分布域?yàn)?/p>

(9)

其中,Bvnd為檢索節(jié)點(diǎn)維數(shù),Bond為檢索節(jié)點(diǎn)對(duì)應(yīng)的檢測(cè)統(tǒng)計(jì)分量.

結(jié)合中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的關(guān)聯(lián)關(guān)系,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的模糊決策模型,設(shè)計(jì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的Transport/Session傳輸協(xié)議和會(huì)話(huà)管理協(xié)議,以此得到中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索輸出為

(10)

(11)

其中,gjun為中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的輸入聯(lián)合參數(shù),kuan為采樣樣本寬度,ajmd為模糊度檢測(cè)系數(shù),Egm為能量分布系數(shù).根據(jù)上述分析,構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言分布關(guān)聯(lián)規(guī)則集,用機(jī)器學(xué)習(xí)算法完成對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索過(guò)程中的迭代融合和自適應(yīng)控制,實(shí)現(xiàn)中文數(shù)據(jù)庫(kù)自然語(yǔ)言的檢索,檢索流程如圖4所示.

圖4 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索實(shí)現(xiàn)流程

3 系統(tǒng)軟件設(shè)計(jì)

在上述中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的算法設(shè)計(jì)基礎(chǔ)上,進(jìn)行系統(tǒng)開(kāi)發(fā)設(shè)計(jì).在三維ICAD平臺(tái)中進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)的硬件配置,建立中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)的底層控制模型,通過(guò)底層信息加載的方法實(shí)現(xiàn)對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)的人機(jī)交互控制,系統(tǒng)的軟件開(kāi)發(fā)實(shí)現(xiàn)流程如圖5所示.

圖5 軟件開(kāi)發(fā)實(shí)現(xiàn)流程

4 仿真測(cè)試分析

為了測(cè)試本文方法在實(shí)現(xiàn)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索中的應(yīng)用性能,進(jìn)行仿真實(shí)驗(yàn),中文數(shù)據(jù)庫(kù)自然語(yǔ)言樣本長(zhǎng)度為2400,語(yǔ)義文本分布的測(cè)試訓(xùn)練集為120,采用SQLerver2014數(shù)據(jù)庫(kù)構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言數(shù)據(jù)集,數(shù)據(jù)庫(kù)樣本分布見(jiàn)表1.

表1 數(shù)據(jù)庫(kù)樣本分布

選取中文數(shù)據(jù)庫(kù)自然語(yǔ)言數(shù)據(jù)庫(kù)中的測(cè)試集作為本文仿真實(shí)驗(yàn)部分的開(kāi)源數(shù)據(jù)集,根據(jù)測(cè)試集樣本序列分布,得到待檢索的中文數(shù)據(jù)庫(kù)自然語(yǔ)言序列分布如圖6所示.

圖6 待檢索的中文數(shù)據(jù)庫(kù)自然語(yǔ)言序列分布

分析圖6得知,待檢索的中文數(shù)據(jù)庫(kù)自然語(yǔ)言序列分布隨機(jī)性較大,采用本文方法進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索,得到檢索結(jié)果如圖7所示.

圖7 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索結(jié)果

分析圖7得知,本文方法進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的輸出均衡性較好,測(cè)試中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的查準(zhǔn)率,得到對(duì)比結(jié)果見(jiàn)表2.分析表2得知,本文方法對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的查準(zhǔn)率較高,這是因?yàn)楸疚牟捎寐?lián)合線性相關(guān)融合的方法構(gòu)建線性機(jī)器學(xué)習(xí)模型,并利用該模型進(jìn)行中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的特征聚類(lèi),從而提升自然語(yǔ)言檢索的查準(zhǔn)率.

表2 中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索查準(zhǔn)率測(cè)試

5 結(jié)語(yǔ)

研究中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)設(shè)計(jì)方法,結(jié)合對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言參數(shù)分析,通過(guò)中文數(shù)據(jù)庫(kù)自然語(yǔ)言參數(shù)分布式融合處理,為實(shí)現(xiàn)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索,本文提出基于機(jī)器學(xué)習(xí)的中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)設(shè)計(jì)方法.為構(gòu)建中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的分塊組合控制模型,結(jié)合語(yǔ)義相似度融合,設(shè)計(jì)數(shù)據(jù)庫(kù)自然語(yǔ)言快速檢索方法,實(shí)現(xiàn)數(shù)據(jù)庫(kù)自然語(yǔ)言檢索系統(tǒng)的優(yōu)化設(shè)計(jì).分析得知,本文方法對(duì)中文數(shù)據(jù)庫(kù)自然語(yǔ)言檢索的可靠性和查準(zhǔn)率較高,檢索性能較好.

猜你喜歡
檢索系統(tǒng)檢索聚類(lèi)
淺析圖書(shū)館檢索系統(tǒng)的應(yīng)用
瑞典專(zhuān)利數(shù)據(jù)庫(kù)的檢索技巧
在IEEE 數(shù)據(jù)庫(kù)中檢索的一點(diǎn)經(jīng)驗(yàn)
一種基于Python的音樂(lè)檢索方法的研究
面向WSN的聚類(lèi)頭選舉與維護(hù)協(xié)議的研究綜述
改進(jìn)K均值聚類(lèi)算法
基于“互聯(lián)網(wǎng)+”的高校檔案數(shù)字資源分析
淺析圖書(shū)館檢索系統(tǒng)的應(yīng)用
基于Spark平臺(tái)的K-means聚類(lèi)算法改進(jìn)及并行化實(shí)現(xiàn)
基于加權(quán)模糊聚類(lèi)的不平衡數(shù)據(jù)分類(lèi)方法