基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法

2020-09-28 07:05:41劉云萍

電腦知識與技術(shù) 2020年16期

劉云萍

摘要：傳統(tǒng)查詢?nèi)s減計算方法存在計算速度較慢的缺陷，以此開展了基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法的設(shè)計。計算種群中整體數(shù)量與樣本之間的正向射向關(guān)系，設(shè)計采樣流程圖，查詢采樣條件;設(shè)計分布式數(shù)據(jù)庫樹查詢函數(shù)，計算查詢數(shù)據(jù)值，提供計算適應(yīng)度數(shù)值;計算參數(shù)數(shù)值，完成分布式數(shù)據(jù)庫樹查詢?nèi)s減計算。經(jīng)過對比實驗，證明所提出的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法可降低查詢計算時間，提高計算效率，因此更具有實際應(yīng)用價值。

關(guān)鍵詞：并行計算;分布式;數(shù)據(jù)庫樹;查詢?nèi)s減計算

中圖分類號：TP311.133.1? ? ? 文獻標識碼：A

文章編號：1009-3044（2020）16-0050-03

并行計算又稱平行計算，基于市場內(nèi)涌現(xiàn)的大量的數(shù)據(jù)集合，并行計算已經(jīng)廣泛應(yīng)用于大數(shù)據(jù)查詢中，作為以此計算可同時執(zhí)行多種計算指令的查詢算法，具有提升計算效率、縮短計算時間的特點，可將問題延伸解決，延展計算規(guī)模。解決實際中大型且復(fù)雜的問題，并在實踐中擺脫時間或空間上的約束[1]。時間層面是指大量數(shù)據(jù)的流水線技術(shù)可同時實施，空間層面是指計算中出現(xiàn)的多個數(shù)據(jù)處理器可并發(fā)運行。使用并行計算方法通常將較復(fù)雜的計算流程或計算步驟進行分散處理，有助于問題的同步解決，結(jié)合計算設(shè)備提出的多個計算指令，為后續(xù)計算提供實時幫助，大內(nèi)存資源包下載的速度將明顯低于逐個資源包下載的速度[2]。分布式數(shù)據(jù)庫是數(shù)據(jù)在系統(tǒng)中以離散式方式存在，每臺計算設(shè)備中均包含一份相對完整的文件拷貝副本，或副本的部分文件具備自身獨立的數(shù)據(jù)庫，且每個離散數(shù)據(jù)庫之間由網(wǎng)絡(luò)進行互連，共同構(gòu)成一個相對完善且全局分布緊密的數(shù)據(jù)庫數(shù)。為了更好地應(yīng)用數(shù)據(jù)庫樹，數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法成了有關(guān)部門的研究重點，檢索查詢指令中一個相對優(yōu)化的策略成為數(shù)據(jù)庫樹在系統(tǒng)中可持續(xù)運行的基礎(chǔ)。由于自身計算方法存在的計算速度慢的缺陷，導(dǎo)致查詢計算結(jié)果通常為局部最優(yōu)解而非全過程最優(yōu)解[3]。以此有關(guān)研究人員將并行計算方法與數(shù)據(jù)庫樹查詢?nèi)珳p縮計算兩者實施動態(tài)化連接，提出一種新的函數(shù)計算方式，在計算中保持參數(shù)運行數(shù)值的穩(wěn)定，使用提取的查詢條件，完成數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法的設(shè)計。

1基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法

1.1基于并行計算采樣查詢條件

查詢數(shù)據(jù)種群問題規(guī)模指數(shù)呈現(xiàn)正極增長趨勢，瀏覽整體數(shù)據(jù)庫數(shù)據(jù)集合歷時較長，基于并行算法將收斂局部最優(yōu)解，保持數(shù)據(jù)集合多樣性的同時對查詢數(shù)據(jù)有針對采樣[4]。假定查詢時間內(nèi)數(shù)據(jù)個體最佳舒適程度未得到提升，數(shù)據(jù)種群樣本中的函數(shù)比例數(shù)值高于原始數(shù)據(jù)種群數(shù)值。自定義[st]表示當前需檢索的數(shù)據(jù)查詢次數(shù)，[W]表示為查詢數(shù)據(jù)庫數(shù)樣本值大小。基于并行計算理論依據(jù)，設(shè)計如下數(shù)據(jù)采樣流程。如下圖1：

根據(jù)上圖可知，賦予數(shù)據(jù)庫數(shù)查詢樣本數(shù)值空值，使用并行計算提供的優(yōu)化查詢方式，評估樣本數(shù)據(jù)中最右束支，判斷查詢數(shù)據(jù)種群是否為初次采樣，若分析結(jié)果表示為“[Y]”，持續(xù)向數(shù)據(jù)庫數(shù)中插入[n]個隨機種群定向向量;若輸出結(jié)果為“[N]”，保留原始樣本中最優(yōu)查詢數(shù)值，插入[x]個定向查詢向量。計算種群中整體數(shù)量與樣本之間的正向射向關(guān)系。制定操作區(qū)域中3個預(yù)設(shè)值，利用有圖理論建立操作區(qū)域基礎(chǔ)查詢模型，依照查詢不同定向標準劃分正向度量標準數(shù)值。分析數(shù)據(jù)種群中是否包含交叉變異數(shù)據(jù)值[5]。判斷查詢數(shù)據(jù)種群中的差異變化數(shù)值，保持數(shù)據(jù)查詢檢索值不變，在提取的新數(shù)據(jù)值樣本中保留最優(yōu)種群。降低樣本收斂速度，數(shù)據(jù)庫數(shù)值種群隨著攝入向量數(shù)量的增多，進化次數(shù)減小。自定義全減縮集合為[u=λu]，當[λ]數(shù)值為0～1之間任意一個常數(shù)時。采樣條件中每次進化次數(shù)[t]會隨著[λ]的降低而降低。當條件保持在一個相對穩(wěn)定的數(shù)據(jù)采樣范圍內(nèi)時，維持減縮集合的數(shù)據(jù)值，判斷是否輸出條件，識別采樣數(shù)據(jù)集合。通過上述采樣方式，可在保持原始數(shù)據(jù)集合的基礎(chǔ)上，向分析樣本中調(diào)入新的數(shù)據(jù)向量，基于并行計算對所有數(shù)據(jù)集合統(tǒng)一查詢，維持數(shù)據(jù)集的穩(wěn)定，避免出現(xiàn)數(shù)據(jù)庫樹過早收斂[6]。

1.2設(shè)計分布式數(shù)據(jù)庫樹查詢函數(shù)

數(shù)據(jù)庫在不同運行狀態(tài)下的動態(tài)化表現(xiàn)形式是不同的，隨機狀態(tài)下某一概率將由其中一個概率轉(zhuǎn)移至另一個概率值，下一時期查詢計算狀態(tài)僅取決于數(shù)據(jù)庫當期的運行狀態(tài)及數(shù)據(jù)計算出現(xiàn)轉(zhuǎn)移的概率，不存在后期效率性[7]。全減縮計算是在數(shù)據(jù)不斷轉(zhuǎn)移、交叉、變異過程中，分析數(shù)據(jù)集合之間存在的某種動態(tài)化鏈接。以此基于并行計算實際操作依據(jù)，設(shè)計分布式數(shù)據(jù)庫樹查詢函數(shù)，如下所示：

上述公式為分布式數(shù)據(jù)庫查詢函數(shù)，公式中：[p]表示為數(shù)據(jù)庫查詢種群;[p]表示為查詢種群的權(quán)值數(shù)值;[F]表示為數(shù)據(jù)庫樹中的字符串;[F]表示為字符串的權(quán)值數(shù)值;[γ]表示為查詢函數(shù)的短期變異參數(shù)，即可能出現(xiàn)數(shù)據(jù)交叉或重組等現(xiàn)象;[x]表示查詢的數(shù)據(jù)組別;[i]表示組別的查詢基礎(chǔ)個數(shù);[xi]表示查詢組別表現(xiàn)出的數(shù)值特征;[j]表示為主句轉(zhuǎn)移概率，計算單位為%。采用上述查詢函數(shù)，將全減縮計算流程近似看作馬爾科夫決策流程，將最有計算方法按照5元組的方式描述[8]。可表示為：

公式中：[S]表示為數(shù)據(jù)集合的特征有限數(shù)據(jù)集合，集合中數(shù)據(jù)值為1～k中任意自然整數(shù)，表示為[S=（S1，S2，S3…Sk）];[A]表示為查詢數(shù)據(jù)庫樹中數(shù)值存在的交叉率，變異參數(shù)記為[η];P表示為在時間t的種群狀態(tài)下，[s]的原始數(shù)值及其獎勵數(shù)值，按照并行計算原理，數(shù)值個體適應(yīng)程度越高，數(shù)值獎勵程度越大;[R（s）]表示為特殊種群中數(shù)值個體的最近適應(yīng)程度，定義[s']表示查詢數(shù)值與計算數(shù)值兩者之間的匹配程度，匹配程度越高，可為函數(shù)計算提供下一步適應(yīng)度數(shù)值，為計算提供正確決策;[π]表示為數(shù)據(jù)庫樹第二次計算的決策函數(shù)，可表達其期望數(shù)值與查詢減縮方向。根據(jù)上述查詢函數(shù)及計算公式，結(jié)合數(shù)據(jù)進化值與數(shù)據(jù)期望值，求解Q值，提供后續(xù)計算方向[9]。

1.3查詢?nèi)珳p縮計算

基于上述建立的數(shù)據(jù)庫樹查詢函數(shù)及最優(yōu)采樣條件，定義計算中多個計算參數(shù)數(shù)值，評價初始化數(shù)據(jù)種群，記錄最優(yōu)查詢計算方式，實施較差變異操作，計算查詢參數(shù)數(shù)值[10]。如下公式：

公式中，[P]表示為查詢?nèi)珳p縮計算的適應(yīng)程度;[m]、[n]表示多種計算參數(shù)的變異概率，計算單位為%;[f]表示為最有計算算法;[λ]表示可調(diào)節(jié)誤差。通過上述公式，計算最佳數(shù)值實用度，適應(yīng)程度越高，計算結(jié)果精準化程度越高，標記計算數(shù)值種群，判斷群體之間的參數(shù)關(guān)系，完成計算。

2對比實驗

2.1實驗準備

提出對比實驗，選定某實驗研究室為此次實驗的實驗對象，隨機選取實驗室某計算機，模擬此次實驗的實驗環(huán)境。為了提高實驗結(jié)果的準確性，整體實驗均在[Matlab]上進行，安裝雙端口萬兆位的路由協(xié)調(diào)控制器，選型計算機運行系統(tǒng)及相關(guān)配置。遵循標準安裝流程將互聯(lián)網(wǎng)與PC設(shè)備連接，并允許地方區(qū)域互聯(lián)網(wǎng)資源共享，在確保網(wǎng)絡(luò)格局相同的條件下，搭建計算節(jié)點緩沖區(qū)域。相關(guān)準備設(shè)備參數(shù)如表1所示。

結(jié)合上述表中設(shè)定的參數(shù)數(shù)值，先用傳統(tǒng)的數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法對指定PC機上數(shù)據(jù)庫樹中數(shù)據(jù)，實施查詢?nèi)珳p縮計算，收集10組實驗數(shù)據(jù)，采用云平臺處理數(shù)據(jù)的方式計算輸出數(shù)據(jù)與輸入數(shù)據(jù)之間的時間差，記該組為對照組。再用本文設(shè)計的基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法，進行相同步驟的操作，記該組為實驗組。

2.2實驗結(jié)果分析

根據(jù)上述提出的實驗環(huán)境及實驗步驟，將數(shù)據(jù)查詢?nèi)珯z索計算時間作為此次實驗的關(guān)鍵對比指標，整理收集的數(shù)據(jù)，并將其繪制表格，如下表2所示。

根據(jù)上述表2及實驗過程中產(chǎn)生的數(shù)據(jù)，可得出如下結(jié)論：本文設(shè)計的基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法，在實際計算中，可縮短輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的時間差，進而提升計算速度，起到提高查詢?nèi)珳p縮計算效率的作用。

3結(jié)束語

基于并行計算的理論依據(jù)，本文提出了基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法的研究。并通過設(shè)計仿真實驗進一步證明，本文設(shè)計的計算方法在實際應(yīng)用中，可起到縮短計算時間，縮短計算效率的作用。盡管本文研究已經(jīng)趨近于完善，但在后期的發(fā)展中，仍需針對提高數(shù)據(jù)分辨率等問題，實施更加深化的研究，推動分布式數(shù)據(jù)庫的發(fā)展。

參考文獻：

[1]黃天恩，郭慶來，孫宏斌，等. 模型-數(shù)據(jù)混合驅(qū)動的電網(wǎng)安全特征選擇和知識發(fā)現(xiàn)關(guān)鍵技術(shù)與工程應(yīng)用[J]. 電力系統(tǒng)自動化，2019，43（1）：95-101，208，102-104.

[2]劉春成，顧漢明，陳寶書，等. 基于GPU和CPU協(xié)同并行的三維各向異性介質(zhì)地震波場正演模擬[J]. 地質(zhì)科技情報，2019，38（5）：240-246.

[3]閆華，汪貽生，王銳淇，等. 基于GPU的大規(guī)模多階段任務(wù)系統(tǒng)可靠性并行計算方法[J]. 系統(tǒng)工程與電子技術(shù)，2019，41（1）：215-222.

[4]宋佩濤，張志儉，梁亮，等. 基于CPU-GPU異構(gòu)并行的MOC中子輸運計算并行效率優(yōu)化研究[J]. 原子能科學技術(shù)，2019，53（11）：2209-2217.

[5]易俊，秦曉萌，岑穎珊，等. GPU并行計算在FD-OCT成像中加速插值計算的應(yīng)用[J]. 儀器儀表用戶，2019，26（9）：40-44.

[6]方睿，董樹鋒，唐坤杰，等. 基于最大測點正常率與GPU并行加速的不良數(shù)據(jù)辨識方法[J]. 電力系統(tǒng)自動化，2019，43（16）：86-094，115.

[7]李楊，李朝奎，方軍，等. 基于數(shù)據(jù)級任務(wù)分解的大范圍地質(zhì)災(zāi)害預(yù)警并行計算架構(gòu)設(shè)計與應(yīng)用[J]. 地理信息世界，2018，25（2）：97-101.

[8]章立宗，張鋒明，蔣正威，等. 基于并行概率潮流計算的含光伏配電網(wǎng)電壓風險評估[J]. 浙江電力，2018，37（8）：7-14.

[9]張子興，吳斌，吳心宇，等. 路徑-維度GraphOLAP大規(guī)模多維網(wǎng)絡(luò)并行分析框架[J]. 軟件學報，2018，29（3）：545-568.

[10]曹禮群，陳志明，許志強，等. 科學與工程計算的方法和應(yīng)用——基于國家自然科學基金創(chuàng)新研究群體項目研究成果的綜述[J]. 中國科學基金，2018，32（2）：141-149.

【通聯(lián)編輯：張薇】

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法