劉云萍
摘要:傳統(tǒng)查詢?nèi)s減計算方法存在計算速度較慢的缺陷,以此開展了基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法的設(shè)計。計算種群中整體數(shù)量與樣本之間的正向射向關(guān)系,設(shè)計采樣流程圖,查詢采樣條件;設(shè)計分布式數(shù)據(jù)庫樹查詢函數(shù),計算查詢數(shù)據(jù)值,提供計算適應(yīng)度數(shù)值;計算參數(shù)數(shù)值,完成分布式數(shù)據(jù)庫樹查詢?nèi)s減計算。經(jīng)過對比實驗,證明所提出的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法可降低查詢計算時間,提高計算效率,因此更具有實際應(yīng)用價值。
關(guān)鍵詞:并行計算;分布式;數(shù)據(jù)庫樹;查詢?nèi)s減計算
中圖分類號:TP311.133.1? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)16-0050-03
并行計算又稱平行計算,基于市場內(nèi)涌現(xiàn)的大量的數(shù)據(jù)集合,并行計算已經(jīng)廣泛應(yīng)用于大數(shù)據(jù)查詢中,作為以此計算可同時執(zhí)行多種計算指令的查詢算法,具有提升計算效率、縮短計算時間的特點,可將問題延伸解決,延展計算規(guī)模。解決實際中大型且復(fù)雜的問題,并在實踐中擺脫時間或空間上的約束[1]。時間層面是指大量數(shù)據(jù)的流水線技術(shù)可同時實施,空間層面是指計算中出現(xiàn)的多個數(shù)據(jù)處理器可并發(fā)運行。使用并行計算方法通常將較復(fù)雜的計算流程或計算步驟進行分散處理,有助于問題的同步解決,結(jié)合計算設(shè)備提出的多個計算指令,為后續(xù)計算提供實時幫助,大內(nèi)存資源包下載的速度將明顯低于逐個資源包下載的速度[2]。分布式數(shù)據(jù)庫是數(shù)據(jù)在系統(tǒng)中以離散式方式存在,每臺計算設(shè)備中均包含一份相對完整的文件拷貝副本,或副本的部分文件具備自身獨立的數(shù)據(jù)庫,且每個離散數(shù)據(jù)庫之間由網(wǎng)絡(luò)進行互連,共同構(gòu)成一個相對完善且全局分布緊密的數(shù)據(jù)庫數(shù)。為了更好地應(yīng)用數(shù)據(jù)庫樹,數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法成了有關(guān)部門的研究重點,檢索查詢指令中一個相對優(yōu)化的策略成為數(shù)據(jù)庫樹在系統(tǒng)中可持續(xù)運行的基礎(chǔ)。由于自身計算方法存在的計算速度慢的缺陷,導(dǎo)致查詢計算結(jié)果通常為局部最優(yōu)解而非全過程最優(yōu)解[3]。以此有關(guān)研究人員將并行計算方法與數(shù)據(jù)庫樹查詢?nèi)珳p縮計算兩者實施動態(tài)化連接,提出一種新的函數(shù)計算方式,在計算中保持參數(shù)運行數(shù)值的穩(wěn)定,使用提取的查詢條件,完成數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法的設(shè)計。
1基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法
1.1基于并行計算采樣查詢條件
查詢數(shù)據(jù)種群問題規(guī)模指數(shù)呈現(xiàn)正極增長趨勢,瀏覽整體數(shù)據(jù)庫數(shù)據(jù)集合歷時較長,基于并行算法將收斂局部最優(yōu)解,保持數(shù)據(jù)集合多樣性的同時對查詢數(shù)據(jù)有針對采樣[4]。假定查詢時間內(nèi)數(shù)據(jù)個體最佳舒適程度未得到提升,數(shù)據(jù)種群樣本中的函數(shù)比例數(shù)值高于原始數(shù)據(jù)種群數(shù)值。自定義[st]表示當前需檢索的數(shù)據(jù)查詢次數(shù),[W]表示為查詢數(shù)據(jù)庫數(shù)樣本值大小。基于并行計算理論依據(jù),設(shè)計如下數(shù)據(jù)采樣流程。如下圖1:
根據(jù)上圖可知,賦予數(shù)據(jù)庫數(shù)查詢樣本數(shù)值空值,使用并行計算提供的優(yōu)化查詢方式,評估樣本數(shù)據(jù)中最右束支,判斷查詢數(shù)據(jù)種群是否為初次采樣,若分析結(jié)果表示為“[Y]”,持續(xù)向數(shù)據(jù)庫數(shù)中插入[n]個隨機種群定向向量;若輸出結(jié)果為“[N]”,保留原始樣本中最優(yōu)查詢數(shù)值,插入[x]個定向查詢向量。計算種群中整體數(shù)量與樣本之間的正向射向關(guān)系。制定操作區(qū)域中3個預(yù)設(shè)值,利用有圖理論建立操作區(qū)域基礎(chǔ)查詢模型,依照查詢不同定向標準劃分正向度量標準數(shù)值。分析數(shù)據(jù)種群中是否包含交叉變異數(shù)據(jù)值[5]。判斷查詢數(shù)據(jù)種群中的差異變化數(shù)值,保持數(shù)據(jù)查詢檢索值不變,在提取的新數(shù)據(jù)值樣本中保留最優(yōu)種群。降低樣本收斂速度,數(shù)據(jù)庫數(shù)值種群隨著攝入向量數(shù)量的增多,進化次數(shù)減小。自定義全減縮集合為[u=λu],當[λ]數(shù)值為0~1之間任意一個常數(shù)時。采樣條件中每次進化次數(shù)[t]會隨著[λ]的降低而降低。當條件保持在一個相對穩(wěn)定的數(shù)據(jù)采樣范圍內(nèi)時,維持減縮集合的數(shù)據(jù)值,判斷是否輸出條件,識別采樣數(shù)據(jù)集合。通過上述采樣方式,可在保持原始數(shù)據(jù)集合的基礎(chǔ)上,向分析樣本中調(diào)入新的數(shù)據(jù)向量,基于并行計算對所有數(shù)據(jù)集合統(tǒng)一查詢,維持數(shù)據(jù)集的穩(wěn)定,避免出現(xiàn)數(shù)據(jù)庫樹過早收斂[6]。
1.2設(shè)計分布式數(shù)據(jù)庫樹查詢函數(shù)
數(shù)據(jù)庫在不同運行狀態(tài)下的動態(tài)化表現(xiàn)形式是不同的,隨機狀態(tài)下某一概率將由其中一個概率轉(zhuǎn)移至另一個概率值,下一時期查詢計算狀態(tài)僅取決于數(shù)據(jù)庫當期的運行狀態(tài)及數(shù)據(jù)計算出現(xiàn)轉(zhuǎn)移的概率,不存在后期效率性[7]。全減縮計算是在數(shù)據(jù)不斷轉(zhuǎn)移、交叉、變異過程中,分析數(shù)據(jù)集合之間存在的某種動態(tài)化鏈接。以此基于并行計算實際操作依據(jù),設(shè)計分布式數(shù)據(jù)庫樹查詢函數(shù),如下所示:
上述公式為分布式數(shù)據(jù)庫查詢函數(shù),公式中:[p]表示為數(shù)據(jù)庫查詢種群;[p]表示為查詢種群的權(quán)值數(shù)值;[F]表示為數(shù)據(jù)庫樹中的字符串;[F]表示為字符串的權(quán)值數(shù)值;[γ]表示為查詢函數(shù)的短期變異參數(shù),即可能出現(xiàn)數(shù)據(jù)交叉或重組等現(xiàn)象;[x]表示查詢的數(shù)據(jù)組別;[i]表示組別的查詢基礎(chǔ)個數(shù);[xi]表示查詢組別表現(xiàn)出的數(shù)值特征;[j]表示為主句轉(zhuǎn)移概率,計算單位為%。采用上述查詢函數(shù),將全減縮計算流程近似看作馬爾科夫決策流程,將最有計算方法按照5元組的方式描述[8]。可表示為:
公式中:[S]表示為數(shù)據(jù)集合的特征有限數(shù)據(jù)集合,集合中數(shù)據(jù)值為1~k中任意自然整數(shù),表示為[S=(S1,S2,S3…Sk)];[A]表示為查詢數(shù)據(jù)庫樹中數(shù)值存在的交叉率,變異參數(shù)記為[η];P表示為在時間t的種群狀態(tài)下,[s]的原始數(shù)值及其獎勵數(shù)值,按照并行計算原理,數(shù)值個體適應(yīng)程度越高,數(shù)值獎勵程度越大;[R(s)]表示為特殊種群中數(shù)值個體的最近適應(yīng)程度,定義[s']表示查詢數(shù)值與計算數(shù)值兩者之間的匹配程度,匹配程度越高,可為函數(shù)計算提供下一步適應(yīng)度數(shù)值,為計算提供正確決策;[π]表示為數(shù)據(jù)庫樹第二次計算的決策函數(shù),可表達其期望數(shù)值與查詢減縮方向。根據(jù)上述查詢函數(shù)及計算公式,結(jié)合數(shù)據(jù)進化值與數(shù)據(jù)期望值,求解Q值,提供后續(xù)計算方向[9]。
1.3查詢?nèi)珳p縮計算
基于上述建立的數(shù)據(jù)庫樹查詢函數(shù)及最優(yōu)采樣條件,定義計算中多個計算參數(shù)數(shù)值,評價初始化數(shù)據(jù)種群,記錄最優(yōu)查詢計算方式,實施較差變異操作,計算查詢參數(shù)數(shù)值[10]。如下公式:
公式中,[P]表示為查詢?nèi)珳p縮計算的適應(yīng)程度;[m]、[n]表示多種計算參數(shù)的變異概率,計算單位為%;[f]表示為最有計算算法;[λ]表示可調(diào)節(jié)誤差。通過上述公式,計算最佳數(shù)值實用度,適應(yīng)程度越高,計算結(jié)果精準化程度越高,標記計算數(shù)值種群,判斷群體之間的參數(shù)關(guān)系,完成計算。
2對比實驗
2.1實驗準備
提出對比實驗,選定某實驗研究室為此次實驗的實驗對象,隨機選取實驗室某計算機,模擬此次實驗的實驗環(huán)境。為了提高實驗結(jié)果的準確性,整體實驗均在[Matlab]上進行,安裝雙端口萬兆位的路由協(xié)調(diào)控制器,選型計算機運行系統(tǒng)及相關(guān)配置。遵循標準安裝流程將互聯(lián)網(wǎng)與PC設(shè)備連接,并允許地方區(qū)域互聯(lián)網(wǎng)資源共享,在確保網(wǎng)絡(luò)格局相同的條件下,搭建計算節(jié)點緩沖區(qū)域。相關(guān)準備設(shè)備參數(shù)如表1所示。
結(jié)合上述表中設(shè)定的參數(shù)數(shù)值,先用傳統(tǒng)的數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法對指定PC機上數(shù)據(jù)庫樹中數(shù)據(jù),實施查詢?nèi)珳p縮計算,收集10組實驗數(shù)據(jù),采用云平臺處理數(shù)據(jù)的方式計算輸出數(shù)據(jù)與輸入數(shù)據(jù)之間的時間差,記該組為對照組。再用本文設(shè)計的基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法,進行相同步驟的操作,記該組為實驗組。
2.2實驗結(jié)果分析
根據(jù)上述提出的實驗環(huán)境及實驗步驟,將數(shù)據(jù)查詢?nèi)珯z索計算時間作為此次實驗的關(guān)鍵對比指標,整理收集的數(shù)據(jù),并將其繪制表格,如下表2所示。
根據(jù)上述表2及實驗過程中產(chǎn)生的數(shù)據(jù),可得出如下結(jié)論:本文設(shè)計的基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)s減計算方法,在實際計算中,可縮短輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的時間差,進而提升計算速度,起到提高查詢?nèi)珳p縮計算效率的作用。
3結(jié)束語
基于并行計算的理論依據(jù),本文提出了基于并行計算的分布式數(shù)據(jù)庫樹查詢?nèi)珳p縮計算方法的研究。并通過設(shè)計仿真實驗進一步證明,本文設(shè)計的計算方法在實際應(yīng)用中,可起到縮短計算時間,縮短計算效率的作用。盡管本文研究已經(jīng)趨近于完善,但在后期的發(fā)展中,仍需針對提高數(shù)據(jù)分辨率等問題,實施更加深化的研究,推動分布式數(shù)據(jù)庫的發(fā)展。
參考文獻:
[1]黃天恩,郭慶來,孫宏斌,等. 模型-數(shù)據(jù)混合驅(qū)動的電網(wǎng)安全特征選擇和知識發(fā)現(xiàn)關(guān)鍵技術(shù)與工程應(yīng)用[J]. 電力系統(tǒng)自動化,2019,43(1):95-101,208,102-104.
[2]劉春成,顧漢明,陳寶書,等. 基于GPU和CPU協(xié)同并行的三維各向異性介質(zhì)地震波場正演模擬[J]. 地質(zhì)科技情報,2019,38(5):240-246.
[3]閆華,汪貽生,王銳淇,等. 基于GPU的大規(guī)模多階段任務(wù)系統(tǒng)可靠性并行計算方法[J]. 系統(tǒng)工程與電子技術(shù),2019,41(1):215-222.
[4]宋佩濤,張志儉,梁亮,等. 基于CPU-GPU異構(gòu)并行的MOC中子輸運計算并行效率優(yōu)化研究[J]. 原子能科學技術(shù),2019,53(11):2209-2217.
[5]易俊,秦曉萌,岑穎珊,等. GPU并行計算在FD-OCT成像中加速插值計算的應(yīng)用[J]. 儀器儀表用戶,2019,26(9):40-44.
[6]方睿,董樹鋒,唐坤杰,等. 基于最大測點正常率與GPU并行加速的不良數(shù)據(jù)辨識方法[J]. 電力系統(tǒng)自動化,2019,43(16):86-094,115.
[7]李楊,李朝奎,方軍,等. 基于數(shù)據(jù)級任務(wù)分解的大范圍地質(zhì)災(zāi)害預(yù)警并行計算架構(gòu)設(shè)計與應(yīng)用[J]. 地理信息世界,2018,25(2):97-101.
[8]章立宗,張鋒明,蔣正威,等. 基于并行概率潮流計算的含光伏配電網(wǎng)電壓風險評估[J]. 浙江電力,2018,37(8):7-14.
[9]張子興,吳斌,吳心宇,等. 路徑-維度GraphOLAP大規(guī)模多維網(wǎng)絡(luò)并行分析框架[J]. 軟件學報,2018,29(3):545-568.
[10]曹禮群,陳志明,許志強,等. 科學與工程計算的方法和應(yīng)用——基于國家自然科學基金創(chuàng)新研究群體項目研究成果的綜述[J]. 中國科學基金,2018,32(2):141-149.
【通聯(lián)編輯:張薇】