摘要:隨著IT技術(shù)迅速發(fā)展,數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)經(jīng)歷了演進(jìn)。為了解決相關(guān)部門的數(shù)據(jù)處理問(wèn)題,以運(yùn)營(yíng)商網(wǎng)絡(luò)運(yùn)行情況為例,對(duì)分布式數(shù)據(jù)庫(kù)技術(shù)加以研究,分析分布式數(shù)據(jù)庫(kù)技術(shù)在應(yīng)用時(shí)的不足之處,提出設(shè)置MPP+SharedNothing架構(gòu)、合理運(yùn)用高效透明壓縮技術(shù)、實(shí)現(xiàn)混合式存儲(chǔ)、利用并行處理技術(shù)、加強(qiáng)智能索引等解決措施,從而體現(xiàn)分布式數(shù)據(jù)庫(kù)技術(shù)在整合分散數(shù)據(jù)內(nèi)容時(shí)的處理價(jià)值所在,并可增加在數(shù)據(jù)管理和應(yīng)用方面的指導(dǎo)。
關(guān)鍵詞:分布式數(shù)據(jù)庫(kù)技術(shù) 數(shù)據(jù)信息 數(shù)據(jù)內(nèi)容
ResearchontheApplicationofDistributedDatabaseTechnology
MAJinru
YinchuanUniversityofEnergy,Yinchuan,NingxiaHuiAutonomousRegion,750000China
Abstract:WiththerapiddevelopmentofITtechnology,databasesystemarchitecturehasundergoneevolution.Inordertosolvethedataprocessingproblemsofrelevantdepartments,thisarticletakestheoperationofoperatornetworksasanexample,studiesdistributeddatabasetechnology,analyzestheshortcomingsofdistributeddatabasetechnologyinapplication.Itproposes solutionssuchassettingupMPP+SharedNothingarchitecture,rationallyapplyingefficienttransparentcompressiontechnology,realizinghybridstorage,applyingparallelprocessingtechnology,strengtheningintelligentindexing,etc.,soastoreflecttheprocessingvalueofdistributeddatabasetechnologyinintegratingdisperseddatacontentandcanincreaseguidanceindatamanagementandapplication.
KeyWords:Distributed;Databasetechnology;DataInformation;Datacontent
為保證運(yùn)營(yíng)商網(wǎng)絡(luò)內(nèi)的數(shù)據(jù)信息能夠被合理地整合,相關(guān)人員需加強(qiáng)對(duì)數(shù)據(jù)傳輸情況的了解。當(dāng)前,多渠道內(nèi)的數(shù)據(jù)是呈現(xiàn)爆炸性增長(zhǎng)狀態(tài)的,這對(duì)數(shù)據(jù)的分析、存儲(chǔ)和管理工作提出了更高的需求。對(duì)此,還需考慮大數(shù)據(jù)的分析場(chǎng)景,融入使用分布式數(shù)據(jù)庫(kù)技術(shù)到數(shù)據(jù)的處理環(huán)節(jié),以整合多區(qū)域內(nèi)的數(shù)據(jù)信息,并保證大數(shù)據(jù)能夠順利地交換和整合。堅(jiān)持以“高效低成本”的基本原則,增加大數(shù)據(jù)分析系統(tǒng)在運(yùn)行期間的驅(qū)動(dòng)力,以分布式的數(shù)據(jù)庫(kù)架構(gòu)手段,促使數(shù)據(jù)信息能夠增強(qiáng)自身的拓展能力。
1分布式數(shù)據(jù)庫(kù)
分布式數(shù)據(jù)庫(kù)系統(tǒng)會(huì)利用相對(duì)較小的計(jì)算機(jī)系統(tǒng)的組合方式,將每臺(tái)計(jì)算機(jī)都放在單獨(dú)的位置,使其中可能包含數(shù)據(jù)庫(kù)管理系統(tǒng)(DatabaseManagementSystem,DBMS),并實(shí)現(xiàn)對(duì)一份完整的副本拷貝,使計(jì)算機(jī)內(nèi)有屬于自己的數(shù)據(jù)庫(kù)。將處于不同位置上的眾多計(jì)算機(jī)進(jìn)行連接,通過(guò)網(wǎng)絡(luò)構(gòu)建出一個(gè)具有全局性的、完整的且在邏輯上實(shí)現(xiàn)集中、在物理層面上實(shí)現(xiàn)分布的大型數(shù)據(jù)庫(kù)[1]。
2分布式數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用措施
2.1設(shè)置MPP+SharedNothing架構(gòu)
通常情況下,分布式數(shù)據(jù)庫(kù)會(huì)在大規(guī)模并行處理(MassivelyParallelProcessing,MPP)技術(shù)的層面上整合各單元內(nèi)容,設(shè)置單元內(nèi)的存儲(chǔ)信息、計(jì)算信息和軟件資源,包括內(nèi)存、總線、操作系統(tǒng)、硬盤及其相關(guān)內(nèi)容[2],展現(xiàn)出各個(gè)單元所具備的獨(dú)立性,利用自給和對(duì)等的方法,防止系統(tǒng)在運(yùn)行期間各個(gè)單元出現(xiàn)單點(diǎn)的瓶頸[3]。
(1)結(jié)合分布式數(shù)據(jù)庫(kù)的應(yīng)用情況,以動(dòng)態(tài)拓展的手段,整合單元內(nèi)容,并運(yùn)用協(xié)同處理的方式落實(shí)系統(tǒng)所具備的相同任務(wù),促使各個(gè)單元之間順利地進(jìn)行信息的交互工作。以節(jié)點(diǎn)之間的連接,依靠互聯(lián)網(wǎng),最終實(shí)現(xiàn)數(shù)據(jù)線信息的交互。這樣一來(lái),各個(gè)單元之間需要根據(jù)本地的IP等情況,完成對(duì)區(qū)域內(nèi)資源的訪問(wèn)。若存在異地的訪問(wèn)情況,則需通過(guò)完全無(wú)共享(SharedNothing)這一架構(gòu)方式實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)容的平均分配,以實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)讀取,彌補(bǔ)Hadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)的不足[4]。在確保每個(gè)節(jié)點(diǎn)上都有可處理的內(nèi)容后,排列節(jié)點(diǎn)存儲(chǔ)表,并實(shí)現(xiàn)對(duì)各區(qū)域內(nèi)資源的分布。如此,相關(guān)人員則可利用數(shù)據(jù)查詢、加載等方式了解各節(jié)點(diǎn)服務(wù)器的情況,以自動(dòng)化的手段,為無(wú)線網(wǎng)絡(luò)個(gè)人用戶提供優(yōu)質(zhì)服務(wù)[5]。
(2)為了實(shí)現(xiàn)對(duì)本架構(gòu)中數(shù)據(jù)內(nèi)容的優(yōu)化分布,還需以MPP架構(gòu)為主,利用并行查詢的處理手段,在系統(tǒng)響應(yīng)多個(gè)任務(wù)時(shí),可以通過(guò)數(shù)據(jù)的傳輸與優(yōu)化分布方式,避免系統(tǒng)中的數(shù)據(jù)在傳遞過(guò)程中出現(xiàn)吞吐量過(guò)少或延遲性多久的問(wèn)題。根據(jù)計(jì)算節(jié)點(diǎn)、存儲(chǔ)、CPU等硬件資源,實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)容的橫向拓展,以保證系統(tǒng)在運(yùn)用過(guò)程中業(yè)務(wù)的增長(zhǎng)需求能夠得到滿足。而且,相關(guān)人員還需通過(guò)精細(xì)管理的方式實(shí)現(xiàn)對(duì)分布數(shù)據(jù)庫(kù)的調(diào)度,保證其能夠加強(qiáng)對(duì)數(shù)據(jù)流的管理。并且,在任務(wù)執(zhí)行過(guò)程中,可以對(duì)數(shù)據(jù)進(jìn)行恢復(fù)、備份、清洗、壓縮等工作,以高效并行的處理方式,以MPP+SharedNothing架構(gòu)的手段,完成專用網(wǎng)絡(luò)、處理單元和商業(yè)通用網(wǎng)絡(luò)的協(xié)作與通信[6]。
(3)以此架構(gòu)展現(xiàn)出單元所具備的較高容錯(cuò)性。確保某一單元內(nèi)的數(shù)據(jù)出錯(cuò),其他單元仍可正常工作,以展現(xiàn)出系統(tǒng)所具備的高可用性,使它可以順利地應(yīng)用于分布式數(shù)據(jù)庫(kù)的架構(gòu)環(huán)節(jié),完成對(duì)高復(fù)雜度、大規(guī)模數(shù)據(jù)任務(wù)的處理。
2.2合理運(yùn)用高效透明壓縮技術(shù)
利用高效透明壓縮技術(shù),可以基于數(shù)據(jù)信息的分布和類型挖掘其規(guī)律,并幫助相關(guān)人員選擇最優(yōu)的壓縮手段,完成對(duì)數(shù)據(jù)庫(kù)級(jí)、表級(jí)和列級(jí)的設(shè)置,以靈活的壓縮選項(xiàng),展現(xiàn)出壓縮比和平衡性能之間的關(guān)聯(lián)。
首先,其可以通過(guò)解壓和壓縮的方式實(shí)現(xiàn)對(duì)用戶信息的透明化處理,讓該部分內(nèi)容用于分布式數(shù)據(jù)庫(kù)的內(nèi)容排列過(guò)程中,以支持存儲(chǔ)的方式,生成有用的數(shù)據(jù)包,并保證其高透明度。這樣一來(lái),相關(guān)人員則可運(yùn)用相關(guān)性相對(duì)較高的同構(gòu)數(shù)據(jù)內(nèi)容開展壓縮工作,使其壓縮比率可以占據(jù)1/5或1/20左右,讓數(shù)據(jù)能夠存儲(chǔ)于數(shù)據(jù)庫(kù)中,并保證存儲(chǔ)空間可以節(jié)省50%~
90%。
其次,相關(guān)人員可以在了解壓縮條件下的數(shù)據(jù)情況保證該部分信息能夠降低對(duì)I/O的要求。以數(shù)據(jù)查詢、加載的方式,實(shí)現(xiàn)與傳統(tǒng)數(shù)據(jù)庫(kù)的比較,使當(dāng)前融入高效透明壓縮技術(shù)的數(shù)據(jù)庫(kù)比傳統(tǒng)數(shù)據(jù)庫(kù)的處理效率提高幾十倍甚至以上。
2.3實(shí)現(xiàn)混合式存儲(chǔ)
與以往的行存數(shù)據(jù)庫(kù)相比,當(dāng)前的分布式數(shù)據(jù)庫(kù)可以通過(guò)在磁盤中增加數(shù)據(jù)信息的方式,以按行和按例的混合手段,實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)容的高效存儲(chǔ),以方便相關(guān)人員根據(jù)列或行的內(nèi)容對(duì)所需信息進(jìn)行統(tǒng)計(jì)、查詢和分析,展現(xiàn)出數(shù)據(jù)的快速處理優(yōu)勢(shì)。所以,在當(dāng)前的分布式數(shù)據(jù)庫(kù)技術(shù)應(yīng)用后,相關(guān)人員可以將數(shù)據(jù)內(nèi)容應(yīng)用到多場(chǎng)景中,展現(xiàn)出其所具備的靈活性和響應(yīng)速度快的特點(diǎn)。
2.4利用并行處理技術(shù)
在分布式數(shù)據(jù)庫(kù)運(yùn)行過(guò)程中,相關(guān)人員可以通過(guò)數(shù)據(jù)查詢和數(shù)據(jù)加載的方式了解其所具備的自動(dòng)、高效處理性能。融入并行處理技術(shù),利用智能算法增加多核資源內(nèi)容的適配性,以CPU資源的并行方式,保障用戶能夠通過(guò)數(shù)據(jù)庫(kù)完成對(duì)相關(guān)內(nèi)容的分區(qū)查詢,并保證數(shù)據(jù)在運(yùn)行過(guò)程中不會(huì)出現(xiàn)問(wèn)題。
首先,可以根據(jù)數(shù)據(jù)的特征與具體分布情況選擇合適的算法,實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)容的處理,相當(dāng)于可以通過(guò)并發(fā)運(yùn)行與低效寫操作的方式實(shí)現(xiàn)對(duì)資源內(nèi)容的整理,并通過(guò)查詢操作,了解數(shù)據(jù)自適應(yīng)條件。
其次,相關(guān)人員可以通過(guò)分布式并行技術(shù)的使用,實(shí)現(xiàn)對(duì)系統(tǒng)內(nèi)資源信息的管控。以負(fù)載均衡的方式,實(shí)現(xiàn)對(duì)相關(guān)內(nèi)容的平衡與調(diào)度;利用并行處理的過(guò)程,讓用戶可以面向相同的數(shù)據(jù)庫(kù)系統(tǒng)完成對(duì)各節(jié)點(diǎn)工作內(nèi)容的調(diào)度;加強(qiáng)對(duì)查詢請(qǐng)求的分解,以制訂節(jié)點(diǎn)查詢方案。這樣一來(lái),其可以結(jié)合不同節(jié)點(diǎn)內(nèi)所檢索到的數(shù)據(jù)內(nèi)容,生成查詢結(jié)果,并開展統(tǒng)一的匯總工作。待融入并行處理技術(shù)后,則可落實(shí)單個(gè)項(xiàng)目的查詢?nèi)蝿?wù),使該部分內(nèi)容能夠在同一臺(tái)主機(jī)上進(jìn)行分解,使多個(gè)CPU能夠進(jìn)行并行運(yùn)算。同時(shí),相關(guān)人員也可以結(jié)合用戶的具體情況,使用戶的查詢?nèi)蝿?wù)進(jìn)行分解,以多臺(tái)主機(jī)的形式,利用CPU完成運(yùn)算。
例如:為了確保數(shù)據(jù)能夠在數(shù)據(jù)庫(kù)內(nèi)合理應(yīng)用,可以通過(guò)數(shù)據(jù)分辨的方式來(lái)夯實(shí)分布式數(shù)據(jù)庫(kù)技術(shù)的基礎(chǔ)。按照規(guī)定,將數(shù)據(jù)內(nèi)容分成多個(gè)片段,采用不同節(jié)點(diǎn)的存儲(chǔ)方式,保證用戶在數(shù)據(jù)查詢過(guò)程中能夠以并行的方式實(shí)現(xiàn)對(duì)不同節(jié)點(diǎn)上數(shù)據(jù)片段內(nèi)容的檢索,從而根據(jù)最終結(jié)果了解數(shù)據(jù)需要被集合或返回。又如:可以通過(guò)數(shù)據(jù)復(fù)制的方式,提高數(shù)據(jù)信息的可用性。將各分片的數(shù)據(jù)內(nèi)容復(fù)制到對(duì)應(yīng)的節(jié)點(diǎn)上,以展現(xiàn)出數(shù)據(jù)信息的可用性和可靠性,實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)容的同步存儲(chǔ),以方便用戶針對(duì)于節(jié)點(diǎn)中數(shù)據(jù)的情況進(jìn)行添加、修改、刪除等操作,從而確保數(shù)據(jù)庫(kù)中的內(nèi)容是一致的。
2.5加強(qiáng)智能索引
分布式數(shù)據(jù)庫(kù)所應(yīng)用的智能索引技術(shù)需建立在數(shù)據(jù)包的前提下,使相關(guān)人員可以在數(shù)據(jù)包進(jìn)行加載時(shí),以自動(dòng)建立的方式開展信息統(tǒng)計(jì)和過(guò)濾活動(dòng),將粗粒度較高的數(shù)據(jù)進(jìn)行處理,以智能索引的方式實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)容的描述,并利用高級(jí)信息與所描述內(nèi)容的聯(lián)系,實(shí)現(xiàn)對(duì)數(shù)據(jù)報(bào)需求的全面分析。
3 結(jié)語(yǔ)
綜上所述,分布式數(shù)據(jù)技術(shù)可以讓數(shù)據(jù)分散到多個(gè)節(jié)點(diǎn),擴(kuò)容數(shù)據(jù)庫(kù),并能保持?jǐn)?shù)據(jù)一致和實(shí)現(xiàn)數(shù)據(jù)同步。但在多個(gè)節(jié)點(diǎn)存在相同數(shù)據(jù)副本時(shí),與單機(jī)數(shù)據(jù)庫(kù)相比,維護(hù)成本、系統(tǒng)復(fù)雜性較高。未來(lái),在應(yīng)用分布式數(shù)據(jù)庫(kù)技術(shù)時(shí),應(yīng)做好傳輸加密機(jī)權(quán)限控制,實(shí)現(xiàn)對(duì)分布式數(shù)據(jù)庫(kù)的性能優(yōu)化,從而推進(jìn)該技術(shù)在云計(jì)算、大數(shù)據(jù)處理、物聯(lián)網(wǎng)等領(lǐng)域內(nèi)的廣泛應(yīng)用。
參考文獻(xiàn)
[1]王儒升.分布式數(shù)據(jù)庫(kù)在信息化管理系統(tǒng)中的應(yīng)用探析[J].電腦知識(shí)與技術(shù),2023,19(35):83-85.
[2]張子豪.分布式數(shù)據(jù)庫(kù)中事務(wù)協(xié)議與一致性協(xié)議的協(xié)同優(yōu)化[D].上海華東師范大學(xué),2024.
[3]崔爽.中國(guó)場(chǎng)景推動(dòng)分布式數(shù)據(jù)庫(kù)立新標(biāo)[N].科技日?qǐng)?bào),2023-11-23(6).
[4]李勇,唐國(guó)琴,羅瑯騰,等.云環(huán)境下海量GPS、視頻監(jiān)控?cái)?shù)據(jù)存儲(chǔ)檢索研究[J].電力大數(shù)據(jù),2022,25(5):85-92.
[5]盧山.無(wú)線網(wǎng)絡(luò)優(yōu)化中大數(shù)據(jù)的應(yīng)用分析[J].中國(guó)新通信,2021,23(20):68-69.
[6]侯曉東,王勐,周軒宇.分布式數(shù)據(jù)庫(kù)技術(shù)的現(xiàn)狀和發(fā)展方向[J].中國(guó)新通信,2020,22(8):120.