王崢
摘 要:為了使分布式數(shù)據(jù)庫技術(shù)更好地服務(wù)于大數(shù)據(jù)分析和處理,文章通過闡述分布式數(shù)據(jù)庫技術(shù)的研究目的,分析了大數(shù)據(jù)應(yīng)用分布式數(shù)據(jù)庫技術(shù)的優(yōu)點,并探討了現(xiàn)階段分布式數(shù)據(jù)庫技術(shù)在大數(shù)據(jù)中的幾種應(yīng)用,最后對如何更好地應(yīng)用分布式數(shù)據(jù)庫技術(shù)提出了一些建議。
關(guān)鍵詞:分布式數(shù)據(jù)庫;大數(shù)據(jù);數(shù)據(jù)庫技術(shù)
0? ? 引言
人們的生產(chǎn)生活方式隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展產(chǎn)生了巨大的變革?;ヂ?lián)網(wǎng)使信息的傳播速度變得飛快,同時帶來了網(wǎng)絡(luò)用戶數(shù)量的激增,信息數(shù)據(jù)的應(yīng)用廣泛覆蓋了各個領(lǐng)域,數(shù)據(jù)體系也越來越龐大。在這種情況下,如何在龐大的數(shù)據(jù)體系當(dāng)中對有效信息進(jìn)行科學(xué)地提取和合理地分析處理成了數(shù)據(jù)技術(shù)行業(yè)值得深思的問題。
傳統(tǒng)的集中式數(shù)據(jù)處理已經(jīng)不適用于當(dāng)前大數(shù)據(jù)背景下的數(shù)據(jù)庫管理。各位學(xué)者不斷地深入研究,對數(shù)據(jù)庫技術(shù)進(jìn)行創(chuàng)新優(yōu)化,研發(fā)了分布式數(shù)據(jù)庫技術(shù)。它的出現(xiàn)為當(dāng)前各種數(shù)據(jù)的儲存、數(shù)據(jù)傳播、結(jié)果分析等提供了一項重要的新技術(shù),極大地提升了大數(shù)據(jù)應(yīng)用的質(zhì)量和效率,進(jìn)一步優(yōu)化數(shù)據(jù)管理體系,為我國的數(shù)據(jù)經(jīng)濟發(fā)展做出了重要貢獻(xiàn)。
1? ? 分布式數(shù)據(jù)庫技術(shù)的研究目的
互聯(lián)網(wǎng)時代使各大商業(yè)主體認(rèn)識到了網(wǎng)上業(yè)務(wù)發(fā)展給公司經(jīng)濟效益、顧客服務(wù)帶來的便捷。因此,各行業(yè)紛紛開拓網(wǎng)上業(yè)務(wù)服務(wù)體系,使互聯(lián)網(wǎng)顧客活躍數(shù)量不斷遞增,隨之而來的各種數(shù)據(jù)也越來越多,龐雜的數(shù)據(jù)管理成為人們關(guān)注的問題。且數(shù)據(jù)的種類也紛亂復(fù)雜,包括文本信息、圖片信息、音頻視頻信息,這些信息中有些商業(yè)價值極高,而有些數(shù)據(jù)已經(jīng)廢棄,需要清理。這就要求數(shù)據(jù)庫的建設(shè)必須進(jìn)行合理分配,有效識別有價值的信息,刪除無效信息,并且要對數(shù)據(jù)進(jìn)行準(zhǔn)確分類,為后期大數(shù)據(jù)運行提供良好的數(shù)據(jù)基礎(chǔ)。
而傳統(tǒng)的數(shù)據(jù)庫技術(shù)數(shù)據(jù)處理方式較為單一,在存儲容量、存儲效率、擴容性等方面都存在欠缺,面對日新月異的數(shù)據(jù)增長量已經(jīng)不能更好地發(fā)揮作用,因此有必要對分布式數(shù)據(jù)庫技術(shù)進(jìn)行深入探討和研究,了解其在大數(shù)據(jù)應(yīng)用當(dāng)中的優(yōu)點、應(yīng)用方式以及存在的問題,并根據(jù)研究做出及時調(diào)整,更好地完善分布式數(shù)據(jù)庫技術(shù),使其更好地應(yīng)用于大數(shù)據(jù)分析當(dāng)中。
2? ?大數(shù)據(jù)應(yīng)用分布式數(shù)據(jù)庫的優(yōu)點
2.1? 使各類數(shù)據(jù)的安全性有保障
互聯(lián)網(wǎng)技術(shù)是把雙刃劍,在應(yīng)用大量數(shù)據(jù)信息為生活生產(chǎn)提供便捷服務(wù)的同時,也給了居心不良之人可乘之機,由于虛擬的網(wǎng)絡(luò)狀態(tài)無法及時對身份進(jìn)行核實,存儲數(shù)據(jù)的網(wǎng)絡(luò)系統(tǒng)極易遭到破壞,造成信息泄露的問題。而分布式數(shù)據(jù)庫技術(shù)在對數(shù)據(jù)進(jìn)行操作管理的過程中,通過建立一套完備的快捷儲存、精準(zhǔn)分析、分類篩選、及時查詢系統(tǒng),并根據(jù)各行業(yè)不同的運營情況,通過設(shè)置數(shù)據(jù)訪問權(quán)限,數(shù)據(jù)庫運行安全監(jiān)測,建立數(shù)據(jù)運行防火墻等措施,滿足不同用戶端數(shù)據(jù)獲取要求的同時,高效地保障了數(shù)據(jù)的安全,防止信息被篡改或發(fā)生泄露。此外,分布式數(shù)據(jù)庫技術(shù)還建立了備份和數(shù)據(jù)恢復(fù)功能,可以使用戶在規(guī)定時間內(nèi)恢復(fù)誤刪或丟失的數(shù)據(jù),給數(shù)據(jù)的完整性提供了保障[1]。
2.2? 為后期數(shù)據(jù)分析提供決策依據(jù)
在大數(shù)據(jù)應(yīng)用到各個行業(yè),商家需要通過對捕捉到的用戶消費數(shù)據(jù)、行為數(shù)據(jù)等進(jìn)行智能化分析,以此來預(yù)判顧客的消費習(xí)慣和消費傾向,便于后期更好地進(jìn)行營銷和宣傳。分布式數(shù)據(jù)庫技術(shù)通過對各行業(yè)用戶數(shù)據(jù)的采集,按照商家要求進(jìn)行不同的數(shù)據(jù)劃分,例如對網(wǎng)絡(luò)電商提供每年的各種品類的商品銷售數(shù)據(jù)、不同年齡段的消費物品傾向、不同地區(qū)的消費水平劃分,或者在網(wǎng)絡(luò)金融交易中用戶在各平臺的貸款數(shù)據(jù)、還款情況、信用程度等。對這些數(shù)據(jù)的分類收集,能夠為后期的信息整合、分類處理提供可靠的數(shù)據(jù)決策依據(jù)。這使大數(shù)據(jù)分析更加準(zhǔn)確高效,為企業(yè)制定最契合的競爭策略,推動企業(yè)可持續(xù)發(fā)展。
2.3? 通過基礎(chǔ)信息挖掘其潛在價值
現(xiàn)階段對于數(shù)據(jù)的應(yīng)用已經(jīng)不只是簡單地進(jìn)行數(shù)據(jù)分析和預(yù)測,基礎(chǔ)信息只是將行業(yè)發(fā)展的表象數(shù)據(jù)呈現(xiàn)出來,更重要的是通過這些寶貴的數(shù)據(jù),對他們進(jìn)行更深層次的價值挖掘。
大數(shù)據(jù)應(yīng)用分布式數(shù)據(jù)庫技術(shù)可以更有針對性地對數(shù)據(jù)進(jìn)行深層次的價值挖掘。例如在電商行業(yè),對顧客的消費數(shù)據(jù)進(jìn)行不同種類的存儲和分析,不僅可以為電商行業(yè)提供發(fā)展導(dǎo)向,并且這些數(shù)據(jù)對人們的消費習(xí)慣的研究也是非常有價值的。在網(wǎng)絡(luò)通信行業(yè),通過收集用戶的評論信息、頁面停留時間、關(guān)鍵詞點擊率等數(shù)據(jù),可以把握不同年齡階段關(guān)注的社會熱點價值取向等[2]。這為更好地進(jìn)行社會管理,核心社會價值的傳播提供了十分有效的信息,這也是數(shù)據(jù)庫最主要的應(yīng)用價值。
3? ? 分布式數(shù)據(jù)庫技術(shù)在大數(shù)據(jù)中的應(yīng)用
3.1? 在大量業(yè)務(wù)中的負(fù)載支撐應(yīng)用
在各行各業(yè)網(wǎng)絡(luò)服務(wù)體系蓬勃發(fā)展的過程中,由于服務(wù)的客戶體系越來越龐大,且提供的服務(wù)分支越來越細(xì)化,傳統(tǒng)集中化的數(shù)據(jù)庫負(fù)載能力有限,因此分布式數(shù)據(jù)庫技術(shù)的應(yīng)用越來越廣泛。一方面,分布式數(shù)據(jù)庫通過對數(shù)據(jù)進(jìn)行不同條件的篩選清洗分流,對有價值的數(shù)據(jù)進(jìn)行加工處理和相應(yīng)的程序運算,之后刪除無效數(shù)據(jù),滿足不同行業(yè)的業(yè)務(wù)需求,很好地解決了數(shù)據(jù)收集過程中負(fù)荷量過大的問題。另一方面,分布式數(shù)據(jù)庫技術(shù)通過對每個階段內(nèi)的熱點信息進(jìn)行優(yōu)先等級劃分,合理地進(jìn)行資源占用傾斜,更方便用戶進(jìn)行數(shù)據(jù)查詢,通過這種方式來使數(shù)據(jù)庫即使在面臨大量任務(wù)時仍然能夠保持高效率。
3.2? 在數(shù)據(jù)存儲擴容方面的應(yīng)用
顯然,數(shù)據(jù)的收集與分析給商業(yè)發(fā)展和學(xué)術(shù)研究等各行業(yè)帶來了極大的應(yīng)用價值,所以現(xiàn)階段各行業(yè)越來越重視對用戶數(shù)據(jù)的收集與存儲。所保存的數(shù)據(jù)庫年限越久容量越大,以較長的時間跨度和較廣的空間跨度進(jìn)行的用戶行為數(shù)據(jù)分析也就越準(zhǔn)確,所產(chǎn)生的預(yù)判也就越精準(zhǔn)。因此數(shù)據(jù)的保存是一項非常重要的工作,這就要求現(xiàn)代化的數(shù)據(jù)庫技術(shù)進(jìn)行存儲方面的擴容,以適應(yīng)越來越龐雜的用戶數(shù)據(jù)體系。分布式數(shù)據(jù)庫技術(shù)不同于傳統(tǒng)的低效率數(shù)據(jù)打包存儲方式,他可以通過對數(shù)據(jù)庫進(jìn)行新節(jié)點的增設(shè),有效實現(xiàn)數(shù)據(jù)存儲設(shè)備的擴容。新節(jié)點的增設(shè)可以使數(shù)據(jù)庫容量增加至先前的十幾倍甚至幾十倍,通過這種方式輕松地應(yīng)對數(shù)據(jù)暴漲的情況,滿足現(xiàn)代化數(shù)據(jù)收集當(dāng)中因存儲空間不足導(dǎo)致后期無法進(jìn)行有效的數(shù)據(jù)分析的問題。
3.3? 在數(shù)據(jù)加載和查詢方面的應(yīng)用
傳統(tǒng)的數(shù)據(jù)庫建設(shè)由于管理、存儲、提取等方式較為落后,在顧客進(jìn)行數(shù)據(jù)查詢業(yè)務(wù)過程中,同一時段內(nèi)的客戶訪問量巨大時,系統(tǒng)加載速度緩慢,無法很好地滿足顧客的查詢要求,還會經(jīng)常發(fā)生系統(tǒng)崩潰的問題。而現(xiàn)階段隨著5G網(wǎng)絡(luò)的普及和應(yīng)用,分布式數(shù)據(jù)庫技術(shù)通過前期用戶數(shù)據(jù)的分析,可以有效地對客戶進(jìn)行不同需求的分流,其次還可以通過設(shè)置客戶優(yōu)先級別,針對不同的客戶群體有針對性地提供自助查詢服務(wù)。在實際應(yīng)用中能進(jìn)行數(shù)百個同時訪問任務(wù),可以達(dá)到一秒鐘讀取2萬條數(shù)據(jù)的加載速度,能在兩個小時以內(nèi)快速完成1億條數(shù)據(jù)查詢的任務(wù),在一天之內(nèi)對300多億條數(shù)據(jù)進(jìn)行匯總[3]。這充分提高了數(shù)據(jù)查詢和加載的速度,有效緩解了高峰期數(shù)據(jù)查詢的壓力。
4? ? 未來如何更好地在大數(shù)據(jù)中應(yīng)用分布式數(shù)據(jù)庫技術(shù)
(1)發(fā)展專門領(lǐng)域的分布式數(shù)據(jù)庫技術(shù):要使分布式數(shù)據(jù)庫技術(shù)更好地發(fā)展,就要根據(jù)不同應(yīng)用領(lǐng)域做出更精細(xì)化的調(diào)整。要結(jié)合不同行業(yè)使分布式數(shù)據(jù)庫技術(shù)更加專業(yè)化,例如針對建筑工程、統(tǒng)計科學(xué)等領(lǐng)域的數(shù)據(jù)庫要著重基礎(chǔ)數(shù)據(jù)的收集,在對數(shù)據(jù)庫的建設(shè)和后期數(shù)據(jù)分析上要進(jìn)一步減少誤差,結(jié)合行業(yè)特點加入相應(yīng)的智能算法,更加貼合該領(lǐng)域的實際應(yīng)用。
(2)將分布式數(shù)據(jù)庫的服務(wù)功能進(jìn)一步完善:當(dāng)今的時代處在一個全球化發(fā)展的過程中,對各項技術(shù)的發(fā)展和創(chuàng)新不能只局限于本國領(lǐng)域,要結(jié)合世界先進(jìn)發(fā)展理念,吸取他國在數(shù)據(jù)庫發(fā)展過程中的成熟經(jīng)驗,結(jié)合我國實際應(yīng)用情況進(jìn)行創(chuàng)新發(fā)展。將分布式數(shù)據(jù)庫打造成適宜全球化發(fā)展的綜合服務(wù)體系,對它的各項現(xiàn)有功能進(jìn)行完善,并不斷發(fā)掘新的服務(wù)功能。
(3)朝著數(shù)據(jù)倉庫和電子商務(wù)的方向發(fā)展:在分布式數(shù)據(jù)庫技術(shù)的發(fā)展過程中,要進(jìn)一步注重與客戶之間的互動,利用互聯(lián)網(wǎng)和智能化信息技術(shù)更好地為客戶提供人性化的線上服務(wù),確保收集到的客戶數(shù)據(jù)更加完善有效,并建立起各行各業(yè)互聯(lián)互通的數(shù)據(jù)倉庫,朝著更高端化的電子商務(wù)領(lǐng)域發(fā)展。
5? ? 結(jié)語
綜上所述,依托互聯(lián)網(wǎng)技術(shù)和智能科技的不斷發(fā)展,大數(shù)據(jù)分析對數(shù)據(jù)庫技術(shù)的應(yīng)用要求越來越高?,F(xiàn)階段,雖然分布式數(shù)據(jù)庫技術(shù)應(yīng)用于大數(shù)據(jù)起到了很好的實踐效果,但要更好地滿足數(shù)據(jù)處理過程中大批量數(shù)據(jù)的處理、高效率的數(shù)據(jù)分析、高品質(zhì)的服務(wù)過程等一系列的要求,還需要對分布式數(shù)據(jù)庫技術(shù)進(jìn)行不斷探索、科學(xué)應(yīng)用、及時創(chuàng)新,在對這項技術(shù)不斷完善的過程中,幫助人們更好地解決大數(shù)據(jù)分析過程當(dāng)中面臨的各種問題。
[參考文獻(xiàn)]
[1]巫細(xì)波.大數(shù)據(jù)在社會科學(xué)領(lǐng)域的應(yīng)用探討—基于POI大數(shù)據(jù)的案例[J].社科縱橫,2019(5):70-74
[2]王志輝.分布式數(shù)據(jù)庫技術(shù)在大數(shù)據(jù)中的應(yīng)用[J].信息系統(tǒng)工程,2019(12):21-22.
[3]陳丹琳.分布式數(shù)據(jù)庫技術(shù)在圖書資料管理系統(tǒng)中的應(yīng)用[J].青春歲月,2018(19):232,231.
(編輯 王永超)