任鹍翔
(山西省第一水文地質(zhì)工程地質(zhì)隊,山西 太原 030024)
在礦區(qū)水工環(huán)地質(zhì)調(diào)查中,一直存在著很多問題。水工環(huán)地質(zhì)調(diào)查中需要調(diào)查的數(shù)據(jù)很多,但一直沒有合適的系統(tǒng)可以收集、整理調(diào)查數(shù)據(jù),也不能實現(xiàn)數(shù)據(jù)的實時發(fā)布。工作人員在進行地質(zhì)調(diào)查后,如果沒有專業(yè)的系統(tǒng)整理數(shù)據(jù),這些數(shù)據(jù)就無法實時發(fā)布,影響地質(zhì)調(diào)查的工作的推進。如果地質(zhì)調(diào)查缺乏數(shù)據(jù)支撐,則會導(dǎo)致調(diào)查工作效率降低。但是礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)屬于保密數(shù)據(jù),在獲取和發(fā)布前都應(yīng)該進行處理,設(shè)置相關(guān)權(quán)限,供一部分人查看。在大數(shù)據(jù)時代,雖然大部分的數(shù)據(jù)在網(wǎng)上都處于共享狀態(tài),但對數(shù)據(jù)進行保護性發(fā)布的技術(shù)也分很多種類,基于數(shù)據(jù)匿名的原理,設(shè)計基于云計算的礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)發(fā)布系統(tǒng)。
系統(tǒng)主要由礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)庫和數(shù)據(jù)發(fā)布的終端兩部分組成,聯(lián)網(wǎng)部分加上數(shù)據(jù)傳輸和修改的瀏覽器,總體構(gòu)造如圖1所示。
圖1 系統(tǒng)結(jié)構(gòu)簡圖
如圖1所示,數(shù)據(jù)的發(fā)布裝置需要同時具備兩種功能,一是實現(xiàn)數(shù)據(jù)的處理,二是充當(dāng)嵌入式服務(wù)器使用。用戶在數(shù)據(jù)發(fā)布裝置上可實現(xiàn)遠程網(wǎng)絡(luò)操控,因此系統(tǒng)的硬件部分可分為處理器、通信器和數(shù)據(jù)儲存器[1],再加上作為驅(qū)使動力的電源和最終顯示結(jié)果的顯示器,系統(tǒng)的硬件共有五部分組成。
系統(tǒng)的電源安裝在顯示器下方,節(jié)省空間的同時還能將電源隱藏,起到美觀效果。電源與供電電路相連接,電壓控制在3V-5V之間,采用E4412芯片作為數(shù)據(jù)處理器,數(shù)據(jù)處理器的主頻最高可達到2G赫茲,可大大提高系統(tǒng)的處理速度。并且該處理器的能量損耗相較于傳統(tǒng)處理器低[2],一塊正常的電池可供處理器使用72個小時。外網(wǎng)遠程控制器的芯片使用12GB的大容量芯片,可實現(xiàn)數(shù)據(jù)秒存,控制器和處理器采用16bit的接口連接儲存器的儲存芯片采用EMMC芯片,一邊與供電電路相連,另一邊連接數(shù)據(jù)通道。儲存器的儲存方式是隨機儲存,符合數(shù)據(jù)加密處理的要求,為礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)發(fā)布系統(tǒng)的設(shè)計提供了良好的硬件環(huán)境。
礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)系統(tǒng)用戶可通過PC端口的瀏覽器直接訪問系統(tǒng),數(shù)據(jù)發(fā)布終端與瀏覽器的連接是通過遠程操控的,瀏覽器與系統(tǒng)不能是單純的連接和兼容關(guān)系,兩者的融合方式是嵌入式的[3,4],嵌入式瀏覽器可隨時為用戶提供服務(wù),用戶在任何有互聯(lián)網(wǎng)的地方通過任何IP地址登錄都可實現(xiàn)系統(tǒng)的數(shù)據(jù)發(fā)布。這主要是考慮到礦區(qū)水工環(huán)地質(zhì)調(diào)查通常的工作地點都不是信號暢通的城市,而是信號薄弱的山區(qū),降低數(shù)據(jù)發(fā)布的信號要求,有利于降低系統(tǒng)最終的運行時間。
服務(wù)器的遠程通信主要是依靠數(shù)據(jù)處理單元和服務(wù)器的連接,在操作系統(tǒng)中進行編程通信環(huán)節(jié)。系統(tǒng)自帶的IP可滿足通訊要求,服務(wù)器附著于操作系統(tǒng)進行數(shù)據(jù)發(fā)布的操作,服務(wù)器的CDI程序又獨立于操作系統(tǒng)實驗用戶的身份驗證和數(shù)據(jù)導(dǎo)出功能。防止操作系統(tǒng)在進行遠程操作的時候被惡意攻擊,導(dǎo)致數(shù)據(jù)丟失。
數(shù)據(jù)的發(fā)布過程中,數(shù)據(jù)的發(fā)布裝置全程監(jiān)聽數(shù)據(jù)發(fā)布的動態(tài),保證發(fā)布安全性的同時允許多個用戶同時登錄,在用戶連接之前會進行來訪者驗證,在用戶使用期間可能會隨機進行來訪驗證。判斷合法連接才能繼續(xù)進行數(shù)據(jù)發(fā)布工作,一旦發(fā)現(xiàn)陌生用戶進行操作立刻返回登陸界面,并向合法登陸者發(fā)出非法登陸提示。CDI程序是一種獨立于操作系統(tǒng)存在的網(wǎng)頁程序,在系統(tǒng)中與其他功能模塊連接通過程序接口,負責(zé)對瀏覽器發(fā)射數(shù)據(jù)判斷的請求,如果數(shù)據(jù)符合發(fā)布標(biāo)準(zhǔn)則直接進入發(fā)布環(huán)節(jié),如果數(shù)據(jù)還處于動態(tài)階段,則會將數(shù)據(jù)傳輸?shù)紺DI程序中進行靜態(tài)處理。數(shù)據(jù)發(fā)布的最終結(jié)果會進行分類傳輸,在顯示器上顯示發(fā)布完成,最終通過遠程網(wǎng)絡(luò)發(fā)送到客戶端的數(shù)據(jù)接收端口上,實現(xiàn)礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)發(fā)布。
為驗證本身設(shè)計的系統(tǒng)是否滿足礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)發(fā)布的需求,設(shè)計對比測試實驗,對比該系統(tǒng)與傳統(tǒng)方式的系統(tǒng)執(zhí)行時間,驗證系統(tǒng)的可實行性。
實驗環(huán)境選擇W10系統(tǒng)的計算機,計算機的CPU為i7-5200,內(nèi)存為12.0GB,設(shè)置編程環(huán)境為JUPY not,數(shù)據(jù)采用某礦山的水工環(huán)地質(zhì)的真實調(diào)查數(shù)據(jù),采用Adult數(shù)據(jù)集進行數(shù)據(jù)整理,調(diào)查數(shù)據(jù)在整理之后篩選出50000條,包含各類型、各種格式的數(shù)據(jù)。數(shù)據(jù)集的具體屬性如表1。
在設(shè)置數(shù)據(jù)屬性時,由于要測試數(shù)據(jù)發(fā)布系統(tǒng)的性能,實驗的數(shù)據(jù)類型要多樣化,但是為了實驗結(jié)果的有效性,敏感性數(shù)據(jù)在實驗數(shù)據(jù)中的比例趨近百分之五十。
系統(tǒng)的執(zhí)行時間是判斷系統(tǒng)優(yōu)劣的重要標(biāo)準(zhǔn),啟用系統(tǒng)進行數(shù)據(jù)發(fā)布任務(wù)執(zhí)行,對比文獻中系統(tǒng)與本文設(shè)計的系統(tǒng)的執(zhí)行時間,實驗結(jié)果如圖2所示:
圖2 系統(tǒng)運行時間對比圖
如上圖所示,本文設(shè)計的系統(tǒng)具有較短的運行時間,因為傳統(tǒng)系統(tǒng)為了抵御信息攻擊需要考慮諸多因素,對攻擊進行類型判斷和構(gòu)造判斷才能進行有效防御。因此,運行時間最高可達到200s以上,而本文設(shè)計系統(tǒng)的運行時間均衡在150s~160s之間。運行時間穩(wěn)定且較短,說明系統(tǒng)的整體性能優(yōu)異。
本文基于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)發(fā)布特征,對礦區(qū)水工環(huán)地質(zhì)調(diào)查數(shù)據(jù)發(fā)布系統(tǒng)進行重新設(shè)計。該系統(tǒng)秉承了傳統(tǒng)系統(tǒng)用加密發(fā)布代替亂碼發(fā)布的優(yōu)勢,彌補了傳統(tǒng)系統(tǒng)運行時間過長的缺點,為日后的數(shù)據(jù)發(fā)布系統(tǒng)的發(fā)展奠定了基礎(chǔ)。