錢(qián)江+宋艷+黃慧+郝自飛+程翔
【摘要】 “大數(shù)據(jù)”是近兩年來(lái)各界最熱議的話題之一,與“大數(shù)據(jù)”相關(guān)的實(shí)踐幾乎成為所有行業(yè)在技術(shù)和商業(yè)兩個(gè)方面最具創(chuàng)新意義的行動(dòng)??梢哉f(shuō),數(shù)據(jù)的有效利用是每個(gè)企業(yè)高效運(yùn)作的基礎(chǔ)。在當(dāng)今信息爆炸的時(shí)代,隨著移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)的發(fā)展以及視頻監(jiān)控、智能終端、應(yīng)用商店的普及,信息每天都在以驚人的速度增長(zhǎng),種類也在不斷擴(kuò)展,越來(lái)越多的非結(jié)構(gòu)化數(shù)據(jù)開(kāi)始涌現(xiàn)。本文分析及探討了無(wú)障礙免接口模式大數(shù)據(jù)采集方法。
【關(guān)鍵詞】 無(wú)障礙 免接口模式 大數(shù)據(jù)采集方法
一、無(wú)障礙免接口模式大數(shù)據(jù)采集的優(yōu)勢(shì)
當(dāng)今社會(huì),是信息化高速發(fā)展的時(shí)代,而數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè)及業(yè)務(wù)職能領(lǐng)域,成為極其重要的生產(chǎn)因素及動(dòng)能,人們對(duì)海量數(shù)據(jù)的挖掘及利用,也就說(shuō)明新一波的生產(chǎn)率在不斷上升。在我國(guó)數(shù)據(jù)呈現(xiàn)出不斷增加的狀態(tài)時(shí),這對(duì)數(shù)據(jù)抓取及信息采集的相關(guān)產(chǎn)品來(lái)說(shuō),不僅是機(jī)遇更是挑戰(zhàn),相對(duì)的采集產(chǎn)品的數(shù)量也就逐漸增加,雖然人們能夠看到采集產(chǎn)品廣闊的發(fā)展前景,但是產(chǎn)品質(zhì)量卻難以達(dá)到高品質(zhì)、高要求標(biāo)準(zhǔn),而無(wú)障礙大數(shù)據(jù)采集系統(tǒng)與其他產(chǎn)品相比,卻存在一定的技術(shù)優(yōu)勢(shì):首先,無(wú)障礙大數(shù)據(jù)采集系統(tǒng)能夠以用戶需求為基礎(chǔ),根據(jù)用戶自定義的任務(wù)配置及概念設(shè)定,進(jìn)行相關(guān)網(wǎng)頁(yè)及關(guān)鍵信息的高效抽取,精準(zhǔn)定位應(yīng)用程序中的半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),在經(jīng)過(guò)加工及處理后,就可以在一定程度上優(yōu)化數(shù)據(jù)記錄結(jié)構(gòu),從而使結(jié)構(gòu)化更加清晰、一致,從而以最簡(jiǎn)化的形式將采集任務(wù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,不僅可以為內(nèi)部使用提供便利,更能實(shí)現(xiàn)信息的高速傳播及共享,確保信息能夠在短時(shí)間內(nèi)完成無(wú)障礙獲取。其次,對(duì)用戶使用資質(zhì)并不更會(huì)做出高標(biāo)準(zhǔn)要求,即使是對(duì)IT一無(wú)所知的業(yè)余人員,也可以在不經(jīng)過(guò)任何專業(yè)講解及學(xué)習(xí)、不需要與被采集系統(tǒng)的開(kāi)發(fā)商進(jìn)行業(yè)務(wù)聯(lián)系、更不需要在被采集系統(tǒng)的開(kāi)發(fā)商提供技術(shù)文檔的情況下,就可以通過(guò)系統(tǒng)設(shè)定信息及指示進(jìn)行自由操作,快速獲取有用信息,在這一過(guò)程中不僅信息操作流程更加簡(jiǎn)單,用戶更可以運(yùn)用自然語(yǔ)言與系統(tǒng)進(jìn)行相互交流及信息溝通,在遵循基本原則的基礎(chǔ)上,可以在本系統(tǒng)以外的其他連接系統(tǒng)中進(jìn)行不同信息的收集。最后,無(wú)障礙大數(shù)據(jù)采集系統(tǒng)內(nèi)設(shè)運(yùn)行規(guī)則靈活多變,可以服務(wù)于各個(gè)種類的網(wǎng)站,有助于他們建立友好連接,實(shí)現(xiàn)信息的高效采集。同時(shí)系統(tǒng)中自帶的解決方法具有快速反應(yīng)、無(wú)需人工啟動(dòng)的優(yōu)勢(shì)特點(diǎn),該方案可以在對(duì)自然語(yǔ)言充分了解的基礎(chǔ)上,利用解析內(nèi)核,精準(zhǔn)定位用戶需求信息,并以此為依托,對(duì)信息內(nèi)容進(jìn)行處理,在結(jié)合概念引用的相關(guān)中提煉出有關(guān)動(dòng)態(tài)及時(shí)態(tài)的量化信息,為用戶的暢快使用帶來(lái)前所未有的無(wú)障礙體驗(yàn)。
二、無(wú)障礙免接口模式大數(shù)據(jù)的采集方法
無(wú)障礙大數(shù)據(jù)的采集系統(tǒng)可以通過(guò)規(guī)則治理系統(tǒng)的管理及控制,在各個(gè)時(shí)段對(duì)云系統(tǒng)中的大數(shù)據(jù)設(shè)置具有規(guī)劃性質(zhì)的大數(shù)據(jù)采集虛擬終端。在此背景下用戶可以將虛擬終端看成是能發(fā)揮職能作用的工作人員,為了便于進(jìn)行操作及管理,則需要在信息采集系統(tǒng)中為假定的工作人員注冊(cè)專屬的員工個(gè)人賬號(hào),而設(shè)備的登錄規(guī)則與員工登錄基本一致,也可以輸入設(shè)備賬號(hào)進(jìn)入不同的系統(tǒng),根據(jù)數(shù)據(jù)的傳遞及處理要求進(jìn)行相關(guān)操作。產(chǎn)品結(jié)構(gòu)如圖1所示:
業(yè)務(wù)流程模擬引擎能夠?qū)Σ煌挠脩粼谙到y(tǒng)中的使用狀態(tài)及訪問(wèn)系統(tǒng)的環(huán)境進(jìn)行模擬,而虛擬用戶的操作行為及過(guò)程則會(huì)記錄在模擬用戶行為集中。模擬用戶行為集的產(chǎn)生需要依托于真實(shí)用戶的行為錄制模塊,該模塊不僅能夠?qū)δM用戶的行為集進(jìn)行記錄,更能推動(dòng)模擬用戶行為集的運(yùn)行,在使用前者時(shí),可以發(fā)揮其參考及指導(dǎo)作用,并且該模塊還能夠掌控行為集的運(yùn)行狀態(tài)及所處環(huán)境。行為錄制模塊及正常工作期間,該模塊不僅能夠?qū)蛻魴C(jī)進(jìn)行監(jiān)督及控制,更能掌握用戶的信息應(yīng)用指令,對(duì)服務(wù)器產(chǎn)生的用戶信息進(jìn)行實(shí)時(shí)記錄,這樣當(dāng)虛擬用戶與服務(wù)器進(jìn)行相互聯(lián)系及請(qǐng)求處理時(shí),客戶機(jī)接口就可以在不需要依托系統(tǒng)資源的前提下進(jìn)行操作。與此同時(shí),每個(gè)工作站都可以容納并運(yùn)用多個(gè)虛擬用戶,而業(yè)務(wù)流程模擬引擎的工作量也不會(huì)相對(duì)增加,只需要進(jìn)行簡(jiǎn)單的操作及處理,就可以進(jìn)行大型、巨量的數(shù)據(jù)抓取。除此之外,模擬用戶行為集的運(yùn)行及功能發(fā)揮,并不需要與客戶機(jī)軟件建立聯(lián)系,這樣如果在客戶機(jī)軟件的用戶界面發(fā)生改變及應(yīng)用功能并不完善的情況下,虛擬用戶檢測(cè)服務(wù)的功能及優(yōu)勢(shì)發(fā)揮也不會(huì)受到任何阻礙。
綜上所述,無(wú)障礙免接口模式的大數(shù)據(jù)采集方法不僅能夠快速實(shí)現(xiàn)數(shù)據(jù)之間的交換及采集,更能提升數(shù)據(jù)采集的安全性及穩(wěn)定性,在強(qiáng)化人機(jī)互動(dòng)的基礎(chǔ)上,使大數(shù)據(jù)的采集更加便利及智能,為用戶打造更加自動(dòng)化、信息化的IT基礎(chǔ)平臺(tái)。
參 考 文 獻(xiàn)
[1] 韓霄漢,黃金娟,孫鋼,謝烽.基于采集大數(shù)據(jù)的拆表止度自動(dòng)復(fù)核模式探索[J].浙江電力,2016(35).
[2] 徐劍.大數(shù)據(jù)時(shí)代圖書(shū)選題信息的采集模式研究[D].安徽大學(xué),2015.