王平泉 逯小青
摘 要 大數(shù)據(jù)時代,谷歌利用人們在網(wǎng)上的幾十億條檢索記錄預(yù)測冬季流感的傳播,其預(yù)測結(jié)果與官方數(shù)據(jù)的相似性高達97%,更重要的是谷歌通過分析大數(shù)據(jù)預(yù)測要比官方給出的結(jié)果早2周,顯然,谷歌大數(shù)據(jù)預(yù)測更有效、更有價值。沃爾瑪由其購物清單的龐大的數(shù)據(jù)庫中發(fā)現(xiàn)颶風(fēng)用品和蛋撻的相關(guān)性,在季節(jié)性風(fēng)暴來臨時,把蛋撻放在靠近颶風(fēng)用品的位置,這一舉措極大地提高了兩者的銷量。而這依然是得益于沃爾瑪對于大數(shù)據(jù)的分析和處理。大數(shù)據(jù)帶來的巨大價值正漸漸被人們認知,為人們提供了一種全新的看待世界的角度。因此,我們研究面向大數(shù)據(jù)的信息系統(tǒng)服務(wù)建模與活動認知。
關(guān)鍵詞 大數(shù)據(jù) 信息系統(tǒng) 構(gòu)建
中圖分類號:TP393 文獻標識碼:A
互聯(lián)網(wǎng)時代,設(shè)備互連,資源共享,UGC帶來大數(shù)據(jù)。UGC是一種提倡個性化的使用互聯(lián)網(wǎng)的新方式,它允許用戶將自己原創(chuàng)的內(nèi)容通過互聯(lián)網(wǎng)平臺進行展示或者提供給其他用戶,比如人們可以通過YouTube 網(wǎng)站分享一段家里萌寵的可愛視頻,可以在博客上發(fā)表對于家庭生活,人際關(guān)系乃至國家大事的看法,可以在facebook上面發(fā)表時時刻刻的心情,與朋友保持互動等等。因此,除了傳統(tǒng)的信息系統(tǒng)提供的數(shù)據(jù),twitter、facebook、微博等信息社交網(wǎng)絡(luò)應(yīng)用的涌現(xiàn),海量用戶原創(chuàng)的內(nèi)容帶來了更大量的數(shù)據(jù);移動互聯(lián)網(wǎng)時代,隨著移動智能設(shè)備的普遍應(yīng)用,人們可以隨時隨地的進行信息傳遞和共享,用戶行為進一步帶來了大數(shù)據(jù)。當(dāng)前,智能終端(智能手機、PAD、平板電腦、MID等)已經(jīng)滲透到大眾的生活當(dāng)中,移動設(shè)備的普及正逐漸改變了人們的生活方式,激發(fā)出更多的移動互聯(lián)網(wǎng)用戶行為。人們更愿意讓移動設(shè)備參與日常生活,運用手機上的應(yīng)用和家人保持聯(lián)系,動動手指就可以上網(wǎng)購物,這些用戶行為產(chǎn)生的數(shù)據(jù)量將成幾何性的增長;物聯(lián)網(wǎng)時代,物理世界融入信息空間,十億計的設(shè)備和物理環(huán)境帶來的海量數(shù)據(jù)更是難以估量。物聯(lián)網(wǎng)技術(shù)使得普通物理對象進入了信息網(wǎng)絡(luò),從而無限的延伸了互聯(lián)網(wǎng)。在物聯(lián)網(wǎng)中,數(shù)十億的設(shè)備互通互聯(lián),產(chǎn)生數(shù)萬億的連接節(jié)點,物聯(lián)網(wǎng)與云化的數(shù)據(jù)中心無縫整合在一起,產(chǎn)生以指數(shù)速度飛速膨脹的數(shù)十萬億GB的海量數(shù)據(jù)。在物聯(lián)網(wǎng)中,由于更多的、混雜的以及關(guān)聯(lián)度低的信息抽象為各種具有實際應(yīng)用意義的用戶服務(wù),因此對信息系統(tǒng)的服務(wù)建模具有重要意義。
本文以物聯(lián)網(wǎng)領(lǐng)域的信息系統(tǒng)為對象,研究信息系統(tǒng)服務(wù)建模與活動認知。為了建立有效的信息系統(tǒng)服務(wù)模型,首先分析物聯(lián)網(wǎng)信息系統(tǒng)提供的服務(wù)。精準農(nóng)業(yè)應(yīng)用中,濕度傳感器采集土壤濕度,根據(jù)濕度值進行智能的灌溉;智能樓宇應(yīng)用中,溫度傳感器感知樓宇中的溫度,系統(tǒng)可以根據(jù)上報的溫度數(shù)據(jù)智能調(diào)整空調(diào)溫度;智能交通應(yīng)用中,各種傳感器感知路口各個方向的車流量,智能控制相關(guān)道路的信號燈,從而有效引導(dǎo)對應(yīng)區(qū)域的車流量。這類服務(wù),都是根據(jù)采集到的環(huán)境量,進行分析、整合并決策,然后通過調(diào)節(jié)相應(yīng)的控制器的操作來反作用于環(huán)境,從而提供智能服務(wù),這類服務(wù)我們歸結(jié)為應(yīng)用服務(wù)。環(huán)境監(jiān)測服務(wù),大量環(huán)境信息,例如各種空氣質(zhì)量參數(shù)、圖像以及視頻信息上傳至數(shù)據(jù)中心,便于用戶隨時獲取;供應(yīng)鏈管理服務(wù),物品的詳細信息以及流通中產(chǎn)生的大量數(shù)據(jù)存儲在云服務(wù)的數(shù)據(jù)中心,用戶根據(jù)每個物品的EPC(Electronic Product Code)碼,則可快速查詢物品的各種信息。這類服務(wù)主要為用戶提供各種數(shù)據(jù)查詢功能,我們稱之為數(shù)據(jù)服務(wù)。本課題主要針對這兩類服務(wù)展開研究。
信息系統(tǒng)既是大數(shù)據(jù)的重要信息來源,又是提供各種數(shù)據(jù)與應(yīng)用服務(wù)的核心。大數(shù)據(jù)的數(shù)據(jù)量大、數(shù)據(jù)類型多樣、價值密度低、處理速度快等特征也給構(gòu)建更為合理的信息服務(wù)系統(tǒng)帶來的多種挑戰(zhàn),針對兩類服務(wù)—應(yīng)用服務(wù)和數(shù)據(jù)服務(wù),從模型建立、服務(wù)相關(guān)性檢測、行為與活動認知、以及訪問控制四個角度對大數(shù)據(jù)背景下的信息系統(tǒng)服務(wù)進行研究,相應(yīng)的研究成果希望能夠通過模型化的形式更加精確的描述信息系統(tǒng)中的服務(wù),并使服務(wù)之間的冗余性、沖突性更低;對行為模式的學(xué)習(xí)與活動認知能夠幫助構(gòu)建更為合理的信息系統(tǒng)服務(wù)。各個異構(gòu)信息系統(tǒng)之間頻繁的信息交互、新興網(wǎng)絡(luò)的涌現(xiàn)對構(gòu)建數(shù)據(jù)中心的訪問控制戰(zhàn)略提出了更高的要求,這迫切要求我們建立適用于海量數(shù)據(jù)的安全的動態(tài)的數(shù)據(jù)服務(wù)訪問機制。由于海量數(shù)據(jù)帶來繁多細粒度的服務(wù)。服務(wù)內(nèi)部以及多個服務(wù)之間都會存在一定的關(guān)聯(lián)性,比如服務(wù)規(guī)則的冗余性、沖突性,因此還需要對服務(wù)的相關(guān)性進行研究。進而對海量感知和操作數(shù)據(jù)的行為模式與活動進行認知和學(xué)習(xí),從而便于生成和提供更加精準和人性化的服務(wù)。在數(shù)據(jù)建模的基礎(chǔ)上,對數(shù)據(jù)服務(wù)上下文進行梳理與研究,提取數(shù)據(jù)和用戶的可視性屬性,實現(xiàn)更為靈活、安全、高效、擴展性強的數(shù)據(jù)服務(wù)訪問。
參考文獻
[1] 汪圣利.大數(shù)據(jù)時代指揮信息系統(tǒng)發(fā)展分析[J].現(xiàn)代雷達.2013(05).
[2] 楊小牛,楊志邦,賴蘭劍.下一代信號情報偵察體系架構(gòu):大數(shù)據(jù)概念的應(yīng)用[J].中國電子科學(xué)研究院學(xué)報.2013(01).
[3] 張春磊,楊小牛.大數(shù)據(jù)分析(BDA)及其在情報領(lǐng)域的應(yīng)用[J].中國電子科學(xué)研究院學(xué)報,2013(01).
[4] 段松青,吳斌,于樂,王柏. PDM:基于Hadoop的并行數(shù)據(jù)分析系統(tǒng)[J].湖南大學(xué)學(xué)報(自然科學(xué)版),2012(10).