国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字城市關(guān)鍵技術(shù)研究

2012-04-29 00:44王建虎吳昊
科技資訊 2012年17期
關(guān)鍵詞:數(shù)據(jù)倉庫數(shù)據(jù)處理數(shù)據(jù)挖掘

王建虎 吳昊

摘 要:本文基于筆者多年從事數(shù)字城市理論的相關(guān)研究,以數(shù)字城市中涉及的關(guān)鍵技術(shù)為研究對(duì)象,論文探討了元數(shù)據(jù)與海量數(shù)據(jù)處理、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘、數(shù)據(jù)融合與虛擬現(xiàn)實(shí)、互操作與超鏈接等現(xiàn)代信息技術(shù)四項(xiàng)關(guān)鍵技術(shù),全文是筆者長期研究基礎(chǔ)上的理論心得,相信對(duì)從事相關(guān)工作的同行能有所裨益。

關(guān)鍵詞:數(shù)字城市關(guān)鍵技術(shù)元數(shù)據(jù)數(shù)據(jù)融合

中圖分類號(hào):P2 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2012)06(b)-0010-02

從廣義上講,“數(shù)字城市”是指信息化的城市,它與城市國民經(jīng)濟(jì)和社會(huì)信息化的概念是一致的。所謂“數(shù)字城市”或城市的信息化是指在城市的生產(chǎn)、生活等活動(dòng)中,利用數(shù)字技術(shù)、信息技術(shù)和網(wǎng)絡(luò)技術(shù),將城市的人口、資源、環(huán)境、經(jīng)濟(jì)、社會(huì)等要素?cái)?shù)字化、網(wǎng)絡(luò)化、智能化和可視化的全部過程?!皵?shù)字城市”或城市信息化的本質(zhì)是要將數(shù)字技術(shù)、信息技術(shù)和網(wǎng)絡(luò)技術(shù)滲透到城市生產(chǎn)、生活的各個(gè)方面,通過運(yùn)用這些技術(shù)手段,把城市的各類信息資源整合起來,再根據(jù)對(duì)這些信息處理、分析和預(yù)測(cè)的結(jié)果來管理城市,以促進(jìn)城市的人流、物流、資金流和信息流的通暢和高效運(yùn)轉(zhuǎn)。

1元數(shù)據(jù)與海量數(shù)據(jù)處理

建立元數(shù)據(jù)的主要任務(wù)是制定元數(shù)據(jù)標(biāo)準(zhǔn)、開發(fā)元數(shù)據(jù)的操作工具和建設(shè)元數(shù)據(jù)庫。制定元數(shù)據(jù)標(biāo)準(zhǔn)其內(nèi)容應(yīng)包括以下部分:主題內(nèi)容與適用范圍、參考標(biāo)準(zhǔn)、術(shù)語、元數(shù)據(jù)層次結(jié)構(gòu)、元數(shù)據(jù)分級(jí)、元數(shù)據(jù)內(nèi)容和元數(shù)據(jù)擴(kuò)展原則與方法。開發(fā)元數(shù)據(jù)的操作工具是編寫一系列軟件,這些軟件須具備元數(shù)據(jù)的輸入、編輯、查詢、檢索和顯示等功能。建設(shè)元數(shù)據(jù)庫要依據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)來收集、整理元數(shù)據(jù),并利用元數(shù)據(jù)的操作工具將數(shù)據(jù)錄入建庫。元數(shù)據(jù)對(duì)數(shù)據(jù)的生產(chǎn)者、管理者和使用者都十分有用,它是溝通上述三者之間的橋梁,在實(shí)現(xiàn)“數(shù)字城市”的信息共享中占有重要地位。

“數(shù)字城市”涉及的數(shù)據(jù)巨大而浩瀚,它不僅有空間數(shù)據(jù),而且有非空間數(shù)據(jù),這些數(shù)據(jù)來源廣泛、種類繁多、形式各異、結(jié)構(gòu)復(fù)雜并且數(shù)量十分龐大,其數(shù)據(jù)量至少要以Tb級(jí)來計(jì)算,因此,人們把如此大量的數(shù)據(jù)比喻作海量數(shù)據(jù)。海量數(shù)據(jù)處理技術(shù)是對(duì)海量數(shù)據(jù)進(jìn)行快速、高效地存取、運(yùn)算和傳輸?shù)募夹g(shù),它是實(shí)現(xiàn)“數(shù)字城市”的重要基礎(chǔ),也是支撐“數(shù)字城市”的關(guān)鍵技術(shù)之一。近年來該項(xiàng)技術(shù)的研究與開發(fā)已取得了較大的進(jìn)展。目前,直接針對(duì)海量數(shù)據(jù)處理的技術(shù)解決方案有兩種:一種是硬件的解決方案,它是采用高性能的并行計(jì)算機(jī),通過多個(gè)CPU的并行計(jì)算來提高數(shù)據(jù)處理的速度。另一種是軟件的解決方案,它是采用基于小波變換的算法,通過對(duì)數(shù)據(jù)的高效壓縮與解壓來提高數(shù)據(jù)處理的效能。此外,針對(duì)海量數(shù)據(jù)處理的輔助技術(shù)解決方案也有兩種:一種是數(shù)據(jù)組織的解決方案,它是采用分布式存儲(chǔ)管理,通過將集中式數(shù)據(jù)存取化為分散式數(shù)據(jù)存取來提高數(shù)據(jù)存取的效率;另一種是通訊網(wǎng)絡(luò)的解決方案,它是采用超高速光纖網(wǎng),通過大幅度增加通信信道的帶寬來提高數(shù)據(jù)傳輸?shù)乃俾?。上述海量?shù)據(jù)處理的各種技術(shù)解決方案,僅單一地運(yùn)用其作用是有限的,必須綜合起來運(yùn)用才能發(fā)揮最佳的效果。

2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

數(shù)據(jù)倉庫的主要任務(wù)是:將分布在不同地點(diǎn)、不同單位的數(shù)據(jù)庫中的內(nèi)容不同、類型不同、結(jié)構(gòu)不同、格式不同的原始數(shù)據(jù),首先進(jìn)行標(biāo)準(zhǔn)化、過濾與匹配、凈化、標(biāo)明時(shí)間和確認(rèn)數(shù)據(jù)質(zhì)量的處理;然后根據(jù)任務(wù)的需要,再對(duì)這些數(shù)據(jù)進(jìn)行集成與分割、概括與聚集、預(yù)測(cè)與推導(dǎo)、翻譯與格式化、轉(zhuǎn)換與再影像的處理;最后進(jìn)行數(shù)據(jù)倉庫的建模、數(shù)據(jù)的概括、數(shù)據(jù)的聚集、數(shù)據(jù)的調(diào)整與確認(rèn)、建立結(jié)構(gòu)化查詢和創(chuàng)建詞匯表。數(shù)據(jù)倉庫對(duì)于“數(shù)字城市”的建設(shè)具有十分重要的支撐作用,因?yàn)樗恰皵?shù)字城市”整合信息資源的重要載體,也是“數(shù)字城市”實(shí)現(xiàn)信息共享的基礎(chǔ)平臺(tái)。

數(shù)據(jù)挖掘有三大技術(shù)支柱,它們分別是數(shù)據(jù)庫技術(shù)、人工智能技術(shù)和概率與數(shù)理統(tǒng)計(jì)學(xué)。數(shù)據(jù)庫技術(shù)是支撐數(shù)據(jù)挖掘的基礎(chǔ),它通過對(duì)數(shù)據(jù)的存儲(chǔ)與管理為數(shù)據(jù)挖掘提供數(shù)據(jù)源。目前數(shù)據(jù)庫技術(shù)正由傳統(tǒng)的數(shù)據(jù)庫向數(shù)據(jù)倉庫發(fā)展,而數(shù)據(jù)倉庫則把數(shù)據(jù)挖掘作為其數(shù)據(jù)處理的重要功能,這兩者的結(jié)合既給數(shù)據(jù)挖掘帶來了便利,又使數(shù)據(jù)倉庫的決策支持能力得到了增強(qiáng)。人工智能技術(shù)是支撐數(shù)據(jù)挖掘的核心,它為數(shù)據(jù)挖掘的知識(shí)發(fā)現(xiàn)提供模擬機(jī)理。概率與數(shù)理統(tǒng)計(jì)學(xué)是支撐數(shù)據(jù)挖掘的算法,它為數(shù)據(jù)挖掘的分析預(yù)測(cè)提供數(shù)學(xué)方法。數(shù)據(jù)挖掘的知識(shí)發(fā)現(xiàn)大致可分為:關(guān)系發(fā)現(xiàn)、模式發(fā)現(xiàn)和趨勢(shì)發(fā)現(xiàn)。數(shù)據(jù)挖掘能發(fā)現(xiàn)的知識(shí)有以下幾種:廣義型知識(shí)、特征型知識(shí)、差異型知識(shí)、關(guān)聯(lián)型知識(shí)、預(yù)測(cè)型知識(shí)和偏離型知識(shí)。

數(shù)據(jù)挖掘如何從大量的數(shù)據(jù)中來挖掘知識(shí),其根本的途徑就是建模。建模實(shí)際上是根據(jù)已知的情況經(jīng)抽象建立其數(shù)學(xué)模型,并將該模型應(yīng)用于對(duì)未知情況的求解。數(shù)據(jù)挖掘的應(yīng)用一般須經(jīng)歷確定數(shù)據(jù)挖掘?qū)ο?、?zhǔn)備數(shù)據(jù)、建立模型、數(shù)據(jù)挖掘、結(jié)果分析和知識(shí)應(yīng)用這樣幾個(gè)階段,這些階段在具體實(shí)施時(shí)可能要反復(fù)多次,并需要業(yè)務(wù)人員和管理人員的相互配合。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的。它把人們對(duì)數(shù)據(jù)的應(yīng)用從簡(jiǎn)單的統(tǒng)計(jì)分析,擴(kuò)展到微觀、中觀乃至宏觀的預(yù)測(cè)分析;從低層次的信息查詢,提升到高層次的知識(shí)發(fā)現(xiàn);從而使數(shù)據(jù)挖掘具備了決策支持的能力。

3數(shù)據(jù)融合與虛擬現(xiàn)實(shí)

GIS的空間數(shù)據(jù)是多種數(shù)據(jù)的重要體現(xiàn),其按數(shù)據(jù)結(jié)構(gòu)可分為柵格數(shù)據(jù)和矢量數(shù)據(jù),按表現(xiàn)形式可分為數(shù)字高程模型(DEM)、數(shù)字正射影像圖(DOM)、數(shù)字柵格地圖(DRG)和數(shù)字線劃地圖(DLG)。GIS空間數(shù)據(jù)融合的主要內(nèi)容有柵格數(shù)據(jù)之間的融合、柵格數(shù)據(jù)與矢量數(shù)據(jù)之間的融合和矢量數(shù)據(jù)之間的融合。柵格數(shù)據(jù)之間的融合是指遙感影像之間的復(fù)合,這一技術(shù)已經(jīng)成熟,應(yīng)用也較普遍。柵格數(shù)據(jù)與矢量數(shù)據(jù)之間的融合是指遙感影像圖與數(shù)字線劃圖的疊加,這種融合相對(duì)簡(jiǎn)單,常用的GIS軟件都能實(shí)現(xiàn)。矢量數(shù)據(jù)之間的融合是指數(shù)字線劃圖之間的融合,這種融合對(duì)多種矢量數(shù)據(jù)的融合來說比較復(fù)雜。因?yàn)樗粌H要融合其中的圖形數(shù)據(jù)和屬性數(shù)據(jù),而且要融合圖形數(shù)據(jù)各元素之間的拓?fù)潢P(guān)系,此外還要融合圖形數(shù)據(jù)與屬性數(shù)據(jù)之間的鏈接關(guān)系,這是全世界都在進(jìn)行攻關(guān)的難題。

虛擬現(xiàn)實(shí)系統(tǒng)主要由顯示子系統(tǒng)、檢測(cè)子系統(tǒng)和模擬子系統(tǒng)三大部分組成。顯示子系統(tǒng)也叫輸出裝置,它的功能是進(jìn)行感覺信息的合成,以滿足身臨其境的要求。檢測(cè)子系統(tǒng)也叫輸入裝置,它的功能是把操作信息傳遞給電腦,以滿足交互作用的要求。模擬子系統(tǒng)是虛擬現(xiàn)實(shí)系統(tǒng)的核心部分,它的功能是實(shí)現(xiàn)虛擬環(huán)境的描述和構(gòu)筑,以滿足仿真客觀世界的要求。虛擬現(xiàn)實(shí)系統(tǒng)的技術(shù)基礎(chǔ)是高級(jí)三維圖形技術(shù)、問題求解工具、多媒體、網(wǎng)絡(luò)通訊、數(shù)據(jù)庫、信息系統(tǒng)、專家系統(tǒng)和面向?qū)ο蟮闹悄軟Q策支持系統(tǒng)等技術(shù)的集成。虛擬現(xiàn)實(shí)系統(tǒng)有三種應(yīng)用類型:一種是視頻映射系統(tǒng)。它是指使用常規(guī)計(jì)算機(jī)的顯示器來表達(dá)虛擬世界的應(yīng)用技術(shù)系統(tǒng)。另一種是沉浸式系統(tǒng)。它是指運(yùn)用頭盔式、手套式、盔甲式的傳感器及顯示器,使人的視覺、聽覺和觸覺沉浸在虛擬世界中的應(yīng)用技術(shù)系統(tǒng)。還有一種是分布式虛擬系統(tǒng)。它是指利用互聯(lián)網(wǎng)技術(shù)將存放在不同地點(diǎn)、不同單位分布式數(shù)據(jù)庫中的數(shù)據(jù)加以集成,再經(jīng)過虛擬現(xiàn)實(shí)技術(shù)的加工處理與顯示,然后通過遙測(cè)、遙控技術(shù)把用戶的感覺與真實(shí)世界結(jié)合在一起。

4互操作與超鏈接

互操作是信息共享和系統(tǒng)集成的基礎(chǔ),它是指異構(gòu)環(huán)境下兩個(gè)或兩個(gè)以上的實(shí)體,盡管它們實(shí)現(xiàn)的語言、基于的模型和執(zhí)行的環(huán)境不同,但它們都可以相互通訊和協(xié)調(diào)運(yùn)行,以完成某一特定的任務(wù)。這些實(shí)體包括應(yīng)用程序、處理對(duì)象和系統(tǒng)運(yùn)行環(huán)境等?;ゲ僮魇且粋€(gè)比較復(fù)雜的問題,它既需要基礎(chǔ)理論的研究與核心技術(shù)的開發(fā),又需要各個(gè)組織機(jī)構(gòu)之間的協(xié)調(diào)與配合?;ゲ僮鲗?duì)軟件業(yè)來說意味著界面的開放,它要求軟件的生產(chǎn)者開放其數(shù)據(jù)的內(nèi)部結(jié)構(gòu),以便系統(tǒng)的建設(shè)者能夠開發(fā)用于互操作的接口。在地理信息系統(tǒng)領(lǐng)域,OpenGIS的規(guī)范是開放界面的重要進(jìn)展?;ゲ僮鲗?duì)用戶來說意味著在各系統(tǒng)之間可自由地交換數(shù)據(jù),并能協(xié)調(diào)地進(jìn)行數(shù)據(jù)處理。互操作的技術(shù)問題可以從網(wǎng)絡(luò)鏈接、數(shù)據(jù)模型和應(yīng)用程序三個(gè)方面來說明。網(wǎng)絡(luò)鏈接涉及到傳輸介質(zhì)、交換設(shè)備和通訊協(xié)議,它的互操作須解決各通訊協(xié)議之間的接口問題。數(shù)據(jù)模型既有同構(gòu)數(shù)據(jù)又有異構(gòu)數(shù)據(jù),它的互操作須解決異構(gòu)數(shù)據(jù)之間的轉(zhuǎn)換問題。各系統(tǒng)的應(yīng)用程序是多種多樣的,它的互操作須解決在網(wǎng)絡(luò)環(huán)境下各應(yīng)用程序協(xié)調(diào)進(jìn)行數(shù)據(jù)處理的問題。互操作在“數(shù)字城市”的建設(shè)中占有顯著地位,它是“數(shù)字城市”實(shí)現(xiàn)信息共享和系統(tǒng)集成的重要技術(shù)途徑。

超鏈接起源于萬維網(wǎng),它是萬維網(wǎng)的精華和魅力所在。因特網(wǎng)的普及得益于萬維網(wǎng)的超鏈接技術(shù),它將世界各地的網(wǎng)站通過IP地址超鏈接起來,建立了分布在不同地點(diǎn)各網(wǎng)站之間的聯(lián)系,把本來處于孤立狀態(tài)的大量信息點(diǎn)組成一個(gè)有機(jī)的整體,使人們?cè)谌魏螘r(shí)間、任何地點(diǎn)都能共享網(wǎng)站上的信息資源。超鏈接的概念是定義一個(gè)定位點(diǎn),它指明了一個(gè)網(wǎng)頁的確定位置,便于超鏈接跳轉(zhuǎn)時(shí)的定位。超連接就象一個(gè)信息向?qū)?它帶領(lǐng)訪問者在萬維網(wǎng)里瀏覽用戶所需要的信息。萬維網(wǎng)能夠超鏈接的是超文本信息。未來的“數(shù)字城市”將擁有龐大的信息資源,它也需要超鏈接技術(shù)將這些資源聯(lián)系起來。從硬件技術(shù)和網(wǎng)絡(luò)協(xié)議上來說,超文本鏈接的問題已經(jīng)解決,但是“數(shù)字城市”涉及的信息種類繁多,結(jié)構(gòu)復(fù)雜、環(huán)境各異,特別是地理空間信息,它的超鏈接遠(yuǎn)沒有超文本鏈接那么簡(jiǎn)單,還需技術(shù)人員對(duì)現(xiàn)有的超鏈接技術(shù)作進(jìn)一步地開發(fā),以便用戶能利用新的超鏈接功能在“數(shù)字城市”的信息海洋中盡情遨游。如此看來,超鏈接是人們對(duì)“數(shù)字城市”進(jìn)行信息瀏覽的重要技術(shù)支撐。

5結(jié)語

綜上所述,元數(shù)據(jù)與海量數(shù)據(jù)處理、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘、數(shù)據(jù)融合與虛擬現(xiàn)實(shí)、互操作與超鏈接等現(xiàn)代信息技術(shù)都是支撐“數(shù)字城市”的關(guān)鍵技術(shù),它們對(duì)于“數(shù)字城市”的實(shí)現(xiàn)均具有重要作用。在建設(shè)“數(shù)字上海”的過程中,如何根據(jù)本市信息化的現(xiàn)狀和目標(biāo),將這些關(guān)鍵技術(shù)進(jìn)行集成并加以有效應(yīng)用則是一項(xiàng)極具挑戰(zhàn)性的工作。

參考文獻(xiàn)

[1] 武漢市委研究室課題組.關(guān)于構(gòu)建武漢“數(shù)字城市”的思路與對(duì)策[J].學(xué)習(xí)與實(shí)踐,2001(5).

[2] 鄭劍宇.數(shù)字城市與數(shù)據(jù)倉庫[J].上海城市管理職業(yè)技術(shù)學(xué)院學(xué)報(bào),2005(4).

猜你喜歡
數(shù)據(jù)倉庫數(shù)據(jù)處理數(shù)據(jù)挖掘
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計(jì)
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于希爾伯特- 黃變換的去噪法在外測(cè)數(shù)據(jù)處理中的應(yīng)用
基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實(shí)踐