最新的圖靈獎(jiǎng)獲獎(jiǎng)人是Dr. Michael Stonebraker,數(shù)據(jù)庫領(lǐng)域非常著名的專家之一,這也證明了大數(shù)據(jù)技術(shù)對(duì)產(chǎn)業(yè)而言非常重要,而智慧城市作為大數(shù)據(jù)實(shí)踐很有代表性。
大數(shù)據(jù)
是智能城市發(fā)展的助推劑
很多人經(jīng)常把智慧城市理解為城市信息化,實(shí)際上,智慧城市的含義遠(yuǎn)不止于此。它應(yīng)該是一個(gè)復(fù)雜的信息生態(tài)系統(tǒng)。這個(gè)生態(tài)系統(tǒng)包括三個(gè)環(huán)節(jié),第一個(gè)環(huán)節(jié)就是感知,首先它能對(duì)大數(shù)據(jù)和城市信息進(jìn)行感知。第二個(gè)環(huán)節(jié)就是要有一個(gè)計(jì)算能力超強(qiáng)的數(shù)據(jù)中心,能把感知到的數(shù)據(jù)進(jìn)行處理。第三個(gè)環(huán)節(jié)往往是被忽略的,就是要有一個(gè)決策中心。我們現(xiàn)在在進(jìn)行城市信息化建設(shè)時(shí),往往是先定下來一個(gè)決策或規(guī)劃,然后再去實(shí)施,所有的系統(tǒng)是按照前期響應(yīng)的目標(biāo)逼近,這個(gè)思路是錯(cuò)的,這也是智慧城市要遠(yuǎn)遠(yuǎn)大于城市信息化的原因。決策應(yīng)該在后,就像人一樣,他首先要對(duì)周圍環(huán)境有一個(gè)感知,然后經(jīng)過大腦的處理,最后決定事情怎么做。所以我們現(xiàn)在的智慧城市或者智能城市,應(yīng)該按照和人較類似的思路去對(duì)它進(jìn)行管理和控制,這三個(gè)部分,特別是最后一個(gè)部分對(duì)于今后城市的管理是很有挑戰(zhàn)的事情。
以廣州外地車限行對(duì)策為例,2012年廣州就想解決擁堵問題,此前很多人認(rèn)為擁堵原因在于路上行駛的車輛很多并不是本地牌照,廣州希望效仿北京的做法,在入京之前辦理通行證,限制外地車輛在京的逗留時(shí)間,以此來緩解交通壓力。廣州有關(guān)部門通過大數(shù)據(jù)的分析得知外地車在廣州可分成四類,一類是本地化使用,譬如深圳的車牌在廣州使用;第二是候鳥型;第三是偶發(fā)過境;第四是常發(fā)過境。分類之后,人們發(fā)現(xiàn)真正對(duì)本地早晚交通造成擁堵的,實(shí)際上是第一類。外地車的本地化使用數(shù)量約4.7萬輛/月,只占所有外地車(約357萬輛/月)的1.31%,基本可忽略不計(jì)。實(shí)際上即使把這些外地車限制住了,高峰時(shí)間只能解決1.31%的擁堵,因此上述政策的實(shí)施與否對(duì)解決交通擁堵現(xiàn)象并沒有太大意義。這也體現(xiàn)了大數(shù)據(jù)在做決策上的重要作用。
傳感器網(wǎng)絡(luò)
是智能城市的基礎(chǔ)
在整個(gè)智慧城市的生態(tài)鏈里,城市大數(shù)據(jù)傳感網(wǎng)絡(luò)和大數(shù)據(jù)中心是基礎(chǔ)。在這個(gè)系統(tǒng)里最主要的就是把數(shù)據(jù)實(shí)時(shí)、全方位地搜集,隨時(shí)隨地地感知,然后輸送到數(shù)據(jù)中心處理。
目前的智慧城市,其網(wǎng)絡(luò)都是碎片式的,沒有完全連起來,這是有問題的。所以一個(gè)比較理想的感知網(wǎng)它應(yīng)包括剛才說的所有的數(shù)據(jù)和網(wǎng)絡(luò),這其中每個(gè)單獨(dú)的信息都應(yīng)實(shí)時(shí)匯聚到數(shù)據(jù)中心,真正形成一個(gè)網(wǎng)絡(luò)。
現(xiàn)在很多網(wǎng)絡(luò)大部分都是單獨(dú)存在的,最終要全連接起來需要不小的投入。譬如在感知網(wǎng)絡(luò)里,大家很容易想到交通系統(tǒng)里的一卡通以及各種交通工具的運(yùn)行情況,把它們?nèi)糠诺匠鞘械臄?shù)據(jù)中心里?,F(xiàn)實(shí)中經(jīng)常出現(xiàn)一些套牌車的事情,中途一旦換掉了車牌,基本上目標(biāo)就丟掉了。但是,如果用剛才所說的感知系統(tǒng),我們就有辦法不僅感知車牌,而且感知車型等。
交通狀況的感知現(xiàn)在已經(jīng)深入到每一個(gè)人的生活當(dāng)中了,如果我們想查查是否堵車,哪條路堵車,馬上打開導(dǎo)航,打開GPS,打開相關(guān)地圖軟件就能看到。這些信息都是從后臺(tái)統(tǒng)計(jì)而來的,后臺(tái)把包括出租車在內(nèi)的一些GPS信息或者個(gè)人的GPS信息,做一個(gè)數(shù)據(jù)統(tǒng)計(jì)分析,查看在某個(gè)區(qū)段,這些移動(dòng)的物體的平均速度是多少,進(jìn)而把整個(gè)交通狀況統(tǒng)計(jì)出來,有了這些我們對(duì)整個(gè)交通狀況就很容易感知。據(jù)統(tǒng)計(jì)分析,在所有的感知系統(tǒng)里,最大量的數(shù)據(jù)就是視頻數(shù)據(jù)。但這些數(shù)據(jù)現(xiàn)在都還沒有很好地利用起來。如果今后能加入攝像頭的監(jiān)控統(tǒng)計(jì),以及地下的傳感器數(shù)據(jù),把這些數(shù)據(jù)都加在一起做更準(zhǔn)確的分析。
另外,城市里總有各種各樣的流行病的產(chǎn)生,流行病發(fā)展到什么程度,都是通過新聞里知道,但是現(xiàn)在通過醫(yī)保的統(tǒng)計(jì)可以分析這些情況。
污染是我們當(dāng)前面臨的一個(gè)很大的問題,現(xiàn)在大家得知污染的情況更多的是從空氣指數(shù),或從網(wǎng)站和手機(jī)軟件上看到的,但是信息量太小。現(xiàn)在通過大數(shù)據(jù),把個(gè)人發(fā)動(dòng)起來,在每個(gè)人家里裝一些檢測(cè)設(shè)備,讓可信的數(shù)據(jù)入網(wǎng),通過采集的大數(shù)據(jù)準(zhǔn)確定位污染源。
因此怎么樣把這個(gè)傳感器網(wǎng)絡(luò)真正建好,確是一個(gè)很大的挑戰(zhàn)。
大數(shù)據(jù)中心形成決策依據(jù)
當(dāng)我們從感知網(wǎng)絡(luò)獲得了大量數(shù)據(jù),就應(yīng)當(dāng)送到數(shù)據(jù)中心,這一過程并不難,但是到中心的數(shù)據(jù)怎樣形成決策,也就是怎樣把海量數(shù)據(jù)變成大數(shù)據(jù),只有經(jīng)過整理可以使用的大規(guī)模的數(shù)據(jù)才能叫做大數(shù)據(jù),否則只是海量數(shù)據(jù),只是一個(gè)簡單的堆積。從技術(shù)上看,就是要過“三關(guān)”。
存儲(chǔ) ?現(xiàn)在的存儲(chǔ)系統(tǒng)還不能做到把所有數(shù)據(jù)存儲(chǔ)下來,譬如現(xiàn)在大多數(shù)像智慧城市里的系統(tǒng),都不敢存太多監(jiān)控視頻的數(shù)據(jù),最大的系統(tǒng)大概也就存三個(gè)月就會(huì)被覆蓋。怎么樣讓數(shù)據(jù)能夠保存下來,這是一個(gè)技術(shù)挑戰(zhàn),要么把數(shù)據(jù)文件壓縮到很小,要么把沒有用的數(shù)據(jù)丟棄。怎么樣壓的更小,就是做視頻編碼或者視頻壓縮,現(xiàn)在經(jīng)過30年的攻關(guān),現(xiàn)在技術(shù)上應(yīng)該說已經(jīng)做到每10年翻一番。從壓縮效率來看,每一代是前一代一倍,高清視頻第一代壓到150分之一,到第三代已經(jīng)做到300分之一,我們希望第四代壓到600分之一。這些技術(shù)還在進(jìn)展,也確有做的不錯(cuò)的。比如說在AVS這個(gè)領(lǐng)域,視頻編碼里我們?cè)诒O(jiān)控視頻已經(jīng)比國外同樣水平效率更高一倍。HEVC就是第三代編碼技術(shù),在極端的情況下,或比較苛刻的情況下,使壓縮效率提升40%,在寬松的情況下基本上就是兩倍了。
表達(dá) ?存儲(chǔ)的數(shù)據(jù)要進(jìn)行特征的抽取、比對(duì)和分析,就需要表達(dá)。特征的提取也是很關(guān)鍵的,比如機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘,其實(shí)這些算法最后效率的高與低都取決于表達(dá)能力強(qiáng)與弱?,F(xiàn)在對(duì)于汽車的表達(dá),已經(jīng)有一些很好的技術(shù),譬如一些加強(qiáng)的SIFT特征的技術(shù),可以把車牌和車型組合到一起進(jìn)行表達(dá),當(dāng)出現(xiàn)車牌被換或者套牌車等,用這個(gè)技術(shù)表達(dá)一下就能識(shí)別,通過這種辦法也可以在更高層面進(jìn)行壓縮。有了高效的存儲(chǔ)和表達(dá),就可以做非??焖俚臋z索或搜索。
計(jì)算 ?此外,最頂層我們就要進(jìn)行場(chǎng)景的分析,最后形成決策的輔助,這就是大數(shù)據(jù)的處理,這個(gè)處理最核心的就是數(shù)據(jù)的關(guān)聯(lián)。因?yàn)閭鞲衅鞯臄?shù)據(jù)來自不同的攝像頭、不同的地點(diǎn),怎么樣把時(shí)間、空間都關(guān)聯(lián)到一個(gè)空間上,這是非常難但是卻很重要的問題。譬如通過這種關(guān)聯(lián)我們可以進(jìn)行分析跟蹤的技術(shù),另外就是對(duì)多個(gè)攝像機(jī)進(jìn)行對(duì)像的標(biāo)識(shí)。
總而言之,整個(gè)智慧城市的生態(tài)鏈有三個(gè)比較重要的部分:傳感系統(tǒng)、大數(shù)據(jù)中心以及決策的環(huán)節(jié)。最后也是最關(guān)鍵的環(huán)節(jié)是決策形成的流程,它已經(jīng)超出了技術(shù)范疇,而是管理范疇,必須要由政策的制定者基于大數(shù)據(jù)形成決策,并進(jìn)行落實(shí),這是一個(gè)很大的挑戰(zhàn),但我們做大數(shù)據(jù)的人要經(jīng)常向管理者灌輸這個(gè)理念,使他們對(duì)第三環(huán)節(jié)更重視,讓大數(shù)據(jù)真正體現(xiàn)它的好處。
(以上內(nèi)容系根據(jù)高文院士在“2015第七屆云計(jì)算大會(huì)”上的演講整理而成)