我們的城市變得越來越繁華,問題也越來越多,如交通擁堵、污染等。隨著傳感器技術(shù)的發(fā)展和大規(guī)模的計算環(huán)境的成熟,我們有了很多大數(shù)據(jù),如果使用得當?shù)脑捨覀兛梢岳么髷?shù)據(jù)解決大城市的問題。
城市里面有哪些大數(shù)據(jù)?有了高速公路與房子連續(xù)多年的數(shù)據(jù)累計,我們就會知道這個城市是朝哪個方向發(fā)展;有了北京市酒吧和電影院的數(shù)據(jù)(興趣點數(shù)據(jù)),我們就能知道城市里有哪些商業(yè)在衰亡,有哪些商業(yè)在發(fā)展,有哪些商業(yè)模式在變化;有了氣溫、氣壓、濕度,這些氣象數(shù)據(jù),我們就能知道空氣質(zhì)量的變化;有了出租車GPS的熱度數(shù)據(jù),我們就可以分析城市里人是怎樣移動的。
我們做了一個城市計算框架,它包括四個環(huán)節(jié),第一,城市感知;二,城市管理;三,城市數(shù)據(jù)的分析和挖掘;四,服務(wù)提供。這是一個多數(shù)據(jù)分析框架,它的數(shù)據(jù)種類非常多,任務(wù)也很多,可以是改進城市規(guī)劃,也可以緩解交通擁堵,在一個任務(wù)中我們要同時用到多個數(shù)據(jù),對數(shù)據(jù)要進行整合分析。
以空氣質(zhì)量分析為例?,F(xiàn)在很多城市都建了空氣質(zhì)量監(jiān)測站,每個小時發(fā)布一些數(shù)據(jù),告訴大家這個地方空氣質(zhì)量是多少。我們國家的站點數(shù)目有限,北京六環(huán)以內(nèi)22個站點已經(jīng)是全國最多了。一方面,站點成本昂貴。另一方面,城市里的空氣質(zhì)量是不均勻的,每個地方變化也是不一樣的。我們不能用一個平均讀數(shù)來代表整體,也不能通過簡單的差值來算出空氣質(zhì)量。
我們利用兩方面的大數(shù)據(jù)來解決這個問題。第一,歷史和實時的空氣質(zhì)量數(shù)據(jù),包括天氣、濕度、氣壓、氣溫等等。第二,交通流量數(shù)據(jù)。這里有多少公園,密度是多少,有多少紅綠燈,多少高速公路。結(jié)合這些數(shù)據(jù),我們就可以算出整個城市里面每個角落的空氣質(zhì)量。我們可以知道,什么時候該關(guān)開窗,什么時候該關(guān)窗,去哪里跑步,線路是什么樣的。也許有人會問這個準不準?我們在9個城市用我們的方法來預(yù)測該城市的空氣質(zhì)量,該城市的預(yù)測精確度提升了20%,環(huán)保部門對這個工作非常重視。
再來看另外一個例子。利用人們的興趣點數(shù)據(jù)來分析這個城市里面不同功能區(qū)域的分布和它的核心區(qū)域所在。開一個超市,我們要知道居民住宅區(qū)的居民,開電影院要知道周邊的分布。單單用一種數(shù)據(jù)是不能完全反應(yīng)地貌的。如兩個餐館在數(shù)據(jù)庫里都是表示是中餐館,但反應(yīng)的地域地貌是完全不一樣的。一個是住宅區(qū),一個是商業(yè)區(qū),它代表的意義是完全不同的。另外,人的移動性也反應(yīng)了區(qū)域的功能。利用興趣點數(shù)據(jù)我們能發(fā)現(xiàn)城市里的功能區(qū)在不斷的變化。
我們認為利用大數(shù)據(jù)進行城市計算前景廣闊,我們的目的是達到城市、人和環(huán)境三盈的局面。