國家發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,綱要的核心是數(shù)據(jù)開放、共享、安全。今天的演講圍繞數(shù)據(jù)資源的開發(fā)展開。
我們認(rèn)為,國民經(jīng)濟(jì)與社會(huì)的信息化從技術(shù)層面來講,實(shí)際上是一個(gè)生產(chǎn)數(shù)據(jù)的過程,這個(gè)過程使得我們各行各業(yè)、各領(lǐng)域現(xiàn)在都積累了非常多的數(shù)據(jù)。數(shù)據(jù)多了以后,實(shí)際上提升了整個(gè)人類的能力。例如,今天我們可以做全球氣候的變化研究,根據(jù)研究做出決策要進(jìn)行全球性的節(jié)能減排,來促進(jìn)人類的可持續(xù)發(fā)展。我們也可以看到,今天我們在很多領(lǐng)域有了進(jìn)展,比如精準(zhǔn)醫(yī)療、疾病早期的診斷和預(yù)防,以及公共醫(yī)療政策的發(fā)布等。當(dāng)前很多人都在討論智慧城市,實(shí)際上有后臺和智慧的引擎在支撐著每一個(gè)智慧的應(yīng)用,智慧引擎實(shí)際上就是一個(gè)大數(shù)據(jù)的平臺。
數(shù)據(jù)被大量的積累以后才形成了數(shù)據(jù)資源,今天我們可以看到,數(shù)據(jù)資源正在作為一種戰(zhàn)略資源,影響著從國家到企業(yè)到個(gè)人。
信息化戰(zhàn)略始于1995年十四屆五中全會(huì),大數(shù)據(jù)戰(zhàn)略是2015年十八屆五中全會(huì)提出的。信息化是生產(chǎn)數(shù)據(jù)的,大數(shù)據(jù)是開發(fā)數(shù)據(jù)的,這兩個(gè)在方向上是不一樣的。關(guān)于這兩個(gè)概念,我的觀點(diǎn)是“不混淆、不沖突”。
所謂不混淆就是不要把兩件事混在一起,一個(gè)是生產(chǎn)數(shù)據(jù),數(shù)據(jù)生產(chǎn)出來以后大量積累形成資源,資源的開發(fā)利用是另外一件事情;所謂不沖突是不要把兩個(gè)對立起來,不是我們今天講大數(shù)據(jù)就不講信息化,信息化還會(huì)快速持續(xù)地發(fā)展,但是大數(shù)據(jù)已經(jīng)從信息化范疇發(fā)展出一個(gè)新領(lǐng)域、新行業(yè)、新產(chǎn)業(yè)、新學(xué)科,正蓬勃興起。
大數(shù)據(jù)有很多的定義,我給過一個(gè)詳細(xì)的定義并系統(tǒng)地介紹了大數(shù)據(jù),有興趣的可以看我的文章《大數(shù)據(jù)是數(shù)據(jù)、技術(shù),還是應(yīng)用》。這里介紹有一個(gè)系統(tǒng)地關(guān)于大數(shù)據(jù)的定義,它涉及了數(shù)據(jù)、技術(shù)和應(yīng)用,三樣缺一不可。但是我們更希望講一個(gè)簡單的大數(shù)據(jù)概念,所謂簡單的大數(shù)據(jù)其實(shí)就是兩件事:第一件事你用數(shù)據(jù)解決問題,第二件是你解決數(shù)據(jù)的問題。解決數(shù)據(jù)的問題就是傳統(tǒng)的做IT的人,用各種方法、算法解決數(shù)據(jù)的問題。用數(shù)據(jù)解決問題就是用數(shù)據(jù)來解決各行各業(yè)各領(lǐng)域的問題。有三點(diǎn)建議:1)現(xiàn)在起學(xué)習(xí)用數(shù)據(jù)解決問題;2)現(xiàn)在起用別人的數(shù)據(jù)來一起解決問題;3)現(xiàn)在起用數(shù)據(jù)做更多的事情,這就屬于真正創(chuàng)新的領(lǐng)域。
我一直不喜歡用“大數(shù)據(jù)的產(chǎn)業(yè)”,而用“數(shù)據(jù)產(chǎn)業(yè)”,因?yàn)閿?shù)據(jù)產(chǎn)業(yè)和數(shù)據(jù)的大小沒有關(guān)系。數(shù)據(jù)產(chǎn)業(yè)有數(shù)據(jù)的技術(shù)和數(shù)據(jù)的應(yīng)用,數(shù)據(jù)的資源是可以交換的。數(shù)據(jù)技術(shù)有一系列的技術(shù)。數(shù)據(jù)的應(yīng)用滲透到了各行各業(yè)、各個(gè)領(lǐng)域和各個(gè)階段,包括個(gè)人、企業(yè)、政府。
雖然數(shù)據(jù)開放談了很多年,但數(shù)據(jù)開放共享是一件非常困難的事。因?yàn)閿?shù)據(jù)的資源性更加加大了開放、共享的難度,這是一個(gè)普遍的現(xiàn)象。開放、共享需要有一些政策和法律的支持,同時(shí)也要對應(yīng)著技術(shù)的支持。
我們看看數(shù)據(jù)的分類。第一是國家機(jī)密數(shù)據(jù),有一些數(shù)據(jù)涉及國家安全的,要保護(hù)起來,否則就泄露了國家的機(jī)密;第二政府開放給公眾的數(shù)據(jù);第三是純市場的數(shù)據(jù),可以自由交易流通;第四是企業(yè)機(jī)密數(shù)據(jù),企業(yè)做的一些保障自己權(quán)利的數(shù)據(jù)和內(nèi)容。這樣,數(shù)據(jù)交易應(yīng)該是交易市場化的數(shù)據(jù),數(shù)據(jù)的開放和共享是針對政府公共資源數(shù)據(jù)。所謂數(shù)據(jù)開放是要政府的數(shù)據(jù)逐步變到數(shù)據(jù)開放這個(gè)象限這邊。所謂數(shù)據(jù)交易完全是市場化的數(shù)據(jù)在市場上交易,國家要保護(hù)國家安全和個(gè)人機(jī)密。共享是在這之間,這個(gè)共享是從政府逐漸移到象限,包括政府內(nèi)部的一些共享,并不一定是全民的共享,后面是一些限制交易的東西。
數(shù)據(jù)開放有一些挑戰(zhàn),對政府來講,對數(shù)據(jù)的用途、特性,特別是可用的數(shù)據(jù),這個(gè)認(rèn)知是非常不足的。
我們講各個(gè)行業(yè)、各個(gè)領(lǐng)域有很多數(shù)據(jù),但是哪些數(shù)據(jù)是可用的,沒有人知道。有些數(shù)據(jù)是在信息系統(tǒng)里面也無法轉(zhuǎn)化出可用的數(shù)據(jù)。即使你覺得這個(gè)數(shù)據(jù)有用,如何讓外界看到你這個(gè)數(shù)據(jù),這個(gè)事情也非常難做到。這些需要一整套完整的體系去規(guī)范。
不過從目前的情況來看,數(shù)據(jù)的黑色產(chǎn)業(yè)發(fā)展的非常發(fā)達(dá),這個(gè)是令人擔(dān)心的事情。我也非常擔(dān)心,今天參加展覽的一些企業(yè)的數(shù)據(jù)來源是否合規(guī)、合法、合理。這是我們面臨的一個(gè)巨大的挑戰(zhàn)。
我們今天新的文明的建設(shè),可能來自于對網(wǎng)絡(luò)的依存,有這樣一些關(guān)于網(wǎng)絡(luò)的區(qū)域、部落正在建成。
今天我們講網(wǎng)絡(luò)已經(jīng)變成我們進(jìn)步和發(fā)展的必需條件,我們到哪里開會(huì)辦公都需要網(wǎng)絡(luò),如果提到哪里沒有網(wǎng)絡(luò),我們的第一反應(yīng)是非常落后,包括網(wǎng)絡(luò)數(shù)據(jù)的流向、流量等,這是我們講的綠色的文明。
在這樣的文明下,將來有數(shù)據(jù)國家形態(tài)的出現(xiàn),國家的邊界將發(fā)生變化,以及剛才講的國家數(shù)據(jù)的主權(quán)。當(dāng)然,大數(shù)據(jù)只是當(dāng)前的一種表現(xiàn)形式,而且是剛剛開始,剛剛處于起步的階段。