宗河
美國NASA如何能提前預(yù)知各種天文奇觀?風(fēng)力發(fā)電機和創(chuàng)業(yè)者開店如何選址?如何才能準(zhǔn)確預(yù)測并對氣象災(zāi)害進行預(yù)警?包括在未來的城鎮(zhèn)化建設(shè)過程中,如何打造智能城市等等。這一系列問題的背后,其實都隱藏著大數(shù)據(jù)的身影,不僅彰顯著大數(shù)據(jù)的巨大價值,更直觀地體現(xiàn)出大數(shù)據(jù)在各個行業(yè)的廣闊應(yīng)用。這些行業(yè)應(yīng)用也都更直白地告訴人們,什么是大數(shù)據(jù)。
這些現(xiàn)象其實都在說明一個問題:如果你對這些現(xiàn)象感到驚訝,那么你落伍了;如果你對這些現(xiàn)象感到興奮,那么你看完本文一定大有收獲。不過在展開之前,我們首先知道什么是大數(shù)據(jù)。
根據(jù)研究機構(gòu)Gartner的定義,大數(shù)據(jù)是指需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。從數(shù)據(jù)的類別上看,“大數(shù)據(jù)”指的是無法使用傳統(tǒng)流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集。
通俗地講,大數(shù)據(jù)具有4V特點:Volume(數(shù)據(jù)量大)、Velocity(實時性強)、Variety(種類多樣)、Veracity(真實性)。更為重要的是,大數(shù)據(jù)還具有Value(價值)的特點。我們選取幾個最具代表性的故事來說明大數(shù)據(jù)。
第1、草船借箭:大數(shù)據(jù)讓你“神機妙算”
情節(jié)概覽:草船借箭,想必讀過書的人都知道這一歷史典故。它發(fā)生在三國時期,由于周瑜長期以來“羨慕嫉妒”諸葛亮的才干,故意刁難并要求諸葛亮在十天內(nèi)趕造十萬支箭。然而,諸葛亮卻表示不需要十天的時間,并以下軍令狀的勇氣和自信,承諾在三天內(nèi)就能提供這十萬支箭。后來,當(dāng)然如諸葛亮所料,輕輕松松地利用“草船”“借”到了曹軍的十萬多支箭。
總結(jié)分析:“草船借箭”體現(xiàn)的是三國時代背景下,諸葛亮的足智多謀。但換在現(xiàn)在來看,“草船借箭”能夠付諸實施,很大程度上得益于孔明對氣象的準(zhǔn)確觀察和預(yù)測,這種觀察預(yù)測和當(dāng)今的天氣預(yù)報本質(zhì)上是一回事,只不過孔明加入了對當(dāng)時所處形勢的預(yù)判。
“草船借箭”和大數(shù)據(jù)有什么關(guān)系呢?對天象的觀察是基于一種對風(fēng)、云、溫度、濕度、光照和所處節(jié)氣的綜合分析。這些數(shù)據(jù)來源于多元化的“非結(jié)構(gòu)”類型,并且數(shù)據(jù)量較大,只不過這些數(shù)據(jù)輸入到的不是電腦,而是人腦并最終通過計算分析得出結(jié)論。需要注意的是,單純的概率統(tǒng)計和數(shù)據(jù)分析,失去眾多非結(jié)構(gòu)類型數(shù)據(jù)支撐的分析、結(jié)論都不是“大數(shù)據(jù)”。
當(dāng)然,“草船借箭”只能算是大數(shù)據(jù)的雛形,并不能和當(dāng)今真正意義上的“大數(shù)據(jù)”相比,但筆者希望通過這種人盡皆知的歷史典故,揭開對“大數(shù)據(jù)”的更直觀、更深刻認識。
第2、智慧城市:智能交通視頻監(jiān)控
情節(jié)概覽:每次出門,是否總擔(dān)心路上遇到交通擁堵?每次行車,是否總害怕前方遇上交通事故?這些問題,恐怕當(dāng)今社會每個人都曾遭遇過。通過現(xiàn)有的IT技術(shù)在大數(shù)據(jù)時代背景下,完全可以打造一座智慧之城。
筆者曾在南京深刻感受到智慧城市視頻監(jiān)控系統(tǒng)給整個城市帶來的變革?;趶姶蟮脑破脚_運行智慧交通云系統(tǒng)、云視頻監(jiān)控和智能分析應(yīng)用,實時采集和處理南京1000個攝像頭、每天數(shù)百TB的海量交通數(shù)據(jù),并對整個南京140萬機動車規(guī)模的交通數(shù)據(jù)進行實時查詢和分析。
除此之外,云計算平臺還可以跟蹤車輛的行車記錄、統(tǒng)計分析交通擁堵路段。以往需要人工參與并監(jiān)控的交通擁堵和車禍等信息,現(xiàn)在完全可以交由該平臺進行處理,主動分析攝像頭搜集的各個路段信息,并分析視頻、主動報警、主動通知用戶。
總結(jié)分析:智慧城市,很大程度上就蘊含了交通作為城市動脈的數(shù)據(jù)流。通過視頻監(jiān)控,采集各個道路視頻攝像頭信息,并對比歷史記錄和實時車流、人流進行分析,可以計算和預(yù)測該路段當(dāng)前、未來的交通情況,也可以動態(tài)調(diào)整交通狀況并實時預(yù)警。其數(shù)據(jù)量之大、結(jié)構(gòu)類型之多、實時性之高,足以體現(xiàn)大數(shù)據(jù)在智慧城市的應(yīng)用前景和價值所在。
第3、生態(tài)中國:讓大數(shù)據(jù)、云計算監(jiān)測預(yù)警環(huán)保
情節(jié)概覽:中國是一個人口大國,同時也是一個能源大國。其中,山西省更是以盛產(chǎn)煤炭資源而著稱的能源大省。在過去的現(xiàn)代化建設(shè)中,在開采礦產(chǎn)和煤炭資源過程中,出現(xiàn)了很多破壞生態(tài)環(huán)境的做法。
然而,得益于物聯(lián)網(wǎng)技術(shù)和IT技術(shù)的突破性發(fā)展,近年來,在開采礦產(chǎn)資源過程中破壞生態(tài)植被、出現(xiàn)生產(chǎn)事故的幾率大大減少,相反還出現(xiàn)了可以實時監(jiān)測并提前告警的智能化解決方案。
筆者去煤炭大省山西太原了解了這一發(fā)展動態(tài)。目前該省物聯(lián)網(wǎng)、安全生產(chǎn)和節(jié)能環(huán)保、能源物流等項目都被整合到—個物聯(lián)網(wǎng)云平臺上,并通過“云端”的方式不斷推進。具體來說,“云”負責(zé)承載業(yè)務(wù)并通過資源池化為用戶(包括政府、公益部門和企業(yè)部門等等)提供接入服務(wù),由嵌入式電路及其之上的智能終端設(shè)備組成的“端”,負責(zé)采集并實時監(jiān)測全省各個煤礦(包括瓦斯含量、溫度、濕度等數(shù)據(jù)),從而打造出智能化、自動后的“數(shù)字礦山”。除了煤礦物聯(lián)網(wǎng)之外,還可通過公關(guān)物聯(lián)網(wǎng)、環(huán)保物聯(lián)網(wǎng)等服務(wù)平臺,對地下管網(wǎng)(“地眼工程”)、污水處理、城市道路提供服務(wù)。
總結(jié)分析:坦白說,物聯(lián)網(wǎng)并不是大數(shù)據(jù),但物聯(lián)網(wǎng)本身具有大數(shù)據(jù)特征,而且在發(fā)展的過程中也需要應(yīng)對大數(shù)據(jù)這種挑戰(zhàn)。對于傳感器數(shù)據(jù)量已經(jīng)達到PB級別、且結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)日益增長的物聯(lián)網(wǎng)平臺來說,需要和企業(yè)一樣共同面對大數(shù)據(jù)帶來的挑戰(zhàn),挖掘大數(shù)據(jù)中所潛藏的巨大價值。
物聯(lián)網(wǎng),尤其是基于類似山西省的這種煤炭、環(huán)保、公益物聯(lián)網(wǎng)平臺,在遇上大數(shù)據(jù)的時候,更多的需要考慮甚至重新部署設(shè)計,以獲得更為靈活高效的實時監(jiān)控和預(yù)警,并幫助各類企業(yè)和環(huán)保等公益事業(yè)部門做出更科學(xué)合理的決策分析??梢灶A(yù)見,生態(tài)中國、美麗中國,需要物聯(lián)網(wǎng),更需要大數(shù)據(jù)解決方案。
第4、云平臺:個性化自主學(xué)習(xí)
情節(jié)概覽:教育是一個國家和社會最具靈魂性的領(lǐng)域。對于教育而言,關(guān)系到每個人的切身利益,而且伴隨著每個人的成長旅程。教育可以改變?nèi)说拿\,同樣,教育方式和教育理念也可以改變?nèi)说囊簧2煌谝酝摹摆s鴨上架”式教育模式,借助信息技術(shù)在二十一世紀(jì)的教育模式將發(fā)生根本性轉(zhuǎn)變。這些轉(zhuǎn)變中,以“個性化學(xué)習(xí)”模式最具變革性。比如在重慶石堰鎮(zhèn)中心學(xué)校,采用了一種“一對一數(shù)字化學(xué)習(xí)”的模式推動傳統(tǒng)教育的變革。
具體做法是,通過引進英特爾“一對一數(shù)字化學(xué)習(xí)”項目,前期先在實驗班開展實施,給每一個學(xué)生都派發(fā)個人學(xué)習(xí)終端(小電腦),并在一對一數(shù)字化教學(xué)環(huán)境下,加強互動教學(xué)與整合信息技術(shù)的培養(yǎng),將傳統(tǒng)的學(xué)習(xí)以教師為中心轉(zhuǎn)變?yōu)橐詫W(xué)生為中心的自主、交互式教學(xué)。如何實現(xiàn)個性化學(xué)習(xí)呢?讓學(xué)生融入到快樂自主學(xué)習(xí)的狀態(tài),培養(yǎng)知識探究的求學(xué)精神,最后還會通過課程標(biāo)準(zhǔn)和學(xué)習(xí)評價系統(tǒng),對每個學(xué)生在不同科目上的學(xué)習(xí)進度、興趣愛好、知識關(guān)聯(lián)上的不同,針對性地做出教學(xué)指導(dǎo)和建議。目前,該學(xué)校已經(jīng)全面開展了這種個性化數(shù)字學(xué)習(xí)模式。
總結(jié)分析:“一對一數(shù)字化學(xué)習(xí)”并不一定是最理想的個性化學(xué)習(xí)模式,但卻是目前最具實踐性并幫助取得教育信息化改革突破的最好方式。個性化學(xué)習(xí),會通過學(xué)生在自己的學(xué)習(xí)平臺上的多媒體學(xué)習(xí)資料、學(xué)習(xí)進展、互動(包括書面和音視頻)、自主學(xué)習(xí)(利用平臺主動學(xué)習(xí)相關(guān)領(lǐng)域科學(xué)知識),幫助學(xué)生完善知識結(jié)構(gòu)并加快學(xué)生對自身興趣愛好的挖掘和特長的培養(yǎng)。
對學(xué)習(xí)評價體系,也會根據(jù)每個學(xué)生的這些行為特征和學(xué)習(xí)內(nèi)容,對考核和科目設(shè)置進行評價,并最終幫助培養(yǎng)學(xué)生早日成為創(chuàng)新人才。雖然單個學(xué)生的各種數(shù)據(jù)(結(jié)構(gòu)、非結(jié)構(gòu))量并不一定很大,但從整個教學(xué)模式的轉(zhuǎn)變,尤其是在教育信息化改革的背景下,這種學(xué)習(xí)方式也體現(xiàn)出了基于大數(shù)據(jù)的個性化學(xué)習(xí)發(fā)展方向。
可以預(yù)見,未來個性化學(xué)習(xí)終端,將會更多的融入學(xué)習(xí)資源云平臺,根據(jù)每個學(xué)生的不同興趣愛好和特長,推送相關(guān)領(lǐng)域的前沿技術(shù)、資訊、資源乃至未來職業(yè)發(fā)展方向等等,并貫穿每個人終身學(xué)習(xí)的全過程,也就是個人云平臺中貫穿自己終身教育的應(yīng)用。
第5、網(wǎng)絡(luò)求職:“上位”變得更加簡單
情節(jié)概覽:求職,是每個學(xué)子走向社會的必經(jīng)之路,也是實現(xiàn)個人價值最為常見的方式之一。在這里,我們講的并不是大數(shù)據(jù)時代下涌現(xiàn)出的大數(shù)據(jù)相關(guān)崗位,也不是介紹大數(shù)據(jù)促進rr就業(yè)機會,而是如何通過大數(shù)據(jù)讓“對”的人才更好、更快地在“對”的崗位“上位”。
網(wǎng)絡(luò)求職,是廣大求職者找工作的一種重要途徑。從開始之初的簡歷制作、投放技巧到面試技巧等等,其實說的都是一個問題,以更好的技巧來找到更好的崗位。如果說傳統(tǒng)的網(wǎng)絡(luò)求職更多的是投機取巧的話,那么大數(shù)據(jù)時代下的網(wǎng)絡(luò)求職則是智能分析。當(dāng)然,這種智能化既有利于招聘者也有利于求職者。
網(wǎng)絡(luò)上的每一秒鐘,都有^在發(fā)電子郵件、在線交易、觀看視頻、內(nèi)容檢索等等。而網(wǎng)絡(luò)求職更多的就是內(nèi)容檢索。1秒鐘背后的上萬億URL,要求高效的數(shù)據(jù)檢索和算法?;ヂ?lián)網(wǎng)搜索經(jīng)歷了數(shù)據(jù)、信息到知識、智慧搜索的發(fā)展過程。目前的搜索引擎正處在從信息搜索向知識搜索發(fā)展的階段。
近年來,在搜索領(lǐng)域出現(xiàn)了一種基于語義的分析搜索技術(shù),這種技術(shù)在招聘求職行業(yè)擁有廣泛的用途。通常來說,招聘流程包括三大過程:異構(gòu)數(shù)據(jù)轉(zhuǎn)化成同構(gòu)信息、篩選并提煉信息、信息高效存儲和推送。由于文化背景、語言背景、教育背景等不同而造成的表達方式不同,會導(dǎo)致人才簡歷、招聘啟示、用戶行為在表現(xiàn)方式上的不同。通過語義分析技術(shù)將它們轉(zhuǎn)化成可以對比、關(guān)聯(lián)、篩選的同構(gòu)信息,并將合適的人才信息與合適的崗位信息進行匹配。
總結(jié)分析:單純看求職者簡歷,數(shù)據(jù)量再大也不屬于大數(shù)據(jù);僅憑招聘啟示,再復(fù)雜多樣的表達方式也同樣不屬于大數(shù)據(jù)。如何更智能、更高效、更準(zhǔn)確地為人才和雇主搭建起橋梁,才是大數(shù)據(jù)應(yīng)用的精髓所在。
一方面,企業(yè)主需要有更多渠道來尋找更具有成長價值的人才,而在網(wǎng)絡(luò)這個平臺上,由于海量求職信息的充斥,使得企業(yè)主尋找合適人才的時間成本和資金成本都很高。廣大獵頭在市場上得以快速發(fā)展就是最好證明。另一方面,應(yīng)聘者需要更準(zhǔn)確地尋找到自己適合的成長平臺。通過網(wǎng)絡(luò)途徑,將自己的教育背景、從業(yè)經(jīng)歷、技能特長等固化到個人屬性之中,并以此對海量數(shù)據(jù)信息進行篩選分析,找到稱心如意的崗位。
語義搜索能理解工作和技能的特征,識別同一個詞在不同語境中不同的語義。一方面把簡歷和職位信息映射到語義網(wǎng)絡(luò)中去,另一方面把用戶搜索和用戶行為也映射進去,最終通過語義網(wǎng)絡(luò)實現(xiàn)精準(zhǔn)搜索和匹配,將招聘者或求職者從搜索和分析工作中解脫出來,讓二者的匹配能達到最優(yōu)。
第6、信用卡:消費者的管家和助理
情節(jié)概覽:信用卡不同于儲蓄卡,它鼓勵透支消費并按照協(xié)議進行償還,如此反復(fù)并建立起現(xiàn)代消費的良性循環(huán),實現(xiàn)商家、銀行和消費者三者都獲益。
信用卡的發(fā)展,乃至于整個銀行業(yè)的發(fā)展,都與計算機技術(shù)、通訊技術(shù)的發(fā)展息息相關(guān)不可分割。比如信用卡安全碼就是根據(jù)戶主的信用卡卡號以及一套復(fù)雜算法計算得出,以此區(qū)別信用卡的真?zhèn)巍?/p>
相比電子商務(wù),銀行業(yè)尤其是信用卡領(lǐng)域接觸大數(shù)據(jù)來得還是晚一些,但信用卡的發(fā)行和使用,其實也都與大數(shù)據(jù)息息相關(guān)。一方面,銀行在確保安全可靠的情況下,會給那些優(yōu)質(zhì)客戶提供高級別信用卡(比如極具身份地位象征的“黑卡”);另一方面,他們還會根據(jù)信用卡持有人的消費記錄對其進行精準(zhǔn)營銷、級別調(diào)整等等。
有沒有想過,信用卡能在卡主無意識的情況下暴露出其行蹤?甚至能根據(jù)卡主的使用情況大體了解一個人的興趣愛好、工作居住情況、人際關(guān)系和業(yè)余時間安排等等。因為信用卡是在刷卡消費,而儲蓄卡僅僅是通過取款消費。因此信用卡更能直觀、準(zhǔn)確、全面地反映出卡主的個人特征。
比如,當(dāng)持普通信用卡的用戶所持信用卡是沒有附加航空意外險和航空里程積分的產(chǎn)品,但是當(dāng)該持卡人使用該卡購買了機票,作為發(fā)卡銀行就會主動向該客戶推薦帶有航空意外險和航空里程積分的航空公司聯(lián)名信用卡。同樣,用戶還會經(jīng)常收到頻繁消費或者關(guān)注度高的產(chǎn)品促銷信息,這些信息的背后其實也都潛藏著大數(shù)據(jù)的應(yīng)用,通過用戶無數(shù)的交易行為、還款記錄、消費地點等,對其進行分門別類,并對日后的額度提升、用戶升級、商業(yè)貸款提供依據(jù)。
總結(jié)分析:數(shù)據(jù)將是未來銀行的核心競爭力之一,在“大數(shù)據(jù)時代”,銀行所面臨的競爭不僅僅來自于同行業(yè)內(nèi)部,外部的挑戰(zhàn)也非常嚴峻。雖然銀行對于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)的挖掘和分析在所有行業(yè)中都處于領(lǐng)先水平,但銀行傳統(tǒng)的數(shù)據(jù)庫信息量并不豐富也不完整(僅僅擁有客戶基本身份屬性,沒有客戶的個性屬性),缺乏對用戶性格特征、興趣愛好、消費習(xí)慣、行業(yè)和家庭狀況等等信息的收集和了解。
此外,信息技術(shù)的發(fā)展,使得用戶的資金交易信息越來越多地來自網(wǎng)銀瀏覽、服務(wù)通話、ATM錄像監(jiān)控等等非結(jié)構(gòu)化數(shù)據(jù)。銀行缺乏對這些數(shù)據(jù)的分析和整合,進一步凸顯在信用卡環(huán)境下大數(shù)據(jù)應(yīng)用的緊迫感。因此,新時代下的信用卡更突出了大數(shù)據(jù)的應(yīng)用價值。
第7、天文探測:了解宇宙的金鑰匙
情節(jié)概覽:我們時不時的會從新聞中看到各種天文奇觀、星系、星團、行星的報道,而且不僅能給出大致的形態(tài)、結(jié)構(gòu)、距離等屬性信息,甚至還可以給出天文奇觀上演的準(zhǔn)確時間以及星體年限等信息。
比如登上美國NASA重點觀察名單的代號為4179的“圖塔蒂斯”行星。當(dāng)時NASA形容這款行星為“形狀似花生,又似啞鈴,直徑約5公里,每3.98年就會經(jīng)過地球一次?!?004年,該小行星曾與地球“近距離接觸”,兩者距離最近時僅為150萬公里。更為重要的是,人們還能精確預(yù)測其飛臨近地點的準(zhǔn)確時間。
我們國家的嫦娥二號衛(wèi)星是距地球約700萬公里遠的深空成功飛越的行星,并對其進行了高清晰成像。
我們經(jīng)??吹降奶煳钠嬗^預(yù)測報告,其實很多都來自于NASA背后的海量數(shù)據(jù)收集、管理、分析。從1959年以來,NASA JSC(約翰遜航天中心)已收集400多萬靜態(tài)圖像,總達950萬英尺的16毫米膠卷,85000卷錄像磁帶,以及總時長81616小時的視頻模擬及數(shù)碼檔案。通過開發(fā)10(在線影像)應(yīng)用平臺,對影像文件名與所有相關(guān)元數(shù)據(jù)連接,并對其進行存檔、管理以備科研之需。
總結(jié)分析:天文學(xué)是最先經(jīng)歷信息爆炸的科學(xué)領(lǐng)域之一,其數(shù)據(jù)量之大、類型之復(fù)雜,恐怕不是一般的行業(yè)領(lǐng)域所能比擬的。
首先在觀測方面,普通的人眼是不行的,需要通過天文望遠鏡來實時監(jiān)測,并對天文物體的距離、運動軌跡進行跟蹤拍照,這些生成的圖片數(shù)據(jù)單個都有上GB的規(guī)模(高清原始圖像);通過這些觀測收集的數(shù)據(jù),還需要對其進行處理和備份,并通過高性能計算平臺,對其挖掘。篩選挖掘出有價值的數(shù)據(jù)信息,分析獲得所要開展科研的情報。
第8、風(fēng)力發(fā)電:科學(xué)選址精確測定遠程監(jiān)測
情節(jié)概覽:為什么在大城市里面看不到風(fēng)能發(fā)電機?為什么風(fēng)力發(fā)電機都齊整有序的排列?早期的風(fēng)力發(fā)電場更多是選擇在風(fēng)力大、地勢平坦、常年盛行的地理位置,而如今,人們更多的會通過科學(xué)計算來準(zhǔn)確選擇風(fēng)力發(fā)電機的選址和間距。
一家丹麥風(fēng)力公司Vestas,通過使用超級計算機以及大數(shù)據(jù)模型解決方案,精確定位其風(fēng)力發(fā)電機,以達到最大發(fā)電量,并減少能源成本。從全球天氣系統(tǒng)中收集的數(shù)據(jù),與公司現(xiàn)有發(fā)電機的數(shù)據(jù)結(jié)合,存儲于風(fēng)庫中。
現(xiàn)在,該公司的風(fēng)庫存儲有2.8PB數(shù)據(jù),這些數(shù)據(jù)涵蓋地面至300英尺高空的氣溫、氣壓、空氣濕度、空氣沉淀物、風(fēng)向、風(fēng)速以及公司的歷史數(shù)據(jù)記錄。另外,該公司還增加全球森林砍伐追蹤圖、衛(wèi)星圖像、地理數(shù)據(jù)以及月相與潮汐數(shù)據(jù)。
總結(jié)分析:風(fēng)速及風(fēng)向的變化對風(fēng)力發(fā)電機的發(fā)電量有著較大的影響。通常,塔架越高,風(fēng)速越大,氣流越平穩(wěn),發(fā)電量越大。因此風(fēng)力發(fā)電機的
第9、預(yù)防犯罪:讓小偷自投羅網(wǎng)
情節(jié)概覽:《黑貓警長》大家都很熟悉,它講述的是“黑貓警長”如何精明能干、對壞人窮追不舍、跌宕起伏的故事情節(jié)。拿到大數(shù)據(jù)時代背景下的話,雖然它也能體現(xiàn)“黑貓警長”的盡職盡責(zé)、聰明能干,但更多的會歸結(jié)到一個問題:為何還是如此的被動、低效?疾病可以預(yù)防,難道犯罪不能預(yù)防么?
答案是肯定的。美國密歇根大學(xué)研究人員就設(shè)計出一種利用“超級計算機以及大量數(shù)據(jù)”來幫助警方定位那些最易受到不法份子侵擾片區(qū)的方法。具體做法是,研究人員通過大量的多類型數(shù)據(jù)(從人口統(tǒng)計數(shù)據(jù)到毒品犯罪數(shù)據(jù)到各區(qū)域所出售酒的種類、治安狀況、流動人口數(shù)據(jù)等等),創(chuàng)建一張波士頓犯罪高發(fā)地區(qū)熱點圖。同時,還將相鄰片區(qū)等各種因素加入到數(shù)據(jù)模型中,并根據(jù)歷史犯罪記錄和地點統(tǒng)計并不斷修正所得出的預(yù)測數(shù)據(jù)。
IBM也通過大數(shù)據(jù)技術(shù)和整合預(yù)防犯罪和數(shù)選址應(yīng)慎重考慮,每一次安裝都不同,而且要考慮塔筒高、電池組的距離、當(dāng)?shù)匾?guī)劃要求以及建筑和樹木這些障礙物等因素。這些因素的背后,考驗的是施工方對這些數(shù)據(jù)(包括數(shù)值數(shù)據(jù)和圖像、遙感、檢測等數(shù)據(jù))的分析能力,并幫助決策生成科學(xué)合理的方案??梢灶A(yù)見,風(fēng)能包括未來的潮汐能等清潔能源的應(yīng)用,都將引入更多的大數(shù)據(jù)技術(shù)和解決方案,幫助人類更加科學(xué)合理的利用這些可再生能源。據(jù)智能軟件資源,為執(zhí)法部門、國防、國家安全和私營機構(gòu)提供智能和調(diào)查服務(wù)。當(dāng)然,這種服務(wù)也可以被用來提供數(shù)字營銷、運營管理等服務(wù)。
總結(jié)分析:美國中情局曾經(jīng)利用過云計算和大數(shù)據(jù)技術(shù)找到恐怖分子,也屬于此類話題。其實,對于犯罪分子而言,往往事先都有犯罪動機(所謂的“激情犯罪”另當(dāng)別論),也就是刑法上的所說的“行為人為追求某種結(jié)果的發(fā)生而故意采取某類行為”的主觀故意。
而在大數(shù)據(jù)時代下的個人,其生活狀況、消費習(xí)慣、家庭背景、社會經(jīng)歷、身份特征等等,都將成為數(shù)據(jù)集的人格化,可以通過這些數(shù)據(jù)來區(qū)分任何一個人。作為執(zhí)法部門,考慮到整個社會的利益,需要也有必要對某些潛在的特定高危人群進行布控(尤其在犯罪高發(fā)地區(qū))。在經(jīng)過對數(shù)據(jù)的收集、傳輸、存儲、分析等一系列過程之后,最終將為執(zhí)法部門提高執(zhí)法效率,變被動為主動,由教育勸解變犯罪預(yù)防。
第10、天氣預(yù)報:天公的心我最懂
情節(jié)概覽:2012年7月21日北京遭遇特大暴雨,在一天之內(nèi),平均降雨量達164毫米,這是北京市61年以來最大規(guī)模暴雨。此次暴雨因來勢兇猛給廣大市民生活帶來巨大影響。其實,攤上這種事兒,最主要的還是需要氣象部門及時、準(zhǔn)確地做出預(yù)警,并協(xié)同其他運營部門,將這種預(yù)警信息第一時間下發(fā)給北京市民(包括在京旅行的人士)。也正是如此,那場暴雨不僅暴露出了管理工作上的漏洞,也引起了業(yè)內(nèi)人士關(guān)于一場“大數(shù)據(jù)”的探討。
在美國NOAA(國家海洋暨大氣總署)其實早就在使用大數(shù)據(jù)業(yè)務(wù)。每天通過衛(wèi)星、船只、飛機、浮標(biāo)、傳感器等收集超過35億份觀察數(shù)據(jù)。收集完畢后,NOAA會匯總大氣數(shù)據(jù),海洋數(shù)據(jù),以及地質(zhì)數(shù)據(jù),進行直接測定,繪制出復(fù)雜的高保真預(yù)測模型,將其提供給NWS(國家氣象局)做出氣象預(yù)報的參考數(shù)據(jù)。目前,NOAA每年新增管理的數(shù)據(jù)量就高達30PB(1PB=1024TB)。由NWS生成最終分析結(jié)果,呈現(xiàn)在日常的天氣預(yù)報和預(yù)警報道上。
總結(jié)分析:氣象對社會的影響涉及到方方面面。傳統(tǒng)上依賴氣象的主要是農(nóng)業(yè)、林業(yè)和水運等行業(yè)部門。而如今,氣象儼然成為了二十一世紀(jì)社會發(fā)展的資源,并支持定制化服務(wù)滿足各行各業(yè)用戶需要。
氣象研究和預(yù)報,需要借助海陸空多種設(shè)備,通過多個地點的數(shù)據(jù)采集,形成完整的數(shù)據(jù)模型,并根據(jù)氣象學(xué)的原理推斷未來的氣象狀況。最為常見的就是大家在電視上所熟知的氣象衛(wèi)星。它從太空上對整個地球包括地球上的大氣層進行觀測,這些觀測數(shù)據(jù)會結(jié)合氣象衛(wèi)星云圖和走勢分析,為氣象部門的天氣預(yù)報提供參考。通常采集的這些數(shù)據(jù)都是非結(jié)構(gòu)類型,而且變化趨勢呈現(xiàn)隨機性特點。