●迪莉婭(燕山大學(xué) 文法學(xué)院,河北 秦皇島 066004)
數(shù)據(jù)顯示,政務(wù)部門(mén)集成的數(shù)據(jù)占社會(huì)總量的90%以上。尤其是在大數(shù)據(jù)時(shí)代,政務(wù)部門(mén)數(shù)據(jù)的類型已多樣化,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。如何采集、保存、維護(hù)、管理、分析、共享正在呈指數(shù)級(jí)增長(zhǎng)的電子政務(wù)大數(shù)據(jù)是目前政府和社會(huì)面臨的挑戰(zhàn)。
(1)云計(jì)算的內(nèi)涵。云計(jì)算的產(chǎn)生是借用了量子物理中的“電子云”,強(qiáng)調(diào)說(shuō)明計(jì)算的彌漫性、無(wú)所不在的分布性和社會(huì)性特征。云計(jì)算是并行計(jì)算、分布式計(jì)算和網(wǎng)格計(jì)算的綜合發(fā)展,或者說(shuō)是計(jì)算機(jī)科學(xué)概念的商業(yè)實(shí)現(xiàn),同時(shí)又提升了虛擬化、效用計(jì)算、IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))、SaaS(軟件即服務(wù))等功能。云計(jì)算的發(fā)展經(jīng)歷了網(wǎng)格計(jì)算、共用計(jì)算、軟件即服務(wù)和云計(jì)算四個(gè)階段。
云計(jì)算的基本類型分為IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))、SaaS(軟件即服務(wù))。
(2)大數(shù)據(jù)的內(nèi)涵。目前國(guó)內(nèi)外關(guān)于大數(shù)據(jù)并沒(méi)有統(tǒng)一的概念,但基本上從以下三個(gè)角度定義大數(shù)據(jù)。① 大數(shù)據(jù)本身的角度。該種定義認(rèn)為大數(shù)據(jù)是“海量數(shù)據(jù)”+“復(fù)雜類型”的數(shù)據(jù)。② 大數(shù)據(jù)特點(diǎn)的角度。大數(shù)據(jù)是具有“4V”特點(diǎn)的數(shù)據(jù),即種類多(Variety)、流量大 (Velocity)、容量大 (Volume)、價(jià)值高(Value)的數(shù)據(jù)。③ 大數(shù)據(jù)要素的角度。大數(shù)據(jù)是具有大分析、高帶寬和大內(nèi)容要素的數(shù)據(jù)。
(3)大數(shù)據(jù)與云計(jì)算的關(guān)系。大數(shù)據(jù)著眼于“數(shù)據(jù)”,關(guān)注實(shí)際業(yè)務(wù),提供數(shù)據(jù)采集分析挖掘,看重的是信息積淀,即數(shù)據(jù)存儲(chǔ)能力。云計(jì)算著眼于“計(jì)算”,關(guān)注 IT解決方案,提供 IT基礎(chǔ)架構(gòu),看重的是計(jì)算能力,即數(shù)據(jù)處理能力。大數(shù)據(jù)植根于云計(jì)算技術(shù),利用云計(jì)算強(qiáng)大的數(shù)據(jù)處理能力,可以為挖掘大數(shù)據(jù)豐富的信息數(shù)據(jù)提供強(qiáng)有力的工具。當(dāng)然,大數(shù)據(jù)和云計(jì)算之間還存在一定的區(qū)別(見(jiàn)表1)。
表1 云計(jì)算和大數(shù)據(jù)的區(qū)別
電子政務(wù)大數(shù)據(jù)是指各種公務(wù)機(jī)構(gòu)通過(guò)廣泛應(yīng)用現(xiàn)代信息技術(shù),推動(dòng)政務(wù)活動(dòng)方式的變革,提高行政效率,發(fā)展民主決策進(jìn)程,向社會(huì)提供優(yōu)質(zhì)、規(guī)范、透明的管理與服務(wù)過(guò)程中所產(chǎn)生的海量的、類型復(fù)雜的數(shù)據(jù)。其管理具有以下重要的意義。
(1)大數(shù)據(jù)的包容性將有助于打破政府各部門(mén)間、政府與公民間的固有邊界,信息孤島現(xiàn)象將有可能大幅度削減,數(shù)據(jù)共享有望成為現(xiàn)實(shí)。大數(shù)據(jù)可以提供政府管理所需要的基本信息支持,提高政府各機(jī)構(gòu)協(xié)同辦公的效率和為民辦事的效率及政府的治理能力和公共服務(wù)能力。(2)有助于增強(qiáng)政府危機(jī)管理的預(yù)警能力和應(yīng)急能力。加強(qiáng)電子政務(wù)大數(shù)據(jù)的管理不僅能動(dòng)態(tài)監(jiān)測(cè)而且還能深度分析和挖掘網(wǎng)絡(luò)輿情和危機(jī)事件的動(dòng)態(tài),提高政府危機(jī)預(yù)警能力和應(yīng)對(duì)能力。(3)有助于改變政府傳統(tǒng)的決策模式和效率。在大數(shù)據(jù)的環(huán)境下,政府將從基于“經(jīng)驗(yàn)”的決策模式走向基于“實(shí)證”的決策模式,為政府科學(xué)和精準(zhǔn)的決策提供支持。(4)有助于促進(jìn)政府管理更加開(kāi)放和透明。數(shù)據(jù)高度開(kāi)放和大規(guī)模強(qiáng)力流動(dòng),意味著知識(shí)在政府管理中得到深度挖掘和更加廣泛的利用,這將促使政府的管理和服務(wù)更加開(kāi)放和透明。
傳統(tǒng)的電子政務(wù)數(shù)據(jù)管理以收集和存儲(chǔ)為主,在云環(huán)境下,電子政務(wù)大數(shù)據(jù)的管理將創(chuàng)新數(shù)據(jù)的管理模式,偏重政府?dāng)?shù)據(jù)的分析與挖掘,為政府的管理與決策服務(wù)(見(jiàn)圖1)。
除臭規(guī)模總風(fēng)量Q為13 000 m3/h,共計(jì)2套處理系統(tǒng),其中,一期設(shè)計(jì)風(fēng)量9 000 m3/h,二期設(shè)計(jì)風(fēng)量4 000 m3/h,除臭工藝采用生物土壤濾池除臭技術(shù)。首先將O池中的惡臭氣體密封加蓋,防止惡臭氣體外溢,采用不銹鋼收集風(fēng)管進(jìn)行收集,通過(guò)引風(fēng)機(jī)將惡臭氣體引至生物土壤濾池進(jìn)行處理,處理后的氣體無(wú)組織達(dá)標(biāo)排放。
圖1 基于云計(jì)算的電子政務(wù)大數(shù)據(jù)管理模式圖
電子政務(wù)大數(shù)據(jù)的采集通常分為集中式采集和分布式采集,二者各具優(yōu)缺點(diǎn)。集中式采集易于控制全局?jǐn)?shù)據(jù),分布式采集靈活性的特點(diǎn)較突出(見(jiàn)表2)。
表2 電子政務(wù)大數(shù)據(jù)采集方法表
大數(shù)據(jù)的采集涉及政府機(jī)構(gòu)內(nèi)部的采集和機(jī)構(gòu)之間的采集,充分利用云計(jì)算分布式并行計(jì)算的特點(diǎn),采用混合式的大數(shù)據(jù)采集模式將會(huì)更有效率。即在整個(gè)大數(shù)據(jù)采集過(guò)程中,政府機(jī)構(gòu)內(nèi)部采用集中式的采集模式,而在機(jī)構(gòu)之間采用分布式采集模式。這種數(shù)據(jù)的采集中,每個(gè)政府機(jī)構(gòu)內(nèi)部設(shè)置一個(gè)或者多個(gè)中心服務(wù)器,該中心服務(wù)器作為虛擬組織內(nèi)的集中式的數(shù)據(jù)注冊(cè)機(jī)構(gòu),負(fù)責(zé)存儲(chǔ)共享的數(shù)據(jù)信息。機(jī)構(gòu)之間所有的中心服務(wù)器之間則采用分布式數(shù)據(jù)采集模式進(jìn)行組織(見(jiàn)圖2)。[1]這種數(shù)據(jù)采集模式克服了集中式與分布式數(shù)據(jù)調(diào)度模式的不足。
圖2 基于云計(jì)算的電子政務(wù)大數(shù)據(jù)采集模式圖
因?yàn)殡娮诱?wù)大數(shù)據(jù)既包括結(jié)構(gòu)化數(shù)據(jù)又包括半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),在進(jìn)行云計(jì)算的分布式采集時(shí),應(yīng)按照數(shù)據(jù)的不同類型,分類存儲(chǔ)。同時(shí)也因?yàn)樵朴?jì)算具有很強(qiáng)的擴(kuò)展性和容錯(cuò)能力,可將數(shù)據(jù)池相同或者相似的數(shù)據(jù)同構(gòu)化,同時(shí)應(yīng)用集群技術(shù)、虛擬化技術(shù)實(shí)現(xiàn)機(jī)構(gòu)之間的無(wú)縫對(duì)接和超級(jí)共享。
電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、相對(duì)穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持政府管理中的決策服務(wù)。電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)與過(guò)去的電子政務(wù)數(shù)據(jù)庫(kù)存儲(chǔ)最大的區(qū)別在于,前者以數(shù)據(jù)分析、決策支持為目的來(lái)組織存儲(chǔ)數(shù)據(jù),后者主要目的則是運(yùn)營(yíng)型系統(tǒng)保存、查詢數(shù)據(jù)。
同時(shí)由于大數(shù)據(jù)本身的特點(diǎn),傳統(tǒng)的電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)也已經(jīng)無(wú)法適應(yīng)大數(shù)據(jù)的存儲(chǔ)需求。首先,大數(shù)據(jù)的急驟增長(zhǎng),使得傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)面臨巨大的挑戰(zhàn),單結(jié)點(diǎn)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)往往難以存儲(chǔ)和分析海量的數(shù)據(jù)。其次,傳統(tǒng)的行式數(shù)據(jù)倉(cāng)庫(kù),是根據(jù)元組按行存儲(chǔ)的,維護(hù)大量的索引和物化視圖無(wú)論是在時(shí)間(處理) 還是空間(存儲(chǔ)) 方面成本都很高。[2]
而基于云計(jì)算的電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)采用列式存儲(chǔ)克服了行式存儲(chǔ)的弱點(diǎn)。列式數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是根據(jù)屬性按照列存儲(chǔ),每一屬性列單獨(dú)存放。投影數(shù)據(jù)時(shí)只訪問(wèn)查詢涉及的屬性列,大大降低了系統(tǒng)輸入和輸出損耗。又由于列式存儲(chǔ)的數(shù)據(jù)具有相同的數(shù)據(jù)類型,相鄰存儲(chǔ)的數(shù)據(jù)之間相似性比較高,具有更好的壓縮率,而壓縮的數(shù)據(jù)更能夠減少輸入與輸出的開(kāi)銷。例如,傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)采用的行式存儲(chǔ)有一個(gè)1萬(wàn)行的表,取其中3個(gè)字段,行存儲(chǔ)需要每行都讀取出來(lái)才能取出3個(gè)字段。而列存儲(chǔ)只需要讀3次就可以完成任務(wù)。尤其在大數(shù)據(jù)環(huán)境下,將大幅度提高電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)管理的性能。
聯(lián)機(jī)分析處理是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。在聯(lián)機(jī)分析當(dāng)中,云計(jì)算的分布式并行計(jì)算從數(shù)據(jù)倉(cāng)庫(kù)中的綜合數(shù)據(jù)出發(fā),提供面向分析的多維模型,并使用多維分析的方法從多個(gè)角度、多個(gè)層次對(duì)多維數(shù)據(jù)進(jìn)行分析,使決策者能夠更全面地分析數(shù)據(jù)。聯(lián)機(jī)分析處理的一個(gè)主要特點(diǎn)是多維數(shù)據(jù)分析,這與數(shù)據(jù)倉(cāng)庫(kù)的多維數(shù)據(jù)組織正好形成相互結(jié)合、相互補(bǔ)充的關(guān)系。因此,利用聯(lián)機(jī)分析處理技術(shù)與數(shù)據(jù)倉(cāng)庫(kù)的結(jié)合可以較好地解決電子政務(wù)決策支持系統(tǒng)既需要處理海量數(shù)據(jù)又需要進(jìn)行大量數(shù)值計(jì)算的問(wèn)題(見(jiàn)圖3)。
圖3 電子政務(wù)大數(shù)據(jù)聯(lián)機(jī)分析圖
利用電子政務(wù)聯(lián)機(jī)分析方法一般只能獲得數(shù)據(jù)的表層信息,難于揭示數(shù)據(jù)屬性的內(nèi)在關(guān)系和隱含信息。電子政務(wù)大數(shù)據(jù)挖掘是指從海量數(shù)據(jù)的大型數(shù)據(jù)倉(cāng)庫(kù)中提取人們感興趣的隱性的知識(shí),這些知識(shí)是事先未知且是潛在的。提取出來(lái)的知識(shí)通常可以表示為概念、規(guī)則、規(guī)律或模式等形式。
基于云計(jì)算的電子政務(wù)大數(shù)據(jù)挖掘采用分布式并行挖掘技術(shù)。分布式并行數(shù)據(jù)挖掘技術(shù)不同于其他并行算法的地方在于它適用于處理大規(guī)模的數(shù)據(jù)處理。過(guò)去所使用的串行數(shù)據(jù)挖掘算法只能適用于規(guī)模很小的數(shù)據(jù),并且其運(yùn)行需要花費(fèi)大量的時(shí)間也成為其缺點(diǎn)。分布式并行數(shù)據(jù)挖掘是指在分布式系統(tǒng)中,機(jī)器集群看作硬件數(shù)據(jù)池,將并行的任務(wù)拆分,然后交由每一個(gè)空閑機(jī)器去處理數(shù)據(jù),能夠極大地提高計(jì)算效率,同時(shí)這種數(shù)據(jù)無(wú)關(guān)性,對(duì)于計(jì)算集群的擴(kuò)展無(wú)疑提供了最好的設(shè)計(jì)保證。任務(wù)分解處理以后,將處理以后的結(jié)果再匯總起來(lái)。MapReduce是云計(jì)算環(huán)境中處理大規(guī)模數(shù)據(jù)集的挖掘模型,程序員在Map(映射)函數(shù)中指定對(duì)各分塊數(shù)據(jù)的處理過(guò)程,在Reduce(規(guī)約)函數(shù)中指定如何對(duì)分塊數(shù)據(jù)處理的中間結(jié)果進(jìn)行歸約(見(jiàn)圖4)。在電子政務(wù)大數(shù)據(jù)中的應(yīng)用,不僅可以提高數(shù)據(jù)挖掘的效率,而且這種機(jī)器數(shù)據(jù)的無(wú)關(guān)性對(duì)于計(jì)算集群的擴(kuò)展也提供了最好的設(shè)計(jì)保證。[3]
圖4 MapReduce-電子政務(wù)大數(shù)據(jù)挖掘模型圖
(1) 反映同類事物共同性質(zhì)的廣義型知識(shí)。(2)反映事物各方面特征的特征型知識(shí)。(3)反映不同事物之間屬性差別的差異型知識(shí)。(4)反映一事物和其他事物之間依賴或關(guān)聯(lián)的關(guān)聯(lián)型知識(shí)。(5)根據(jù)歷史和當(dāng)前數(shù)據(jù)推測(cè)未來(lái)數(shù)據(jù)的預(yù)測(cè)型知識(shí)。(6)揭示事物偏離常規(guī)出現(xiàn)異常現(xiàn)象的偏離型知識(shí)。但如何能更好的揭示這些蘊(yùn)藏在政府領(lǐng)域中的海量知識(shí)之間的關(guān)系和發(fā)展趨勢(shì),則需要在數(shù)據(jù)挖掘的過(guò)程中應(yīng)用可視化技術(shù)為政府決策和管理服務(wù)。數(shù)據(jù)可視化是對(duì)大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)的可視化,它是可視化技術(shù)在非空間數(shù)據(jù)領(lǐng)域的應(yīng)用,使人們不再局限于通過(guò)關(guān)系數(shù)據(jù)表來(lái)觀察和分析數(shù)據(jù)信息,還能以更直觀的方式看到數(shù)據(jù)及其結(jié)構(gòu)關(guān)系。具體而言是將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形、圖像形式表示,并利用數(shù)據(jù)分析和開(kāi)發(fā)工具發(fā)現(xiàn)其中未知信息的處理過(guò)程。[4]
數(shù)據(jù)可視化是電子政務(wù)大數(shù)據(jù)管理過(guò)程中重要的技術(shù)。在云環(huán)境中,電子政務(wù)大數(shù)據(jù)可視化不僅用圖像來(lái)顯示多維的非空間數(shù)據(jù),使用戶加深對(duì)數(shù)據(jù)含義的理解,而且用形象直觀的圖像來(lái)指引檢索過(guò)程,加快了檢索速度,因此得到很多國(guó)家的重視,例如美國(guó)能源部將投資2500萬(wàn)美元建立可擴(kuò)展數(shù)據(jù)管理與可視化研究所,幫助科學(xué)家對(duì)數(shù)據(jù)進(jìn)行有效管理,促進(jìn)其生物和環(huán)境研究計(jì)劃、核數(shù)據(jù)計(jì)劃等的研究。[5]
(1)建立電子政務(wù)大數(shù)據(jù)管理的框架。頂層設(shè)計(jì)是很多國(guó)家電子政務(wù)和大數(shù)據(jù)管理成功的經(jīng)驗(yàn)。目前,為了更好的促進(jìn)電子政務(wù)大數(shù)據(jù)的管理,面對(duì)大數(shù)據(jù)的挑戰(zhàn),很多國(guó)家和政府將政府大數(shù)據(jù)的管理提升到國(guó)家戰(zhàn)略層面,從國(guó)家政策或者制度層面規(guī)劃大數(shù)據(jù)的發(fā)展,挖掘大數(shù)據(jù)的潛力。例如,2012年3月,美國(guó)奧巴馬政府推出“大數(shù)據(jù)研究與開(kāi)發(fā)計(jì)劃”,提出“通過(guò)收集、處理龐大而復(fù)雜的數(shù)據(jù)信息,從中獲得知識(shí)和洞見(jiàn),提升能力,加快科學(xué)、工程領(lǐng)域的創(chuàng)新步伐,強(qiáng)化美國(guó)國(guó)土安全,轉(zhuǎn)變教育和學(xué)習(xí)模式”。而英國(guó)、法國(guó)、日本等國(guó)政府也已經(jīng)關(guān)注大數(shù)據(jù)和大數(shù)據(jù)技術(shù),積極開(kāi)展和推動(dòng)政府和企業(yè)大數(shù)據(jù)的管理和大數(shù)據(jù)技術(shù)的應(yīng)用。我國(guó)電子政務(wù)大數(shù)據(jù)的管理還處于發(fā)展階段,更需要從國(guó)家戰(zhàn)略層面規(guī)劃我國(guó)電子政務(wù)大數(shù)據(jù)的發(fā)展策略,提升政府的數(shù)據(jù)管理和應(yīng)用能力。
(2)制定相關(guān)的法律,保護(hù)大數(shù)據(jù)時(shí)代下的信息安全。在大數(shù)據(jù)環(huán)境中,電子政務(wù)所依托的非關(guān)系型數(shù)據(jù)庫(kù)中,在訪問(wèn)控制中并沒(méi)有設(shè)置嚴(yán)格的訪問(wèn)控制和隱私管理工具,同時(shí)由于電子政務(wù)大數(shù)據(jù)來(lái)源的廣泛性和復(fù)雜性,讓政府部門(mén)定位私密信息的界限變得復(fù)雜起來(lái)。由于云管理中將數(shù)據(jù)儲(chǔ)存在同一個(gè)地方,雖便于數(shù)據(jù)保護(hù)但同時(shí)也容易成為黑客的攻擊目標(biāo)。因此這就需要政府部門(mén)加強(qiáng)立法,保護(hù)個(gè)人隱私安全。面對(duì)技術(shù)進(jìn)步以及信息呈幾何級(jí)數(shù)增長(zhǎng),立法部門(mén)一方面需要使相關(guān)法律更加具體和細(xì)化,其反應(yīng)機(jī)制也應(yīng)該越來(lái)越快,為監(jiān)管部門(mén)提供及時(shí)有效的監(jiān)管依據(jù);另一方面,需要借鑒他國(guó)立法經(jīng)驗(yàn),以及各國(guó)政府之間的合作,共同保護(hù)云環(huán)境中大數(shù)據(jù)的安全。
(3)建立云計(jì)算和電子政務(wù)大數(shù)據(jù)的標(biāo)準(zhǔn)??梢哉f(shuō)云計(jì)算和電子政務(wù)大數(shù)據(jù)管理和技術(shù)標(biāo)準(zhǔn)是政府大數(shù)據(jù)有效管理的前提和基礎(chǔ)。例如云的外部特性與接口,包括互操作、業(yè)務(wù)遷移、安全以及電子政務(wù)大數(shù)據(jù)的采集標(biāo)準(zhǔn)、質(zhì)量標(biāo)準(zhǔn)、數(shù)據(jù)生命周期管理標(biāo)準(zhǔn)、數(shù)據(jù)安全標(biāo)準(zhǔn)等的研究和應(yīng)用問(wèn)題都期待解決。全球范圍內(nèi)的云計(jì)算標(biāo)準(zhǔn)化工作已經(jīng)啟動(dòng),全世界已經(jīng)有30多個(gè)標(biāo)準(zhǔn)組織宣布加入云計(jì)算和大數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)的制定行列,并且這個(gè)數(shù)字還在不斷增加。因此,面對(duì)大數(shù)據(jù)的挑戰(zhàn),我國(guó)政府也需要積極參與云計(jì)算標(biāo)準(zhǔn)和大數(shù)據(jù)標(biāo)準(zhǔn)的制定,為各級(jí)各類信息系統(tǒng)的網(wǎng)絡(luò)互連、信息互通、數(shù)據(jù)共享和安全奠定基礎(chǔ)。
(4)積極培養(yǎng)數(shù)據(jù)分析人才。大數(shù)據(jù)最關(guān)鍵的部分是挖掘和分析數(shù)據(jù)。大數(shù)據(jù)分析主要基于預(yù)言建?;蛭磥?lái)趨勢(shì)分析。但是傳統(tǒng)數(shù)據(jù)分析師并不具備開(kāi)發(fā)預(yù)言分析應(yīng)用程序模型的技能。而且大數(shù)據(jù)源很多來(lái)自非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)源的廣泛性和類型的復(fù)雜性等因素也制約了對(duì)數(shù)據(jù)的分析和挖掘。
大數(shù)據(jù)需要三類人才:第一類是云計(jì)算方面的人才;第二類是掌握計(jì)算框架和基礎(chǔ)算法,并能很快部署到云計(jì)算和需要掌握機(jī)器學(xué)習(xí)和知識(shí)圖譜的人才;第三類是具備數(shù)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)分析、商業(yè)分析和自然語(yǔ)言處理的應(yīng)用型人才。人才短缺是制約大數(shù)據(jù)領(lǐng)域發(fā)展的重要因素。而政府、大學(xué)、企業(yè)合作,是培養(yǎng)大數(shù)據(jù)人才的重要途徑。在大數(shù)據(jù)理論和技術(shù)研究領(lǐng)域,大學(xué)具有一定的優(yōu)勢(shì),但是大學(xué)不生產(chǎn)大數(shù)據(jù),政府和企業(yè)的大數(shù)據(jù)為人才培養(yǎng)提供了重要的實(shí)踐場(chǎng)所。為了適應(yīng)大數(shù)據(jù)的發(fā)展,這種大數(shù)據(jù)人才培養(yǎng)模式在我國(guó)已經(jīng)開(kāi)始,例如北京航空航天大學(xué)計(jì)算機(jī)學(xué)院、軟件學(xué)院和百度、淘寶、騰訊等企業(yè)合作,聯(lián)合開(kāi)辦國(guó)內(nèi)第一個(gè)大數(shù)據(jù)專業(yè)工程碩士,為大數(shù)據(jù)人才的培養(yǎng)提供重要的平臺(tái)。
[1]韓振.政務(wù)數(shù)據(jù)中心體系結(jié)構(gòu)及其訪問(wèn)控制機(jī)制的研究與設(shè)計(jì)[D].杭州:杭州大學(xué)碩士論文,2009:34-35.
[2]楊卓犖.?dāng)?shù)據(jù)倉(cāng)庫(kù)分布式列存儲(chǔ)技術(shù)研究與實(shí)現(xiàn)[D].昆明:昆明理工大學(xué)碩士學(xué)位論文,2012.
[3]張春艷.云計(jì)算下的SRINT并行算法研究[J].軟件,2010(11):57-61.
[4]劉勘,等.?dāng)?shù)據(jù)可視化的研究與發(fā)展[J].計(jì)算機(jī)工程,2002(8):9-10,71.
[5]馮海超.透視美國(guó)大數(shù)據(jù)爆發(fā)全景[J].互聯(lián)網(wǎng)周刊,2013(1):38-41.