李艷玲
(東北財(cái)經(jīng)大學(xué) 管理科學(xué)與工程學(xué)院,遼寧大連 116025;大連東軟信息學(xué)院 信息技術(shù)與商務(wù)管理系,遼寧 大連 116023)
隨著社會(huì)化媒體的逐漸成熟,寬帶技術(shù)的迅速提升,移動(dòng)互聯(lián)網(wǎng)的日益普及,云計(jì)算、物聯(lián)網(wǎng)的應(yīng)用也更加豐富,各種傳感器如手機(jī)、臺(tái)式電腦、筆記本、平板電腦、智能電視、導(dǎo)航定位等終端遍及各個(gè)角落,每個(gè)人都是數(shù)據(jù)的創(chuàng)造者、傳播者和分享者,如瀏覽網(wǎng)頁(yè)、發(fā)布微博、搜索關(guān)鍵詞、上傳文件、發(fā)送郵件、交友、購(gòu)物的每一個(gè)行為都被實(shí)時(shí)記錄下來(lái),正是由于這些數(shù)據(jù)的大量瞬間積累,數(shù)據(jù)量和信息量激增,發(fā)展態(tài)勢(shì)迅猛,數(shù)據(jù)單位由G、T到P、E、Z、Y演變,據(jù)IDC在《數(shù)字宇宙膨脹:到2020年全球信息增長(zhǎng)預(yù)測(cè)》所做的數(shù)據(jù)統(tǒng)計(jì),2006年全球制造復(fù)制出的數(shù)字信息量共計(jì)16.1萬(wàn),大約是歷史上圖書(shū)信息總量的3 000倍;2010年達(dá)到98.8萬(wàn)PB,過(guò)去三年間產(chǎn)生的數(shù)據(jù)量超過(guò)以往總和。2011年,全球創(chuàng)建和復(fù)制的數(shù)據(jù)總量達(dá)1.8ZB,照此速度的話(huà),到2020年,數(shù)字宇宙將超出預(yù)期達(dá)到40 ZB。
在這樣一個(gè)數(shù)字爆炸的時(shí)代,每時(shí)每刻都即時(shí)產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比,呈現(xiàn)新的特征,美國(guó)麥肯錫全球研究院(MGI)發(fā)表一篇名為“Big data:The next frontier for innovation,competition and productivity”(大數(shù)據(jù):未來(lái)創(chuàng)新、競(jìng)爭(zhēng)、生產(chǎn)力的指向標(biāo))的研究報(bào)告,“Big Data”(大數(shù)據(jù))這個(gè)關(guān)鍵詞便開(kāi)始流行起來(lái)。
據(jù)IDC描述,大數(shù)據(jù)(Big Data)是指無(wú)法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合。包括所建立的數(shù)據(jù)庫(kù)等結(jié)構(gòu)化信息,也包括文本、圖片、視頻等非結(jié)構(gòu)化信息,難以用一般技術(shù)來(lái)管理的大量數(shù)據(jù)的集合,業(yè)界通常用4個(gè)V(即Volume、Variety、Value、Velocity)來(lái)概括大數(shù)據(jù)的特征。
一是數(shù)據(jù)體量巨大(Volume)。數(shù)據(jù)量之大,是前所未有的,數(shù)據(jù)量呈幾何級(jí)數(shù)增加,用現(xiàn)有的技術(shù),無(wú)法有效管理和分析。
二是數(shù)據(jù)類(lèi)型繁多(Variety)。數(shù)據(jù)類(lèi)型花樣繁多,除了傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)、文本等結(jié)構(gòu)化數(shù)據(jù)以外,多種類(lèi)型的非結(jié)構(gòu)化數(shù)據(jù)與日俱增,如網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,這些類(lèi)型的數(shù)據(jù)需要更科學(xué)高效的技術(shù)來(lái)進(jìn)行處理。
三是價(jià)值密度低(Value)。價(jià)值密度低是指數(shù)據(jù)總量比較大,比如一部1小時(shí)的視頻,真正有用的數(shù)據(jù)或者是有價(jià)值的數(shù)據(jù)可能只有一二秒,價(jià)值密度的高低與數(shù)據(jù)量大小成相反比例,那么如何對(duì)大數(shù)據(jù)量通過(guò)機(jī)器算法迅速地完成價(jià)值數(shù)據(jù)“提純”,是目前大數(shù)據(jù)技術(shù)處理的一個(gè)難題。
四是處理速度快(Velocity)。這是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的最顯著特征,數(shù)據(jù)產(chǎn)生和更新的速度非???,每時(shí)每秒都在即時(shí)增加,對(duì)大數(shù)據(jù)的處理效率的要求,是大數(shù)據(jù)處理技術(shù)的重大挑戰(zhàn)。
1.快速捕獲即時(shí)數(shù)據(jù),創(chuàng)造高速價(jià)值
大數(shù)據(jù)最大的特點(diǎn)是數(shù)據(jù)的產(chǎn)生速度非常快,每時(shí)每秒可以產(chǎn)生很多的數(shù)據(jù)。例如,每分鐘facebook上的視頻就可以多產(chǎn)生390萬(wàn)部,大數(shù)據(jù)的產(chǎn)生速度是不可想象的。據(jù)調(diào)查,53%的高管表示大部分關(guān)鍵信息無(wú)法及時(shí)獲得,獲取信息的速度越快,采取行動(dòng)的速度也就越快,快速行動(dòng)創(chuàng)造的價(jià)值越高,數(shù)據(jù)的使用和分析效率真高,企業(yè)為實(shí)現(xiàn)卓越的運(yùn)營(yíng),需要快速捕獲高速運(yùn)行中的大數(shù)據(jù),更加迅速地計(jì)算分析數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)為信息,信息轉(zhuǎn)為洞察,實(shí)時(shí)推進(jìn)業(yè)務(wù)措施,立即采取行動(dòng),從而提升企業(yè)競(jìng)爭(zhēng)力。在這里還有一點(diǎn),當(dāng)企業(yè)捕獲的數(shù)據(jù)越來(lái)越多,需要分析的數(shù)據(jù)量越多,需要對(duì)數(shù)據(jù)進(jìn)行評(píng)判,這個(gè)數(shù)據(jù)的重要性是怎樣的,有的時(shí)候需要評(píng)判這個(gè)數(shù)據(jù)的價(jià)值是多少。通過(guò)更智能的方法,對(duì)數(shù)據(jù)加以篩選,對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)的判斷,提煉出有價(jià)值的數(shù)據(jù),最終將高速數(shù)據(jù)轉(zhuǎn)化為高速價(jià)值,體驗(yàn)即時(shí)數(shù)據(jù)以及數(shù)據(jù)處理給我們帶來(lái)的便捷,進(jìn)而實(shí)現(xiàn)實(shí)時(shí)大數(shù)據(jù)的美好前景,如圖1所示:
圖1 大數(shù)據(jù)業(yè)務(wù)價(jià)值與響應(yīng)時(shí)間關(guān)系
2.如何對(duì)異構(gòu)數(shù)據(jù)的處理
當(dāng)今企業(yè)在發(fā)展中積累的新信息來(lái)源越來(lái)越廣泛,企業(yè)應(yīng)用不再是唯一的信息來(lái)源,數(shù)據(jù)來(lái)源還可以來(lái)自傳感器,有的是來(lái)自網(wǎng)絡(luò)線(xiàn)上交易,有的是來(lái)自消費(fèi)者行為,有的是來(lái)自智能手機(jī)或者是移動(dòng)設(shè)備,這些設(shè)備變得日益智能化和互聯(lián),智能設(shè)備將從2013年的13億部增長(zhǎng)至2020年的125億部,非結(jié)構(gòu)化數(shù)據(jù)將超出傳統(tǒng)數(shù)據(jù)多個(gè)數(shù)量級(jí)??傮w來(lái)說(shuō)數(shù)據(jù)來(lái)源可以分為人為生成、互聯(lián)網(wǎng)/云生成、機(jī)器生成這幾種類(lèi)型,這些不同源頭的數(shù)據(jù)的格式也不一樣,我們必須用有效的方式高速捕獲、組織和分析。
對(duì)于那些已經(jīng)規(guī)模較大,系統(tǒng)環(huán)境高度異構(gòu)的企業(yè)而言,數(shù)據(jù)越來(lái)越發(fā)揮其重要資產(chǎn)的作用,如何在架構(gòu)整合方面有所舉措,從全局的角度促進(jìn)數(shù)據(jù)整合,將不同來(lái)源、不同類(lèi)型的數(shù)據(jù)整合到一起同,對(duì)數(shù)據(jù)搜集、管理、分析與挖掘等領(lǐng)域都對(duì)技術(shù)與系統(tǒng)提出了更高的要求,使得數(shù)據(jù)能夠?yàn)槠髽I(yè)所用。以前,數(shù)據(jù)都是分散在各個(gè)業(yè)務(wù)系統(tǒng),在大數(shù)據(jù)時(shí)代,企業(yè)需要考慮如何打破系統(tǒng)的邊界,把不同來(lái)源的數(shù)據(jù)整合在一起,企業(yè)不僅關(guān)注外部數(shù)據(jù)源對(duì)企業(yè)的價(jià)值,也需要關(guān)注消費(fèi)者的情緒如何、對(duì)企業(yè)的評(píng)價(jià)如何,互聯(lián)網(wǎng)、微博等就是很好的信息獲取渠道,怎樣把結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)整合,怎樣把微信、微博等非結(jié)構(gòu)化數(shù)據(jù)植入商務(wù)分析,將虛擬數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)結(jié)合起來(lái),這些外部數(shù)據(jù)源對(duì)企業(yè)也具有十分重要的意義。如何整合架構(gòu),將異構(gòu)數(shù)據(jù)整合到一個(gè)系統(tǒng),并在此基礎(chǔ)上,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)和分析系統(tǒng)的一體化,加速并分析大數(shù)據(jù),滿(mǎn)足企業(yè)的實(shí)時(shí)業(yè)務(wù)需求和分析需求,是目前亟待解決的技術(shù)難題。
正因?yàn)榇髷?shù)據(jù)所呈現(xiàn)的新的特點(diǎn)(4V),大數(shù)據(jù)的意義并不僅僅在于“容量之大”,其更大的意義在于通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行整合和分析,發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值。傳統(tǒng)的數(shù)據(jù)分析方法和工具已不適應(yīng)大數(shù)據(jù)的管理,大數(shù)據(jù)不同于普通的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘和商業(yè)智能分析,如沒(méi)有恰當(dāng)?shù)拇髷?shù)據(jù)分析工具,大數(shù)據(jù)將無(wú)法發(fā)揮其價(jià)值。大數(shù)據(jù)多樣、高速、海量的特點(diǎn)從各個(gè)領(lǐng)域推動(dòng)著行業(yè)的技術(shù)創(chuàng)新,給數(shù)據(jù)的抓取、存儲(chǔ)和分析帶來(lái)了新的挑戰(zhàn),工具、開(kāi)源以及框架設(shè)施對(duì)于大數(shù)據(jù)行業(yè)來(lái)說(shuō)非常重要,開(kāi)源包括軟件和硬件的開(kāi)源。
當(dāng)前,較為成熟的技術(shù)是通過(guò)采用分布式計(jì)算模式實(shí)現(xiàn),如當(dāng)前IT業(yè)的巨頭(如谷歌等)MapReduce的云計(jì)算模型以及Hadoop的開(kāi)源方案。Hadoop已經(jīng)成為新的主流范式,而十幾年前用的軟件開(kāi)發(fā)范式已經(jīng)不適用了。之前幾年的軟件開(kāi)發(fā)范式只適合處理結(jié)構(gòu)化的數(shù)據(jù),面對(duì)非結(jié)構(gòu)化的數(shù)據(jù),Hadoop是主流。Hadoop有一個(gè)有效的框架,可以處理非結(jié)構(gòu)的數(shù)據(jù),尤其是處理分布式數(shù)據(jù)。
其中,Hadoop是一種分布式系統(tǒng)的平臺(tái),通過(guò)它可以很輕松地搭建一個(gè)高效、高質(zhì)量的分布系統(tǒng),有著高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來(lái)部署在低廉的硬件上。Hadoop在可伸縮性、健壯性、計(jì)算性能和成本上具有無(wú)可替代的優(yōu)勢(shì),事實(shí)上已成為當(dāng)前互聯(lián)網(wǎng)企業(yè)主流的大數(shù)據(jù)分析平臺(tái)。MapReduce是Hadoop的核心組件之一,可以通過(guò)MapReduce很容易在Hadoop平臺(tái)上進(jìn)行分布式的計(jì)算編程。
隨著大數(shù)據(jù)和分析在企業(yè)應(yīng)用的深入,面臨的問(wèn)題和挑戰(zhàn)也越來(lái)越多,主要有如下方面:第一,對(duì)大數(shù)據(jù)和分析平臺(tái)的企業(yè)級(jí)應(yīng)用的可靠性、穩(wěn)定性、安全性要求會(huì)越來(lái)越高;第二,大多數(shù)企業(yè)級(jí)用戶(hù)都面對(duì)著極為復(fù)雜的行業(yè)應(yīng)用場(chǎng)景,不同類(lèi)型和來(lái)源的數(shù)據(jù)需要統(tǒng)一地被利用,在系統(tǒng)較多的企業(yè)中,如何對(duì)數(shù)據(jù)進(jìn)行集成管理是很大的問(wèn)題,特別是新的大數(shù)據(jù)方案如何與傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)無(wú)縫集成;第三,大多數(shù)企業(yè)級(jí)客戶(hù)還處于對(duì)大數(shù)據(jù)和分析的探索初期,對(duì)于新問(wèn)題的初判和解決經(jīng)驗(yàn)不足。
對(duì)于企業(yè)來(lái)說(shuō),隨著系統(tǒng)的復(fù)雜性上升,最為迫切也是最為重要的問(wèn)題是,如何將不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù)通過(guò)系統(tǒng)整合到一個(gè)平臺(tái)。在這個(gè)平臺(tái)上,全面涵蓋大數(shù)據(jù)和分析的各個(gè)應(yīng)用,采用統(tǒng)一架構(gòu),集成到一個(gè)系統(tǒng)。在這個(gè)系統(tǒng)上,建立全面覆蓋各種復(fù)雜行業(yè)應(yīng)用場(chǎng)景的企業(yè)級(jí)大數(shù)據(jù)和分析應(yīng)用解決方案,如靜態(tài)批量大數(shù)據(jù)處理、實(shí)時(shí)大數(shù)據(jù)業(yè)務(wù)處理、數(shù)據(jù)倉(cāng)庫(kù)整合和數(shù)據(jù)集市構(gòu)建等,對(duì)于這些大量異構(gòu)數(shù)據(jù)系統(tǒng),整合的標(biāo)準(zhǔn)是一個(gè)非常關(guān)鍵的問(wèn)題。同時(shí)企業(yè)又在不斷發(fā)展,未來(lái)要部署包括電商、移動(dòng)商務(wù)、社交網(wǎng)絡(luò)等新的應(yīng)用,都需要在這個(gè)統(tǒng)一的平臺(tái)上展開(kāi)。以上所有的應(yīng)用,構(gòu)成了一個(gè)大數(shù)據(jù)的生態(tài)系統(tǒng)。這個(gè)生態(tài)系統(tǒng)應(yīng)具備以下特點(diǎn),如圖2所示:
圖2 大數(shù)據(jù)生態(tài)系統(tǒng)特點(diǎn)
對(duì)于現(xiàn)代企業(yè)來(lái)說(shuō),隨著業(yè)務(wù)應(yīng)用范圍的廣泛深入、企業(yè)積累的數(shù)據(jù)類(lèi)型越來(lái)越多,包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),交易數(shù)據(jù)與非交易數(shù)據(jù),數(shù)據(jù)量呈幾何級(jí)次激增,甚至達(dá)到Z、Y級(jí),如何高效地捕獲和分析這些大數(shù)據(jù),是企業(yè)廣泛關(guān)注的事情,企業(yè)亟需一個(gè)平臺(tái),可以捕獲和管理大數(shù)據(jù)的所有維度,整合數(shù)據(jù)孤島,將不同來(lái)源、不同類(lèi)型的數(shù)據(jù)庫(kù),通過(guò)整合的開(kāi)發(fā)環(huán)境,在技術(shù)架構(gòu)基礎(chǔ)上,通過(guò)單一系統(tǒng)實(shí)現(xiàn)大數(shù)據(jù)并行計(jì)算列式平臺(tái)管理把ERP的業(yè)務(wù)數(shù)據(jù)、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)整合到一個(gè)系統(tǒng),直接在整個(gè)數(shù)據(jù)平臺(tái)建模、計(jì)算、分析、預(yù)測(cè),再借助BI進(jìn)行圖形化展示。所有可使用數(shù)據(jù)的人,實(shí)時(shí)獲得分析結(jié)果,如財(cái)務(wù)數(shù)據(jù),你只需用自然語(yǔ)言輸入查詢(xún)條件,系統(tǒng)提供實(shí)時(shí)解決方案,像花瓣一樣呈現(xiàn)。
在這樣的平臺(tái),能夠快速、高效地捕獲并整合海量多元化的任意數(shù)據(jù),實(shí)現(xiàn)快速分析處理海量信息,實(shí)時(shí)進(jìn)行商業(yè)決策,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)和分析系統(tǒng)的一體化,能夠同時(shí)滿(mǎn)足企業(yè)的實(shí)時(shí)業(yè)務(wù)需求和分析需求,不但降低了企業(yè)對(duì)服務(wù)器等硬件的需求,還減少了數(shù)據(jù)從業(yè)務(wù)系統(tǒng)到分析系統(tǒng)過(guò)程中所需的數(shù)據(jù)抽取、清洗等操作,大大提高了效率。
2012年是中國(guó)的大數(shù)據(jù)元年,云計(jì)算概念的爭(zhēng)論漸漸平息,而大數(shù)據(jù)的熱潮隨之到來(lái)。隨著大數(shù)據(jù)的到來(lái),大家對(duì)云計(jì)算的“中國(guó)夢(mèng)”開(kāi)始有了更清晰的認(rèn)識(shí),云計(jì)算如何落地為雨,成為2013年中國(guó)云計(jì)算的主旋律。
對(duì)于大部分企業(yè)而言,“云計(jì)算之旅”都將是一場(chǎng)速度與耐力的較量,關(guān)鍵是部署的靈活性。如何在整個(gè)價(jià)值鏈中獲得出色競(jìng)爭(zhēng)優(yōu)勢(shì),快速分析數(shù)據(jù),發(fā)現(xiàn)并響應(yīng)業(yè)務(wù)網(wǎng)絡(luò)中的各種變化,借助廣泛的托管功能選擇,從高度安全的環(huán)境和云技術(shù)的經(jīng)濟(jì)優(yōu)勢(shì)中獲益,是每個(gè)企業(yè)所要達(dá)到的理想效果。
大數(shù)據(jù)時(shí)代,云計(jì)算所發(fā)揮的主要作用是為大數(shù)據(jù)提供按需服務(wù),主要體現(xiàn)在云存儲(chǔ)、云計(jì)算、私用云、公有云的服務(wù)方面,將云共享的思想應(yīng)用于企業(yè),主要有有幾種主要方式,其中一種就是嵌入式企業(yè)原有平臺(tái)的OEM方式,包括移動(dòng)平臺(tái)、商務(wù)分析平臺(tái)和數(shù)據(jù)庫(kù)平臺(tái)等。另一種方式是托管私有云服務(wù)的方式,那就是構(gòu)建一個(gè)充滿(mǎn)活力的生態(tài)系統(tǒng),為企業(yè)提供選擇上的自由,既可以選擇在企業(yè)本地來(lái)搭建這個(gè)平臺(tái),也可以享受在云端來(lái)實(shí)現(xiàn)這個(gè)服務(wù),實(shí)現(xiàn)從本地向云端的遷移。充分利用與企業(yè)原有的ERP核心系統(tǒng)的無(wú)縫集成,又能夠與企業(yè)其他來(lái)源、其他類(lèi)型的數(shù)據(jù)、其他系統(tǒng)如BI、ETL和備份工具的集成,實(shí)現(xiàn)更廣泛的用戶(hù)支持、數(shù)據(jù)尋源以及對(duì)現(xiàn)有投資的再利用,以達(dá)到協(xié)同、共同參與、分享的目的,有效實(shí)現(xiàn)數(shù)據(jù)分析處理中“溫?cái)?shù)據(jù)”到“熱數(shù)據(jù)”的瞬間響應(yīng),從而幫助其客戶(hù)獲取實(shí)時(shí)、精準(zhǔn)的數(shù)據(jù)分析,把握瞬息萬(wàn)變的市場(chǎng)動(dòng)態(tài),獲取商機(jī)。
所構(gòu)建的生態(tài)系統(tǒng)不僅僅是數(shù)據(jù)庫(kù),而是創(chuàng)新的基于云框架的計(jì)算平臺(tái),具有出色的云靈活性,支持自動(dòng)配置計(jì)算資源,簡(jiǎn)化日常管理,將突破傳統(tǒng)的游戲規(guī)則,它從數(shù)據(jù)到?jīng)Q策覆蓋了整個(gè)企業(yè)的業(yè)務(wù)流程。這樣一個(gè)生態(tài)系統(tǒng),應(yīng)基于開(kāi)放式標(biāo)準(zhǔn),提供安全可靠、易于使用的開(kāi)發(fā)和運(yùn)行環(huán)境。它所具備的能力主要有:加速在線(xiàn)交易處理,同時(shí)可以作為數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行海量數(shù)據(jù)分析;既能夠加速傳統(tǒng)的關(guān)系型數(shù)據(jù),又能連接外部的Hadoop做非結(jié)構(gòu)化數(shù)據(jù)處理,它將是一個(gè)“全能”平臺(tái),將企業(yè)日常的數(shù)據(jù)需求全部集中在一個(gè)生態(tài)系統(tǒng)中,企業(yè)可以根據(jù)自己的需求,個(gè)性化地選擇,比如,可以任意選擇各種類(lèi)型的業(yè)務(wù)應(yīng)用和數(shù)據(jù)處理,做交易用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),運(yùn)行報(bào)表應(yīng)用企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)(EDW),處理大數(shù)據(jù)用NoSQL或者Hadoop,在這樣一個(gè)大而全的生態(tài)平臺(tái),可以實(shí)現(xiàn)簡(jiǎn)化的IT架構(gòu),即想即得,企業(yè)將高效地應(yīng)用諸多大數(shù)據(jù)技術(shù)手段,諸如分布式計(jì)算、并行處理、實(shí)時(shí)計(jì)算、高級(jí)分析與決策、數(shù)據(jù)可視化,進(jìn)而實(shí)時(shí)獲取答案,幫助企業(yè)快速獲取洞察力,助力企業(yè)轉(zhuǎn)型與發(fā)展,重塑無(wú)限可能。如圖3所示:
圖3 大數(shù)據(jù)生態(tài)系統(tǒng)
面對(duì)與日俱增的大量復(fù)雜的數(shù)據(jù),企業(yè)面臨前所未有的挑戰(zhàn)和機(jī)遇,如何利用這些數(shù)據(jù)流的巨大潛力,發(fā)現(xiàn)大數(shù)據(jù)所蘊(yùn)涵的巨大價(jià)值,是每個(gè)企業(yè)迫切解決的關(guān)鍵問(wèn)題。在大數(shù)據(jù)時(shí)代,分析和處理技術(shù)不斷地發(fā)展變化,如果哪家企業(yè)能夠在這新的技術(shù)更新浪潮中,掌握有效地分析和利用大數(shù)據(jù)的利器,真正駕馭數(shù)字宇宙,將直接轉(zhuǎn)化為企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì),促進(jìn)企業(yè)變革和升級(jí)。
[1]城田真琴.大數(shù)據(jù)的沖擊[M].朱四明,譯.北京:人民郵電出版社,2013:45-50.
[2]涂子沛.The Big Data Revolution[M].桂林:廣西師范大學(xué)出版社,2012:22-30.
[3]維克托·爾耶·舍恩伯格.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013:30-34.
[4]王珊.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,10(2):51-54.
[5]鄧國(guó)清.大數(shù)據(jù)時(shí)代的精益財(cái)務(wù)分析[J].中國(guó)會(huì)計(jì)報(bào),2013,4(5):23-25.
[6]鄒大斌.大數(shù)據(jù)分析驅(qū)動(dòng)制造業(yè)轉(zhuǎn)型[J].計(jì)算機(jī)世界,2011,10(6):45-50.
[7]黃性清,柳清.ERP商務(wù)智能系統(tǒng)的設(shè)計(jì)方案[J].中國(guó)管理信息化,2011,11(5):54-60.
[8]湯銘.挖掘制造業(yè)大數(shù)據(jù)價(jià)值[J].計(jì)算機(jī)世界,2012,5(7):23-30.
[9]覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.
[10]周傲英.數(shù)據(jù)密集型計(jì)算—數(shù)據(jù)管理技術(shù)面臨的挑戰(zhàn)[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2009,5(7):50-53.
[11]馮芷艷,郭迅華,曾大軍,等.大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報(bào),2013,1(2):36-40.
[12]王樹(shù)良,丁剛毅,鐘鳴.大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考[J].中國(guó)電子科學(xué)研究院學(xué)報(bào),2013,2(1):40-44.
[13]羅恩韜,胡志剛,林華.一種大數(shù)據(jù)時(shí)代海量數(shù)據(jù)抽取的開(kāi)發(fā)模型研究[J].計(jì)算機(jī)應(yīng)用研究,2013,6(2):30-34.
[14]張桂剛,李超,張勇,等.一種基于海量信息處理的云存儲(chǔ)模型研究[J].計(jì)算機(jī)研究與發(fā)展,2012,49(S1):32-36.
【責(zé)任編輯 詹 麗】
沈陽(yáng)師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2014年2期