国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀與展望*

2014-12-18 03:08:21于兆吉
關(guān)鍵詞:數(shù)據(jù)管理實體數(shù)據(jù)庫

于兆吉, 魏 闖

(沈陽工業(yè)大學 管理學院, 沈陽 110870)

大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀與展望*

于兆吉, 魏 闖

(沈陽工業(yè)大學 管理學院, 沈陽 110870)

在對數(shù)據(jù)庫和數(shù)據(jù)管理發(fā)展歷程進行梳理的基礎(chǔ)上,提出主題數(shù)據(jù)庫應結(jié)合大數(shù)據(jù)時代背景下的數(shù)據(jù)特點進行重新定位和改變的觀點。通過對大數(shù)據(jù)和主題數(shù)據(jù)庫相關(guān)文獻的篩選、分類和分析,對大數(shù)據(jù)和主題數(shù)據(jù)庫的概念進行認知和界定,對與主題數(shù)據(jù)庫緊密相連的相關(guān)研究,包括主題劃分、信息資源規(guī)劃和大數(shù)據(jù)背景下管理和決策的研究現(xiàn)狀進行評述,最后提出大數(shù)據(jù)時代主題數(shù)據(jù)庫進一步研究的方向。

大數(shù)據(jù); 數(shù)據(jù)管理; 數(shù)據(jù)分析; 主題數(shù)據(jù)庫; 主題劃分; 信息資源規(guī)劃; 研究綜述

隨著互聯(lián)網(wǎng)突飛猛進的發(fā)展,數(shù)據(jù)總量呈爆炸式增長,數(shù)據(jù)量從TB級別升到ZB級別,IDC報告稱,未來10年數(shù)據(jù)總量將會增加50倍,應對如此的數(shù)據(jù)總量,相應管理數(shù)據(jù)倉庫的服務(wù)器將增加10倍[1]。目前主流的軟件已經(jīng)無法在合理的時間內(nèi)針對如此數(shù)量級別的數(shù)據(jù)進行擷取、管理、處理并整理成能為決策提供幫助的信息。美國政府率先提出并啟動了“大數(shù)據(jù)研究和發(fā)展計劃”,標志著大數(shù)據(jù)已上升到國家意志,大數(shù)據(jù)時代到來。

一、主題數(shù)據(jù)庫的理論發(fā)展

1.數(shù)據(jù)庫和數(shù)據(jù)管理的發(fā)展

維基百科中對數(shù)據(jù)是這樣定義的:“描述事物的符號記錄,是可以定義為意義的實體,它涉及到事物的存在形式?!盵2]數(shù)據(jù)逐漸演變?yōu)橹腔鄣牧鞒倘鐖D1所示??v觀數(shù)據(jù)庫和數(shù)據(jù)處理的發(fā)展階段,也是圍繞著數(shù)據(jù)演化流程中的處理、挖掘和分析不斷發(fā)展和完善的。

圖1 數(shù)據(jù)演化流程圖

20世紀50年代中期以前,數(shù)據(jù)管理處于人工管理階段,數(shù)據(jù)并不被保存,只在需要使用時輸入。數(shù)據(jù)庫在20世紀50年代產(chǎn)生,此時數(shù)據(jù)管理簡單,通過大量的分類、比較和表格繪制的機器運行數(shù)百萬穿孔卡片來進行數(shù)據(jù)處理。Remington Rand Inc 1950年推出的一秒鐘可以輸入數(shù)百條記錄的磁帶驅(qū)動器,引發(fā)了數(shù)據(jù)管理的革命。20世紀50年代后期到60年代中期,磁盤、磁鼓等存儲設(shè)備出現(xiàn),數(shù)據(jù)管理進入到文件系統(tǒng)階段。1969年IBM建立第一個數(shù)據(jù)庫系統(tǒng)IMS,數(shù)據(jù)管理由此進入數(shù)據(jù)庫系統(tǒng)階段。

由于數(shù)據(jù)獨立性和抽象級別上的欠缺,1970年E.F.Codd在論文《大型共享數(shù)據(jù)庫的數(shù)據(jù)關(guān)系模型》中提出關(guān)系模型的概念。隨著信息技術(shù)不斷發(fā)展,關(guān)系數(shù)據(jù)庫系統(tǒng)技術(shù)趨向成熟,但是不斷出現(xiàn)的復雜數(shù)據(jù)類型對數(shù)據(jù)庫提出了更新更高的要求,接下來出現(xiàn)了演繹數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫等新的數(shù)據(jù)庫類型研究,但沒有一個統(tǒng)一的數(shù)據(jù)模型能夠?qū)⑿滦偷臄?shù)據(jù)進行表示和聯(lián)系[3]。數(shù)據(jù)管理隨數(shù)據(jù)特點和外部環(huán)境變化共經(jīng)歷了如表1所示的三個階段。

由于事務(wù)處理環(huán)境的局限性,數(shù)據(jù)庫無法實現(xiàn)高效的數(shù)據(jù)分析決策功能,大量數(shù)據(jù)處于分散狀態(tài),而有效正確分析的前提是需要完整和集成的數(shù)據(jù),這樣所得到的結(jié)果更加可靠。新的數(shù)據(jù)庫環(huán)境需求由此出現(xiàn),人們的需求從向數(shù)據(jù)庫中添加信息轉(zhuǎn)變?yōu)閺臄?shù)據(jù)庫中得到有用的信息。Bill Inmon 在《建立數(shù)據(jù)倉庫》中提出被人廣泛接受的概念——數(shù)據(jù)倉庫是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策[4]。數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別如表2所示。

表1 數(shù)據(jù)管理發(fā)展三個階段

表2 數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別

數(shù)據(jù)倉庫是面向主題而不是面向事務(wù)的,主題是根據(jù)日常事務(wù)處理的業(yè)務(wù)進行提取的。主題數(shù)據(jù)庫始于20世紀的70年代末期到80年代初,James Martin在《戰(zhàn)略數(shù)據(jù)規(guī)劃方法學》中提出了“主題數(shù)據(jù)庫”的概念和相關(guān)理論方法。主題數(shù)據(jù)庫隨著應用的增多,數(shù)據(jù)庫不再增多,它不是按單證報表原樣去進行數(shù)據(jù)庫的搭建,而是面向業(yè)務(wù)主題建立數(shù)據(jù)庫,實現(xiàn)系統(tǒng)的集成,解決數(shù)據(jù)冗余、信息共享程度低等亟需解決的問題[5]。

數(shù)據(jù)倉庫是集成的、面向主題的數(shù)據(jù)集合,主題數(shù)據(jù)庫就是這個集合中的元素。主題數(shù)據(jù)庫是四類數(shù)據(jù)環(huán)境中的高層次數(shù)據(jù)環(huán)境,經(jīng)過歸納總結(jié),主要有以下幾個方面的優(yōu)點:

(1) 高度共享集約化的數(shù)據(jù)環(huán)境,易于管理。雖然建設(shè)時間長,但是所需維護成本低,信息共享程度高,不再是“自建自用”數(shù)據(jù)庫,而是各個應用系統(tǒng)之間的“共建和共用”。

(2) 獨立于計算機的具體應用。主題數(shù)據(jù)庫與企業(yè)組織需要解決的主要問題相關(guān)聯(lián),建成之后很多應用項目可以此為基礎(chǔ)進行構(gòu)建,減少冗余。

(3) 可以保證數(shù)據(jù)庫邏輯結(jié)構(gòu)的穩(wěn)定性。數(shù)據(jù)處于相對穩(wěn)定的環(huán)境之中,以此可以建立相對穩(wěn)定的數(shù)據(jù)模型,通過數(shù)據(jù)模型可以保證信息的準確性和及時性,提供可靠的分析決策。

大數(shù)據(jù)時代下傳統(tǒng)的數(shù)據(jù)倉庫必須向大數(shù)據(jù)進行靠攏,必須具有如表3所示的重要特性才能滿足目前的大數(shù)據(jù)需求。

表3 數(shù)據(jù)倉庫系統(tǒng)必須具備大數(shù)據(jù)的重要特性

面對大數(shù)據(jù)時代的數(shù)據(jù)特點,主題數(shù)據(jù)庫的規(guī)劃方法和數(shù)據(jù)管理方式也應產(chǎn)生新的變化以應對數(shù)據(jù)思維的改變。

2.相關(guān)概念界定

大數(shù)據(jù)最早在Apache org的項目Nutch中被定義為“更新網(wǎng)絡(luò)搜索所需要進行批量處理或分析的大量數(shù)據(jù)”[6]。Grobelnik M給出大數(shù)據(jù)的3V定義,認為大數(shù)據(jù)需要基于以下3個特點:Volume(規(guī)模性)、Velocity(高速型)和Variety(多樣性)[7]。IDC考慮大數(shù)據(jù)價值稀疏性的特點,提出了大數(shù)據(jù)4V的定義,即在3V的基礎(chǔ)上添加了Value(價值性)[8]。由于大數(shù)據(jù)的真實性,IBM的4V定義是在3V的基礎(chǔ)上添加了Veracity(真實性)[9]。目前國內(nèi)外在大數(shù)據(jù)的定義上并沒有達成共識,本文基于主題數(shù)據(jù)庫在大數(shù)據(jù)時代下的應用,把大數(shù)據(jù)定義為:“海量的數(shù)據(jù)規(guī)模已經(jīng)無法通過目前主流的工具在合理的時間范圍內(nèi)對業(yè)務(wù)數(shù)據(jù)進行搜集、管理和分析處理?!?/p>

國內(nèi)高復先最早指出主題數(shù)據(jù)庫是一種數(shù)據(jù)環(huán)境,它獨立于具體的應用,數(shù)據(jù)經(jīng)過設(shè)計后的存儲結(jié)構(gòu)與處理過程獨立開來,保持主題數(shù)據(jù)庫的邏輯結(jié)構(gòu)穩(wěn)定性[10]。李俊、趙霽對主題數(shù)據(jù)庫的特點與組織方式進行研究后,定義主題數(shù)據(jù)庫為“一個用于支持企業(yè)或組織的決策分析處理的、面向主題的、集成的數(shù)據(jù)集合”[11]。本文結(jié)合大數(shù)據(jù)時代背景重新定義主題數(shù)據(jù)庫,認為主題數(shù)據(jù)庫是在對整體業(yè)務(wù)需求分析規(guī)劃的前提下,以面向業(yè)務(wù)主題為基準對各類應用數(shù)據(jù)進行綜合管理,消除冗余,抽取主題而建立的穩(wěn)定數(shù)據(jù)庫。

二、大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀

目前國內(nèi)外的學者對主題數(shù)據(jù)庫的研究主要集中在信息資源規(guī)劃和主題劃分兩個方面。

1.信息資源規(guī)劃的相關(guān)研究

I.B.Singh最早在《信息資源規(guī)劃方法:案例研究》中以加拿大Albert地區(qū)殺蟲劑的使用和相關(guān)管理網(wǎng)建設(shè)為例,解釋了IRP產(chǎn)生的時代背景、目的和理論方法,其實施的主要步驟如圖2[12]所示。

圖2 IRP的實施流程圖

信息資源規(guī)劃的研究角度主要有以下幾個方面:

(1) 戰(zhàn)略角度。大數(shù)據(jù)時代信息資源主要是海量的業(yè)務(wù)數(shù)據(jù),無論多復雜龐大的信息系統(tǒng)都是以信息資源作為基礎(chǔ)和先導工作。

陳延壽在《企業(yè)信息資源的開發(fā)和利用》一文中指出了信息資源規(guī)劃的戰(zhàn)略性地位,認為由于信息資源規(guī)劃的復雜性,存在著在規(guī)劃中缺乏相關(guān)的理論指導和專業(yè)型人才缺乏的問題[13]。秦艷姣在《信息資源規(guī)劃與企業(yè)信息化》中對我國的信息化發(fā)展現(xiàn)狀進行了分析,認為信息化的首要解決辦法就是信息資源規(guī)劃,闡釋了信息資源規(guī)劃的實施流程和步驟,并對其在企業(yè)信息化中相關(guān)的具體應用進行歸納總結(jié)[14]。王學穎在《基于生命周期視角的企業(yè)信息資源規(guī)劃研究》中分析了我國企業(yè)信息資源管理和規(guī)劃的現(xiàn)狀,在此基礎(chǔ)上提出了基于生命周期的規(guī)劃方法ILEA,并對其基本構(gòu)成和開發(fā)的方法進行了闡述[15]。

大多數(shù)企業(yè)或組織在業(yè)務(wù)處理中沒有明確的信息資源規(guī)劃,還有一些企業(yè)形成的信息資源戰(zhàn)略管理的思維是信息資源杠桿戰(zhàn)略,因此信息資源的整合需要相應的戰(zhàn)略制定[16]。S.K.Min指出,數(shù)據(jù)信息是目前企業(yè)或組織在競爭市場中獲得有利地位的決定性資源,提出了戰(zhàn)略系統(tǒng)規(guī)劃的概念,并且介紹了相關(guān)的方法論以及實施的具體過程[17]。

隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)信息共享以及工作的跨領(lǐng)域特性,在交接環(huán)節(jié)中就會導致延遲或者錯誤。許捷關(guān)注財務(wù)系統(tǒng)在各個組織中的重要地位,并試圖從信息資源規(guī)劃的角度去詮釋建立財務(wù)信息系統(tǒng)在數(shù)據(jù)規(guī)劃中的相應模型[18]。李翔認為,信息資源規(guī)劃的工作需要和業(yè)務(wù)流程重組聯(lián)系,以業(yè)務(wù)流程重組為中心點進行展開[19]。

(2) 應用角度。信息資源一般可以按照來源分為內(nèi)部資源和外部資源。其中內(nèi)部資源系指與企業(yè)組織內(nèi)部業(yè)務(wù)聯(lián)系的各種信息資源,而外部資源就是企業(yè)或組織運營之外產(chǎn)生的但是與其緊密相連的各種信息的集合。

從內(nèi)部信息資源來看,企業(yè)組織在空間上的跨度越來越大,分布地區(qū)越來越分散,然而對信息共享的要求越來越高,而且每個層次對于信息需求的程度和類型不同。從外部信息資源來看,Asa.Du.Toit在其《南非制造企業(yè)信息管理》一文中對南非制造企業(yè)的信息競爭優(yōu)勢進行了研究分析,討論了通過有效的信息資源,從戰(zhàn)略的眼光來看其競爭優(yōu)勢能否增強[20]。我國學者孫毅通過對遼寧大連圣達公司為某企業(yè)成功實施信息資源規(guī)劃項目的研究,闡釋了如何使IRP適合各種應用系統(tǒng)。

此外,我國學者對不同行業(yè)IRP進行了研究。其中,吳迪針對建筑行業(yè)闡述了因為采用分散開發(fā)和局部應用系統(tǒng)造成“信息孤島”問題的現(xiàn)實存在,并探討了通過信息資源規(guī)劃的相關(guān)方法進行信息系統(tǒng)的集成,進而解決數(shù)據(jù)共享程度低的問題[21]。郭崇針對電信行業(yè),介紹了集成化和網(wǎng)絡(luò)化的龐大任務(wù)以及采用信息資源規(guī)劃和應用系統(tǒng)進行資源整合、引進先進的軟件和系統(tǒng)開發(fā)間的聯(lián)系[22]。

(3) 方法模型角度。大多數(shù)學者對信息資源規(guī)劃、管理的模型和框架進行了探討。馬爾香提出了信息資源管理7模塊的理論,包括電子通訊、數(shù)據(jù)管理、文書和記錄管理、圖書館和技術(shù)情報中心、辦公系統(tǒng)研究和統(tǒng)計信息管理、信息服務(wù)[23]。而我國學者王曉光提出了6I模型,包括信息產(chǎn)品、信息內(nèi)容、信息標準、信息系統(tǒng)、信息流程、信息組織[24]。

蔡文海重點突出了主題數(shù)據(jù)庫建設(shè)在信息組織技術(shù)中的核心地位,探討了主題數(shù)據(jù)庫在運輸經(jīng)濟中的應用和重要地位[25]。陳騫在探討主題數(shù)據(jù)庫規(guī)劃的過程中提出了建立主題數(shù)據(jù)庫的相關(guān)方法,并闡述了對模型進行遴選的方法[26]。

2.主題劃分的相關(guān)研究

主題數(shù)據(jù)庫在某種程度上是IRP實施數(shù)據(jù)標準化的支撐,對主題合理的規(guī)劃實施才能保證數(shù)據(jù)庫系統(tǒng)高效率、穩(wěn)定地運行,并能快速適用于多變的應用環(huán)境。在主題數(shù)據(jù)庫的構(gòu)建中,如何找出實體之間的關(guān)系,根據(jù)業(yè)務(wù)需求、數(shù)據(jù)需求提取主題是國內(nèi)外學者研究的重要內(nèi)容。

James Martin在《信息工程》中提出實體和活動之間的內(nèi)在聯(lián)系,親和度的概念以及計算公式也同時被給出,企業(yè)組織可以依據(jù)計算出的親和度值判斷實體之間聯(lián)系的密切程度,然后進行實體劃分,最后可以實現(xiàn)主題數(shù)據(jù)庫的簡單劃分[26]126-127。然而,親和度具有雙向性,也就是說實體A到實體B的親和度并不等同于實體B到實體A的親和度。因此,親和度不能明顯地區(qū)分和確定實體之間的關(guān)系,容易造成實體之間緊密程度的混淆,影響業(yè)務(wù)活動中對實體關(guān)系的分析,這對于主題的劃分并沒有實際的意義。

周炎濤在親和性分析的基礎(chǔ)上提出了單向性模型,對雙向性的方法進行改進,定義了聚合性分析以及聚合度的概念,以此來區(qū)別親和度和親和性分析的相關(guān)概念,通過建立聚合性分析的矩陣,可以清楚地看到實體之間的關(guān)聯(lián)程度,規(guī)避了親和性分析中的雙向性問題,更有利于實體分析中對于實體關(guān)系的分析和理解[27]。而王思昌通過對實體活動之間關(guān)系的研究,建立了E-A矩陣,間接地判斷實體之間的關(guān)聯(lián)程度,從而對實體進行規(guī)劃:首先確立核心實體,然后計算核心實體和其他各個實體之間的關(guān)系數(shù)值R,當R大于給定的關(guān)聯(lián)系數(shù)分界值時,表明兩個實體之間的關(guān)聯(lián)程度為緊密,因此這兩個實體組就可以歸為一個實體大組;相反則兩個實體組之間的關(guān)系為互相獨立[28]。

劉文遠在對聚合性分析的研究中發(fā)現(xiàn),一些非核心的實體和核心實體對中的兩個實體之間的聚合度值是相同的,但是遇到聚合度不相等的情形,依然會出現(xiàn)和親和度一樣的雙向性問題,導致無法準確判斷對兩個實體如何進行劃分。為解決此問題,劉文遠在《IRP中基于廣義聚合度的主題數(shù)據(jù)庫劃分技術(shù)》一文中給出了廣義聚合度的概念,規(guī)避了核心實體和與其聚合的其他實體具有次要聯(lián)系時的雙向性問題。這樣主題數(shù)據(jù)庫的劃分技術(shù)就更具有普遍適用性,實體之間的關(guān)系更為清晰且易于理解[29]。

樊康新等在研究實體之間的關(guān)系以及聯(lián)系強度的基礎(chǔ)上,提出了實體閉包的概念,指出可以將有關(guān)聯(lián)的實體劃分到一個閉包中,在進行實體分組時,計算實體之間聯(lián)系的緊密程度和使用頻率,認為同一組的所有實體應該都具有較緊密的關(guān)聯(lián)并較為頻繁地被使用,與此同時,各個組的實體之間原則上應該沒有關(guān)聯(lián)或者關(guān)聯(lián)性較弱而且被使用頻率較低。基于這種理論,企業(yè)組織應該根據(jù)實際應用情況確定各個實體之間的關(guān)聯(lián)程度,然后根據(jù)實體之間關(guān)聯(lián)程度的強弱進行再次調(diào)整[30]。

綜合主題數(shù)據(jù)庫主題規(guī)劃的研究現(xiàn)狀,主題數(shù)據(jù)庫的規(guī)劃就是從上至下對業(yè)務(wù)所涉及的所有實體進行聚類分析,并將全部數(shù)據(jù)劃分成可管理的單元。

3.大數(shù)據(jù)背景下數(shù)據(jù)的管理決策

大數(shù)據(jù)時代下的數(shù)據(jù)思維發(fā)生了革命性的變化,國內(nèi)外學者緊跟時代步伐,對大數(shù)據(jù)背景下的管理決策進行研究與探索。包括R.E.Bryant在內(nèi)的三位信息科學領(lǐng)域的資深專家發(fā)表了《大數(shù)據(jù)計算:商務(wù)、科學和社會領(lǐng)域的革命性突破》,讓研究人員和業(yè)界認識到,最重要的是大數(shù)據(jù)帶來的用途和見解的新穎性而不是數(shù)據(jù)本身[31]。緊隨其后,包括IBM在內(nèi)的國際知名公司爭先開始了大數(shù)據(jù)戰(zhàn)略的進程,主動跟進大數(shù)據(jù)研究的最新進展和應用。目前的大數(shù)據(jù)研究仍處于初步階段,大部分研究集中于數(shù)據(jù)的挖掘、儲存、處理以及數(shù)據(jù)安全等方面。國內(nèi)外鮮有學者從管理決策的層面對大數(shù)據(jù)帶來的革新和變化進行研究,這個領(lǐng)域是大數(shù)據(jù)背景下亟需關(guān)注的研究方向。

三、總結(jié)與展望

主題數(shù)據(jù)庫概念的提出已有時日,但主題數(shù)據(jù)庫的相關(guān)理論和方法并沒有被大規(guī)模地應用到實踐中,因此還存在很多值得深入探討的問題。隨著大數(shù)據(jù)時代的到來,主題數(shù)據(jù)庫也必然產(chǎn)生新的理論和問題,總結(jié)歸納起來主要有以下幾個方面:

(1) 計算機技術(shù)隨著時代的發(fā)展飛速變化,IRP中主題數(shù)據(jù)庫的相關(guān)劃分方法也將隨之發(fā)生新的改變。如何在海量數(shù)據(jù)的今天,在滿足信息化要求的同時簡化主題數(shù)據(jù)庫流程,提高適用性,統(tǒng)一標準,仍需要對理論方法不斷完善并和IRP結(jié)合起來,開展大量的工作。

(2) 大數(shù)據(jù)背景下,大部分數(shù)據(jù)是非結(jié)構(gòu)化的數(shù)據(jù),數(shù)據(jù)質(zhì)量參差不齊。主題數(shù)據(jù)庫中主題的劃分方法在此時代背景下需要得以完善,如何對實體與實體、實體與活動之間的關(guān)系建立合理的模型或者進行計算,快速地將龐大的數(shù)據(jù)量分成合理的數(shù)據(jù)單元,建立起符合業(yè)務(wù)需求的主題數(shù)據(jù)庫是擺在面前的首要問題[32]。

目前大數(shù)據(jù)仍然處于起步探索階段,對于大數(shù)據(jù)的管理決策問題并沒有太多相關(guān)的研究成果。主題數(shù)據(jù)庫的建立是為了對數(shù)據(jù)進行管理和通過數(shù)據(jù)進行決策,因此在大數(shù)據(jù)背景下的主題數(shù)據(jù)庫更應該側(cè)重于主題數(shù)據(jù)庫的數(shù)據(jù)分析和數(shù)據(jù)管理決策問題。針對大數(shù)據(jù)的幾個特點,哪個特點對數(shù)據(jù)管理決策的影響最大,不同領(lǐng)域的使用人員和不同學科的研究人員之間如何溝通和協(xié)作才能有利于大數(shù)據(jù)背景下主題數(shù)據(jù)庫相關(guān)問題的解決,都將是下一步需要研究的方向。

[1] Gantz J,Reinsel D.2011 digital universe study:extracting value from chaos [EB/OL].[2011-09-01].http://china.emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf.

[2] 維基百科.數(shù)據(jù) [EB/OL].[2014-04-05].http://zh.wikipedia.org/w/index.php?title=%E6%95%B0%E6%8D%AE&oldid=28910777.

[3] 覃雄派,王會舉,李芙蓉,等.數(shù)據(jù)管理技術(shù)的新格局 [J].軟件學報,2013(2):175-197.

[4] 劉喜文,鄭昌興,王文龍,等.構(gòu)建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究 [J].圖書與情報,2013(5):22-28.

[5] 陳騫,劉偉,孟慶久.信息資源規(guī)劃中的主題數(shù)據(jù)庫研究 [J].情報雜志,2006(2):136-137.

[6] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn) [J].計算機研究與發(fā)展,2013(1):146-169.

[7] Grobelnik M.Big-data computing:creating revolutionary breakthroughs in commerce,science,and society [EB/OL].[2014-04-05].http://videolectures.net/eswc2012_grobelnik_big_data.

[8] Barwick H.The “four Vs” of big data:implementing information infrastructure symposium [EB/OL].[2014-04-05].http://www.computerworld.com.au/article/396198/iiis_four_vs_big_data.

[9] IBM.What is big data [EB/OL].[2014-04-05].http://www-01.ibm.com/software/data/bigdata.

[10]高復先.信息工程與總體數(shù)據(jù)規(guī)劃 [J].交通與計算機,1988(2):8-14,55.

[11]李俊,趙霽.主題數(shù)據(jù)庫的特點與組織方式 [J].交通與計算機,2000(3):12-13.

[12]柯新生.基于網(wǎng)絡(luò)的企業(yè)級信息資源規(guī)劃理論與方法研究 [D].北京:北京交通大學,2009:2-15.

[13]陳延壽.企業(yè)信息資源的開發(fā)與利用 [J].現(xiàn)代情報,2005(7):193-195.

[14]秦艷姣.信息資源規(guī)劃與企業(yè)信息化 [J].現(xiàn)代情報,2006(7):179-181.

[15]劉益江,毛寧,陳慶新.一種評估數(shù)據(jù)倉庫設(shè)計質(zhì)量的方法 [J].計算機技術(shù)與發(fā)展,2012(9):161-165.

[16]王學穎.基于生命周期視角的企業(yè)信息資源規(guī)劃研究 [J].情報雜志,2011(6):156-160,147.

[17]Chantrasa R.Decision-making approaches for information sharing in a supply chain [D].USA:Clemson University,2005:5-20.

[18]許捷.財務(wù)信息化與信息資源規(guī)劃 [D].大連:東北財經(jīng)大學,2003:15-32.

[19]李翔.試論企業(yè)經(jīng)營秘密的保護 [J].科技情報開發(fā)與經(jīng)濟,2003(11):181-183.

[20]李曉鋼.智慧城市的信息資源規(guī)劃研究 [J].電子政務(wù),2011(4):32-37.

[21]劉明,高明印,李常建.企業(yè)信息資源規(guī)劃實施研究 [J].價值工程,2004(4):113-116.

[22]郭崇.應用信息資源規(guī)劃建立電信企業(yè)信息化基礎(chǔ) [J].東北財經(jīng)大學學報,2004(6):51-53.

[23]覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析:RDBMS與Map Reduce的競爭與共生 [J].軟件學報,2012(1):32-45.

[24]王曉光.面向信息企業(yè)的信息資源規(guī)劃研究 [D].武漢:武漢大學,2004:21-31.

[25]蔡文海.信息資源規(guī)劃工具的研制及其在運輸經(jīng)濟中的應用 [D].大連:大連海事大學,2000:6-18.

[26]詹姆斯·馬丁.戰(zhàn)略數(shù)據(jù)規(guī)劃 [M].北京:清華大學出版社,1994.

[27]周炎濤,謝東,吳正國.單向性模型下的主題數(shù)據(jù)庫聚合性分析 [J].湖南大學學報:自然科學版,2005(3):101-104.

[28]王思昌,冀亞林.信息工程中主題數(shù)據(jù)庫的規(guī)劃與設(shè)計 [J].價值工程,2005(9):66-68.

[29]劉文遠,徐麗娜,王寶文,等.IRP中基于廣義聚合度的主題數(shù)據(jù)庫劃分技術(shù) [J].情報雜志,2007(10):70-71,74.

[30]樊康新,李春明,顧暉,等.MIS戰(zhàn)略數(shù)據(jù)規(guī)劃與主題數(shù)據(jù)庫構(gòu)造 [J].工業(yè)控制計算機,2002(10):4-7.

[31]Watts D J.A twenty-first century science [J].Nature,2007,445(7127):489.

[32]王珊,王會舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望 [J].計算機學報,2011(10):1741-1752.

Statusquoandprospectofresearchesonsubjectdatabaseineraofbigdata

YU Zhao-ji, WEI Chuang

(School of Management, Shenyang University of Technology, Shenyang 110870, China)

Based on summarizing the development process of database and data management, the opinion is proposed that subject database should be repositioned and changed combining with the data features under the background of big data era.Through filtering, classifying and analyzing related literatures of big data and subject database, the conceptions of big data and subject database are recognized and defined, the status quo of related researches closely connected with subject database is reviewed and elaborated including topic partition, information resource planning, and management and decision-making under background of big data, and the further research direction of subject database in era of big data is proposed finally.

big data; data management; data analysis; subject database; subject partition; information resource planning; research review

2014-03-22

國家軟科學研究計劃資助項目(2012GXS4D078); 遼寧省自然科學基金項目(201202169); 遼寧省高等學校優(yōu)秀人才支持計劃項目(WR2012003)。

基金項目:于兆吉(1975-),男,遼寧遼陽人,副教授,博士,主要從事企業(yè)管理與技術(shù)創(chuàng)新等方面的研究。

* 本文已于2014-05-20 16∶55在中國知網(wǎng)優(yōu)先數(shù)字出版。 網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/21.1558.C.20140524.2141.016.html

10.7688/j.issn.1674-0823.2014.03.12

C 93-0

A

1674-0823(2014)03-0263-05

(責任編輯:吉海濤)

猜你喜歡
數(shù)據(jù)管理實體數(shù)據(jù)庫
企業(yè)級BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
前海自貿(mào)區(qū):金融服務(wù)實體
中國外匯(2019年18期)2019-11-25 01:41:54
實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
哲學評論(2017年1期)2017-07-31 18:04:00
振興實體經(jīng)濟地方如何“釘釘子”
兩會進行時:緊扣實體經(jīng)濟“釘釘子”
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
宝坻区| 龙江县| 商城县| 铜川市| 衡山县| 大兴区| 罗田县| 霍城县| 富顺县| 贺兰县| 合肥市| 洛川县| 泽库县| 五大连池市| 关岭| 辛集市| 社会| 柞水县| 深水埗区| 调兵山市| 沈阳市| 浑源县| 云南省| 濮阳市| 上高县| 调兵山市| 施秉县| 崇礼县| 江陵县| 容城县| 海丰县| 环江| 克东县| 东莞市| 庆城县| 绥中县| 西平县| 攀枝花市| 增城市| 金湖县| 乾安县|