劉彬 梁建交
中國商用飛機有限責任公司 航空工業(yè)信息技術中心(金航數(shù)碼)
基于復雜組織體架構(gòu)方法的企業(yè)數(shù)據(jù)中心總體設計
劉彬 梁建交
中國商用飛機有限責任公司 航空工業(yè)信息技術中心(金航數(shù)碼)
本文提出在工業(yè)企業(yè)數(shù)據(jù)中心建設過程中,引入復雜組織體架構(gòu)(Enterprise Architecture,EA)方法,從業(yè)務、應用、數(shù)據(jù)、技術四個方面對數(shù)據(jù)中心架構(gòu)進行定義,提出了工業(yè)企業(yè)數(shù)據(jù)中心頂層參考架構(gòu)。采用復雜組織體架構(gòu)方法,可以將企業(yè)戰(zhàn)略、運營和管控需求與數(shù)據(jù)中心的業(yè)務定位、軟硬件環(huán)境進行很好地匹配,保證數(shù)據(jù)中心運營和數(shù)據(jù)資源管理能夠很好地支撐企業(yè)運營發(fā)展。
復雜組織體架構(gòu) 數(shù)據(jù)中心 數(shù)據(jù)中心總體設計
“數(shù)據(jù)中心”一直以來被認為是一組硬件設備及容納這些硬件的建筑物,例如:維基百科針對數(shù)據(jù)中心給出的定義是“一整套復雜的設施,它不僅僅包括計算機系統(tǒng)和其它與之配套的設備(例如通信和存儲系統(tǒng)),還包含冗余的數(shù)據(jù)通信連接、環(huán)境控制設備、監(jiān)控設備以及各種安全裝置”。谷歌在其發(fā)布的《The Datacenter as a Computer》一書中,將數(shù)據(jù)中心解釋為“多功能的建筑物,能容納多個服務器以及通信設備。這些設備被放置在一起是因為它們具有相同的對環(huán)境的要求以及物理安全上的需求,并且這樣放置便于維護”,而“并不僅僅是一些服務器的集合”。隨著企業(yè)數(shù)據(jù)資源作為新型資產(chǎn)越來越受到重視以及大數(shù)據(jù)與數(shù)據(jù)分析技術的發(fā)展和普及,人們對數(shù)據(jù)中心的理解也在發(fā)生變化,逐漸從關注硬件環(huán)境建設到關注數(shù)據(jù)資源本身的管理。本人認為,在DT時代這個大背景下,數(shù)據(jù)中心建設應聚焦數(shù)據(jù)資源管理,將數(shù)據(jù)中心理解為:是企業(yè)數(shù)據(jù)資源和對數(shù)據(jù)資源進行集成、共享、分析的標準、流程、工具及所依托的軟件、硬件和物理、組織環(huán)境的集合。數(shù)據(jù)中心既是一個技術體系,也是一個組織體(Enterprise)。數(shù)據(jù)中心是企業(yè)數(shù)據(jù)資源開發(fā)利用的重要的載體,其相關技術應用近些年來重新燃起了許多企業(yè)的熱情。
但是,由于數(shù)據(jù)中心一直以來主要沿用數(shù)據(jù)倉庫(Data Warehouse,DW)、 商 務 智 能(Business Intelligence,BI)等技術及相關工程經(jīng)驗,缺乏始于業(yè)務終于業(yè)務的成體系的設計和實施方法論,很多企業(yè)的數(shù)據(jù)中心還主要聚焦于數(shù)據(jù)分析與展示,價值存在很大的局限性,失去了數(shù)據(jù)中心的許多意義。而復雜組織體架構(gòu)(Enterprise Architecture,EA)正是解決從戰(zhàn)略到業(yè)務再到IT的一套科學方法,被國際上眾多組織(企業(yè)組織和政府等非盈利性組織)所采用。EA最早可以追溯到20世紀80年代中期,由當時還在IBM工作的John Zachman首先提出了“信息系統(tǒng)架構(gòu)框架”的概念。1996年美國的Clinger-Cohen 法案導致了術語“IT架構(gòu)”(ITA),ITA現(xiàn)在被解釋為IT企業(yè)架構(gòu)(EA)。經(jīng)過近二十年的發(fā)展,EA相關理論日益成熟,IBM、美國聯(lián)邦政府、波音、空客、羅羅都基于EA思想在構(gòu)建和管理自己的IT系統(tǒng)。在中國,EA也被中國航空工業(yè)集團、中國航天科工集團、華為、用友、金蝶等工業(yè)企業(yè)集團、軟件廠商所采用。中國航空工業(yè)集團公司提出了以復雜組織體架構(gòu)方法應對組織與管理的復雜性,通過與國際開放組TOG開展廣泛合作,系統(tǒng)地導入架構(gòu)方法論和知識體系,已經(jīng)將EA方法運用到企業(yè)戰(zhàn)略分析、業(yè)務和組織架構(gòu)設計、IT架構(gòu)設計、數(shù)據(jù)中心建設和企業(yè)治理等方方面面,“十二五”期間取得了明顯的應用成效。
數(shù)據(jù)中心是一個企業(yè)(復雜組織體)的有機組成部分,一個現(xiàn)代化的企業(yè)數(shù)據(jù)中心具備復雜組織體的所有特征。因此,數(shù)據(jù)中心架構(gòu)設計可以參考國際上最主流的架構(gòu)方法TOGAF-ADM(如圖1)。在這個方法框架基礎上,通過修改或擴展,以及在每個階段中融入特定的方法論和技巧(如:業(yè)務九要素法、信息資源規(guī)劃IRP,甚至DoDAF等)來適應數(shù)據(jù)中心架構(gòu)設計的需要。TOGAF-ADM將一個復雜組織體架構(gòu)的開發(fā)過程劃分為A-H八個階段,ADM中的需求管理是一個連續(xù)的階段,它確保通過適當?shù)闹卫砹鞒虂硖幚砣魏涡枨笞兏⒎从吃谒衅渌A段中。
圖1 數(shù)據(jù)中心設計方法框架
本階段重點需要掌握數(shù)據(jù)中心關鍵利益攸關者的核心關注,選擇架構(gòu)開發(fā)的方法,以及建立架構(gòu)開發(fā)方法與其他相關管理框架(如:項目管理方法、軟件開發(fā)方法、運行管理方法等)之間的關系,明確數(shù)據(jù)中心架構(gòu)設計的原則,在組織內(nèi)部對數(shù)據(jù)中心形成高層次的一致共識。
本階段重點是完成立項,并識別利益攸關者,了解他們對數(shù)據(jù)中心的關注焦點和業(yè)務需求。提出數(shù)據(jù)中心規(guī)劃設計與建設、運行的基本原則,明確數(shù)據(jù)中心建設范圍和目標,評價數(shù)據(jù)中心建設所需要的基礎條件,識別風險,制訂相關措施等。
本階段重點是完成數(shù)據(jù)中心或數(shù)據(jù)管理的業(yè)務現(xiàn)狀,如:數(shù)據(jù)管理組織、流程和相關制度,以及企業(yè)內(nèi)部各部門在數(shù)據(jù)管理與信息資源開發(fā)利用方面的協(xié)作關系。參照國際標準和國內(nèi)外數(shù)據(jù)管理與數(shù)據(jù)中心管理的先進經(jīng)驗,對未來數(shù)據(jù)中心的業(yè)務架構(gòu)進行定義和描述,重點是組織、流程和業(yè)務功能,及配套的標準規(guī)范。
本階段重點是完成數(shù)據(jù)集成交換、數(shù)據(jù)管理和數(shù)據(jù)分析等相關應用的現(xiàn)狀,結(jié)合業(yè)務需求,對未來數(shù)據(jù)中心信息系統(tǒng)進行架構(gòu)、功能設計,對未來數(shù)據(jù)中心的數(shù)據(jù)存儲、數(shù)據(jù)分析所涉及的數(shù)據(jù)架構(gòu)(如:數(shù)據(jù)緩沖區(qū)、數(shù)據(jù)倉庫、數(shù)據(jù)集市等)進行設計。描述信息系統(tǒng)如何實現(xiàn)業(yè)務架構(gòu)和架構(gòu)愿景,關鍵利益攸關者數(shù)據(jù)架構(gòu)視圖、應用架構(gòu)視圖。
本階段重點完成數(shù)據(jù)中心軟硬件平臺的架構(gòu)設計,包括數(shù)據(jù)中心所涉及的技術譜系、技術標準及服務器、存儲設備、安全設備、信息安全體系、軟件部署與集成技術架構(gòu)等。同時,要描述技術組件與應用系統(tǒng)的關系。
本階段重點根據(jù)數(shù)據(jù)中心目標架構(gòu)與現(xiàn)狀(架構(gòu))的差距分析,制定實施策略,對推進數(shù)據(jù)中心建設的風險和準備度進行確認,識別主要的工作包并將這些工作包分組,以便開展項目組合。本階段也需要判斷是否要開發(fā)過渡的架構(gòu),以指導分步實施。
本階段重點是對數(shù)據(jù)中心建設相關工作的優(yōu)先級進行評估,制訂詳細的實施計劃,確保數(shù)據(jù)中心建設項目與其他相關工作的協(xié)調(diào),同時,確保數(shù)據(jù)中心建設項目和相關工作取得關鍵利益攸關者的理解。本階段對數(shù)據(jù)中心架構(gòu)進行最終確認。
本階段重點是實施已經(jīng)明確的數(shù)據(jù)中心項目,包括識別相關資源和技能、軟硬件的選型、解決方案開發(fā)與部署,對項目進度、質(zhì)量和風險進行管理,開展業(yè)務和IT試運行等,本階段的目的是通過實施治理確保規(guī)劃的數(shù)據(jù)中心架構(gòu)的實現(xiàn)。
本階段的工作是保證數(shù)據(jù)中心具有能迅速演進以響應技術和業(yè)務環(huán)境變化的柔性。通過對業(yè)務需求、數(shù)據(jù)中心運行進行監(jiān)控,識別架構(gòu)變更、解決方案變更的機會,并對變更(如:軟硬件升級)進行管理。
需求管理結(jié)穿數(shù)據(jù)中心架構(gòu)開發(fā)的始終,在數(shù)據(jù)中心架構(gòu)開發(fā)各階段,都應識別各種需求,包括功能性需求、非功能性需求。數(shù)據(jù)中心的各類需求應進行統(tǒng)一管理。
參照復雜組織體架構(gòu)框架,企業(yè)數(shù)據(jù)中心架構(gòu)可以從業(yè)務架構(gòu)、應用架構(gòu)、數(shù)據(jù)架構(gòu)和技術架構(gòu)等四個方面來定義和描述,如下圖所示:
圖2 數(shù)據(jù)中心總體架構(gòu)
企業(yè)數(shù)據(jù)中心的業(yè)務架構(gòu)組成要素包括:組織、人員、流程、績效、標準規(guī)范等。數(shù)據(jù)中心建設過程中,應建立和優(yōu)化數(shù)據(jù)中心組織,配置數(shù)據(jù)管理、分析人員,建立支撐數(shù)據(jù)中心運行和數(shù)據(jù)服務的流程、績效衡量指標體系和相關的標準規(guī)范。企業(yè)數(shù)據(jù)中心自身的管理包括對數(shù)據(jù)資產(chǎn)的管理,如:數(shù)據(jù)標準化、數(shù)據(jù)交換與集成、數(shù)據(jù)治理等,還包括對數(shù)據(jù)中心軟硬件環(huán)境的運行管理和數(shù)據(jù)中心的人財物等綜合管理。數(shù)據(jù)中心對外提供的服務包括:數(shù)據(jù)存儲服務(結(jié)構(gòu)化數(shù)據(jù)存儲、大數(shù)據(jù)存儲)、數(shù)據(jù)共享服務和數(shù)據(jù)分析服務,數(shù)據(jù)分析服務又可以分為報表服務、聯(lián)機分析處理、數(shù)據(jù)挖掘等。
企業(yè)數(shù)據(jù)中心的應用架構(gòu)描述了支撐數(shù)據(jù)中心內(nèi)外部業(yè)務的核心應用組成及其關系。核心應用可以分為四類:一是數(shù)據(jù)交換系統(tǒng)(如:ETL、ESB),主要功能包括異構(gòu)信息系統(tǒng)的數(shù)據(jù)集成、抽取、清洗、轉(zhuǎn)換,并加載到數(shù)據(jù)倉庫。二是數(shù)據(jù)存儲系統(tǒng),主要實現(xiàn)對各種類型數(shù)據(jù)的集中存儲。第三是數(shù)據(jù)治理系統(tǒng),主要實現(xiàn)對元數(shù)據(jù)的管理、對主數(shù)據(jù)和業(yè)務數(shù)據(jù)質(zhì)量的控制和數(shù)據(jù)模型的管理。第四是數(shù)據(jù)分析系統(tǒng),主要是用于滿足不同人員對數(shù)據(jù)的分析需求,提供報表分析、即席查詢、多維數(shù)據(jù)分析和數(shù)據(jù)挖掘等。
企業(yè)數(shù)據(jù)可以分為元數(shù)據(jù)、主數(shù)據(jù)、業(yè)務數(shù)據(jù)和主題分析數(shù)據(jù)。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),主要描述數(shù)據(jù)對象的結(jié)構(gòu)、數(shù)據(jù)倉庫中有關數(shù)據(jù)源定義和轉(zhuǎn)化規(guī)則;主數(shù)據(jù)是指需在企業(yè)全局保持一致的核心業(yè)務實體的數(shù)據(jù),同時也是在企業(yè)范圍內(nèi)需要共享的數(shù)據(jù);業(yè)務數(shù)據(jù)是指為完成業(yè)務處理而產(chǎn)生的事務性數(shù)據(jù),是業(yè)務活動的描述,更新頻繁且快速增長;主題分析數(shù)據(jù)是指按照業(yè)務邏輯結(jié)構(gòu)對各業(yè)務數(shù)據(jù)進行識別和運算,根據(jù)業(yè)務需求統(tǒng)一定義和組織的相關數(shù)據(jù),由業(yè)務數(shù)據(jù)按照分析需要抽取后按主題存儲。數(shù)據(jù)中心數(shù)據(jù)架構(gòu)定義了數(shù)據(jù)分類、數(shù)據(jù)模型、數(shù)據(jù)存儲的方式與結(jié)構(gòu)(包括:數(shù)據(jù)緩沖區(qū)、數(shù)據(jù)倉庫、數(shù)據(jù)集市、大數(shù)據(jù)存儲區(qū)等)和各類數(shù)據(jù)的標準。
數(shù)據(jù)中心的技術架構(gòu)由技術平臺、基礎設施、標準體系和安全體系組成。技術平臺指數(shù)據(jù)中心應用系統(tǒng)的開發(fā)和運行平臺、數(shù)據(jù)集成與展示平臺、數(shù)據(jù)庫系統(tǒng)等?;A設施包括機房、服務器、存儲設備和基礎軟件(如:操作系統(tǒng)、郵件系統(tǒng)等)等。標準體系指企業(yè)的信息化標準體系,定義了信息化技術、應用、管理等的規(guī)范化要求。安全體系定義了確保數(shù)據(jù)安全所需要的技術、流程、制度等。
通過對數(shù)據(jù)中心目標架構(gòu)和現(xiàn)狀架構(gòu)之間的差距分析來識別和定義路線圖組件或工作包,這些組件或工作包通常可以作為獨立的項目來組織實施。典型的路線圖組件包括:數(shù)據(jù)中心現(xiàn)狀調(diào)研與診斷、數(shù)據(jù)中心總體規(guī)劃、數(shù)據(jù)中心架構(gòu)設計、數(shù)據(jù)模型設計與驗證、數(shù)據(jù)治理體系設計與構(gòu)建、數(shù)據(jù)中心物理環(huán)境建設、數(shù)據(jù)中心IT運行環(huán)境建設、數(shù)據(jù)交換平臺建設、數(shù)據(jù)管理平臺建設、數(shù)據(jù)分析平臺建設、特定專題的數(shù)據(jù)分析應用、數(shù)據(jù)中心運行維護等。
企業(yè)數(shù)據(jù)中心建設可以劃分為三個發(fā)展階段:數(shù)據(jù)中心設計與平臺驗證、數(shù)據(jù)中心深化建設和數(shù)據(jù)中心優(yōu)化應用,如圖3所示。第一階段重點完成數(shù)據(jù)中心總體規(guī)劃、架構(gòu)設計和初步的軟硬件環(huán)境建設,通過選擇試點單位、試點業(yè)務驗證相關技術和設計方案的可行性。第二階段重點在橫縱兩個方向上深化建設,橫向擴大試點單位、試點業(yè)務的范圍,縱向擴展數(shù)據(jù)資源開發(fā)利用的深度,如:數(shù)據(jù)鉆取、數(shù)據(jù)挖掘、大數(shù)據(jù)實時分析等。第三階段重點是優(yōu)化,包括運行環(huán)境的優(yōu)化、應用系統(tǒng)的優(yōu)化、數(shù)據(jù)模型的優(yōu)化、數(shù)據(jù)中心業(yè)務架構(gòu)的優(yōu)化等。
圖3 數(shù)據(jù)中心實施路線
當然,由于企業(yè)各級人員對數(shù)據(jù)的需求是變化的,數(shù)據(jù)中心建設主體工程雖然呈現(xiàn)一定的階段性,可以依托特定的項目來完成,但從數(shù)據(jù)中心的運行和數(shù)據(jù)資源開發(fā)利用角度來看,數(shù)據(jù)中心建設實際上是一個持續(xù)工程,其價值往往需要依賴于數(shù)據(jù)中心的日常運行管理,因此,數(shù)據(jù)中心治理是整個數(shù)據(jù)中心建設的核心。
在企業(yè)數(shù)據(jù)中心建設過程中,引入架構(gòu)思想,采用復雜組織體架構(gòu)方法開展數(shù)據(jù)中心架構(gòu)設計與治理,有助于將數(shù)據(jù)中心資產(chǎn)與企業(yè)發(fā)展戰(zhàn)略、運營管理目標進行很好地對接,使數(shù)據(jù)資源管理能夠動態(tài)滿足管理與決策的需求,實現(xiàn)數(shù)據(jù)中心價值最大化。
[1]TOGAF標準9.1版,The Open GroupA著,張新國等譯,2017年1月第1版
[2]中國航空工業(yè)集團統(tǒng)一IT架構(gòu)要求V2.0,2016年
[3]中國商用飛機有限責任公司十三五信息化規(guī)劃,2017年
[4]https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E4%B8%AD%E5%BF%83/967340?fr=aladdin