王眾
“數(shù)據(jù)科學(xué)家”這個BI核心人才根本就是個古董職業(yè),最近它在創(chuàng)新解決方案——數(shù)據(jù)可視化——的幫助下走下了神壇。
今年可能會有大批企業(yè)在BI部門新?lián)芤还P錢,因為企業(yè)們重要的參考指標(biāo)GartnerMagic Quadrant for Business Intelligence andAnalytics Platforms 2016(商業(yè)智能和分析平臺2016魔力象限)出現(xiàn)了大變臉,原本熱鬧的領(lǐng)導(dǎo)力象限只剩下3個品牌,其中Qlik和Tableau都是BI的攪局分子;只有微軟這個經(jīng)典品牌留了下來,至于之前一直強(qiáng)勢的SAP、IBM、SAS、MicroStrategy等均降到了有遠(yuǎn)見者象限,Orade干脆出局。
在這源于市場對BI的需求已經(jīng)有了根本性的轉(zhuǎn)變,簡言之,是由IT主導(dǎo)的企業(yè)報表轉(zhuǎn)向了業(yè)務(wù)主導(dǎo)的自助分析;BI的應(yīng)用從管理層向業(yè)務(wù)層、個人層面普及。稍微深究一下,當(dāng)然是大數(shù)據(jù)煽的火。
從桌餐到農(nóng)家樂
商業(yè)智能的定義是由Howard Dresner在1989年的通俗化而被人們廣泛了解。當(dāng)時將商業(yè)智能定義為一類由數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的、以幫助企業(yè)決策為目的的技術(shù)及應(yīng)用。
提到數(shù)據(jù)分析,一定要提美國,不僅是因為Gartner魔力象限上的公司的總部幾乎都在美國,實在是作為《老友記》鐵粉的我深深記得,在這部20多年前的肥皂劇里,Chandler的工作就是數(shù)據(jù)分析及重構(gòu);Joey去參加猜詞節(jié)目,搭檔的職業(yè)就是數(shù)據(jù)科學(xué)家。從這個角度看,“數(shù)據(jù)科學(xué)家”這個BI核心人才根本就是個古董職業(yè),雖然它近幾年才隨著大數(shù)據(jù)和云計算在我國為大眾所知。
這個古董職業(yè)最近煥發(fā)了新的生機(jī),它在創(chuàng)新解決方案——數(shù)據(jù)可視化——的幫助下走下了神壇。這種方案的魔力就在于無限降低技術(shù)門檻,讓普通人能夠通過拖拽的方式“分析”數(shù)據(jù),還能生成漂亮的報告。
比較起來,傳統(tǒng)BI就像一桌套菜,把行業(yè)內(nèi)多年的經(jīng)驗整合和展示出來,幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策,通常企業(yè)在部署B(yǎng)I的時候會選擇一個大品牌的整體解決方案。新型BI在推廣的概念是自助,但如果從整體架構(gòu)和長期使用來看,與其說是自助餐,更像是農(nóng)家樂——你可以直接購買現(xiàn)成的軟硬件,也可以自主開發(fā)、輕松集成。
知易行難的互聯(lián)網(wǎng)+
物理網(wǎng)、大數(shù)據(jù)、新型BI,看上去大數(shù)據(jù)應(yīng)用就要幫助企業(yè)創(chuàng)新、營收了,實則不然,尤其對于互聯(lián)網(wǎng)+過程中的傳統(tǒng)企業(yè)來說。
所謂大數(shù)據(jù),并不只是數(shù)量大就夠了,一個企業(yè)在傳統(tǒng)BI系統(tǒng)中累積下來的幾個數(shù)據(jù)庫,不能叫做大數(shù)據(jù),只是歷史數(shù)據(jù),分析它們是對數(shù)據(jù)降維,描述過去,解釋現(xiàn)狀。大數(shù)據(jù)除了海量,更重要的是來源廣泛,尤其是來自網(wǎng)上的非結(jié)構(gòu)性數(shù)據(jù),新型BI就是要對付它們,對當(dāng)下的數(shù)據(jù)升維,影響現(xiàn)在,改變未來。后者是傳統(tǒng)企業(yè)最大的挑戰(zhàn),因為它們根本沒有外部數(shù)據(jù),已有的BI也不支持這種分析。聯(lián)想對新型BI的部署就是在為積累大數(shù)據(jù)之后的應(yīng)用做準(zhǔn)備。
早就和大數(shù)據(jù)密不可分的是互聯(lián)網(wǎng)行業(yè),阿里巴巴是其中的領(lǐng)頭羊,它不僅自建BI支撐起龐大的阿里系,而且在數(shù)加平臺上將BI的各個環(huán)節(jié)產(chǎn)品化。數(shù)加團(tuán)隊對于傳統(tǒng)BI的七寸之處,自然多有研究。阿里云BI產(chǎn)品經(jīng)理解敏總結(jié)了幾個常見的技術(shù)難點:數(shù)據(jù)倉庫的建設(shè),ETCL(抽取、轉(zhuǎn)換、清洗和加載)過程涉及面廣,工作量大;多種數(shù)據(jù)源的數(shù)據(jù)管理困難;BI建模實施時間長;海量數(shù)據(jù)分析處理速度慢;大多數(shù)深度的數(shù)據(jù)挖掘算法及工具還沒普及到普通用戶都可觸手可及的地步。這些困難都是企業(yè)接入互聯(lián)網(wǎng)數(shù)據(jù)后將要遇到的困難。
在走訪了多家努力實現(xiàn)互聯(lián)網(wǎng)+的傳統(tǒng)企業(yè)后,我愕然認(rèn)識到,傳統(tǒng)企業(yè)的互聯(lián)網(wǎng)+過程絕不是加減法,而是脫胎換骨的大手術(shù),包括大數(shù)據(jù)的積累和應(yīng)用:要渡過這個劫,直接引入互聯(lián)網(wǎng)企業(yè)的經(jīng)驗遠(yuǎn)遠(yuǎn)不夠。