Bob Violino
在IT界,炒作越大誤區(qū)就越多,數(shù)據(jù)分析也不例外。數(shù)據(jù)分析是當(dāng)下IT界最熱門的領(lǐng)域之一,它可以帶來(lái)顯著的業(yè)務(wù)效益,但是誤區(qū)會(huì)妨礙企業(yè)順利和及時(shí)地交付可能使業(yè)務(wù)用戶、最終使客戶受益的分析功能。企業(yè)在制定或夯實(shí)分析策略時(shí),應(yīng)當(dāng)提防這12個(gè)誤區(qū)。
這年頭,實(shí)施的每一項(xiàng)技術(shù)似乎都要過(guò)財(cái)務(wù)穩(wěn)健性這道關(guān)卡。IT和業(yè)務(wù)經(jīng)理們提議啟動(dòng)項(xiàng)目或部署新工具時(shí),首先面臨的問題之一是“這要花多少錢?”
一些人認(rèn)為,數(shù)據(jù)分析本質(zhì)上很燒錢,因此僅限于預(yù)算龐大或內(nèi)部資源豐富的大企業(yè)。不過(guò)移動(dòng)和在線房地產(chǎn)服務(wù)提供商Trulia的工程副總裁Deep Varma表示,并非所有的數(shù)據(jù)分析工作都需要大量投入。
Varma說(shuō):“現(xiàn)在市場(chǎng)上有眾多的開源及其他工具可以幫助你開始展示數(shù)據(jù)分析具有的價(jià)值。你要深入了解內(nèi)部數(shù)據(jù)存儲(chǔ)和想解決什么樣的問題。有了云計(jì)算,試著用分析技術(shù)解決業(yè)務(wù)問題也變得很容易?!?/p>
安永咨詢公司的全球分析主管Beatriz SanzSaiz補(bǔ)充道,現(xiàn)代分析技術(shù)“基于云系統(tǒng)和大數(shù)據(jù)架構(gòu),它們本身比傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)便宜得多。”
Saiz說(shuō):“此外,數(shù)據(jù)和分析技術(shù)通常用來(lái)獲得三個(gè)結(jié)果:提高流程效率、增加收入和積極主動(dòng)的風(fēng)險(xiǎn)管理。所以總的來(lái)說(shuō),運(yùn)用數(shù)據(jù)和分析技術(shù)可以為任何公司帶來(lái)大幅節(jié)省成本的好處?!?h3>誤區(qū)2:需要大數(shù)據(jù)才能執(zhí)行分析
對(duì)許多人來(lái)說(shuō),大數(shù)據(jù)和分析這兩個(gè)概念密不可分。這種想法指的是,企業(yè)需要在執(zhí)行分析之前收集大量數(shù)據(jù),以便獲得業(yè)務(wù)洞察力和改進(jìn)決策制定等。
當(dāng)然,大數(shù)據(jù)分析的好處已得到了公認(rèn),擁有資源的公司確實(shí)可以利用其存儲(chǔ)的數(shù)據(jù)作為分析工作的一部分,從而獲得顯著的競(jìng)爭(zhēng)優(yōu)勢(shì)。但大數(shù)據(jù)對(duì)分析來(lái)說(shuō)必不可少的想法是錯(cuò)誤的。
人力資源公司Allegis Global Solutions的商業(yè)智能執(zhí)行董事Tim Johnson說(shuō):“人們常常努力采集盡可能多的數(shù)據(jù);他們一聽到‘大數(shù)據(jù)就來(lái)勁。一個(gè)誤區(qū)是以為數(shù)據(jù)越多越好,機(jī)器會(huì)分門別類?!?/p>
然而分析員需要的是具體的數(shù)據(jù),而不是更多的數(shù)據(jù)。Johnson說(shuō):“95%的用戶在尋找與其工作相關(guān)的信息,支持決策和提高業(yè)績(jī)。”企業(yè)切忌一味獲取更多的數(shù)據(jù),而是要明白業(yè)務(wù)用戶不光關(guān)注需要訪問哪些數(shù)據(jù),還關(guān)注如何展示數(shù)據(jù)。
Johnson說(shuō):“讓員工可以訪問每一個(gè)信息(這些信息采用多種格式)會(huì)讓人無(wú)所適從,實(shí)際上阻礙采用。而是應(yīng)搞清楚對(duì)他們來(lái)說(shuō)重要的信息,以及如何以最簡(jiǎn)單的格式向他們展示這些信息?!?h3>誤區(qū)3:分析可以消除人為偏差
自動(dòng)化系統(tǒng)執(zhí)行的方式不應(yīng)該有偏差。但技術(shù)是人類開發(fā)的,所以消除所有偏差幾乎不可能。一些人認(rèn)為,分析技術(shù)和機(jī)器學(xué)習(xí)可以消除人為偏差。
全球技術(shù)咨詢公司ThoughtWorks的技術(shù)負(fù)責(zé)人Mike Mason說(shuō):“遺憾的是,這根本就不對(duì)。算法和分析使用‘訓(xùn)練數(shù)據(jù)加以調(diào)整,會(huì)重現(xiàn)該訓(xùn)練數(shù)據(jù)具有的任何特征?!?/p>
Mason表示,在一些情況下,這會(huì)給分析結(jié)果帶來(lái)無(wú)害的偏差;在其他情況下,會(huì)帶來(lái)較嚴(yán)重的偏差。他說(shuō):“就因?yàn)椤惴ㄟ@么說(shuō)并不意味著答案是合理的或有用的?!?h3>誤區(qū)4:最好的算法總是勝出
實(shí)際上,有了足夠的數(shù)據(jù),“有時(shí)候算法并不重要。”在Mason提到的IEEE上的一篇文章《數(shù)據(jù)的不合理有效性》中,谷歌的工程師認(rèn)為,簡(jiǎn)單的統(tǒng)計(jì)模型加上超海量數(shù)據(jù)比含有眾多特征和摘要的“更智能化”模型取得了更好的結(jié)果。
Mason說(shuō):“在一些情況下,僅僅處理數(shù)量更多的數(shù)據(jù)就能取得最好的結(jié)果?!?h3>誤區(qū)5:算法萬(wàn)無(wú)一失
Johnson表示,人們天生就高度信任統(tǒng)計(jì)模型和算法;隨著許多企業(yè)紛紛搞分析項(xiàng)目,它們?nèi)找嬉蕾噺?fù)雜的模型來(lái)支持決策。
“由于人們不了解模型、算法及其他先進(jìn)的數(shù)據(jù)科學(xué)實(shí)踐,所以信任它們?!盝ohnson表示,用戶不覺得自己具備可以挑戰(zhàn)模型的知識(shí),于是他們只好信任構(gòu)建模型的“聰明人”。
“在過(guò)去五六十年,我們聽說(shuō)過(guò)人工智能會(huì)在20年內(nèi)取得主導(dǎo)地位,我們會(huì)繼續(xù)聽到人們這么說(shuō)。在我們能公然信任機(jī)器學(xué)習(xí)和結(jié)果之前,還有好多事情要做。在此之前,我們要讓構(gòu)建算法和模型的人解釋是如何得出答案的。不是我們不能依賴結(jié)果,而是需要透明度,以便我們能夠信任和驗(yàn)證分析?!?h3>誤區(qū)6:數(shù)據(jù)科學(xué)是神秘的“魔法”
近年來(lái)數(shù)據(jù)科學(xué)備受關(guān)注,有時(shí)讓人犯疑:它到底是什么樣的學(xué)科。數(shù)據(jù)科學(xué)基本上是利用算法找出數(shù)據(jù)中的模式。
數(shù)據(jù)存儲(chǔ)公司Micron的CIO Trevor Schulze說(shuō):“數(shù)據(jù)科學(xué)似乎很神秘,因?yàn)檫@些算法能夠分析人腦理解能力之外的更多變量和更龐大數(shù)據(jù)集?!?/p>
“近年來(lái)隨著計(jì)算能力和內(nèi)存增大,我們現(xiàn)在能夠迅速解決僅僅10年前用任何技術(shù)都解決不了的問題。數(shù)據(jù)科學(xué)是幾十年來(lái)廣為人知的統(tǒng)計(jì)推論技術(shù)的自然演變的產(chǎn)物。一旦你了解數(shù)學(xué),數(shù)據(jù)科學(xué)毫無(wú)神秘可言?!?h3>誤區(qū)7:想搞更多的數(shù)據(jù)科學(xué),你需要更多的數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家是如今所有技術(shù)專業(yè)人員中最緊俏的。如果企業(yè)調(diào)整一下工作重心,也許用較少的數(shù)據(jù)科學(xué)家就可以。
Mason說(shuō):“許多數(shù)據(jù)科學(xué)家把時(shí)間花在了非增值型活動(dòng)上,比如尋找數(shù)據(jù)集、把數(shù)據(jù)放到可以處理它們的地方以及轉(zhuǎn)換和清理數(shù)據(jù)。鑒于招聘數(shù)據(jù)科學(xué)家很難,你不希望他們處理那些低價(jià)值的任務(wù)?!?/p>
“優(yōu)步(Uber)的Michelangelo平臺(tái)讓數(shù)據(jù)科學(xué)家可以專注于特征工程、提取和分析,而不是將數(shù)據(jù)倒來(lái)倒去,因而大大提高了生產(chǎn)力?!?/p>
如今,無(wú)論是趕緊將產(chǎn)品或服務(wù)推向市場(chǎng),還是近乎實(shí)時(shí)地響應(yīng)客戶咨詢,迅速完成工作是許多公司在考慮的一大競(jìng)爭(zhēng)優(yōu)勢(shì)。分析似乎要花很長(zhǎng)時(shí)間來(lái)執(zhí)行,這有悖于實(shí)現(xiàn)速度和靈活性的目標(biāo)。
Saiz說(shuō):“這種類型的項(xiàng)目耗時(shí)太長(zhǎng),相當(dāng)復(fù)雜,這個(gè)誤區(qū)依然存在。到頭來(lái),人才是關(guān)鍵。借助適當(dāng)?shù)募寄芙M合、運(yùn)用敏捷方法,可以在幾天或幾周后、而不是幾個(gè)月后解決重大問題?!?h3>誤區(qū)9:技術(shù)是最難的部分
咨詢公司ISG的IT采購(gòu)和數(shù)字咨詢服務(wù)主管James Burke表示,由于現(xiàn)在可供使用的技術(shù)越來(lái)越多,選擇合適的工具組合來(lái)部署和集成以便獲得分析團(tuán)隊(duì)預(yù)期的結(jié)果并非易事。
不過(guò)Burke表示,真正困難的部分是“把組織結(jié)構(gòu)和運(yùn)營(yíng)模式結(jié)合起來(lái),進(jìn)而把人員、流程和技術(shù)等角度所有必需的東西綜合起來(lái)。另外,你如何在現(xiàn)有的組織內(nèi)部或‘附近搞這項(xiàng)工作對(duì)企業(yè)組織來(lái)說(shuō)是最難的?!?/p>
別以為分析工具會(huì)完成所有工作也很重要。咨詢公司W(wǎng)est Monroe的技術(shù)業(yè)務(wù)高級(jí)主管Greg Layok說(shuō):“光靠技術(shù)根本解決不了任何業(yè)務(wù)問題。許多企業(yè)急著構(gòu)建數(shù)據(jù)湖,到頭來(lái)深陷泥潭或誰(shuí)也搞不明白的信息困境?!?/p>
Layok表示,技術(shù)解決不了分析問題。他說(shuō):“先找出業(yè)務(wù)問題,然后問‘我需要哪些數(shù)據(jù)來(lái)解決該問題?這將幫助你找出貴企業(yè)存在的數(shù)據(jù)缺口?!?h3>誤區(qū)10:數(shù)據(jù)分析應(yīng)該是獨(dú)立的部門
咨詢和數(shù)據(jù)收集公司Delvinia的總裁兼首席創(chuàng)新官Steven Mast表示,在一些企業(yè),數(shù)據(jù)分析作為一個(gè)獨(dú)立部門來(lái)運(yùn)作;而在另一些企業(yè),深深地融入到跨職能團(tuán)隊(duì)中。
Mast說(shuō):“然而,由于數(shù)據(jù)在所有業(yè)務(wù)領(lǐng)域大量涌現(xiàn),加上變化速度快,部門模式不管用了。隨著企業(yè)變得更以客戶為中心,數(shù)據(jù)驅(qū)動(dòng)的分析專家應(yīng)該是業(yè)務(wù)部門的核心,而不是作為你尋求支持的部門來(lái)運(yùn)作?!?/p>
如今企業(yè)面臨的許多復(fù)雜問題都在業(yè)務(wù)部門內(nèi)部,而解決這些問題的許多方案都隱藏在數(shù)據(jù)中?!皵?shù)據(jù)科學(xué)家和專家與這些業(yè)務(wù)部門密切合作,利用龐大數(shù)據(jù)集和人工智能,將是打造下一代產(chǎn)品、服務(wù)和客戶體驗(yàn)的關(guān)鍵?!?h3>誤區(qū)11:分析完全是博士干的事
分析團(tuán)隊(duì)有眾多受過(guò)良好教育的人雖好,但不是成功的必然要求。
Saiz說(shuō):“許多公司往往認(rèn)為,要是沒有博士成員,就無(wú)法開展最佳的分析工作?,F(xiàn)代分析需要結(jié)合一系列技能,需要精通新興技術(shù)和開源軟件的人員。擁有不同的技能很重要,包括大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)可視化專家等。”
歷史上新技術(shù)的出現(xiàn)顛覆了許多工作和行業(yè),于是有人擔(dān)心人工智能將不需要人們執(zhí)行某些任務(wù)。
Schulze說(shuō):“人工智能解決方案在解決某些類別的問題方面比人類好得多。“人工智能比人類讀得更快、記得更多,計(jì)算復(fù)雜的數(shù)學(xué)關(guān)系更準(zhǔn)確。然而面對(duì)新的情形,人工智能卻無(wú)能為力,而這正是人類擅長(zhǎng)的地方?!?/p>
當(dāng)然,某些工作已經(jīng)因人工智能的崛起而消失或式微,但其他工作會(huì)隨之而來(lái)。他說(shuō):“不過(guò),我們?nèi)祟惱斫夂蛻?yīng)對(duì)完全無(wú)法預(yù)料的情形的能力不會(huì)被任何目前所知的人工智能技術(shù)取代。在可預(yù)見的未來(lái),人工智能方面最有效的做法是,用人工智能系統(tǒng)增強(qiáng)人類能力,這類人工智能系統(tǒng)在算法勝過(guò)人類的領(lǐng)域執(zhí)行一些‘繁重任務(wù)。雖然許多工作會(huì)因人工智能而變化,但人仍將是這個(gè)商業(yè)生態(tài)系統(tǒng)的重要組成部分?!?/p>