国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

怎樣避免大數(shù)據(jù)分析失敗

2017-09-22 12:35:12BobViolino楊勇
計(jì)算機(jī)世界 2017年35期
關(guān)鍵詞:數(shù)據(jù)管理工具產(chǎn)品

Bob+Violino+楊勇

請(qǐng)遵循這六個(gè)最佳實(shí)踐,超越競(jìng)爭(zhēng),創(chuàng)造新的收入來源,更好地為客戶服務(wù)。

大數(shù)據(jù)和分析能夠改變游戲規(guī)則,為您提供深度分析,幫助您在競(jìng)爭(zhēng)中領(lǐng)先,創(chuàng)造新的收入來源,更好地為客戶服務(wù)。

大數(shù)據(jù)和分析也可能導(dǎo)致巨大的失敗,浪費(fèi)大量的時(shí)間和金錢——更不用說會(huì)失去才華橫溢的技術(shù)專家,他們厭倦了那些令人失望的管理失誤。

怎樣避免大數(shù)據(jù)失敗呢?從基本的業(yè)務(wù)管理角度來看,一些最好的做法是顯而易見的:一定要有公司最高級(jí)別的行政人員參與,確保需要的所有技術(shù)投資獲得足夠的資金,并引入所需的專業(yè)知識(shí)和/或良好的培訓(xùn)。如果不先解決這些基本問題,其他的什么都不重要。

假設(shè)您已經(jīng)解決了這些基本問題,那么大數(shù)據(jù)分析成功與失敗的區(qū)別在于您怎樣處理大數(shù)據(jù)分析的技術(shù)問題和挑戰(zhàn)。下面介紹的最佳實(shí)踐可以幫助您站在成功的一邊。

1.仔細(xì)選擇您的大數(shù)據(jù)分析工具

很多技術(shù)的失敗源于這樣一個(gè)事實(shí),即企業(yè)購(gòu)買和實(shí)施的產(chǎn)品好像正是他們想要的。任何廠商都可以把“大數(shù)據(jù)”或者“高級(jí)分析”之類的詞用在產(chǎn)品描述上,利用這些術(shù)語來進(jìn)一步炒作。

但是產(chǎn)品不僅在質(zhì)量和效果上有很大的差別,而且應(yīng)用重點(diǎn)也不同。因此,即使您選擇了技術(shù)含量很高的產(chǎn)品,也未必是您真正需要的。

幾乎所有的大數(shù)據(jù)分析都有一些基本功能,比如圍繞數(shù)據(jù)轉(zhuǎn)換和存儲(chǔ)架構(gòu)(想想Hadoop和Apache Spark)的功能。而在大數(shù)據(jù)分析中也有很多細(xì)分功能,您應(yīng)該選擇能夠滿足自己技術(shù)戰(zhàn)略要求的細(xì)分產(chǎn)品。這些細(xì)分功能包括挖掘、預(yù)測(cè)分析、實(shí)時(shí)解決方案,人工智能和商業(yè)智能儀表板等。

在決定購(gòu)買任何大型數(shù)據(jù)分析產(chǎn)品或者存儲(chǔ)平臺(tái)之前,您需要弄清楚真正的業(yè)務(wù)需求和問題是什么,選擇能夠有效解決這些具體問題的產(chǎn)品。

例如,由于編譯龐大的數(shù)據(jù)集會(huì)非常復(fù)雜,您會(huì)選擇使用人工智能來分析非結(jié)構(gòu)化數(shù)據(jù)的認(rèn)知大數(shù)據(jù)產(chǎn)品。電信公司沃達(dá)豐大數(shù)據(jù)全球業(yè)務(wù)主管Israel Exposito說,但您不會(huì)針對(duì)結(jié)構(gòu)化和標(biāo)準(zhǔn)化數(shù)據(jù)使用認(rèn)知工具,您可以從眾多的分析產(chǎn)品中選擇一款并部署它,以更合理的價(jià)格實(shí)時(shí)獲得高質(zhì)量的深度分析結(jié)果。

Exposito說,明智的做法是,在為您的產(chǎn)品環(huán)境選擇一款產(chǎn)品之前,使用至少兩款產(chǎn)品來驗(yàn)證概念。該產(chǎn)品還應(yīng)該與您相關(guān)的企業(yè)平臺(tái)有接口。

每一大數(shù)據(jù)分析工具都需要在后端系統(tǒng)中開發(fā)數(shù)據(jù)模型。這是項(xiàng)目中最重要的部分。因此,您一定要讓系統(tǒng)集成商和業(yè)務(wù)領(lǐng)域?qū)<以陧?xiàng)目工作中攜手合作。不要急,第一次就把它做好。

重要的是要記住,始終要提供正確的數(shù)據(jù),并轉(zhuǎn)換成業(yè)務(wù)語言,這樣用戶就可以完全理解輸出,從而可以使用它來發(fā)現(xiàn)機(jī)會(huì),或者改進(jìn)流程。

2.這些工具一定要易于使用

大數(shù)據(jù)和高級(jí)分析非常復(fù)雜,但業(yè)務(wù)用戶所采用的,并用于理解數(shù)據(jù)的產(chǎn)品沒必要這么復(fù)雜。

為業(yè)務(wù)分析部門提供用于數(shù)據(jù)發(fā)現(xiàn)以及分析和可視化功能的簡(jiǎn)單、有效的工具。

域名注冊(cè)商GoDaddy商業(yè)智能工具拓展專員Sharon Graves說,自己的公司很難找到合適的組合工具。它必須能夠簡(jiǎn)單方便地快速實(shí)現(xiàn)可視化,而且有足夠的能力進(jìn)行深度分析。GoDaddy能夠找到產(chǎn)品,這些產(chǎn)品讓企業(yè)用戶很容易找到相應(yīng)的數(shù)據(jù),然后自己生成數(shù)據(jù)可視化。這使得分析部門能騰出時(shí)間去進(jìn)行更高級(jí)的分析工作。

最重要的是,不要給非技術(shù)業(yè)務(wù)用戶提供程序員級(jí)的工具。不然,他們會(huì)變得沮喪,可能會(huì)再去使用以前的工具,而這些工具并不能勝任工作(否則,您就不會(huì)有大數(shù)據(jù)分析項(xiàng)目)。

3.項(xiàng)目和數(shù)據(jù)要與實(shí)際業(yè)務(wù)需求相一致

大數(shù)據(jù)分析工作可能失敗的另一個(gè)原因是,它最終成了一個(gè)要去解決不存在問題的解決方案。信息服務(wù)提供商Experian全球數(shù)據(jù)實(shí)驗(yàn)室首席科學(xué)家Shanji Xiong說,這就是為什么您必須把要滿足的業(yè)務(wù)挑戰(zhàn)和需求納入到相應(yīng)的分析問題中的原因。

關(guān)鍵的一點(diǎn)是,在項(xiàng)目早期就要讓具有很強(qiáng)的分析背景的領(lǐng)域?qū)<覅⑴c進(jìn)來,與數(shù)據(jù)科學(xué)家合作來確定問題。

下面是Experian自己的大數(shù)據(jù)分析計(jì)劃的一個(gè)例子。當(dāng)開發(fā)打擊身份欺騙的分析解決方案時(shí),難點(diǎn)在于評(píng)估姓名、地址和社會(huì)保障號(hào)碼等個(gè)人身份信息(PII)是否合法。還有一個(gè)難點(diǎn)是,當(dāng)一名客戶申請(qǐng)貸款時(shí),所使用的一組身份是否是合法擁有者的身份。這些難點(diǎn)可能會(huì)同時(shí)存在。

第一個(gè)難點(diǎn)是“合成身份”的問題,Xiong說,這需要一個(gè)分析模型在客戶級(jí)或者PII級(jí)評(píng)估身份合成的風(fēng)險(xiǎn)。第二個(gè)難點(diǎn)是應(yīng)用程序欺騙問題,需要在應(yīng)用程序級(jí)開發(fā)用于評(píng)估欺騙風(fēng)險(xiǎn)的評(píng)分系統(tǒng)。Experian必須理解這些不同的問題——即使這些問題最初被認(rèn)為是表現(xiàn)不一樣的同一問題,然后建立合適的模型,進(jìn)行分析以解決問題。

Xiong說,當(dāng)把一組PII提交給兩家金融機(jī)構(gòu)申請(qǐng)貸款時(shí),通常要求是針對(duì)合成風(fēng)險(xiǎn)應(yīng)返回相同的得分,但這通常不是應(yīng)用程序欺騙評(píng)分系統(tǒng)所必須的功能。

必須把正確的算法應(yīng)用于正確的數(shù)據(jù),才能實(shí)現(xiàn)商業(yè)智能,做出準(zhǔn)確的預(yù)測(cè)。在建模過程中,收集并包含相關(guān)的數(shù)據(jù)集總是比精確的調(diào)整機(jī)器學(xué)習(xí)算法更重要,因此應(yīng)把數(shù)據(jù)處理工作視為頭等大事。

4.建立數(shù)據(jù)湖,不要舍不得帶寬

顧名思義,大數(shù)據(jù)涉及到大量的數(shù)據(jù)。在過去,很少有企業(yè)能夠存儲(chǔ)這么多的數(shù)據(jù),更不用說組織這些數(shù)據(jù)并進(jìn)行分析了。但是今天,高性能存儲(chǔ)技術(shù)和大規(guī)模并行處理技術(shù)已經(jīng)應(yīng)用得非常廣泛了——即在云中,也在本地系統(tǒng)中。

然而,存儲(chǔ)本身是不夠的。您需要一種方法來處理輸入到大數(shù)據(jù)分析系統(tǒng)中的各種類型的數(shù)據(jù)。這就是Apache的Hadoop發(fā)揮其天才之處,它能夠存儲(chǔ)和映射龐大的、不同的數(shù)據(jù)集。這種存儲(chǔ)庫(kù)通常被稱為數(shù)據(jù)湖。實(shí)際的湖泊一般有多條河流流入,會(huì)有很多種類的植物、魚和其他動(dòng)物;數(shù)據(jù)湖一般有多個(gè)數(shù)據(jù)源輸入,含有多種類型的數(shù)據(jù)。endprint

但是數(shù)據(jù)湖不應(yīng)該成為數(shù)據(jù)的垃圾場(chǎng)。亞利桑那州國(guó)家大學(xué)計(jì)算研究主任Jay Etchings說,您應(yīng)該想好怎樣匯集數(shù)據(jù),以有意義的方式增加數(shù)據(jù)價(jià)值。數(shù)據(jù)可以是完全不同的,但是使用MapReduce和Apache Spark等工具進(jìn)行分析時(shí),就應(yīng)該使用可靠的數(shù)據(jù)架構(gòu)對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。

創(chuàng)建一個(gè)數(shù)據(jù)湖,其中,輸入、索引和標(biāo)準(zhǔn)化等都是大數(shù)據(jù)策略精心設(shè)計(jì)好的組成部分。Etchings說,如果沒有一個(gè)清晰的認(rèn)識(shí)和明確的藍(lán)圖,大多數(shù)數(shù)據(jù)密集型的計(jì)劃注定要失敗。

同樣,擁有足夠的帶寬是非常重要的;否則數(shù)據(jù)不可能從各種來源流入到數(shù)據(jù)湖中,業(yè)務(wù)用戶也不能很快地使用數(shù)據(jù)。Etchings說,要實(shí)現(xiàn)擁有大量數(shù)據(jù)資源的承諾,不僅需要支持每秒數(shù)百萬次I/O操作(IOPS)的高速硬盤,而且還需要連接節(jié)點(diǎn)和處理引擎,這些節(jié)點(diǎn)和處理引擎可以在生成數(shù)據(jù)時(shí)方便地訪問數(shù)據(jù)。

從社交媒體到數(shù)據(jù)流路由,速度對(duì)于實(shí)時(shí)分析尤其重要。因此,用最快的互連構(gòu)建您的數(shù)據(jù)湖。

5.把安全設(shè)計(jì)到大數(shù)據(jù)的各個(gè)方面中

計(jì)算基礎(chǔ)設(shè)施組件的高度異構(gòu)性極大地提高了企業(yè)從數(shù)據(jù)中獲取有意義的深度分析結(jié)果的能力。但有一個(gè)缺點(diǎn):Etchings說,系統(tǒng)在管理和安全上會(huì)非常復(fù)雜。很多大數(shù)據(jù)分析系統(tǒng)都涉及到巨量的數(shù)據(jù),其任務(wù)也都是非常關(guān)鍵的,如果不能在保護(hù)系統(tǒng)和數(shù)據(jù)方面采取足夠的預(yù)防措施,那在很大程度上就是自找麻煩。

企業(yè)采集、存儲(chǔ)、分析和共享的大部分?jǐn)?shù)據(jù)都是客戶信息——其中一些是個(gè)人信息和身份信息。如果這些數(shù)據(jù)落入別人手中,結(jié)果是可以預(yù)測(cè)的:法律上的損失是訴訟,可能還有監(jiān)管罰款,品牌和聲譽(yù)受損,客戶也不會(huì)滿意。

您的安全措施應(yīng)包括部署基本的企業(yè)工具:實(shí)用的數(shù)據(jù)加密、身份和訪問管理,以及網(wǎng)絡(luò)安全。您的安全措施還應(yīng)包括為能夠正確訪問和使用數(shù)據(jù)所要遵從的政策以及相關(guān)的培訓(xùn)。

6.把數(shù)據(jù)管理和質(zhì)量放在首位

確保良好的數(shù)據(jù)管理和質(zhì)量應(yīng)該是所有大數(shù)據(jù)分析項(xiàng)目的標(biāo)志——否則會(huì)很有可能失敗。

您應(yīng)該做好控制工作,以確保數(shù)據(jù)是最新的、準(zhǔn)確的,并能夠及時(shí)交付。作為其大數(shù)據(jù)計(jì)劃的一部分,GoDaddy提供了報(bào)警功能,如果數(shù)據(jù)更新失敗或者運(yùn)行推遲,會(huì)通知管理員。此外,GoDaddy對(duì)關(guān)鍵指標(biāo)進(jìn)行數(shù)據(jù)質(zhì)量檢查,當(dāng)這些指標(biāo)不符合預(yù)期時(shí),會(huì)發(fā)送警報(bào)。

確保數(shù)據(jù)質(zhì)量和治理的一個(gè)關(guān)鍵點(diǎn)是聘請(qǐng)技術(shù)熟練的數(shù)據(jù)管理專家,其中包括數(shù)據(jù)管理主管以及監(jiān)管這些領(lǐng)域的高管??紤]到這些舉措的戰(zhàn)略重要性,企業(yè)在數(shù)據(jù)管理、治理和政策方面確實(shí)應(yīng)擁有數(shù)據(jù)所有權(quán)。endprint

猜你喜歡
數(shù)據(jù)管理工具產(chǎn)品
企業(yè)級(jí)BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實(shí)踐
波比的工具
波比的工具
CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
“巧用”工具
讀者(2017年18期)2017-08-29 21:22:03
2015產(chǎn)品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
新產(chǎn)品
玩具(2009年10期)2009-11-04 02:33:14
產(chǎn)品
壤塘县| 兰州市| 连云港市| 长泰县| 灵石县| 富民县| 济南市| 石泉县| 诸城市| 车致| 宁津县| 阿拉善右旗| 两当县| 棋牌| 台州市| 郯城县| 遂溪县| 荔波县| 桃园县| 东城区| 平顺县| 文安县| 九龙城区| 海晏县| 白河县| 贵州省| 宜宾县| 呼玛县| 内丘县| 自治县| 泉州市| 庆阳市| 安远县| 客服| 青田县| 林周县| 依安县| 泰宁县| 百色市| 会东县| 梁平县|