王永
“20年前我剛開(kāi)始做數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)商務(wù)智能領(lǐng)域的時(shí)候,如果用戶擁TB級(jí)的數(shù)據(jù)量,那么它一定是電信、金融等少有的公司,但是現(xiàn)在這變成一件很正常的事情?!盩ableau大中華區(qū)客戶解決方案總監(jiān)劉琳珂在接受筆者的采訪時(shí)表示,Tableau 3年前的數(shù)據(jù)量就已經(jīng)超過(guò)了1000T了。而現(xiàn)在全球范圍內(nèi),不管是結(jié)構(gòu)化,還是非結(jié)構(gòu)化的數(shù)據(jù),都在爆炸式增長(zhǎng)。
事實(shí)上,面對(duì)如此龐大的數(shù)據(jù)量,如何充分利用、挖掘數(shù)據(jù)的價(jià)值,正在成為企業(yè)用戶急需解決的難題。
像百度、谷歌等類似做搜索引擎的成熟公司,以及一些點(diǎn)評(píng)類的公司,都是積累了大量的數(shù)據(jù),并利用數(shù)據(jù)的變現(xiàn)來(lái)給企業(yè)提供重要的增值服務(wù)。
然而對(duì)于大多數(shù)用戶來(lái)說(shuō),他們?cè)跀?shù)據(jù)的利用和使用上還處于初級(jí)入門的階段。“我們碰到的10個(gè)客戶其中9個(gè)都處于這種狀態(tài),比例甚至更高?!眲⒘甄姹硎?,Tableau希望可以幫助用戶更好地利用數(shù)據(jù),讓數(shù)據(jù)真正的為客戶發(fā)揮價(jià)值。
在最近發(fā)布的2019.3版本中,Tableau針對(duì)客戶的需求分別從可信賴的數(shù)據(jù)環(huán)境、規(guī)模、降低數(shù)據(jù)使用門檻三個(gè)方向進(jìn)行優(yōu)化和升級(jí)。
“過(guò)去用戶經(jīng)常存在著報(bào)表數(shù)據(jù)不及時(shí)、不準(zhǔn)確、甚至是上下級(jí)數(shù)據(jù)統(tǒng)計(jì)口徑對(duì)不上的情況,”在劉琳珂看來(lái),為客戶數(shù)據(jù)分析建立干凈、準(zhǔn)確、及時(shí)的環(huán)境,并不是很容易的事情,尤其是對(duì)于大規(guī)模使用的用戶來(lái)說(shuō)。
為了讓客戶的整個(gè)企業(yè)擁有一個(gè)可信賴的數(shù)據(jù)環(huán)境,去年,Tableau發(fā)布了第一款數(shù)據(jù)管理類產(chǎn)品組件——Tableau Prep,為用戶提供一個(gè)自助式、可視化的工具,幫助其進(jìn)行數(shù)據(jù)清洗和整理。在2019.3版本中,為了幫助企業(yè)的業(yè)務(wù)人員和IT人員更深層次的認(rèn)識(shí)、使用Tableau,Tableau建立了一套使用的目錄和字典——Tableau Catalog。通過(guò)Tableau Catalog,用戶可以更好地了解企業(yè)的可視化圖表,以及圖表背后對(duì)應(yīng)的數(shù)據(jù)源、數(shù)據(jù)表、數(shù)據(jù)庫(kù),實(shí)現(xiàn)更優(yōu)的可見(jiàn)性并提升數(shù)據(jù)發(fā)現(xiàn),確保分析時(shí)始終使用的是正確的數(shù)據(jù)。其可以直接可以在Tableau Server上進(jìn)行使用。Tableau Catalog會(huì)自動(dòng)地把Tableau環(huán)境里面可視化的儀表盤、報(bào)表、數(shù)據(jù)連接等全部維護(hù)起來(lái),讓用戶們可以快速了解,并進(jìn)行操作管理。
此外,為了讓企業(yè)更高效地管理整個(gè)公司內(nèi)Tableau Server 部署的產(chǎn)品,在2019.3版本中Tableau推出了Tableau Sever Management Add-on服務(wù)器管理插件——適用于私有云集群、混合云集群和公有云集群服務(wù)器。Tableau 的Data Management Add-On涵蓋 Tableau Catalog 和 Prep Conductor,將能夠幫助客戶更好地管理其分析環(huán)境下的數(shù)據(jù),確保總是使用最新且值得信賴的數(shù)據(jù)來(lái)驅(qū)動(dòng)決策制定。
劉琳珂提到,企業(yè)在運(yùn)營(yíng)中,多樣化的云環(huán)境,這為用戶的使用體驗(yàn)帶來(lái)一定程度的困擾?!昂芏鄧?guó)際化企業(yè)是大集中式的環(huán)境,導(dǎo)致其計(jì)算服務(wù)環(huán)境集中在某一國(guó)家的云環(huán)境中,也有一些分布式的,可能每個(gè)部門就會(huì)有一臺(tái)Tableau的服務(wù)器。所以,用戶更希望Tableau能夠推出多個(gè)環(huán)境之間的協(xié)同與遷移的功能?!眲⒘甄姹硎荆谶^(guò)去Tableau是通過(guò)多服務(wù)器管理的最佳時(shí)間服務(wù)方法來(lái)實(shí)現(xiàn),而在2019.3版本中,Tableau的遷移管理組件可以有效的解決這些問(wèn)題——從開(kāi)發(fā)測(cè)試生產(chǎn)環(huán)境當(dāng)中一級(jí)一級(jí)地把幾十、上百個(gè)Tableau的儀表盤來(lái)做環(huán)境的遷移,或者是把Tableau做好的內(nèi)容打包之后在多個(gè)環(huán)境當(dāng)中來(lái)去做遷移。
除此之外,為了進(jìn)一步降低數(shù)據(jù)的使用門檻,讓企業(yè)所有人都能參與其中,Tableau推出了Explain Data。Tableau去年推出了Ask Data,可以讓用戶用自然語(yǔ)言輸出提出問(wèn)題,得到相關(guān)答案。而Explain Data(數(shù)據(jù)解釋)則是Tableau在這一領(lǐng)域的延展,讓用戶不僅知其然,還能知其所以然。
“Tableau一直以來(lái)都是希望幫助用戶能夠在跟少的培訓(xùn)基礎(chǔ)上得到更多業(yè)務(wù)上的回饋。從Ask Data到Explain Data,Tableau希望通過(guò)與AI整合,滿足用戶的需求?!眲⒘甄姹硎荆郧捌髽I(yè)的業(yè)務(wù)人員從數(shù)據(jù)表到數(shù)據(jù)分析,整個(gè)環(huán)節(jié)可能會(huì)消耗大量的時(shí)間成本,但是對(duì)于Explain Data來(lái)講,可能只需要一個(gè)按鈕即可完成可視化推薦的圖表。Explain Data可替代分析師并使用精密統(tǒng)計(jì)算法分析所有可用數(shù)據(jù),隨后自動(dòng)對(duì)驅(qū)動(dòng)任何給定數(shù)據(jù)點(diǎn)最相關(guān)的因素提供解釋。由此,它能夠讓更多的人使用強(qiáng)大的分析技術(shù),幫助他們獲得此前難以發(fā)現(xiàn)或探索過(guò)程極為耗時(shí)的深入見(jiàn)解。
Tableau持續(xù)投入在機(jī)器學(xué)習(xí)和AI上的研發(fā),希望幫助客戶保留固有的使用習(xí)慣,帶來(lái)更多便捷和易用性。
在談到此次發(fā)布的重要意義時(shí),劉琳珂表示,Data Management數(shù)據(jù)管理的插件包是Tableau整個(gè)產(chǎn)品戰(zhàn)略當(dāng)中重要的一環(huán)?!拔覀兪窍M约翰恢皇亲隹梢暬治龅牟糠?,還需要下探到客戶并為其提供可信的數(shù)據(jù)環(huán)境。所以,從去年推出Tableau Prep來(lái)做可視化數(shù)據(jù),一直到Tableau Catalog,做元數(shù)據(jù)的管理和維護(hù),都是這個(gè)領(lǐng)域不同的產(chǎn)品塊。我們希望可以更多完善Tableau的產(chǎn)品架構(gòu),進(jìn)一步擴(kuò)展Tableau在數(shù)據(jù)管理、元數(shù)據(jù)管理、可信數(shù)據(jù)的方向的能力?!眲⒘甄嫒缡钦f(shuō)。