路沙
前不久,Gartner 公布 2020 年度全球數(shù)據(jù)庫魔力象限評估結(jié)果,阿里云挺進全球數(shù)據(jù)庫第一陣營——領(lǐng)導(dǎo)者象限。這是中國基礎(chǔ)軟件行業(yè)首次進入Gartner魔力象限的全球領(lǐng)導(dǎo)者。從表面上看,這是一種從挑戰(zhàn)者到領(lǐng)導(dǎo)者之間的角色轉(zhuǎn)變。不過這種角色轉(zhuǎn)變的背后卻代表著中國技術(shù)正日益走向國際舞臺,并日漸成為這個舞臺當(dāng)中的佼佼者。就像Gartner分析師在報告中所說的那樣:“阿里云擁有豐富的數(shù)據(jù)庫種類覆蓋度和完善的產(chǎn)品布局,為用戶提供了多種關(guān)系型、分析型和非關(guān)系型數(shù)據(jù)庫產(chǎn)品,還提供了混合云環(huán)境部署,同時集成了備份、數(shù)據(jù)遷移與同步等能力,并且阿里云有非常強大的技術(shù)實力與創(chuàng)新能力?!?/p>
也正是憑借這種能力使得消費者在今年又度過了一個有著絲般順滑體驗的雙十一購物之夜。據(jù)統(tǒng)計,今年雙十一交易峰值是每秒58.3萬筆,每筆訂單背后包括商品、交易、支付、物流、評價等復(fù)雜的業(yè)務(wù)邏輯,對于數(shù)據(jù)庫來講就變成了上億甚至更高的每秒事務(wù)處理能力。不過對于坐在電腦前的消費者來說,盡管瞬間產(chǎn)生了如此大規(guī)模的高并發(fā)流量,但選款、下單、付款的購物流程,仍然是一氣呵成,“如絲般潤滑”。
在阿里巴巴副總裁、阿里云數(shù)據(jù)庫事業(yè)部負責(zé)人李飛飛看來,雙十一的場景特點就是數(shù)量大,并發(fā)高,瞬間對系統(tǒng)的要求非常極致,所以阿里巴巴主要通過云原生架構(gòu)的突破以及分布式技術(shù)的應(yīng)用,實現(xiàn)了資源池化,資源池化以后進一步實現(xiàn)存儲計算分離,這樣帶來的好處就是極致的彈性以及高可用性,從而可以在短時間內(nèi)快速地分配資源,然后滿足這種系統(tǒng)負載瞬間飆高的場景需求。
為什么要將一個個豎井變成相互貫通的“水池”
李飛飛表示,云的本質(zhì)就是利用虛擬化的技術(shù)將資源池化,從而進一步實現(xiàn)計算存儲分離和資源解耦。這就像以前家家戶戶打水井,每個水井都獨立的,但今天我們實際上是要把水井底部全部打通,形成一個暗的池塘,做到資源池化,從而提升資源的使用率。
這種技術(shù)優(yōu)勢是傳統(tǒng)IT基礎(chǔ)設(shè)施當(dāng)中計算存儲緊耦合和單一的分布式架構(gòu)所不能比擬的。因為單一的分布式的架構(gòu),在面對數(shù)據(jù)只讀、讀寫,甚至數(shù)據(jù)一致性等問題時,會變得越來越復(fù)雜,挑戰(zhàn)自然也會越來越多。而實現(xiàn)資源池化,并在這個基礎(chǔ)上做資源解耦,可以享受到極致彈性和高可用的性能?!霸谶@個前提下,我們認為在云原生的時代,數(shù)據(jù)庫的設(shè)計和數(shù)據(jù)庫的理念都將發(fā)生本質(zhì)性的變化?!崩铒w飛這樣講道。
作為前沿技術(shù)的創(chuàng)新者和引領(lǐng)者,阿里巴巴自然不會坐失機遇??梢钥吹剑⒗锇桶褪状卧谛袠I(yè)內(nèi)提出了云原生分布式數(shù)據(jù)庫的概念。對于云原生分布式數(shù)據(jù)庫,李飛飛表示,隨著企業(yè)業(yè)務(wù)全面向數(shù)字化、在線化、智能化演進,企業(yè)面臨著呈指數(shù)級遞增的海量存儲需求和挑戰(zhàn),業(yè)務(wù)有更多的熱點和突發(fā)流量帶來的挑戰(zhàn),而云原生分布式數(shù)據(jù)庫帶來的四大特性,很好地解決了企業(yè)用戶的核心訴求。從資源池化到彈性擴展,再到智能運維,再到離在線一體化。利用這些核心的特性,數(shù)據(jù)庫也將全面地進入云原生加分布式的時代。
不僅如此,在云原生數(shù)據(jù)庫層面,阿里巴巴還推出了核心的云原生關(guān)系型數(shù)據(jù)庫 PolarDB 以及分布式版 PolarDB-X ;在傳統(tǒng)的 OLAP 領(lǐng)域,推出了新一代云原生數(shù)據(jù)倉庫 AnalyticDB以及云原生數(shù)據(jù)湖分析 Data Lake Analytics;在NoSQL領(lǐng)域,推出了云原生多模數(shù)據(jù)庫Lindorm和云原生內(nèi)存數(shù)據(jù)庫Tair。除此之外還構(gòu)建了企業(yè)級數(shù)據(jù)庫生態(tài)工具產(chǎn)品體系,以及云原生智能化數(shù)據(jù)庫管控平臺。
從管控平臺,到生態(tài)工具,再到具體領(lǐng)域的相應(yīng)技術(shù)產(chǎn)品,在記者看來,阿里巴巴正在日益構(gòu)建一個數(shù)據(jù)庫產(chǎn)品的閉環(huán)。對此,李飛飛認為,通過豐富的數(shù)據(jù)庫產(chǎn)品體系來構(gòu)建一個豐富的生態(tài),能夠讓客戶在這個生態(tài)當(dāng)中用數(shù)據(jù)庫的方法解決諸多數(shù)據(jù)處理、存儲分析、計算所面臨的挑戰(zhàn)和問題,這不僅是阿里巴巴的基本出發(fā)點,也是客戶學(xué)習(xí)曲線最低,應(yīng)用成本最低的一種方案。
從離在線一體化訴求到數(shù)據(jù)庫大數(shù)據(jù)一體化技術(shù)趨勢
當(dāng)記者問道,隨著阿里巴巴在行業(yè)內(nèi)實踐的日漸深入,我們有沒有發(fā)現(xiàn)目前客戶呈現(xiàn)出的一些明顯的需求變化時,李飛飛著重強調(diào)了離在線一體化計算分析的訴求。在他看來,傳統(tǒng)的數(shù)據(jù)庫可能只做在線交易和在線分析,但客戶越來越希望通過一套系統(tǒng)能夠解決數(shù)據(jù)處理過程中整個鏈路的訴求。也就是說,不僅僅能做在線分析,最好也能做離線的復(fù)雜計算分析。
基于此,李飛飛提到了HTAP以及數(shù)據(jù)庫大數(shù)據(jù)一體化技術(shù)。HTAP技術(shù)能夠?qū)⒃诰€事務(wù)處理和在線分析與計算合二為一,數(shù)據(jù)庫大數(shù)據(jù)一體化技術(shù)將在線分析和離線計算合二為一, 結(jié)合MPP和BSP技術(shù),提供交互式分析和復(fù)雜離線ETL的一體化處理。從產(chǎn)品體系上,基于這種訴求和技術(shù)趨勢,阿里巴巴要為客戶提供端到端的數(shù)據(jù)能力,包括生產(chǎn)、處理、存儲、計算分析等。
對此,李飛飛表示,這就要求我們不僅要具備豐富的產(chǎn)品體系,還要構(gòu)建一個開放的合作生態(tài)。眾所周知,阿里巴巴在數(shù)據(jù)庫領(lǐng)域已經(jīng)形成了從管控平臺,到生態(tài)工具,再到具體領(lǐng)域的相應(yīng)技術(shù)產(chǎn)品的豐富體系。而對于構(gòu)建開放的合作生態(tài),李飛飛提到,數(shù)據(jù)庫系統(tǒng)發(fā)展已經(jīng)將近40年,如果你想在這個賽道上另起爐灶,重新建立生態(tài),這幾乎是不可能完成的事情。雖然這并不代表就不能做到自研自主可控,但是上面的使用習(xí)慣、使用語法一定要兼容現(xiàn)有的生態(tài),這樣才能快速地融入到現(xiàn)有的體系當(dāng)中去,而不是把現(xiàn)有的體系全部徹底推翻,然后讓大家來適應(yīng)你。
基于這種理解,如今阿里巴巴數(shù)據(jù)庫的核心產(chǎn)品PolarDB和AnalyticDB都在做兼容性的工作。比如說PolarDB100%兼入MySQL、100%兼容PostgreSQL,還有高度兼容Oracle的版本,AnalyticDB 高度兼容MySQL, 100%兼容PostgreSQL和Greenplum, 高度兼容Oracle和TeraData的版本。
在李飛飛看來,所有的這些工作本質(zhì)上就是為了更好地服務(wù)現(xiàn)有的生態(tài),融入現(xiàn)有的生態(tài)體系。到具體操作層面,首先從系統(tǒng)架構(gòu)上,盡可能保障系統(tǒng)設(shè)計和現(xiàn)有的系統(tǒng)架構(gòu)不要有太大的差異化。其次,雖然從架構(gòu)上做了存儲計算分離,資源池化,但是除此之外,并不希望徹底地改變現(xiàn)有的這些架構(gòu),而是盡可能地讓內(nèi)核能夠和現(xiàn)有的架構(gòu)有一個比較好的融合。這樣一來,用戶從現(xiàn)有的生態(tài)體系遷移到阿里巴巴的數(shù)據(jù)庫上就不會有太大的挑戰(zhàn)。
最后,李飛飛表示,數(shù)據(jù)庫領(lǐng)域的核心發(fā)展方向是云原生+分布式,并由此帶來了幾個核心技術(shù)布局: 數(shù)據(jù)庫與大數(shù)據(jù)一體化、智能化、安全可信、軟硬件一體化、離在線一體化、多模數(shù)據(jù)處理。在這些方面,未來阿里云數(shù)據(jù)庫將深度結(jié)合云原生與分布式,通過存儲計算分離等技術(shù)以及積極構(gòu)建開放的融合生態(tài),幫助用戶最大限度地實現(xiàn)資源池化、彈性變配、超高并發(fā)等能力,實現(xiàn)數(shù)據(jù)從生產(chǎn)、到處理、到存儲、再到分析計算的一體化體驗。