郭濤
提供大規(guī)模、標(biāo)準(zhǔn)化、統(tǒng)一且易于使用的云渲染服務(wù)對(duì)于整個(gè)渲染行業(yè)來(lái)說(shuō)都是一個(gè)難題。贊奇科技憑借定制化的服務(wù)器、分布式存儲(chǔ)和靈活的業(yè)務(wù)模式,在云渲染服務(wù)市場(chǎng)上找到了自己的定位。
贊奇科技發(fā)展有限公司(以下簡(jiǎn)稱贊奇科技)是國(guó)內(nèi)一家專業(yè)從事三維圖形云渲染服務(wù)的公司,目前其云渲染平臺(tái)上的客戶總數(shù)已經(jīng)超過(guò)1000家。對(duì)于圖形渲染業(yè)務(wù)來(lái)說(shuō),性能是第一位的。贊奇科技總經(jīng)理?xiàng)铌考貞浾f(shuō):“最初,我們選擇了一家業(yè)內(nèi)知名品牌的存儲(chǔ)廠商提供的集中式存儲(chǔ)系統(tǒng),但當(dāng)存儲(chǔ)節(jié)點(diǎn)增加到100個(gè)時(shí),系統(tǒng)性能出現(xiàn)瓶頸,僅通過(guò)硬件的疊加很難使性能得到改善。痛定思痛,在升級(jí)云平臺(tái)時(shí),我們選擇了分布式存儲(chǔ)架構(gòu),使得存儲(chǔ)性能可以線性增長(zhǎng),從而突破了困擾我們已久的性能瓶頸?!?/p>
性能是第一位的
圖形渲染計(jì)算的要求有“三高”:第一,計(jì)算密度高,計(jì)算業(yè)務(wù)有明顯的波峰和波谷,當(dāng)計(jì)算高峰到來(lái)時(shí),I/O通常會(huì)被占滿;第二,計(jì)算資源的占用率高;第三,存儲(chǔ)并發(fā)讀寫量高,通常呈指數(shù)級(jí)增長(zhǎng)。在傳統(tǒng)的存儲(chǔ)系統(tǒng)中,存儲(chǔ)性能的增長(zhǎng)與硬件設(shè)備數(shù)量的增加并不完全成正比,而是有一個(gè)臨界點(diǎn),當(dāng)存儲(chǔ)系統(tǒng)的配置達(dá)到這個(gè)臨界點(diǎn)時(shí),即使再增加硬件設(shè)備的數(shù)量,也不能實(shí)現(xiàn)性能的同步增長(zhǎng),甚至?xí)霈F(xiàn)性能下降的情況。這就是曾經(jīng)困擾贊奇科技的一個(gè)難題。
為了突破系統(tǒng)性能的瓶頸,贊奇科技攜手江蘇集云信息科技有限公司(以下簡(jiǎn)稱集云科技)重構(gòu)了數(shù)據(jù)中心機(jī)房,并全面采用分布式存儲(chǔ)架構(gòu)和創(chuàng)新的基于英特爾至強(qiáng)E5處理器的托盤式服務(wù)器,實(shí)現(xiàn)了系統(tǒng)的橫向擴(kuò)展,降低了整體擁有成本。贊奇科技采用全新技術(shù)打造的云平臺(tái)基礎(chǔ)設(shè)施包括500個(gè)計(jì)算節(jié)點(diǎn),未來(lái)很快將擴(kuò)展至1500~000個(gè)計(jì)算節(jié)點(diǎn)。楊昕吉解釋說(shuō):“以前,我們采用傳統(tǒng)的磁盤陣列,瓶頸就存在于磁盤陣列的讀取過(guò)程中,而我們又苦于沒(méi)有辦法解決。在系統(tǒng)升級(jí)后,我們采用了分布式存儲(chǔ)架構(gòu),也就是集云科技提供的計(jì)算與存儲(chǔ)一體化的系統(tǒng),不僅保證了系統(tǒng)的穩(wěn)定和可靠,而且性能可以線性提升?!?/p>
經(jīng)贊奇科技實(shí)際測(cè)試,集云科技提供的一體化系統(tǒng)有幾大優(yōu)點(diǎn):第一,服務(wù)器CPU的占用率和存儲(chǔ)設(shè)備的占用率明顯下降,只有原有系統(tǒng)的三分之一;第二,整體系統(tǒng)的存儲(chǔ)訪問(wèn)速率提高三倍多;第三,通過(guò)采用英特爾至強(qiáng)E5處理器和一系列優(yōu)化技術(shù)后,有效降低了系統(tǒng)的整體擁有成本?!翱傮w來(lái)說(shuō),現(xiàn)在這套新的計(jì)算和存儲(chǔ)架構(gòu)的效率和讀取穩(wěn)定性都有大幅提高。而以前那套老系統(tǒng),一旦參與渲染的設(shè)備增加后很容易出現(xiàn)存儲(chǔ)訪問(wèn)失敗的情況,而新系統(tǒng)的渲染成功率大大提升?!睏铌考嬖V記者,“隨著業(yè)務(wù)的不斷增加,我們現(xiàn)在又面臨新的挑戰(zhàn),就是解決在超大計(jì)算規(guī)模下提升并發(fā)訪問(wèn)的性能和穩(wěn)定性。現(xiàn)在,我們最多可以同時(shí)利用500臺(tái)設(shè)備,而未來(lái)只有規(guī)模擴(kuò)大到2000臺(tái)甚至5000臺(tái)時(shí),我們才有底氣承攬美國(guó)好萊塢影片的高性能渲染服務(wù)?!?/p>
看重高性價(jià)比
云渲染主要考驗(yàn)的是計(jì)算能力和存儲(chǔ)的讀寫能力。計(jì)算是并行的,一個(gè)計(jì)算任務(wù)分布在500個(gè)節(jié)點(diǎn)上同時(shí)進(jìn)行處理,只有當(dāng)所有節(jié)點(diǎn)上的任務(wù)處理完畢后才能進(jìn)入下一步計(jì)算,如果某個(gè)節(jié)點(diǎn)的處理速度稍慢就會(huì)影響整個(gè)系統(tǒng)的處理性能。“大部分的性能瓶頸并不在計(jì)算上,而是在存儲(chǔ)上,很多時(shí)候數(shù)據(jù)在讀取時(shí)速度就已經(jīng)很慢了?!奔瓶萍伎偛藐悓気x介紹說(shuō),“為了解決這個(gè)問(wèn)題,我們開(kāi)始了與英特爾的合作。在英特爾提供的參考設(shè)計(jì)架構(gòu)之上,我們?cè)O(shè)計(jì)了一體化的云存儲(chǔ)系統(tǒng),整合了服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)等,然后與贊奇科技一起針對(duì)云渲染應(yīng)用進(jìn)行了調(diào)優(yōu)。”贊奇科技云渲染平臺(tái)底層技術(shù)架構(gòu)最大的改變就是用分布式的云存儲(chǔ)取代了原有的集中式存儲(chǔ)。早在2012年,集云科技就開(kāi)始與英特爾合作,準(zhǔn)備開(kāi)發(fā)云存儲(chǔ)。云存儲(chǔ)最大的優(yōu)勢(shì)就是可以實(shí)現(xiàn)橫向擴(kuò)展,并且能用低成本的存儲(chǔ)服務(wù)器達(dá)到用戶所需的高性能、高可擴(kuò)展,同時(shí)還能保證很高的可靠性。這也是贊奇科技云渲染平臺(tái)成功的關(guān)鍵因素之一。
中國(guó)用戶通常都十分重視IT產(chǎn)品的性價(jià)比,像贊奇科技這樣提供云服務(wù)且擁有大規(guī)模IT基礎(chǔ)設(shè)施的企業(yè)就要加一個(gè)“更”字了。一方面,品牌廠商提供的集中式存儲(chǔ)不能滿足贊奇科技云渲染平臺(tái)對(duì)性能和擴(kuò)展性的需要;另一方面,相比集云科技提供的一體化系統(tǒng),品牌廠商提供的服務(wù)器、存儲(chǔ)產(chǎn)品價(jià)格過(guò)于昂貴。這些都促使贊奇科技與英特爾和集云科技合作。
集云科技提供的分布式云存儲(chǔ),并沒(méi)有采用企業(yè)級(jí)存儲(chǔ)廠商通常使用的價(jià)格高昂的光纖磁盤,而是采用大量廉價(jià)SATA硬盤堆疊的方式,在寫入數(shù)據(jù)時(shí)同時(shí)制作多個(gè)數(shù)據(jù)副本,不僅保證了系統(tǒng)的可靠性,而且將成本降低了三分之二,同時(shí)保證了分布式存儲(chǔ)的性能與傳統(tǒng)企業(yè)級(jí)存儲(chǔ)處于同一水平?!艾F(xiàn)在很多做大數(shù)據(jù)、云存儲(chǔ)項(xiàng)目的用戶不再使用高端存儲(chǔ)廠商提供的光纖磁盤陣列,而是傾向于選擇分布式的云存儲(chǔ)系統(tǒng),以更低的成本實(shí)現(xiàn)更好的擴(kuò)展性,并可達(dá)到企業(yè)級(jí)的性能?!标悓気x表示,“我們采用的英特爾的參考設(shè)計(jì)是基于開(kāi)源程序做的,它包含了豐富的功能,并且在管理技術(shù)上也有許多創(chuàng)新,這讓我們的一體化系統(tǒng)的設(shè)計(jì)變得更容易。與贊奇科技的成功合作表明,我們可以用廉價(jià)的硬盤達(dá)到與光纖磁盤陣列一樣的高速度,甚至更快,成本卻大幅降低。”英特爾在國(guó)內(nèi)已經(jīng)與包括集云科技在內(nèi)的一些中國(guó)合作伙伴基于英特爾的參考設(shè)計(jì)架構(gòu)共同開(kāi)發(fā)一體機(jī)、云存儲(chǔ)等創(chuàng)新的產(chǎn)品,并且在智慧交通、云渲染等領(lǐng)域取得了初步成功。
方案定制化
現(xiàn)在,廠商針對(duì)用戶的需求提供定制化的產(chǎn)品和解決方案正變得日益流行。楊昕吉表示:“當(dāng)初我們購(gòu)買的品牌服務(wù)器和存儲(chǔ)包含一些我們并不需要的功能,而且價(jià)格還非常貴。現(xiàn)在, 我們整個(gè)的數(shù)據(jù)中心,包括其中的服務(wù)器、存儲(chǔ)全部是按需定制的。我只要求500個(gè)甚至更多的計(jì)算點(diǎn)能夠保證訪問(wèn)的高性能即可,而不關(guān)心后臺(tái)到底用了什么樣的存儲(chǔ)。我們現(xiàn)在的IT基礎(chǔ)架構(gòu)既簡(jiǎn)單,成本又低,而且全部資源都是可控的,在未來(lái)資源不夠用時(shí),只要增加硬件就可以實(shí)現(xiàn)輕松擴(kuò)展,這才是我們需要的。”一些用戶之所以喜歡定制化的產(chǎn)品,是因?yàn)樗鼈兛梢酝耆瓶剡@些IT部件,有時(shí)可能只需要CPU、內(nèi)存,甚至都不需要硬盤就能滿足某些特定計(jì)算的需求。在這種情況下,如果采購(gòu)一個(gè)部件和功能齊全的品牌服務(wù)器就顯得多此一舉了。
走向開(kāi)放是業(yè)界的大勢(shì)所趨?!艾F(xiàn)在風(fēng)生水起的‘去IOE,其本質(zhì)是讓人們拋棄專有的硬件,轉(zhuǎn)而使用標(biāo)準(zhǔn)的商業(yè)化硬件?!标悓気x表示,“我們?yōu)橘澠婵萍继峁┑耐斜P式定制服務(wù)器,借鑒了互聯(lián)網(wǎng)廠商的成功經(jīng)驗(yàn),采用了英特爾至強(qiáng)E5系列處理器。雖然英特爾還有更高性能的處理器,但是從綜合指標(biāo)評(píng)估和贊奇科技的實(shí)際需求來(lái)看,至強(qiáng)E5系列處理器是性價(jià)比最好的?!爆F(xiàn)在,廠商之間的競(jìng)爭(zhēng)并不體現(xiàn)在對(duì)某種先進(jìn)技術(shù)的使用上,因?yàn)楦鞣N新技術(shù)是現(xiàn)成的,大家都可以使用,若想實(shí)現(xiàn)差異化,還是要看整體的解決方案和能否針對(duì)應(yīng)用進(jìn)行優(yōu)化。
除了定制化的服務(wù)器和存儲(chǔ),贊奇科技云渲染平臺(tái)所依托的數(shù)據(jù)中心也是定制的。數(shù)據(jù)中心的面積雖然不是很大,但采用了業(yè)界先進(jìn)的模塊化構(gòu)建方式,實(shí)現(xiàn)了冷通道封閉。陳寶輝介紹說(shuō):“為了適應(yīng)托盤式服務(wù)器的需要,我們對(duì)數(shù)據(jù)中心乃至所有服務(wù)器機(jī)架都進(jìn)行了調(diào)整,實(shí)現(xiàn)了最優(yōu)配置?!爆F(xiàn)在,越來(lái)越多的用戶青睞一體機(jī)。贊奇科技采用的基于英特爾參考設(shè)計(jì)的一體機(jī)實(shí)現(xiàn)了硬件與軟件的高度整合,即插即用,性價(jià)比非常高,完全能夠滿足云渲染平臺(tái)的要求。
云渲染服務(wù)這個(gè)概念剛剛出現(xiàn)三四年,具有一定的技術(shù)和商業(yè)門檻。贊奇科技目前也在摸索之中。不過(guò)贊奇科技做云渲染服務(wù)有其獨(dú)特的優(yōu)勢(shì):一是已經(jīng)擁有了一個(gè)具有500個(gè)節(jié)點(diǎn)的高度可擴(kuò)展的云平臺(tái);二是贊奇科技自己開(kāi)發(fā)了Elara渲染器,它可與贊奇科技的云基礎(chǔ)架構(gòu)組成一個(gè)完善的云渲染服務(wù)平臺(tái)。目前,國(guó)內(nèi)的云渲染服務(wù)市場(chǎng)上幾乎沒(méi)有專為云設(shè)計(jì)的渲染軟件,憑借Elara渲染器,贊奇科技已經(jīng)在這方面占據(jù)了先機(jī)。
楊昕吉表示:“隨著云渲染服務(wù)市場(chǎng)逐漸走向成熟,過(guò)去那些小作坊式的服務(wù)商將慢慢消失,云渲染服務(wù)一定會(huì)變成一個(gè)高度集中的標(biāo)準(zhǔn)化的服務(wù)。我們的目標(biāo)是為用戶提供標(biāo)準(zhǔn)化的、統(tǒng)一的、方便使用的云渲染服務(wù)。”endprint