蔡文偉
(肇慶學(xué)院計(jì)算機(jī)科學(xué)與軟件學(xué)院,肇慶 526021)
盡管,目前業(yè)界已經(jīng)從不同視角對(duì)大數(shù)據(jù)展開(kāi)了充分的研究,但是,對(duì)于如何在成本和獲利層面上,對(duì)云服務(wù)進(jìn)行評(píng)估,該類研究還是少之又少,因此,本文就此方向,提出了一個(gè)量化模型,該模型在成本驅(qū)動(dòng)和非線性分析(例如,存儲(chǔ)空間的需求波動(dòng)等)的基礎(chǔ)上,對(duì)云服務(wù)和市面?zhèn)鹘y(tǒng)高性能數(shù)據(jù)倉(cāng)庫(kù),兩種大數(shù)據(jù)存儲(chǔ)方式,展開(kāi)了性能對(duì)比評(píng)估分析。
值得一提的是,本文是通過(guò)充分參考Skourletopou?los等人從大數(shù)據(jù)角度上實(shí)現(xiàn)的相關(guān)研究成果,以此為基礎(chǔ),對(duì)其量化模型展開(kāi)修訂,進(jìn)而提出本文的相關(guān)公式模型的。
該公式模型是基于用戶租賃的云存儲(chǔ)服務(wù)的實(shí)際存儲(chǔ)能力,通過(guò)假設(shè)用戶對(duì)存儲(chǔ)容量的需求,因?yàn)閿?shù)據(jù)的大幅度增長(zhǎng)而發(fā)生波動(dòng)的情況下,采取非線性以及非對(duì)稱的方式展開(kāi)相關(guān)數(shù)據(jù)分析。在初始階段,用戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)還是云服務(wù)的選擇以及云存儲(chǔ)的最大容量,明顯對(duì)額外的成本產(chǎn)生影響,我們可由此,預(yù)測(cè)未來(lái)是否會(huì)產(chǎn)生更多的存儲(chǔ)空間需求??梢?jiàn)該評(píng)估模型,對(duì)于技術(shù)層面以及非技術(shù)層面都有相當(dāng)?shù)膮⒖家饬x[1]。
充分考慮到云存儲(chǔ)的租賃屬性,本研究提出的相關(guān)計(jì)算公式和公式模型,就充分建立在對(duì)成本和獲利的分析基礎(chǔ)上,通過(guò)非線性和非對(duì)稱的方法,能夠準(zhǔn)確計(jì)算出,在存儲(chǔ)容量沒(méi)有充分利用的情況下,還有多少收益無(wú)法實(shí)現(xiàn)的。
本文假定,在對(duì)以L年為周期的預(yù)計(jì)收益和總投入成本進(jìn)行充分考慮的情況下,作出了在云服務(wù)還是傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)之間作出選擇的。
租期結(jié)束后預(yù)計(jì)的收益,可根據(jù)以下表述和假設(shè)進(jìn)行估量:
(1)云存儲(chǔ)是基于租賃的,按照L年為周期,每年依據(jù)用戶對(duì)于存儲(chǔ)空間的需求波動(dòng),按實(shí)際情況(比如,以每月10億字節(jié)為單位)收費(fèi)的。
(2)存儲(chǔ)容量的需求波動(dòng),在L年為周期的時(shí)間段內(nèi),可以被預(yù)測(cè),在服務(wù)質(zhì)量和用戶體驗(yàn)質(zhì)量需被保障的情況下,該波動(dòng)將直接影響到整體成本。
(3)當(dāng)開(kāi)發(fā)該收益模型的時(shí)候,充分考慮到云服務(wù)的可擴(kuò)展性和彈性,因此,每年的存儲(chǔ)需求的變化所導(dǎo)致的成本變化,應(yīng)包含,文檔(非結(jié)構(gòu)化)存儲(chǔ)的成本變化,維修服務(wù)成本變化,按需輸入/輸出成本變化,操作(例如相應(yīng)服務(wù)請(qǐng)求)成本變化以及服務(wù)器和技術(shù)支持成本變化。
(4)全部的網(wǎng)絡(luò)成本,包括了帶寬的使用成本,網(wǎng)絡(luò)出口成本以及數(shù)據(jù)在不同區(qū)間傳輸成本,尤其對(duì)于在云端,需始終保持在線狀態(tài)的移動(dòng)服務(wù)而言,其對(duì)網(wǎng)絡(luò)帶寬和數(shù)據(jù)傳輸延時(shí)要求比較高,為避免延時(shí),需滿足對(duì)超過(guò)實(shí)際帶寬的網(wǎng)絡(luò)需求,因此產(chǎn)生額外的網(wǎng)絡(luò)成本。
(5)當(dāng)用戶從存儲(chǔ)區(qū)里檢索內(nèi)容的速度比以往要快的時(shí)候,數(shù)據(jù)傳輸?shù)耐掏铝繒?huì)加大,導(dǎo)致了產(chǎn)生額外的輸入/輸出成本投入。
(6)額外的服務(wù)器成本,包括了額外投入使用的CPU內(nèi)核的成本,以及出于臨時(shí)處理事務(wù)需要而增加的內(nèi)存數(shù)目[2]。
在這種情況下,針對(duì)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的成本分析模型,采用以下的公式進(jìn)行表述,其中Smax是指存儲(chǔ)容量的最大值,Scurr是指近期利用的存儲(chǔ)容量(涉及使用情況計(jì)量以及根據(jù)使用情況的收費(fèi)),由于傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)在性能上不具備云計(jì)算和云服務(wù)在存儲(chǔ)上的彈性和可伸縮性,因此,針對(duì)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的成本分析模型,沒(méi)有檢測(cè)目前使用的存儲(chǔ)容量,因此只要滿足Scurr≤Smax,是不會(huì)發(fā)生成本的變化的,也就是說(shuō)以L年為周期的時(shí)間段內(nèi),實(shí)際獲益總是為0,也就是B為0。值得一提的是,一旦出現(xiàn)了Scurr>Smax的情況,增加的存儲(chǔ)容量利用系統(tǒng)停機(jī)時(shí)間,添加到數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)系統(tǒng)中,由此引起了額外的成本,因?yàn)槭欠钦_\(yùn)作的時(shí)間的存儲(chǔ)容量增加,也就是說(shuō)不是實(shí)際使用到的,這方面也可以計(jì)算費(fèi)用。
這里:
Cs=Csmax=Cαmax+Cγmax+Cηmax+Cθmax+Cκmax+Cλmax+Cμmax+Cσmax
這里,Cs表示,每年租賃云存儲(chǔ)的總成本,Cα表示數(shù)據(jù)存儲(chǔ)成本,Cγ表示文件存儲(chǔ)成本,Cη表示維修服務(wù)成本,Cθ表示網(wǎng)絡(luò)成本,Cκ表示按需輸入/輸出成本,Cλ表示操作成本,Cμ表示服務(wù)器成本,Cσ表示技術(shù)支持成本。
而針對(duì)云存儲(chǔ)的成本分析和獲利模型的情況恰好相反,模型采用了以下的公式進(jìn)行表述,然后關(guān)于獲利的計(jì)算過(guò)程,在下面的算法1中將詳細(xì)表述。
CD1=Cs/m*(S max-Scurr)
CDi=12*[Δi-2*(Smax-Bi-2)],i≥2 ,這里:
Cs=Cscurr=Cαcurr+Cγcurr+Cηcurr+Cθcurr+
Cκcurr)+Cλcurr+Cμcurr+Cσcurr
這里,β1是以L為周期,第2年存儲(chǔ)空間的需求變化率,βi是以L年為周期,第3年開(kāi)始直到第L年結(jié)束,各年比前一年增長(zhǎng)的存儲(chǔ)空間需求變化率;B0是以L年為周期第2年存儲(chǔ)空間的使用量;Bi以L年為周期第3年開(kāi)始直到第L年結(jié)束,各年存儲(chǔ)空間的使用量。
而δ1是因租賃云存儲(chǔ)服務(wù),以L為周期,第2年成本變化率;δi是以L年為周期,第3年開(kāi)始,直到第L年結(jié)束,各年比前一年增長(zhǎng)的成本變化率;Δ0
Δ0=(1+δ1%)*Scurr
Δi=(1+δi+1%)*Δi-1,i≥1
δi%=αi%+γi%+ηi%+θi%+κi%+λi%+μi%+σi%,i≥1,且:
因此:
Bi以此類推。
算法1.實(shí)現(xiàn)獲益模型的偽代碼:
//在預(yù)測(cè)存儲(chǔ)容量的需求呈直線增長(zhǎng)的前提下,該算法計(jì)算出云服務(wù)模型的獲利情況//
1:執(zhí)行函數(shù)BENEFITSCALCULATION(Smax,Scurr,i,Δ%,β%,L,Cs/m,α%,γ%,η%,θ%,κ%,λ%,μ%,σ%)
2:依次輸入(α%,γ%,η%,θ%,κ%,λ%,μ%,σ%)
Δ←α%+γ%+η%+θ%+κ%+λ%+μ%+σ%
3:返回Δ%值
4:依次輸入( Smax,Scurr,i,Δ%,β%,L,Cs/m)
5:for i=1to L執(zhí)行循環(huán)//從第一年到第L年B【i】← (1+βi+1%)*Bi-1,i≥ 1//得出各年的 B 值
6:結(jié)束該循環(huán)
7:返回各年的B值
8:結(jié)束全部進(jìn)程
本文提出一個(gè)全新的成本/收益分析模型,該模型在假定云存儲(chǔ)容量需求發(fā)生波動(dòng)的情況下,對(duì)云服務(wù)與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)之間,孰優(yōu)孰劣,展開(kāi)比較評(píng)估。從研究角度看,在租賃云存儲(chǔ)服務(wù)的過(guò)程中,對(duì)成本和收益的分析就采納了相對(duì)復(fù)雜的分析模型,通過(guò)添加更多的相關(guān)參數(shù),對(duì)該模型進(jìn)行表征,使得該模型具有相對(duì)強(qiáng)大的可擴(kuò)展性,即該模型的公式是用戶可根據(jù)自身的專業(yè)水平進(jìn)行自定義參數(shù)添置的。進(jìn)一步說(shuō),想要充分對(duì)云服務(wù)與傳統(tǒng)高性能數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用進(jìn)行比較,還需應(yīng)用量化工具,作為一種“概念驗(yàn)證”的途徑,來(lái)真正實(shí)現(xiàn)分析模型的公式。從技術(shù)角度看,本文所指的云存儲(chǔ)是安裝在由谷歌App引擎所支持的谷歌云平臺(tái)上,該存儲(chǔ)應(yīng)用是由Java程序語(yǔ)言開(kāi)發(fā)出來(lái)的。
CA1=Cs*Scurr
CD1=Cs*( )
Smax-Scurr CA2=(1+δ1%)*Cs*(1+β1%)*Scurr
CD2=(1+ δ1%)*Cs*[Smax-(1+ β1%]*Scurr][4]
以下是,假設(shè)云存儲(chǔ)需求呈線型增長(zhǎng),通過(guò)兩個(gè)不同的場(chǎng)景,以4年為周期(L=4),對(duì)云服務(wù)和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)展開(kāi)的成本和獲益比較分析。下面分別給出兩個(gè)場(chǎng)景相應(yīng)參數(shù)的值。
首先是存儲(chǔ)需求變化率β,在場(chǎng)景1,第1年到第2年為5%,第2年到第3年為15%,第3年到第4年為20%,第4年到第5年為23%;在場(chǎng)景2,第1年到第2年為10%,第2年到第3年為22%,第3年到第4年為35%,第4年到第5年為40%;
然后是租賃云存儲(chǔ)造成的額外成本增長(zhǎng)率δ,在場(chǎng)景1,第1年到第2年為2%,第2年到第3年為5%,第3年到第4年為18%;在場(chǎng)景2,第1年到第2年為5%,第2年到第3年為10%,第3年到第4年為25%;
應(yīng)用于等式(1)到(4)的變量值分別為 Smax=6/兆兆字節(jié),Scurr=2/兆兆字節(jié),剛開(kāi)始第一個(gè)月租賃云存儲(chǔ)的成本為Cs/m=300美元。
然后分別進(jìn)行計(jì)算,得出如表1和表2的評(píng)估結(jié)果。
表1 場(chǎng)景1中針對(duì)云服務(wù)的成本和獲利分析計(jì)算結(jié)果
表2 場(chǎng)景2中針對(duì)云服務(wù)的成本和獲利分析計(jì)算結(jié)果
對(duì)比傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù),重申本文第二部分公式說(shuō)明處,需指出的,由于其在性能上不具備云計(jì)算和云服務(wù)在存儲(chǔ)上的彈性和可伸縮性,因此,針對(duì)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的成本分析模型,沒(méi)有檢測(cè)目前使用的存儲(chǔ)容量,因此只要滿足,是不會(huì)發(fā)生成本的變化的,也就是說(shuō)以L年為周期的時(shí)間段內(nèi),實(shí)際獲益總是為0,也就是B為0。
本文圍繞云服務(wù)的租賃屬性,應(yīng)用本文提出的量化公式模型,將云服務(wù)與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)展開(kāi)成本和獲益的分析,結(jié)果顯示,云服務(wù)給使用方帶來(lái)的持續(xù)的獲益增長(zhǎng),建議使用者把獲益作為存儲(chǔ)需求增長(zhǎng)所產(chǎn)生的額外成本,從而獲得投資收益的最大化。
[1]R.Buyya,C.S.Yeo,S.Venugopal,J.Broberg,I.Brandic.Cloud Computing and Emerging IT Platforms:Vision,Hype,and Reality for Delivering Computing as the 5th Utility.Future Gener.Comput.Syst.,2009,25(6):599-616.
[2]G.Mastorakis,E.Markakis,E.Pallis,C.X.Mavromoustakis,G.Skourletopoulos.Virtual Network Functions Exploitation Through a Prototype Resource Management Framework.in 2014 IEEE 6th International Conference on Telecommunications and Multimedia(TEMU),Heraklion,Crete,Greece,2014:24-28.
[3]P.Neves,J.Bernardino.Big Data Issues.in Proceedings of the 19th International Database Engineering&Applications Symposium,2015:200-201.
[4]G.Skourletopoulos,C.X.Mavromoustakis,G.Mastorakis,J.M.Batalla,C.Dobre,S.Panagiotakis,E.Pallis.Towards Mobile Cloud Computing in 5G Mobile Networks:Applications,Big Data Services and Future Opportunities.in Advances in Mobile Cloud Computing and Big Data in the 5G Era,1st ed.,vol.22,Switzerland:Springer International Publishing AG,2017.
[5]G.Skourletopoulos,C.X.Mavromoustakis,G.Mastorakis,J.M.Batalla,C.Dobre,S.Panagiotakis,E.Pallis.Big Data and Cloud Computing:A Survey of the State-of-the-Art and Research Challenges.in Advances in Mobile Cloud Computing and Big Data in the 5G Era,1st ed.,vol.22,Switzerland:Springer International Publishing AG,2017.