特約通訊員 陳芯怡
重復(fù)數(shù)據(jù)刪除技術(shù)是近年來存儲行業(yè)最炙手可熱的技術(shù)之一。它是一種非常高級的數(shù)據(jù)縮減方式,通過減少存儲的數(shù)據(jù)量,改變數(shù)據(jù)保護(hù)方式,極大地降低了存儲空間,提升了磁盤備份方式的經(jīng)濟(jì)性。重復(fù)數(shù)據(jù)刪除被業(yè)界公認(rèn)為備份技術(shù)的下一代發(fā)展步驟,是今日數(shù)據(jù)中心的“必備”技術(shù)。
隨著技術(shù)應(yīng)用的推廣,重復(fù)數(shù)據(jù)刪除技術(shù)也加入到網(wǎng)絡(luò)行業(yè)的行列,成為廣域網(wǎng)優(yōu)化性能的一個(gè)重要工具。通過消除重復(fù)IP的流量傳輸,重復(fù)數(shù)據(jù)刪除技術(shù)明顯地提高了廣域網(wǎng)的利用率和加速了地理分散點(diǎn)之間的數(shù)據(jù)傳輸,使得在廣域網(wǎng)通信時(shí)能夠節(jié)省寬帶成本和幫助克服很多障礙。
廣域網(wǎng)重復(fù)數(shù)據(jù)刪除技術(shù)是服務(wù)于所有的IP流量傳輸,因此,它在各種各樣的IT創(chuàng)新中,如服務(wù)器集中化、虛擬化和應(yīng)用交付中發(fā)揮了關(guān)鍵的作用。此外,廣域網(wǎng)重復(fù)數(shù)據(jù)刪除技術(shù)實(shí)際上是對存儲重復(fù)數(shù)據(jù)刪除技術(shù)的一個(gè)很好的補(bǔ)充,它能為整個(gè)企業(yè)帶來顯著的成本節(jié)約和更好的恢復(fù)點(diǎn)和時(shí)間目標(biāo)(RPO/RTOs),有效提高廣域網(wǎng)的性能和數(shù)據(jù)復(fù)制、備份、恢復(fù)的可靠性。
廣域網(wǎng)重復(fù)數(shù)據(jù)刪除技術(shù)應(yīng)用于各企業(yè)所在地配置的加速設(shè)備中(即廣域網(wǎng)連接的遠(yuǎn)程站點(diǎn)和復(fù)制目標(biāo)站點(diǎn))。這些加速設(shè)備可以在合適的企業(yè)位置上實(shí)時(shí)監(jiān)測IP流量傳輸,通過監(jiān)視在廣域網(wǎng)上傳送的全部數(shù)據(jù),可以檢測到重復(fù)的信息,并且讓這些信息在本地傳送,而不是在整個(gè)網(wǎng)絡(luò)上傳送。隨著日常使用數(shù)據(jù)的增加,這些數(shù)據(jù)量變得非常龐大,其中包括了與每個(gè)位置相關(guān)的各企業(yè)的工作數(shù)據(jù)集,這給數(shù)據(jù)的存儲與傳送都帶來了巨大的壓力。重復(fù)數(shù)據(jù)刪除技術(shù)可確保各個(gè)信息數(shù)據(jù)在每個(gè)位置都只被存儲一次,降低了設(shè)備的負(fù)荷,使得只要采用合適大小的廣域網(wǎng)加速設(shè)備就能容納幾個(gè)星期或幾個(gè)月的有價(jià)值的數(shù)據(jù)。
當(dāng)收到外來數(shù)據(jù)包時(shí),重復(fù)數(shù)據(jù)刪除技術(shù)會在廣域網(wǎng)加速設(shè)備配置上檢測是否在目標(biāo)位置存在數(shù)據(jù)的本地副本。如果有一個(gè)副本存在,那么重復(fù)的信息就不會通過廣域網(wǎng)傳送而會通過本地發(fā)送來提供數(shù)據(jù)。如果該數(shù)據(jù)被修改了,只會在廣域網(wǎng)中傳輸數(shù)據(jù)的修改部分,從而最大限度地提高寬帶利用率和應(yīng)用程序的性能。
重復(fù)數(shù)據(jù)刪除技術(shù)克服了廣域網(wǎng)中進(jìn)行數(shù)據(jù)備份、復(fù)制、災(zāi)后修復(fù)等連續(xù)性業(yè)務(wù)時(shí)所面臨的一系列難題。更具體地,該技術(shù)具有以下的優(yōu)點(diǎn):
●加快了數(shù)據(jù)傳輸?shù)乃俾剩荷厦嫣岬?,重?fù)的信息只在本地傳送,而不會通過廣域網(wǎng)重新發(fā)送,那么廣域網(wǎng)流量傳輸就具備了類似局域網(wǎng)的速度。這是一種更先進(jìn)的解決方案,可在TCP和UDP通信上縮減數(shù)據(jù)量,對于大部分的通信類型來說,這種解決方案能夠顯著提升性能。
●廣域網(wǎng)效率最大化:重復(fù)數(shù)據(jù)消除技術(shù)通過清除重復(fù)信息的轉(zhuǎn)移從而減少廣域網(wǎng)流量達(dá)99%。當(dāng)進(jìn)行數(shù)據(jù)備份和傳輸時(shí),重復(fù)數(shù)據(jù)消除技術(shù)只備份經(jīng)過更改的數(shù)據(jù),這與傳統(tǒng)的每周或每天備份所有數(shù)據(jù)的模式形成了鮮明對比,也就意味著重復(fù)數(shù)據(jù)刪除可以大量地削減需要傳輸?shù)臄?shù)據(jù)量。
●擴(kuò)大數(shù)據(jù)中心之間的地理距離:重復(fù)數(shù)據(jù)刪除技術(shù)可以減少延遲的影響,讓企業(yè)可以擴(kuò)大數(shù)據(jù)中心和災(zāi)后修復(fù)地之間的距離,提高運(yùn)作的靈活性。
廣域網(wǎng)重復(fù)數(shù)據(jù)刪除技術(shù)與存儲重復(fù)數(shù)據(jù)刪除是兼容的,后者著重于提高存儲量,前者則著重于在整個(gè)廣域網(wǎng)中提供可能的最佳性能。當(dāng)重復(fù)數(shù)據(jù)刪除技術(shù)在廣域網(wǎng)中應(yīng)用時(shí),企業(yè)通??梢垣@得10-20倍以上的性能提高,遠(yuǎn)遠(yuǎn)超過了在存儲設(shè)備中單獨(dú)使用重復(fù)數(shù)據(jù)刪除技術(shù)所獲得的效果。這可以歸結(jié)于以下幾個(gè)因素。
其一,當(dāng)搜索重復(fù)數(shù)據(jù)塊的時(shí)候,廣域網(wǎng)加速設(shè)備通常能比存儲設(shè)備提供更高的精確度。這是因?yàn)閺V域網(wǎng)加速設(shè)備是對數(shù)據(jù)的單個(gè)字節(jié)進(jìn)行檢驗(yàn)而不是對塊進(jìn)行檢驗(yàn),這能夠讓更多重復(fù)的數(shù)據(jù)塊被發(fā)現(xiàn),即使在同步復(fù)制數(shù)據(jù)流中,也能實(shí)現(xiàn)更佳的數(shù)據(jù)檢測。此外,當(dāng)重復(fù)數(shù)據(jù)刪除技術(shù)在網(wǎng)絡(luò)層中執(zhí)行時(shí),它服務(wù)于所有IP流量傳輸。因此,數(shù)據(jù)通過電子郵件、文件或網(wǎng)頁作為備份和復(fù)制的一部分在廣域網(wǎng)中被傳送時(shí),它將會立即登記作為一個(gè)訪問點(diǎn)。換句話說,應(yīng)用程序本身是不考慮數(shù)據(jù)重復(fù)的問題,所以重復(fù)數(shù)據(jù)刪除技術(shù)僅僅從存儲角度可能無法運(yùn)行。然而,它是來自廣域網(wǎng)上的復(fù)制數(shù)據(jù),就這點(diǎn)而論,廣域網(wǎng)加速設(shè)備將會視它為多數(shù)據(jù)運(yùn)作。
其二,廣域網(wǎng)重復(fù)數(shù)據(jù)刪除技術(shù)可以以雙向方式工作。換句話說,無論通信往哪個(gè)方向流動(dòng),兩個(gè)位置都了解到信息并且可以利用本地索引提供信息,這能極大地提高了企業(yè)恢復(fù)數(shù)據(jù)的速度。例如,如果信息是運(yùn)用某些正常操作(也就是復(fù)制/備份或簡單地通過電子郵件或FTP)通過廣域網(wǎng)往一個(gè)方向傳送,則作為恢復(fù)進(jìn)程的一部分再發(fā)送到對面方向時(shí)立即就可以被檢測到。而不用在該位置上通過廣域網(wǎng)重新傳送一個(gè)完整的數(shù)據(jù)集,這些信息可以更高的效率和更好的性能從本地?cái)?shù)據(jù)存儲中傳輸。
其三,廣域網(wǎng)加速裝置也采用了其它優(yōu)化技術(shù)。例如,有效負(fù)載和壓縮頭文件經(jīng)常與重復(fù)數(shù)據(jù)刪除技術(shù)一起使用,進(jìn)一步減少備份和復(fù)制的廣域網(wǎng)寬帶需求。即使非重復(fù)性信息通過廣域網(wǎng)傳送,也可以配置壓縮功能以獲得顯著的性能提高。廣域網(wǎng)加速設(shè)備也可以減少雙方數(shù)據(jù)包的丟失和抖動(dòng)等情況所帶來的影響,這種情況發(fā)生于當(dāng)路由器連接超額、掉線或者數(shù)據(jù)包的再請求時(shí),同時(shí)還可以通過網(wǎng)絡(luò)加速功能去解決不同的通信類型的固定延遲,比如TCP加速。另外,廣域網(wǎng)加速裝置采用服務(wù)質(zhì)量(QOS)技術(shù)也可以用于區(qū)分流量傳輸?shù)膬?yōu)先次序和為關(guān)鍵業(yè)務(wù)分配必要的寬帶,例如數(shù)據(jù)復(fù)制。
當(dāng)傳送和存儲數(shù)據(jù)時(shí),節(jié)省容量和提高性能的最有效方法是消除多余的信息。重復(fù)數(shù)據(jù)刪除技術(shù)在廣域網(wǎng)加速設(shè)備中配合其它廣域網(wǎng)優(yōu)化技術(shù)一起使用時(shí),可以進(jìn)一步達(dá)到以下的優(yōu)化效果:
●滿足并超越恢復(fù)時(shí)間目標(biāo)(RTO)
●提高恢復(fù)點(diǎn)目標(biāo)(RPO)
●避免昂貴的廣域網(wǎng)寬帶升級
●避免在分配窗口里備份和復(fù)制任務(wù)沒有完成時(shí)出現(xiàn)的數(shù)據(jù)庫同步化問題
●管理廣域網(wǎng)的容量以便更好地處理高峰負(fù)荷、緊急應(yīng)變、業(yè)務(wù)增長等問題
重復(fù)數(shù)據(jù)刪除技術(shù)是一項(xiàng)被證實(shí)了的能夠提高性能、可靠性、數(shù)據(jù)備份和恢復(fù)效率的技術(shù)。它對網(wǎng)絡(luò)和存儲行業(yè)都產(chǎn)生了重大的影響,通過在存儲備份和廣域網(wǎng)傳送領(lǐng)域中應(yīng)用該技術(shù),可以更好地改善數(shù)據(jù)中心中數(shù)據(jù)保護(hù)的過程。
參考資料:
www.silver-peak.com