国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式存儲系統(tǒng)CEPH研究與試用

2017-12-29 01:17:09梁坤榮中國郵政集團公司廣東省信息技術局
數(shù)碼世界 2017年7期
關鍵詞:試用存儲系統(tǒng)備份

梁坤榮 中國郵政集團公司廣東省信息技術局

分布式存儲系統(tǒng)CEPH研究與試用

梁坤榮 中國郵政集團公司廣東省信息技術局

分布式存儲系統(tǒng)通過軟件定義存儲,具有高可用、高擴展性、價格低廉等優(yōu)點,正日益取代傳統(tǒng)存儲成為云計算的新寵。本文通過研究開源分布式存儲系統(tǒng)CEPH的工作原理,試用并提出調優(yōu)方案,嘗試為數(shù)據中心使用分布式存儲系統(tǒng)來降低企業(yè)IT成本、提高數(shù)據安全性提供方案。

分布式存儲 開源 CEPH

1 分布式存儲系統(tǒng)簡介

分布式存儲系統(tǒng)通過軟件定義存儲,將數(shù)據分散存儲在多臺獨立的設備上,采用可擴展的系統(tǒng)結構,利用多臺存儲服務器分擔存儲負荷,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展。

常見的分布式文件系統(tǒng)有GFS、HDFS、Ceph等。GFS是Google公司為了滿足本公司需求而開發(fā)的專有分布式文件系統(tǒng);HDFS是Hadoop分布式文件系統(tǒng)的簡稱,是為處理離線大數(shù)據設計的;Ceph是一個通用的實時存儲系統(tǒng),既可滿足高IOPS的隨機讀寫,又可滿足高帶寬的連續(xù)讀寫操作,既可為云計算提供對象存儲,又可為傳統(tǒng)設備提供塊存儲服務。

2 CEPH架構

2.1 基本架構

Ceph主要由核心服務RADOS以及塊存取接口(RBD)、對象存取接口(RADOSGW)和文件系統(tǒng)接口(CEPH FS)組成。

RADOS作為底層服務實現(xiàn)集群數(shù)據的復制、恢復、回填、再均衡、集群狀態(tài)監(jiān)控等核心功能。Librados為客戶端與底層RADOS通訊提供接口。RADOS GateWay、RBD的作用是在librados庫的基礎上提供抽象層次更高、更便于應用或客戶端使用的上層接口。由于實驗環(huán)境所限,本文以塊存儲(RBD)接口為例子對該系統(tǒng)原理加以詳細闡述以及進行試驗。

2.2 數(shù)據存儲過程

無論使用哪種存儲方式(對象、塊、掛載),存儲的數(shù)據都會被切分成對象(Objects)。每個對象映射到一個PG(歸置組),PG通過CRUSH算法存儲到不同的OSD節(jié)點上,而且每個PG會對應一個主OSD和若干從OSD,這樣就避免了OSD損壞時PG找不到OSD的問題。

Ceph的讀寫操作采用主從模型,客戶端要讀寫數(shù)據時,只能向對象所對應的主OSD節(jié)點發(fā)起請求。主節(jié)點在接受到寫請求時,會同步的向從OSD中寫入數(shù)據。當所有的OSD節(jié)點都寫入完成后,主節(jié)點才會向客戶端報告寫入完成的信息,因此保證了主從節(jié)點數(shù)據的高度一致性。而讀取的時候,客戶端也只會向主osd節(jié)點發(fā)起讀請求,并不會有類似于數(shù)據庫中的讀寫分離的情況出現(xiàn)。

3 CEPH試用

為了以最低的成本來部署實驗環(huán)境,我們利舊了淘汰的5臺pc server,購買了一批2T的SATA硬盤。pc server的配置各異,CPU和內存容量尚未能滿足CEPH的一些硬件要求,因此性能會稍差,但并不影響可用性的要求,后續(xù)可進行擴容優(yōu)化。

3.1 安裝

在互聯(lián)網環(huán)境中安裝CEPH非常簡單,只要配置好yum源,使用ceph-deploy工具即可快速部署所有機器。如果是內網環(huán)境,則需要配置本地yum源,然后進行安裝,本文不再詳細敘述。

3.2 自定義CRUSH

CRUSH算法通過計算數(shù)據存儲位置來確定如何存儲和檢索,使Ceph避免了單點故障、性能瓶頸、和伸縮的物理限制。

CRUSH圖包含OSD列表、把設備匯聚為物理位置的“桶”列表、和指示CRUSH如何復制存儲池里的數(shù)據的規(guī)則列表。我們把每個硬盤對應的OSD匯聚到所在的物理服務器上(HOST),再把5臺HOST匯聚到ROOT。HOST和ROOT都是虛擬出來的桶列表,使CRUSH算法能有效的將每份數(shù)據分布到不同的主機中,保證當主機發(fā)生故障時只會損壞一份數(shù)據,而不會出現(xiàn)所有數(shù)據都在同一臺主機中的現(xiàn)象。

3.3 系統(tǒng)概覽

通過指令ceph-s可查看系統(tǒng)當前健康狀態(tài),還可以看到monitor情況、OSD概況、歸置組PG概況以及系統(tǒng)總空間、已用空間等情況。由此指令看到我們的實驗環(huán)境當前有3個monitor,25個OSD,總空間為46T,已用308G。但這個空間應該除以3,因為我們設置了3份數(shù)據,因此實際總空間只有46/3=15.3T,已用空間為308G/3=102.7G。

4 性能測試與調優(yōu)

4.1 性能測試

為使測試結果更接近實際使用環(huán)境,我們使用了一臺虛擬機,同時掛載HP DS4700存儲和CEPH存儲,這兩款存儲都使用2T容量的SATA硬盤。隨后使用scp工具來讀寫同一個ORACLE數(shù)據文件,結果發(fā)現(xiàn)兩款存儲在該測試中的性能非常接近,DS4700性能稍微好一點,但基本上是一個級別的。

4.2 性能調優(yōu)

4.2.1 滿足基本硬件配置

實驗環(huán)境中的設備未能滿足CEPH的最低硬件要求,可通過提升硬件配置以提升性能。

4.2.2 使用SSD作為journal

Journal的作用是當有突發(fā)的大量寫入操作時,先把一些零散的,隨機的IO請求保存到緩存中進行合并,然后再統(tǒng)一向內核發(fā)起IO請求。這樣做效率會比較高,但是journal的IO是非常密集的,所以可以使用SSD來單獨存儲journal文件以提高CEPH讀寫性能。

4.2.3 網絡優(yōu)化

CEPH使用以太網進行數(shù)據傳輸、故障點自我修復等,因此對網絡帶寬要求特別大。實驗環(huán)境中僅使用一張千兆以太網網卡進行所有的數(shù)據傳輸,如用于生產環(huán)境,建議把CEPH的內部通訊和外部通訊分開,并且使用萬兆網絡,即可提高CEPH與外部傳輸數(shù)據的性能,減少故障修復的時間。

5 應用場景

CEPH分布式存儲早已是企業(yè)級的產品,被大量的為亞馬遜、Openstack等云平臺提供對象存儲。

實驗環(huán)境中使用的是基于Vmware的虛擬化平臺,無法使用對象存儲,但是可以使用CEPH塊存儲來代替?zhèn)鹘y(tǒng)存儲,為虛擬機提供塊設備。在前期試用階段,可作為備份存儲使用,為OS備份、應用備份、數(shù)據備份等提供存儲空間,解決備份存儲的空間和成本問題。

[1]Ceph中國社區(qū)(著)《Ceph分布式存儲實戰(zhàn)》機械工業(yè)出版社2016年12月

猜你喜歡
試用存儲系統(tǒng)備份
“備份”25年:鄧清明圓夢
血管吻合試驗臺的研制及試用
GYK-160G型和GYK-160X型軌道車運行控制設備通過試用評審
分布式存儲系統(tǒng)在企業(yè)檔案管理中的應用
哈爾濱軸承(2020年2期)2020-11-06 09:22:36
天河超算存儲系統(tǒng)在美創(chuàng)佳績
一諾千金!試用十天,不滿意無條件退款!新發(fā)明專利幸福寶 讓婚姻更美滿幸福
華為震撼發(fā)布新一代OceanStor 18000 V3系列高端存儲系統(tǒng)
淺析數(shù)據的備份策略
科技視界(2015年6期)2015-08-15 00:54:11
一種基于STM32的具有斷電保護機制的采集存儲系統(tǒng)設計
低汞觸媒試用總結
中國氯堿(2014年11期)2014-02-28 01:05:06
泰顺县| 泸州市| 禹城市| 镇原县| 庆阳市| 郑州市| 辽阳县| 达日县| 武冈市| 藁城市| 丰城市| 新和县| 康平县| 荆州市| 无极县| 宜都市| 晴隆县| 银川市| 衡水市| 大庆市| 栖霞市| 柳江县| 汝城县| 周宁县| 丰镇市| 丰原市| 郧西县| 铁岭县| 且末县| 百色市| 绥化市| 民乐县| 九龙城区| 乐都县| 舟曲县| 句容市| 尖扎县| 灯塔市| 闽侯县| 栖霞市| 建德市|