■ 河北 王春海
編者按:筆者遇到客戶服務(wù)器在更換硬盤后出現(xiàn)的數(shù)據(jù)沒有同步問題,筆者在分析故障之后發(fā)現(xiàn)客戶在之前服務(wù)器更換硬盤時(shí)就出現(xiàn)了很多錯(cuò)誤,導(dǎo)致后續(xù)的一系列問題。
近期在給一個(gè)用戶更換服務(wù)器硬盤時(shí)發(fā)現(xiàn),一是RAID配置錯(cuò)誤,使用300GB的硬盤給600GB的磁盤做熱備,另外是更換的硬盤型號(hào)不對(duì)導(dǎo)致數(shù)據(jù)沒有同步。
新近入職的管理員如果接手的有舊的服務(wù)器,有時(shí)間應(yīng)重點(diǎn)檢查一下硬盤及RAID信息,看是否有離線的硬盤或配置不合適的地方好及時(shí)糾正。
圖1 兩塊硬盤亮黃燈
圖2 300GB的硬盤被配置成了全局熱備
今年4月上旬,有個(gè)單位的兩臺(tái)服務(wù)器硬盤損壞了3塊硬盤,客戶讓送3塊600GB的硬盤并幫著給更換一下。
到了現(xiàn)場(chǎng)筆者看到了這兩臺(tái)服務(wù)器,其中一臺(tái)服務(wù)器有兩個(gè)硬盤亮黃燈(如圖1所示),另一臺(tái)服務(wù)器有1個(gè)硬盤亮黃燈。
仔細(xì)一看,這兩臺(tái)服務(wù)器,每臺(tái)都配置了1塊300GB硬盤、3塊600GB硬盤。當(dāng)時(shí)比較奇怪怎么有這種配置,難道這塊300GB的用來裝系統(tǒng)、另3塊600GB的做RAID-5存 數(shù)據(jù)?
當(dāng)時(shí)筆者與客戶溝通,圖1中的這種壞了兩塊硬盤的可能需要做數(shù)據(jù)恢復(fù)了,因?yàn)?塊硬盤的RAID-5中同時(shí)壞兩塊,此時(shí)換盤是不行了。當(dāng)時(shí)這臺(tái)服務(wù)器已經(jīng)不能啟動(dòng)了(圖2中的服務(wù)器還在使用,能夠進(jìn)入系統(tǒng))。
將圖1中損壞兩塊硬盤的服務(wù)器,在打開電源并進(jìn)入到RAID界面后,看到01、02槽位的硬盤為Failed狀態(tài),按下“Ctrl + N”組合鍵進(jìn)入PD Mgmt之后整個(gè)人就有點(diǎn)暈了,槽位0的300GB硬盤竟然被配置成了熱備磁盤!如圖2所示。
客戶說這臺(tái)服務(wù)器已經(jīng)使用多年,原來也壞過(一塊)硬盤,換了之后就繼續(xù)使用了。這次是系統(tǒng)不能用了才發(fā)現(xiàn)壞了兩塊硬盤的,以為換上就能繼續(xù)使用了。當(dāng)時(shí)這臺(tái)服務(wù)器買的時(shí)候是1塊300GB的硬盤,財(cái)務(wù)軟件公司的人說一塊硬盤不安全,又買了3塊600GB的硬盤做的RAID-5,是軟件公司的人給配置的。
這得多有水平的人給配置的呀!算了,不說了,想辦法恢復(fù)數(shù)據(jù)吧。
圖3 槽位3的硬盤是年前換上的
圖4 硬盤沒有同步
圖5 硬盤數(shù)據(jù)開始同步
另外一臺(tái)服務(wù)器只壞了一塊硬盤,換上硬盤之后數(shù)據(jù)開始同步。因?yàn)榭吹降牡?臺(tái)服務(wù)器RAID配置不合適,筆者重新啟動(dòng)服務(wù)器進(jìn)入RAID卡配置模塊,果然這塊300GB的硬盤也被配置成了熱備磁盤。同時(shí)新?lián)Q上的硬盤已經(jīng)開始重組數(shù)據(jù)。
這時(shí)客戶表示,還有一臺(tái)服務(wù)器,年前換了一塊硬盤,這次來了順便幫著給檢查一下,這一檢查就又發(fā)現(xiàn)新的問題了。
第三臺(tái)服務(wù)器也是3650 M5,在另一個(gè)機(jī)房,槽位3的硬盤是年前換的,這個(gè)機(jī)房明顯環(huán)境好一些,服務(wù)器硬盤上的灰塵也少一些,如圖3所示。
重新啟動(dòng)進(jìn)入RAID卡,300GB的硬盤還是配成了熱備磁盤,又是熟悉的配方、熟悉的味道。
但是,槽位3的硬盤是Unconfigured Good,這塊硬盤沒有同步,如圖4所示。
仔細(xì)看圖3,發(fā)現(xiàn)新?lián)Q上的硬盤托架上的序號(hào)和原來的托架序號(hào)不同。好在還有兩塊新買的硬盤暫時(shí)沒有用上,取下年前購(gòu)買的硬盤,換上這次帶來的硬盤,此時(shí)硬盤開始重組數(shù)據(jù),此時(shí)新?lián)Q上的硬盤黃燈、綠燈交替閃爍,如圖5所示。
在RAID界面中數(shù)據(jù)開始重組,一個(gè)多小時(shí)之后數(shù)據(jù)重組完成,硬盤綠燈閃爍,此時(shí)這臺(tái)服務(wù)器檢查完成。
后期建議,如果客戶需要熱備磁盤,應(yīng)該是每臺(tái)取下原來300GB的硬盤,添加一塊600GB的硬盤并重新配置成熱備磁盤。