如何做出明智的存儲(chǔ)決策?
—— 閱讀:14583次
我們面臨著:嚴(yán)峻的形勢(shì),以及削減成本的壓力。但是解決問題的方法并不是只要選擇最便宜的數(shù)據(jù)存儲(chǔ)技術(shù)就可以了。無論你是企業(yè),小公司還是個(gè)人家庭用戶,如果你關(guān)心你的數(shù)據(jù)而且如果你閱讀了這篇文章,你肯定會(huì)關(guān)心你的數(shù)據(jù)那么你就需要考慮存儲(chǔ)技術(shù)中技術(shù)和可靠性的權(quán)衡和取舍。存儲(chǔ)成本并不僅僅是硬件或軟件的價(jià)格成本,它還包括營(yíng)運(yùn)和維護(hù)成本以及數(shù)據(jù)丟失或數(shù)據(jù)損壞的成本。
當(dāng)我開始幫助客戶理解技術(shù)權(quán)衡的時(shí)候,我所做的第一件事情就是理解他們的要求。有時(shí),對(duì)方會(huì)面無表情地看著我,然后告訴我說只要解決問題就好了,有時(shí),對(duì)方會(huì)告訴我說他的要求就是獲得最便宜的存儲(chǔ)。能夠真正理解自己需求的人很少,而能夠真正知道如何應(yīng)用它們的人就更少了。
SATA,SAS和磁帶
我們來看一個(gè)在不同類型的磁盤和磁帶驅(qū)動(dòng)器中進(jìn)行選擇的例子。你可能會(huì)說這些驅(qū)動(dòng)器都可以通過RAID(獨(dú)立磁盤冗余陣列)來保護(hù),不過你還需要考慮一些重要的事情。我認(rèn)為即使是最算計(jì)的人也不希望你讓公司的數(shù)據(jù)處于危險(xiǎn)狀態(tài)。
最大的問題是技術(shù)的硬錯(cuò)誤率。任何磁盤或磁帶驅(qū)動(dòng)器都有一個(gè)硬錯(cuò)誤率,這個(gè)硬錯(cuò)誤率用平均比特?cái)?shù)來表示。硬錯(cuò)誤有可能是讀取也可能是寫入,如果發(fā)生這種錯(cuò)誤,將返回一個(gè)錯(cuò)誤信號(hào)稱設(shè)備無法訪問。硬錯(cuò)誤的發(fā)生有多種原因,比如媒介錯(cuò)誤,磁頭錯(cuò)誤,或媒介故障。無論原因是什么,你所要考慮的是設(shè)備發(fā)生這種錯(cuò)誤的概率。
如果你有一個(gè)RAID-5 LUN(邏輯單元號(hào))發(fā)生硬錯(cuò)誤,那么這個(gè)LUN就必須重建,而在重建過程中如果你再發(fā)生一次硬錯(cuò)誤,那么數(shù)據(jù)將丟失。如果你有RAID-6,那么另一次硬錯(cuò)誤還不會(huì)是致命的,因?yàn)槟阌袃蓚(gè)校驗(yàn)設(shè)備。
下面是驅(qū)動(dòng)器制造商所給出的磁盤和磁帶的硬錯(cuò)誤率數(shù)據(jù)。
設(shè)備
用比特?cái)?shù)所表示的硬錯(cuò)誤率 等量的字節(jié)數(shù) 等量的PB數(shù) 120MB/秒下錯(cuò)誤發(fā)生間隔日數(shù)
200MB/秒下錯(cuò)誤發(fā)生間隔日數(shù)
你必須記住,比特錯(cuò)誤率(BER)也稱為硬錯(cuò)誤率和設(shè)備的年故障率(AFR)完全不同。一個(gè)區(qū)別的方式就是將它們分別看做單一訪問的故障和整個(gè)設(shè)備的故障。有時(shí)候,在一些RAID控制器下,單一訪問的故障就是設(shè)備的故障,但是你必須記住的是BER是以傳輸?shù)谋忍財(cái)?shù)來衡量的,而AFR則是以小時(shí)數(shù)來衡量的。一個(gè)設(shè)備即使什么也沒做也可能發(fā)生故障,而BER則根據(jù)的是設(shè)備的使用情況。如果你關(guān)心你的數(shù)據(jù),這是一個(gè)很關(guān)鍵的問題。
一些低端的存儲(chǔ)系統(tǒng)使用消費(fèi)者級(jí)別的SATA驅(qū)動(dòng)器,如果用戶頻繁使用的話,很有可能會(huì)很快發(fā)生故障。問題是RAID設(shè)備,有時(shí)在一個(gè)設(shè)備發(fā)生故障后,在重建過程中,其他設(shè)備也有可能發(fā)生故障。在任何存儲(chǔ)決策的制定過程中,你都必須考慮磁盤驅(qū)動(dòng)器和數(shù)據(jù)丟失的風(fēng)險(xiǎn)。購買市場(chǎng)上最便宜的系統(tǒng)可能在成本上能如你所愿,但是你的數(shù)據(jù)同時(shí)也有可能處于風(fēng)險(xiǎn)中。
SAS和光纖通道驅(qū)動(dòng)器的每GB成本確實(shí)是高于SATA,但是只有很少人認(rèn)識(shí)到重要數(shù)據(jù)的存儲(chǔ)決策還必須考慮可靠性。如果你的數(shù)據(jù)對(duì)于組織來說非常重要,那么購買十倍以上BER的設(shè)備是更好的考慮,很明顯,在這里,SATA和SAS/FC的每GB成本的區(qū)別并不是重要的考慮。即使是在現(xiàn)在的艱難形勢(shì)下,用戶也不應(yīng)該只考慮初始成本,還應(yīng)該考慮數(shù)據(jù)丟失的成本。
磁帶與重復(fù)數(shù)據(jù)刪除磁盤的對(duì)比
我還從沒看到過有人會(huì)說磁盤和磁帶的每GB成本相近的。磁帶總能在成本上獲勝,不過你必須將所有數(shù)據(jù)寫入磁帶嗎?
重復(fù)數(shù)據(jù)刪除已成為存儲(chǔ)市場(chǎng)上發(fā)展最快的市場(chǎng)之一即使不是最快。有許多公司提供重復(fù)數(shù)據(jù)刪除技術(shù)。一些技術(shù)是同硬件平臺(tái)相結(jié)合,而另一些技術(shù)則是純粹的軟件。一些廠商聲稱在VMware等環(huán)境下,數(shù)據(jù)備份可以達(dá)到50:1的節(jié)約率,但是其他一些環(huán)境,比如媒體文件等則不能達(dá)到這個(gè)數(shù)據(jù)節(jié)約率。
同樣賦予磁帶和重復(fù)數(shù)據(jù)刪除系統(tǒng)足夠的帶寬,與磁帶相比,重復(fù)數(shù)據(jù)刪除可以加速備份流程。從時(shí)間的角度來說,由于磁帶有延遲性和其他問題,因此重復(fù)數(shù)據(jù)刪除設(shè)備很可能優(yōu)于標(biāo)準(zhǔn)的磁帶備份,而根據(jù)備份的規(guī)模以及磁帶的數(shù)量、磁帶槽的數(shù)量以及重復(fù)數(shù)據(jù)刪除系統(tǒng)的成本,重復(fù)數(shù)據(jù)刪除甚至還可以實(shí)現(xiàn)成本節(jié)約。當(dāng)然,備份的真正問題并在于數(shù)據(jù)備份本身,而在于恢復(fù)數(shù)據(jù)。你要記住的是,比起在通道中寫入數(shù)據(jù),重復(fù)數(shù)據(jù)刪除在數(shù)據(jù)擴(kuò)展上的速度可以更快。
我所聽到的有關(guān)磁帶的最大抱怨就是磁帶比較慢。自從磁帶盒發(fā)明以來,磁帶在載入和準(zhǔn)備的延遲性上沒有多大改變,但這并不是真正的問題。更經(jīng)常的情況是,備份和磁帶性能的真正問題是磁帶比目前它們所連接的網(wǎng)絡(luò)要更快?纯聪旅娴氖聦(shí)。2001年,LTO非壓縮數(shù)據(jù)傳輸率為20MB/秒,而大部分網(wǎng)絡(luò)為1Gb,或者說實(shí)際上是80-90MB/秒,因此,當(dāng)時(shí)網(wǎng)絡(luò)的速度要比磁帶的非壓縮數(shù)據(jù)傳輸率快四倍以上,比壓縮數(shù)據(jù)傳輸率要快兩倍以上。
現(xiàn)在的LTO-4有120MB/秒的非壓縮數(shù)據(jù)傳輸率,240MB/秒的壓縮數(shù)據(jù)傳輸率。如果你的備份服務(wù)器使用的是10GB/秒以太網(wǎng),那你還有一點(diǎn)喘息空間,但也不多。問題是很少人有端到端的10GB/秒以太網(wǎng)網(wǎng)絡(luò),而且根據(jù)短板原理,你還受限于網(wǎng)絡(luò)上最慢的那部分。這對(duì)于磁帶來說也是一樣如果使用LTO-4的你使用的是FC-2,那么FC-2的網(wǎng)速限制為200MB/秒,而LTO-4的壓縮數(shù)據(jù)傳輸率為240MB/秒。此外,多數(shù)人在同一個(gè)FC連接上還有多個(gè)磁帶驅(qū)動(dòng)器,而在這種情況下,你的性能瓶頸又將來自網(wǎng)絡(luò)。
因此,如果你準(zhǔn)備使用磁帶情境是你的磁帶不僅比磁盤更便宜,而且如果處理和存儲(chǔ)得當(dāng)?shù)脑,還能更可靠那么為了能夠有效地利用磁帶,你必須全速使用設(shè)備,包括壓縮,因此D2D2T(磁盤到磁盤到磁帶)是一種值得考慮的方式。為了實(shí)現(xiàn)這一點(diǎn),你需要一個(gè)VTL(虛擬磁帶庫)或一個(gè)能夠管理D2D2T框架的備份軟件,而這通常會(huì)增加軟件的成本。在D2D2T、VTL和重復(fù)數(shù)據(jù)刪除設(shè)備之間進(jìn)行權(quán)衡或結(jié)合是一個(gè)復(fù)雜的決策,它取決于數(shù)據(jù)的可重復(fù)刪除性,網(wǎng)絡(luò)的狀態(tài),新增硬件和軟件的成本,以及其他因素,比如能耗、培訓(xùn)和空間。D2D2T系統(tǒng)的一個(gè)好處就是該系統(tǒng)可以在數(shù)據(jù)被寫入磁帶之前對(duì)其進(jìn)行重復(fù)數(shù)據(jù)刪除,從而節(jié)約更多的成本。
另一個(gè)要考慮的因素:如果你在刪除數(shù)據(jù)的多個(gè)副本,那么要確保你所保留的是正確的版本。你要從重復(fù)數(shù)據(jù)刪除廠商那里確認(rèn)他們有正確的檢驗(yàn)來保證數(shù)據(jù)的完整性和可靠性。(見《數(shù)據(jù)損壞:重復(fù)數(shù)據(jù)刪除的弱點(diǎn)》)
磁盤和磁帶之間的權(quán)衡很清除。磁帶更便宜,而且比磁盤更可靠,但是你需要有合適的架構(gòu)來確保其能夠有效運(yùn)作。重復(fù)數(shù)據(jù)刪除可以節(jié)約存儲(chǔ)成本,但是廉價(jià)的磁盤有可能帶來數(shù)據(jù)丟失。在數(shù)據(jù)存儲(chǔ)市場(chǎng)上,你不能無代價(jià)地獲得好處,希望你現(xiàn)在可以做出更明智的支出決策。