基于分層校驗(yàn)技術(shù)的全新RAID
—— 閱讀:14069次
那些有大型數(shù)據(jù)存儲(chǔ)需求的企業(yè)提供更為可靠的解決方案外,分層校驗(yàn)可能還將預(yù)示著基于"傳統(tǒng)"(或者說單向奇偶校驗(yàn)RAID)、甚至是基于RAID 6(也即雙重校驗(yàn)RAID)的解決方案的終結(jié)。
傳統(tǒng)RAID和新的RAID
計(jì)算機(jī)研究專家,Panasas公司的合伙創(chuàng)始人兼首席技術(shù)官Garth Gibson從八十年代晚期就引領(lǐng)著RAID技術(shù)的研究。他認(rèn)為,分層校驗(yàn)代表著舊的、非Panasas類型的RAID將過時(shí)。這是因?yàn)樽畛醯腞AID技術(shù)主要是為了解決整體磁盤數(shù)據(jù)丟失的情況,而非一個(gè)或多個(gè)磁盤上的介質(zhì)故障(也被叫做不可恢復(fù)讀錯(cuò)誤或介質(zhì)錯(cuò)誤)。(具體可見"Gibson探討如何從存儲(chǔ)錯(cuò)誤中學(xué)習(xí)教訓(xùn)")。
Gibson解釋道,"RAID的策略是將數(shù)據(jù)放在多個(gè)故障區(qū)域的條帶內(nèi),并利用故障區(qū)域之間廉價(jià)的錯(cuò)誤糾正碼來恢復(fù)由于普通的存儲(chǔ)故障所導(dǎo)致的數(shù)據(jù)丟失,特別是整體磁盤的災(zāi)難性數(shù)據(jù)丟失。
"在那個(gè)時(shí)候,一個(gè)故障區(qū)域就是一個(gè)物理磁盤,而我們每次是將一個(gè)數(shù)據(jù)邏輯地分布在固定數(shù)目的磁盤上。從那以后,我們認(rèn)識(shí)到簡(jiǎn)單地將存儲(chǔ)中所有同一類型文件的數(shù)據(jù)一次性分布在固定數(shù)目的磁盤上雖然是正確的,但是過于專門化了。"
舊的RAID同時(shí)也未能解決介質(zhì)故障的問題,而后者發(fā)生的機(jī)率是和磁盤密度的增長(zhǎng)同步增加的,F(xiàn)在的磁盤密度已經(jīng)是20年前的250倍,而RAID的出現(xiàn)也是在20年前,對(duì)于那些依賴高性能計(jì)算、存儲(chǔ)安全和TB級(jí)數(shù)據(jù)恢復(fù)的企業(yè)以及機(jī)構(gòu)來說,這種情況是個(gè)大問題。根據(jù)Panasas的研究,介質(zhì)故障發(fā)生的概率大約是磁盤故障發(fā)生概率的30倍,而一個(gè)介質(zhì)故障就能導(dǎo)致RAID重建失敗。
Gibson說,即使是像RAID 6這樣的強(qiáng)大的解決方案也不能應(yīng)付這種問題。
"RAID 6是能夠很好的解決其中一些問題,但是它也使校驗(yàn)碼的數(shù)量增加一倍,如果你要對(duì)特定類型的工作負(fù)荷進(jìn)行小更新,你的工作量也被增加一倍了",他說,"而且RAID 6也不像你所希望的那樣強(qiáng)大,實(shí)際上,如果有兩個(gè)故障磁盤,你還是得處理這些介質(zhì)故障,因?yàn)镽AID 6實(shí)際上所作的就是處理一個(gè)磁盤故障和一個(gè)介質(zhì)故障".
換句話說,RAID 6只是處理故障的癥狀,而不是根本原因——而且還要承擔(dān)昂貴的費(fèi)用并損失很多性能。
另一方面,Gibson說,分層校驗(yàn)"是一整套解決方案……提高了對(duì)介質(zhì)故障和隱性硬件故障的抵御能力,減少了商業(yè)的商品陣列所可能進(jìn)行的冗長(zhǎng)重建的次數(shù)。"
那么也就是說這位RAID之父已經(jīng)放棄了RAID了嗎?既是也不是。Gibson說,分層校驗(yàn)可以利用RAID(特別是Panasas的對(duì)象RAID),它實(shí)際上是一種"全新和改善了的RAID",是一個(gè)成熟的RAID.分層校驗(yàn)?zāi)軌驖M足如今的企業(yè)和機(jī)構(gòu)對(duì)大型存儲(chǔ)可靠性的需求。
什么是"分層校驗(yàn)"?
分層存儲(chǔ)包括三個(gè)獨(dú)立的層面,或者說解決方案——水平奇偶校驗(yàn),垂直奇偶校驗(yàn)和網(wǎng)絡(luò)奇偶校驗(yàn)——能夠在磁盤故障發(fā)生前就檢測(cè)到并糾正問題。
水平奇偶校驗(yàn)使用Panasas的基于對(duì)象的RAID技術(shù),對(duì)整個(gè)存儲(chǔ)陣列提供磁盤故障保護(hù)。它同時(shí)也提供可擴(kuò)展的RAID恢復(fù),并行重建以及每個(gè)文件的故障隔離。
垂直奇偶校驗(yàn),這是來自Panasas公司的一項(xiàng)新技術(shù),也被看作是單個(gè)驅(qū)動(dòng)器中的RAID.它在出現(xiàn)可能影響RAID重建的故障之前探測(cè)和修復(fù)磁盤的介質(zhì)錯(cuò)誤,這項(xiàng)新技術(shù)修復(fù)了導(dǎo)致RAID重建操作失敗的根源。
網(wǎng)絡(luò)奇偶校驗(yàn),這種校驗(yàn)方法提供了業(yè)界第一個(gè)具有保持端到端數(shù)據(jù)完整性能力的校驗(yàn)方法,檢測(cè)來自企業(yè)或機(jī)構(gòu)存儲(chǔ)系統(tǒng)外部的錯(cuò)誤。
銷售分層校驗(yàn)的產(chǎn)品名稱是Panasas ActiveScale.根據(jù)Panasas的說法,當(dāng)聯(lián)合使用時(shí)(雖然分層校驗(yàn)是捆綁式銷售,但是用戶可以根據(jù)自己的需要關(guān)閉或激活各個(gè)分層),分層校驗(yàn)?zāi)軌蛱峁┫喈?dāng)于傳統(tǒng)RAID 5 1000倍的保護(hù)能力——而且不損害主要性能。
換句話說,分層存儲(chǔ)是RAID,但是是更好的RAID.