RAID與備份
一.Raid定義
RAID(Redundant Array of Independent Disk 獨立冗余磁盤陣列)技術是加州大學伯克利分校1987年提出,最初是為了組合小的廉價磁盤來代替大的昂貴磁盤,同時希望磁盤失效時不會使對數據的訪問受損失而開發出一定水平的數據保護技術。RAID就是一種由多塊廉價磁盤構成的冗余陣列,在操作系統下是作為一個獨立的大型存儲設備出現。RAID可以充分發揮出多塊硬盤的優勢,可以提升硬盤速度,增大容量,提供容錯功能夠確保數據安全性,易于管理的優點,在任何一塊硬盤出現問題的情況下都可以繼續工作,不會受到損壞硬盤的影響。 二、RAID的幾種工作模式
1、RAID0
即Data Stripping數據分條技術。RAID 0可以把多塊硬盤連成一個容量更大的硬盤群,可以提高磁盤的性能和吞吐量。RAID 0沒有冗余或錯誤修復能力,成本低,要求至少兩個磁盤,一般只是在那些對數據安全性要求不高的情況下才被使用。
(1)、RAID 0最簡單方式
就是把x塊同樣的硬盤用硬件的形式通過智能磁盤控制器或用操作系統中的磁盤驅動程序以軟件的方式串聯在一起,形成一個獨立的邏輯驅動器,容量是單獨硬盤的x倍,在電腦數據寫時被依次寫入到各磁盤中,當一塊磁盤的空間用盡時,數據就會被自動寫入到下一塊磁盤中,它的好處是可以增加磁盤的容量。速度與其中任何一塊磁盤的速度相同,如果其中的任何一塊磁盤出現故障,整個系統將會受到破壞,可靠性是單獨使用一塊硬盤的1/n。
(2)、RAID 0的另一方式
是用n塊硬盤選擇合理的帶區大小創建帶區集,最好是為每一塊硬盤都配備一個專門的磁盤控制器,在電腦數據讀寫時同時向n塊磁盤讀寫數據,速度提升n倍。提高系統的性能。
2、RAID 1
RAID 1稱為磁盤鏡像:把一個磁盤的數據鏡像到另一個磁盤上,在不影響性能情況下最大限度的保證系統的可靠性和可修復性上,具有很高的數據冗余能力,但磁盤利用率為50%,故成本最高,多用在保存關鍵性的重要數據的場合。RAID 1有以下特點:
(1)、RAID 1的每一個磁盤都具有一個對應的鏡像盤,任何時候數據都同步鏡像,系統可以從一組鏡像盤中的任何一個磁盤讀取數據。
(2)、磁盤所能使用的空間只有磁盤容量總和的一半,系統成本高。
(3)、只要系統中任何一對鏡像盤中至少有一塊磁盤可以使用,甚至可以在一半數量的硬盤出現問題時系統都可以正常運行。
(4)、出現硬盤故障的RAID系統不再可靠,應當及時的更換損壞的硬盤,否則剩余的鏡像盤也出現問題,那么整個系統就會崩潰。
(5)、更換新盤后原有數據會需要很長時間同步鏡像,外界對數據的訪問不會受到影響,只是這時整個系統的性能有所下降。
(6)、RAID 1磁盤控制器的負載相當大,用多個磁盤控制器可以提高數據的安全性和可用性。
3、RAID0+1
把RAID0和RAID1技術結合起來,數據除分布在多個盤上外,每個盤都有其物理鏡像盤,提供全冗余能力,允許一個以下磁盤故障,而不影響數據可用性,并具有快速讀/寫能力。RAID0+1要在磁盤鏡像中建立帶區集至少4個硬盤。
4、RAID2
電腦在寫入數據時在一個磁盤上保存數據的各個位,同時把一個數據不同的位運算得到的海明校驗碼保存另一組磁盤上,由于海明碼可以在數據發生錯誤的情況下將錯誤校正,以保證輸出的正確。但海明碼使用數據冗余技術,使得輸出數據的速率取決于驅動器組中速度最慢的磁盤。RAID2控制器的設計簡單。
5、RAID3:帶奇偶校驗碼的并行傳送
RAID 3使用一個專門的磁盤存放所有的校驗數據,而在剩余的磁盤中創建帶區集分散數據的讀寫操作。當一個完好的RAID 3系統中讀取數據,只需要在數據存儲盤中找到相應的數據塊進行讀取操作即可。但當向RAID 3寫入數據時,必須計算與該數據塊同處一個帶區的所有數據塊的校驗值,并將新值重新寫入到校驗塊中,這樣無形雖增加系統開銷。當一塊
磁盤失效時,該磁盤上的所有數據塊必須使用校驗信息重新建立,如果所要讀取的數據塊正好位于已經損壞的磁盤,則必須同時讀取同一帶區中的所有其它數據塊,并根據校驗值重建丟失的數據,這使系統減慢。當更換了損壞的磁盤后,系統必須一個數據塊一個數據塊的重建壞盤中的數據,整個系統的性能會受到嚴重的影響。RAID 3最大不足是校驗盤很容易成為整個系統的瓶頸,對于經常大量寫入操作的應用會導致整個RAID系統性能的下降。RAID 3適合用于數據庫和WEB服務器等。
6、 RAID4
RAID4即帶奇偶校驗碼的獨立磁盤結構,RAID4和RAID3很象,它對數據的訪問是按數據塊進行的,也就是按磁盤進行的,每次是一個盤,RAID4的特點和RAID3也挺象,不過在失敗恢復時,它的難度可要比RAID3大得多了,控制器的設計難度也要大許多,而且訪問數據的效率不怎么好。
7、 RAID5
RAID 5把校驗塊分散到所有的數據盤中。RAID 5使用了一種特殊的算法,可以計算出任何
一個帶區校驗塊的存放位置。這樣就可以確保任何對校驗塊進行的讀寫操作都會在所有的RAID磁盤中進行均衡,從而消除了產生瓶頸的可能。RAID5的讀出效率很高,寫入效率一般,塊式的集體訪問效率不錯。RAID 5提高了系統可靠性,但對數據傳輸的并行性解決不好,而且控制器的設計也相當困難。
8、RAID6
RAID6即帶有兩種分布存儲的奇偶校驗碼的獨立磁盤結構,它是對RAID5的擴展,主要是用于要求數據絕對不能出錯的場合,使用了二種奇偶校驗值,所以需要N+2個磁盤,同時對控制器的設計變得十分復雜,寫入速度也不好,用于計算奇偶校驗值和驗證數據正確性所花費的時間比較多,造成了不必須的負載,很少人用。
9、 RAID7
RAID7即優化的高速數據傳送磁盤結構,它所有的I/O傳送均是同步進行的,可以分別控制,這樣提高了系統的并行性和系統訪問數據的速度;每個磁盤都帶有高速緩沖存儲器,實時操作系統可以使用任何實時操作芯片,達到不同實時系統的需要。允許使用SNMP協
議進行管理和監視,可以對校驗區指定獨立的傳送信道以提高效率。可以連接多臺主機,當多用戶訪問系統時,訪問時間幾乎接近于0。但如果系統斷電,在高速緩沖存儲器內的數據就會全部丟失,因此需要和UPS一起工作,RAID7系統成本很高。
10、 RAID10
RAID10即高可靠性與高效磁盤結構它是一個帶區結構加一個鏡象結構,可以達到既高效又高速的目的。這種新結構的價格高,可擴充性不好。
11、 RAID53
RAID7即高效數據傳送磁盤結構,是RAID3和帶區結構的統一,因此它速度比較快,也有容錯功能。但價格十分高,不易于實現。
三、應用RAID技術
要使用磁盤RAID主要有兩種方式,第一種就是RAID適配卡,通過RAID適配卡插入PCI插槽再接上硬盤實現硬盤的RAID功能。第二種方式就是直接在主板上集成RAID控制芯片,讓主板能直接實現磁盤RAID。這種方式成本比專用的RAID適配卡低很多。
此外還可以用2k or xp or linux系統做成軟raid.個人使用磁盤RAID主要是用RAID0、 RAID1或RAID0+1工作模式。
幾種常見的數據備份方案
常見的數據備份系統主要有Host-Ba、LAN-Ba和基于SAN結構的LAN-Free、Server-Free等多種結構。
綜述
Host-Bad備份方式:
Host-Bad是傳統的數據備份的結構這種結構中磁帶庫直接接在服務器上,而且只為該服務器提供數據備份服務。在大多數情況下,這種備份大多是采用服務器上自帶的磁帶機,而備份操作往往也是通過手工操作的方式進行的。
Host-Bad備份結構的優點是數據傳輸速度快,備份管理簡單;缺點是不利于備份系統的共享,不適合于現在大型的數據備份要求。
LAN-Bad備份方式:
LAN-Bad備份,在該系統中數據的傳輸是以網絡為基礎的。其中配置一臺服務器作為備份服務器,由它負責整個系統的備份操作。磁帶庫則接在某臺服務器上,在數據備份時備份對象把數據通過網絡傳輸到磁帶庫中實現備份的。
LAN-Bad備份結構的優點是節省投資、磁帶庫共享、集中備份管理;它的缺點是對網絡傳輸壓力大。
LAN-Free備份方式:
LAN-Free和Server-Free的備份系統是建立在SAN(存儲區域網)的基礎上的,其結構如下圖所示。基于SAN的備份是一種徹底解決傳統備份方式需要占用LAN帶寬問題的解決方案。它采用一種全新的體系結構,將磁帶庫和磁盤陣列各自作為獨立的光纖結點,多臺主機共享磁帶庫備份時,數據流不再經過網絡而直接從磁盤陣列傳到磁帶庫內,是一種無需占用網絡帶寬 (LAN-Free) 的解決方案。
目前隨著SAN技術的不斷進步,LAN-Free的結構已經相當成熟,而Server-Free的備份結
構則不太成熟。
LAN-Free的優點是數據備份統一管理、備份速度快、網絡傳輸壓力小、磁帶庫資源共享;缺點是投資高。
利用IBM Tivoly Storage Manager軟件,配合IBM LTO等磁帶庫產品,可以實現以上各種備份方式。
數據備份方式的選擇
目前數據備份主要方式有:LAN 備份、LAN Free備份和SAN Server-Free備份三種。LAN 備份針對所有存儲類型都可以使用, LAN Free備份和SAN Server-Free備份只能針對SAN架構的存儲。
基于LAN備份
傳統備份需要在每臺主機上安裝磁帶機備份本機系統,采用LAN備份策略,在數據量不是很大時候,可采用集中備份。一臺中央備份服務器將會安裝在 LAN 中,然后將應用服務器
和工作站配置為備份服務器的客戶端。中央備份服務器接受運行在客戶機上的備份代理程序的請求,將數據通過 LAN 傳遞到它所管理的、與其連接的本地磁帶機資源上。這一方式提供了一種集中的、易于管理的備份方案,并通過在網絡中共享磁帶機資源提高了效率。
LAN-Free備份
由于數據通過LAN傳播,當需要備份的數據量較大,備份時間窗口緊張時,網絡容易發生堵塞。在SAN環境下,可采用存儲網絡的LAN- Free 備份,需要備份的服務器通過SAN連接到磁帶機上,在LAN-Free備份客戶端軟件的觸發下,讀取需要備份的數據,通過SAN備份到共享的磁帶機。這種獨立網絡不僅可以使 LAN 流量得以轉移,而且它的運轉所需的 CPU 資源低于 LAN 方式,這是因為光纖通道連接不需要經過服務器的 TCP/IP 棧,而且某些層的錯誤檢查可以由光纖通道內部的硬件完成。在許多解決方案中需要一臺主機來管理共享的存儲設備以及用于查找和恢復數據的備份數據庫。