
关于raid10和raid5??
展开全部
[存储]RAID5与RAID10差异分析 05月06日(星期日) 应用系统一般要求存储系统具有良好的IO性能,同时也要求做好数据的安全保护,这里我们重点讨论raid10和raid5两种阵列方式。
关于这方面的讨论,网上也有了不少的资料,我这里一方面是做了一些整理,另一方面,在看别的帖子的时候,有些想法不敢苟同,所以就自己整理了一篇,所参考的资料在文后都有列述。对于其他RAID级别,由于比较简单,不再叙述。就以这一篇文章作为blog存储系列专题的第一篇吧。主要内容包括三点:RAID5基本原理;RAID10基本原理;RAID10与RAID5差异比较。 一、RAID5基本原理
1、认识RAID5
RAID5是一种存储性能、数据安全和存储成本兼顾的存储解决方案,它使用的是Disk Striping(硬盘分割)技术,RAID5不是利用镜像而是利用分散奇偶校验冗余数据。RAID5可以理解为是RAID0和RAID1的折衷方案,RAID5可以为系统提供数据安全保障,但保障程度要比RAID1低,而磁盘空间利用率要比RAID1高。
一般都需要增加RAID卡实现对RAID5的支持,保护数据存储安全。支持RAID5的RAID卡一般是使用SCSI RAID卡,它是用来实现RAID功能的板卡,通常是由I/O处理器、SCSI控制器、SCSI连接器、缓存、蜂鸣器等一系列零组件构成的。RAID卡可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍、几十倍甚至上百倍的速率,这也是RAID卡最初想要解决的问题;另外,RAID卡也可以提供容错功能。因此RAID卡不仅仅是提供数据存储安全保障,还能扩展硬盘的挂载数量,所以,在企业购买阵列卡之后也会增加一些硬盘,来满足数据存储的需要,这里我们仅以四个硬盘组成的RAID5为例来说明。 2、RAID5的写(Write)操作
RAID5数据存储方式为:盘1 盘2 盘3 盘4
................................
p4 9 10 11
6 p3 7 8
3 4 p2 5
0 1 2 p1 其中:P4为数据9、10、11的奇偶校验信息,其它以此类推;P3为数据6、7、8的奇偶校验信息;P2为数据3、4、5的奇偶校验信息;P1为数据0、1、2的奇偶校验信息。四个硬盘组成的RAID5采用数据分块并行传送的方法,它在数据分块之后计算它们的奇偶校验和。可以看出,RAID5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息分别存储在组成RAID5的不同磁盘上。 RAID5具有和RAID0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID5的磁盘空间利用率要比RAID1高,存储成本相对较低。RAID5是采用奇偶校验的方法维护数据,这些奇偶校验的信息只占用一块磁盘的容量,所以RAID5的实际容量相当于阵列中的磁盘数n-1,数据读写速度等于单盘的速度*盘数,RAID5具有较好的综合性能,因此是目前服务器使用最多的阵列选择之一。 3、RAID 5的数据损坏(Crash)与恢复(Recover)操作
当组成RAID5的磁盘1数据发生损坏后,磁盘中的数据0、数据3、数据6以及奇偶校验信息P4将全部丢失。RAID5的数据恢复有二种方式:Recover S/W和Recover H/W。Recover S/W主要是指用软件(如操作系统或第三方软件)做的RAID5的数据恢复,由于是操作系统下实现RAID,软RAID不能保护系统盘。软件RAID很多情况下已经包含在系统之中,并成为其中一个功能,如 Windows、Netware及Linux。软件RAID中的所有操作皆由中央处理器负责,所以系统资源的利用率会很高,从而使系统性能降低。软件RAID是不需要另外添加任何硬件设备,因为它是靠服务器的系统,主要是中央处理器的功能,提供所有现成的资源。
如果磁盘1坏了,系统将受到影响;必须进行更换新的硬盘,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据,将数据数据0、数据3、数据6和奇偶校验信息P4写到新硬盘(磁盘1)中后,系统才能正常操作运行。 Recover H/W主要是指用硬件做热备份的RAID5的数据恢复,如果磁盘1坏了,系统一般不会受到影响;当我们更换新的硬盘,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据,将数据0、数据3、数据6和奇偶校验信息P4写到新硬盘(磁盘1)中,在整个数据恢复过程中,系统仍能正常操作运行。因此,有条件的话,在做RAID5的时候最好做真正的硬件磁盘阵列。
关于这方面的讨论,网上也有了不少的资料,我这里一方面是做了一些整理,另一方面,在看别的帖子的时候,有些想法不敢苟同,所以就自己整理了一篇,所参考的资料在文后都有列述。对于其他RAID级别,由于比较简单,不再叙述。就以这一篇文章作为blog存储系列专题的第一篇吧。主要内容包括三点:RAID5基本原理;RAID10基本原理;RAID10与RAID5差异比较。 一、RAID5基本原理
1、认识RAID5
RAID5是一种存储性能、数据安全和存储成本兼顾的存储解决方案,它使用的是Disk Striping(硬盘分割)技术,RAID5不是利用镜像而是利用分散奇偶校验冗余数据。RAID5可以理解为是RAID0和RAID1的折衷方案,RAID5可以为系统提供数据安全保障,但保障程度要比RAID1低,而磁盘空间利用率要比RAID1高。
一般都需要增加RAID卡实现对RAID5的支持,保护数据存储安全。支持RAID5的RAID卡一般是使用SCSI RAID卡,它是用来实现RAID功能的板卡,通常是由I/O处理器、SCSI控制器、SCSI连接器、缓存、蜂鸣器等一系列零组件构成的。RAID卡可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍、几十倍甚至上百倍的速率,这也是RAID卡最初想要解决的问题;另外,RAID卡也可以提供容错功能。因此RAID卡不仅仅是提供数据存储安全保障,还能扩展硬盘的挂载数量,所以,在企业购买阵列卡之后也会增加一些硬盘,来满足数据存储的需要,这里我们仅以四个硬盘组成的RAID5为例来说明。 2、RAID5的写(Write)操作
RAID5数据存储方式为:盘1 盘2 盘3 盘4
................................
p4 9 10 11
6 p3 7 8
3 4 p2 5
0 1 2 p1 其中:P4为数据9、10、11的奇偶校验信息,其它以此类推;P3为数据6、7、8的奇偶校验信息;P2为数据3、4、5的奇偶校验信息;P1为数据0、1、2的奇偶校验信息。四个硬盘组成的RAID5采用数据分块并行传送的方法,它在数据分块之后计算它们的奇偶校验和。可以看出,RAID5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息分别存储在组成RAID5的不同磁盘上。 RAID5具有和RAID0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID5的磁盘空间利用率要比RAID1高,存储成本相对较低。RAID5是采用奇偶校验的方法维护数据,这些奇偶校验的信息只占用一块磁盘的容量,所以RAID5的实际容量相当于阵列中的磁盘数n-1,数据读写速度等于单盘的速度*盘数,RAID5具有较好的综合性能,因此是目前服务器使用最多的阵列选择之一。 3、RAID 5的数据损坏(Crash)与恢复(Recover)操作
当组成RAID5的磁盘1数据发生损坏后,磁盘中的数据0、数据3、数据6以及奇偶校验信息P4将全部丢失。RAID5的数据恢复有二种方式:Recover S/W和Recover H/W。Recover S/W主要是指用软件(如操作系统或第三方软件)做的RAID5的数据恢复,由于是操作系统下实现RAID,软RAID不能保护系统盘。软件RAID很多情况下已经包含在系统之中,并成为其中一个功能,如 Windows、Netware及Linux。软件RAID中的所有操作皆由中央处理器负责,所以系统资源的利用率会很高,从而使系统性能降低。软件RAID是不需要另外添加任何硬件设备,因为它是靠服务器的系统,主要是中央处理器的功能,提供所有现成的资源。
如果磁盘1坏了,系统将受到影响;必须进行更换新的硬盘,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据,将数据数据0、数据3、数据6和奇偶校验信息P4写到新硬盘(磁盘1)中后,系统才能正常操作运行。 Recover H/W主要是指用硬件做热备份的RAID5的数据恢复,如果磁盘1坏了,系统一般不会受到影响;当我们更换新的硬盘,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据,将数据0、数据3、数据6和奇偶校验信息P4写到新硬盘(磁盘1)中,在整个数据恢复过程中,系统仍能正常操作运行。因此,有条件的话,在做RAID5的时候最好做真正的硬件磁盘阵列。
展开全部
RAID10与RAID5的异同比较
从一个普通应用来讲,要求存储系统具有良好的IO性能同时也要求对数据安全做好保护工作,所以raid10和raid5应该成为我们重点关注的对象。
单纯的谈论不同raid级别的优缺是不切实际的,raid只有和磁盘结合才是完整的阵列。
下面从IO性能,数据重构及对系统性能的影响,数据安全保护等方面,结合磁盘现状来分析两种技术的差异。
IO的性能:
读操作上raid10和raid5是相当的,
对于RAID-5 在一些很小数据的写操作(如比每个条带还小的小数据)需要2 个读、2 个写,还有2 个XOR 操作,对于单个用户的写操作,在新数据应用之前必须将老的数据从校验盘中移除,整个的执行过程是这样:读出旧数据,旧数据与新数据做XOR,并创建一个即时的值,读出旧数据的校验信息,将即时值与校验数据进行XOR,最后写下新的校验信息。为了减少对系统的影响,大多数的RAID5 都读出并将整个条带(包括校验条带)写入缓存,执行2 个XOR 操作,然后发出并行写操作(通常对整个条带),即便了进行了上述优化,系统仍然需要为这种写操作进行额外的读和XOR操作。小量写操作困难使得RAID-5 技术很少应用于密集写操作的场合,如回滚字段及重做同志。当然,也可以将存储系统的条带大小定义为经常读写动作的数据大小,使之匹配,但这样会限制系统的灵活性,也不适用于企业中其它的应用。
对于raid10,由于不存在数据校验,每次写操作只是单纯的执行写操作。应此在写性能上raid10要好于raid5。
数据重构:
对于raid10,当一块磁盘失效时,进行数据重构的操作只是复制一个新磁盘,如果假定磁盘的容量为250G,那么复制的数据量为250G。
对于raid5的存储阵列,则需要从每块磁盘中读取数据,经过重新计算得到一块硬盘的数据量,如果raid5是以4+1的方式组建,每块磁盘的容量也为250G,那么,需要在剩余的4个磁盘中读出总共是1000G的数据量计算得出250G的数据。从这点来看,raid5在数据重构上的工作负荷和花费的时间应该远大于raid10,负荷变大将影响重构期间的性能,时间长意味再次出现数据损坏的可能性变大。
数据安全保护:
raid10系统在已有一块磁盘失效的情况下,只有出现该失效盘的对应镜像盘也失效,才会导致数据丢失。其他的磁盘失效不会出现数据丢失情况。
Raid5系统在已有一块磁盘失效的情况下,只要再出现任意的一块磁盘失效,都将导致数据丢失。
从综合来看,raid10和raid5系统在出现一块磁盘失效后,进行数据重构时,raid5需耗费的时间要比raid10长,同时重构期间系统负荷上raid5要比raid10高,同时raid5出现数据丢失的可能性要比raid10高,因此,数据重构期间,raid5系统的可靠性远比raid10来的低。
Raid5在磁盘空间率用率上比raid10高,raid5的空间利用率是(N-1)/ N (N为阵列的磁盘数目),而raid10的磁盘空间利用率仅为50%。
但是结合磁盘来考虑,今天的硬盘厂商所生产的ATA硬盘的质量已经可以承担企业级的应用,并且,容量的增加幅度相当大,目前已经可以实现单个磁盘400G的存储容量。SCSI硬盘由于要求高转速而使用小直径盘片,容量的增加相对缓慢。ATA磁盘相对SCSI磁盘拥有成本也要小很对,
应此,在一些IO要求非常高的应用中,raid5结合SCSI磁盘是比较好的选择,其他应用中采用大容量的ATA硬盘结合raid10,既降低了raid10的为获得一定的存储空间必须采用双倍磁盘空间的拥有成本,又避免了raid5相对raid10的各种缺点。
在企业应用中,raid10结合ATA磁盘意味着一个更好的选择。
从一个普通应用来讲,要求存储系统具有良好的IO性能同时也要求对数据安全做好保护工作,所以raid10和raid5应该成为我们重点关注的对象。
单纯的谈论不同raid级别的优缺是不切实际的,raid只有和磁盘结合才是完整的阵列。
下面从IO性能,数据重构及对系统性能的影响,数据安全保护等方面,结合磁盘现状来分析两种技术的差异。
IO的性能:
读操作上raid10和raid5是相当的,
对于RAID-5 在一些很小数据的写操作(如比每个条带还小的小数据)需要2 个读、2 个写,还有2 个XOR 操作,对于单个用户的写操作,在新数据应用之前必须将老的数据从校验盘中移除,整个的执行过程是这样:读出旧数据,旧数据与新数据做XOR,并创建一个即时的值,读出旧数据的校验信息,将即时值与校验数据进行XOR,最后写下新的校验信息。为了减少对系统的影响,大多数的RAID5 都读出并将整个条带(包括校验条带)写入缓存,执行2 个XOR 操作,然后发出并行写操作(通常对整个条带),即便了进行了上述优化,系统仍然需要为这种写操作进行额外的读和XOR操作。小量写操作困难使得RAID-5 技术很少应用于密集写操作的场合,如回滚字段及重做同志。当然,也可以将存储系统的条带大小定义为经常读写动作的数据大小,使之匹配,但这样会限制系统的灵活性,也不适用于企业中其它的应用。
对于raid10,由于不存在数据校验,每次写操作只是单纯的执行写操作。应此在写性能上raid10要好于raid5。
数据重构:
对于raid10,当一块磁盘失效时,进行数据重构的操作只是复制一个新磁盘,如果假定磁盘的容量为250G,那么复制的数据量为250G。
对于raid5的存储阵列,则需要从每块磁盘中读取数据,经过重新计算得到一块硬盘的数据量,如果raid5是以4+1的方式组建,每块磁盘的容量也为250G,那么,需要在剩余的4个磁盘中读出总共是1000G的数据量计算得出250G的数据。从这点来看,raid5在数据重构上的工作负荷和花费的时间应该远大于raid10,负荷变大将影响重构期间的性能,时间长意味再次出现数据损坏的可能性变大。
数据安全保护:
raid10系统在已有一块磁盘失效的情况下,只有出现该失效盘的对应镜像盘也失效,才会导致数据丢失。其他的磁盘失效不会出现数据丢失情况。
Raid5系统在已有一块磁盘失效的情况下,只要再出现任意的一块磁盘失效,都将导致数据丢失。
从综合来看,raid10和raid5系统在出现一块磁盘失效后,进行数据重构时,raid5需耗费的时间要比raid10长,同时重构期间系统负荷上raid5要比raid10高,同时raid5出现数据丢失的可能性要比raid10高,因此,数据重构期间,raid5系统的可靠性远比raid10来的低。
Raid5在磁盘空间率用率上比raid10高,raid5的空间利用率是(N-1)/ N (N为阵列的磁盘数目),而raid10的磁盘空间利用率仅为50%。
但是结合磁盘来考虑,今天的硬盘厂商所生产的ATA硬盘的质量已经可以承担企业级的应用,并且,容量的增加幅度相当大,目前已经可以实现单个磁盘400G的存储容量。SCSI硬盘由于要求高转速而使用小直径盘片,容量的增加相对缓慢。ATA磁盘相对SCSI磁盘拥有成本也要小很对,
应此,在一些IO要求非常高的应用中,raid5结合SCSI磁盘是比较好的选择,其他应用中采用大容量的ATA硬盘结合raid10,既降低了raid10的为获得一定的存储空间必须采用双倍磁盘空间的拥有成本,又避免了raid5相对raid10的各种缺点。
在企业应用中,raid10结合ATA磁盘意味着一个更好的选择。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询