磁盘阵列的原理及相关知识.docx
- 文档编号:7331349
- 上传时间:2023-01-23
- 格式:DOCX
- 页数:12
- 大小:32.22KB
磁盘阵列的原理及相关知识.docx
《磁盘阵列的原理及相关知识.docx》由会员分享,可在线阅读,更多相关《磁盘阵列的原理及相关知识.docx(12页珍藏版)》请在冰豆网上搜索。
磁盘阵列的原理及相关知识
磁盘阵列的原理及相关知识
1.为什么需要磁盘阵列?
如何增加磁盘的存取(access)速度,如何防止数据因磁盘的故障而失落及如何有效的利用磁盘空间,一直是电脑专业人员和用户的困扰;而大容量磁盘的价格非常昂贵,对用户形成很大的负担。
磁盘阵列技术的产生一举解决了这些问题。
过去十年来,CPU的处理速度几乎是几何级数的跃升,内存(memory)的存取速度亦大幅增加,而数据储存装置——主要是磁盘——的存取速度相较之下,较为缓慢,整个I/O吞吐量不能系统匹配,形成电脑系统的瓶颈,拉低了电脑系统的整体性能(throughput),若不能有效的提升磁盘的存取速度,CPU、内存及磁盘间的不平衡将使CPU及内存的改进形成浪费。
目前改进磁盘存取速度的方式主要有两种:
一是磁盘快取控制(diskcachecontroller),它将从磁盘读取的数据存在快取内存(cachememory)中以减少磁盘存取的速度,如要读取的数据在在快取内存中,或要写数据到磁盘时,才做磁盘的存取动作。
这种方式在单工环境如DOS之下,对大量数据的存取有很好的性能(量小且频繁的存取则不然),但在多工(multi-tasking)环境之下(因为要不停的作数据交换——swapping——的动作)或数据库的存取(因为每一记录都很小)就不能显示其性能。
这种方式没有任何安全保障。
其二是使用磁盘阵列的技术。
磁盘阵列是把多个磁盘组成一个阵列,当作单一磁盘使用,它将数据以分段(striping)的方式储存在不同的磁盘中,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。
磁盘阵列所利用的不同的技术,称为RAIDLevel,不同的level针对不同的系统及应用,以解决数据安全的问题。
一般高性能的磁盘阵列都是以硬件的形式来达成,进一步地把磁盘快取控制及磁盘阵列结合在一个控制器(RAIDController)或控制卡上,针对不同的用户解决众对磁盘输出输入系统的四大要求:
(1)增加存取速度;
(2)容错(faulttolerance),即安全性;
(3)有效地利用磁盘空间;
(4)尽量地平衡CPU、内存及磁盘的性能差异,提高电脑的整体工作性能。
2.磁盘阵列原理
1987年,加州柏克大学的三位人员发表了名为“磁盘阵列研究”的论文,正式提到了RAID也就是磁盘阵列,论文提出廉价的5.25"及3.5"的硬盘也能如大机器上的8"盘般提供大容量、高性能和数据的一致性,并详述了RAID1至5的技术。
磁盘阵列针对不同的应用使用不同技术,称为RAIDLevel,RAID是RedundantArrayofInexpensiveDisks的缩写,而每一Level代表一种技术,目前业界公认的标准是RAID0~RAID5。
这个level并不代表技术的高低,level5并不高于level3,level1也不低过level4,至于要选择那一种RAIDlevel的产品,纯视用户的操作环境及应用而定,与level的高低没有必然的关系。
RAID0没有安全的保障,但其快速,所以适合高速I/O的系统;RAID1适用于需安全性又要兼顾速度的系统,RAID2及RAID3适用于大型电脑及影像、CAD/CAM等处理;RAID5多用于OLTP,因有金融机构及大型数据处理中心的迫切需要,故使用较多而较有名气,但也因此形成很多人对磁盘阵列的误解,以为磁盘阵列非要RAID5不可;RAID4较少使用,各RAID5有其共同之处,但RAID4适合大量数据的存取。
其他如RAID6,RAID7,乃至RAID10,50,100等,都是厂商各做各的,并无一致的标准,在此不作说明。
介绍各个RAIDlevel之前,先看看形成磁盘阵列的两个基本技术:
磁盘延伸(DiskSpanning):
译为磁盘延伸,能确切地表示diskspanning这种技术的含义。
如下图所示,Oaraid?
;磁盘阵列控制器,联接了四个磁盘:
磁盘1磁盘2磁盘3磁盘4
这四个磁盘形成一个阵列,而磁盘阵列的控制器是将此四个磁盘视为单一的逻辑磁盘,如DOS环境下的C:
盘。
这是diskspanning的意义,把小容量的磁盘延伸为大容量的单一磁盘。
因为电脑本身只把硬盘当作一储存空间,并不安排管理数据在硬盘的方式,磁盘阵列控制器会决定如何使用储存空间以得到最好的性能和数据的一致性。
所以用户不必规划数据在磁盘的分布,而且提高磁盘空间的使用率。
Oaraid?
;的SCSI磁盘阵列更可连接几十个磁盘,形成数十GB到数百GB的阵列,使磁盘容量几乎可作无限的延伸;而各个磁盘一起作存取的动作,比单一磁盘更为快捷。
很明显地由此阵列形成而产生RAID的各种技术。
我们也可从上图看出inexpensive(便宜)的意义,四个500MB的磁盘比一个2GB的磁盘要便宜,因为以前大磁盘的价格非常昂贵,但在磁盘越来越便宜的今天,inexpensive已非磁盘阵列的重点,虽然对于需要大磁盘容量的系统,仍是考虑的要点。
磁盘或数据分段(DiskstrippingorDataStriping):
因为磁盘阵列是将同一阵列的多个磁盘视为单一的虚拟磁盘(virtualdisk),所以其数据是以分段(blockorsegment)的方式顺序存放在磁盘阵列中,如下图:
磁盘0磁盘1磁盘2磁盘3
A0A1A2A3
A4A5A6A7
…………
4N-34N-24N-14N
分段的意思是把数据分小段跨越分布在各个磁盘,数据按需要分段,从第一个磁盘开始放,放到最后一个磁盘再回到第一个磁盘,直到数据分布完毕。
至于分段的大小视系统而定,如果磁盘阵列所分区块和操作系统的所分的区块是一致的话,会有较好的效率。
有的系统或以1KB最有效率,或以4KB,或以6KB,甚至是4MB或8MB的,但除非数据小于扇区(sector,即512bytes),否则其分段应是512byte的倍数。
因为磁盘的读写是以一个扇区为单位,若数据小于512bytes,系统读取该扇区后,还做组合或分组(视读或写而定)的动作,浪费时间。
从上图我们可以看出数据以段方式放在不同的磁盘,整个阵列的各个磁盘可同时作读写,故数据分段使数据的存取有最好的效率,理论上本来读一个包含四个分段的数据所需要的时间约为(磁盘的accesstime+数据的transfertime)*4次,现在只要一次就可以完成。
Oaraid?
;可将同一数据分段放在不同的磁盘,比如磁盘阵列定义的分段为4KB,而5KB的数据可把4KB的数据放在一个磁盘的分段上,另外1KB的数据放在另一磁盘的分段,而另一笔数据可从这个磁盘分段所剩下的3KB空位放起,这样不但能增加磁盘的利用率,而且可同时启动多个磁盘一起动作,增加存取的速度,在很多情况之下,即使是小于一个分段的数据,也能得到负载均衡的好处,所以分段大小优化心脏可作跨盘分段(同一数据分段放在不同的磁盘分段)。
可得到较好的存取效能,这也是为什么OAraid?
;Viper-II5000系列能有37MB/sec的存取效能的原因。
若以N表示磁盘的数目,R表示读取,W表示写入,S表示可使用空间,则数据分段的性能为:
R:
N(可同时读取所有磁盘)
W:
N(可同时写入所有磁盘)
S:
N(可利用所有的磁盘,并有最佳的使用率)
Diskstriping也称为RAID0,很多人以为RAID0没有什么,其实这是非常错误的观念,因为RAID0使磁盘的输入输出有最高的效率。
而磁盘阵列有更好的效率的原因除数据分段外,它可以同时执行多个输入输出的要求,因为阵列中的每一个磁盘都能独立动作,分段放在不同的磁盘,不同的磁盘可同时作读写,而且能在快取内存及磁盘作并行存取(parallelaccess)的动作。
Striping打破了单一磁盘所形成的瓶颈。
Oapro对以上图4个1GB硬盘的阵列和1个4GB的硬盘作过比较,磁盘阵列的效能约为单一磁盘的3至3.5倍,若4个磁盘分别接Oaraid?
;4个SCSI通道形成阵列,其I/O性能是单一磁盘的4倍。
但是否真能表现出这种能力,要视操作系统,用户数目或工作负荷的特性而定,要能同时得到各个磁盘的交通,其工作负荷也必须分布在各个磁盘。
从上面两点我们可以看出,diskspanning定义了RAID的基本形式,提供了一个便宜、灵活、高性能系统结构,而diskstripping解决了数据的存取效率和磁盘的利用率问题,RAID1至RAID5是在此基础上提供磁盘安全的方案。
RAID1
RAID1是使用磁盘镜像(diskmirroring)的技术。
磁盘镜像应用在RAID1之前就在很多系统中使用,它的方式是在工作磁盘(workingdisk)之外再加一额外的备份磁盘(backupdisk),两个磁盘所储存的数据完全一样,数据写入工作磁盘的同时亦写入备份磁盘。
一般镜像对磁盘的读取有几种方式:
1.只读取工作磁盘,镜像磁盘只是作后备
2.两个硬盘同时读取,采用选取回应的磁盘的数据
3.把不同的读取要求分布在不同的磁盘上
4.直接读主磁盘,如主磁盘正忙,则读取镜像磁盘,如两个磁盘都忙碌,则采用3的方式以分散负载
5.把磁盘的容量分为两半,一个磁盘只读0至N/2(磁盘外侧)的区域,另一磁盘只读N/2至N(磁盘内侧)的区域。
以上方式除1之外,其余都比单一磁盘的效能来的高,能提高多少和系统有关,但以5而言,如数据主不到磁盘的一半,则和单一磁盘无异。
写入也有几种方式:
1.同时写入两个磁盘,并等待两个盘的数据完好。
这种方式比单个磁盘稍慢。
2.直接写入主磁盘,而在镜像磁盘不忙时才写入,这样比方式1有较好的性能,但在某些读取的方式上会导致数据不一致,在引非同步情况之下,若主磁盘故障会使数据失落。
磁盘镜像不见得就是RAID1,一般磁盘镜像和RAID1有两点最大的不同:
下图为RAID1,每一笔数据都储存两份:
磁盘0磁盘1磁盘2磁盘3
A0A1A2A3
A4A5A6A7
…………
4N-34N-24N-14N
从上图可以看出:
R:
N(可同时读取所有磁盘)
W:
N/2(同时写入磁盘数)
S:
N/2(利用率)
读取数据时可用到所有的磁盘,充分发挥数据分段的优点;写入数据时,因为有备份,所以要写入两个磁盘,其效率是N/2,磁盘空间的使用率也只有全部磁盘的一半。
RAID1无工作磁盘和备份磁盘之分,多个磁盘可同时动作而有重叠(overlaping)读取的功能,甚至不同的镜像磁盘可同时作写入的动作,这是一种最佳化的方式,称为负载平衡(load-balance)。
例如有多个用户在同一时间要读取数据,系统能同时驱动互相镜像的磁盘,同时读取数据,以减轻系统的负载,增加I/O的性能。
RAID1的磁盘是以磁盘延伸的方式形成阵列,而数据是以数据分段的方式作储存,因而在读取时,它几乎和RAID0有同样的性能。
从RAID的结构就可以很清楚地看出RAID1和一般磁盘镜像的不同。
这种方式又称为RAID0+1,事实上就是RAID0和RAID1的结合,即在数据分段的情形下作镜像。
这样使得RAID1有很好的存取性能,Oaraid?
;磁盘阵列同时提供了这两种方式。
RAID1当其中一个磁盘故障时,就只能有一个磁盘的性能,故障磁盘更换后需重建或重镜像数据,这要花较长的时间,如果I/O很忙的话,并会对性能产生一些影响,但硬件磁盘阵列可用后台(background)作业的方式做数据重建。
重建完成之前,RAID1没有任何完全保障。
和单一磁盘比较,RAID1的读出比较快,但写入比较慢,因为要同时写入两个磁盘,但RAID0+1可增加其性能,因为多个磁盘可同时操作。
很多人以为RAID1/0+1要加一倍额外的磁盘,形成浪费而不看好RAID1,事实上磁盘越来越便宜,并不见得造成负担,况且RAID0+1有最好的容错(faulttolerence)能力,其效率也是除RAID0之外最好的。
我们可视应用的不同,在同磁盘阵列中使用不同的RAIDlevel,如建联科技公司的Oaraid?
;系列都可在同一磁盘阵列中定义八个逻辑磁盘(logicdisk),分别使用不同的RAIDlevel,例如分为C:
,D:
及E:
三个逻辑磁盘(或LUN0,LUN1,LUN2)。
RAID0+1完全做到了容错包括不停机(non-stop),当某一磁盘发生故障,可将此磁盘拆下来而不影响其他磁盘的操作。
等新的磁盘换上去之后,系统即时做镜像,将数据重新复制上去,RAID0+1在容错及存取的性能上为所有RAIDlevel之冠。
在磁盘阵列的技术上,从RAID1到RAID5,不停机的意思表示在工作时如发生磁盘故障,系统能持续工作而不停顿,仍然可作磁盘的存取,正常地读写数据;而容错则表示即使磁盘故障,数据仍能保持完整,可让系统存取到正确的数据,而SCSI的磁盘阵列更可在工作中抽换磁盘,并可自动重建故障磁盘的数据。
磁盘阵列之所以能做到容错及不停机,是因为它有冗余的磁盘空间可以利用,这也就是Redundant的意义。
RAID2
RAID2是把数据分散为位元/位元组(bit/byte)或块(block),加入海明码HammingCode,在磁盘阵列中作间隔写入(interleaving)到每个磁盘中,而且地址都一样,也就是在各个磁盘中,其数据都在相同的磁道(clinderortrack)及扇区中。
RAID2又称为并行阵列(parallelarray)其设计是使用共轴同步(spindlesynchronize)的技术,存取数据时,整个磁盘阵列一起动作,在各个磁盘的相同位置作平行存取,所以有最好的存取时间,其总线是特别的设计,以大带宽(bandwide)并传输所存取数据,所以有最好的传输时间。
在大型档案的存取应用,RAID2有最好的性能,但如果档案太小,会将其性能拉下来,因为磁盘的存取是以扇区为单位,而RAID2的存取是所有磁盘平行动作,而且是作单位元或位元组的存取,故小于一个扇区的数据量会使其性能大打折扣。
RAID2是设计给需要连续且大量数据的电脑使用的,如大型电脑(mainframetosupercomputer),作影像处理或CAD/CAM的工作站等,并不适用于一般的多用户环境、网络服务器,小型机或PC。
RAID2的安全采用内存阵列(memoryarray)的技术,使用多个额外的磁盘作单位错误校正(single-bitcorrection)及双位错误检测(double-bitdetection);至于需要多少个额外的磁盘,则视其所采用的方法及结构而定,例如八个数据磁盘的阵列可能需要三个额外的磁盘,有三十二数据磁盘的高档阵列可能需要七个额外的磁盘。
RAID3
RAID3的数据储存及存取方式都和RAID2一样,查在安全方面以奇偶校验取代海明码做错误校正及检测,所以只需要一个额外的校检磁盘(paritydisk)。
奇偶校验值的计算是以各个磁盘的相对应位作XOR的逻辑运算,然后将结果写入奇偶校验磁盘,任何数据的修改都要做奇偶校验计算,如下图:
在上图中,磁盘0~4是数据盘,磁盘5是校验盘,校验盘的数据是由数据盘0~4的同一位置的数据作XOR的运算计算出来的。
我们可以看出其数据这种分段的方式是要配合共轴同步的并行操作,譬如每个磁盘的传输率为10MB/sec,则4个数据盘的并行传输速率是40MB,所以RAID3较诸单硬盘,其性能有很大的提升。
如某一磁盘故障,换上新的磁盘后,整个磁盘阵列(包括奇偶校验磁盘)需重新计算一次,将故障磁盘的数据恢复并写入新磁盘中;如奇偶校验磁盘故障,则重新计算奇偶校验值,以达容错的要求。
较之RAID1及RAID2,RAID3有较高的磁盘空间利用率,其性能比RAID2稍差,因为要做奇偶校验计算;共轴同步的平行存取在读档案时有很好的性能,但在写入时较慢,需要重新计算及修改奇偶校验磁盘的内容。
RAID3和RAID2有同样的应用方式,适用大档案及大量数据输入输出的应用,并不适用于PC及网络服务器。
RAID3因为采用共轴同步的并行操作,要把每个盘的数据同时送出,所以需有很大的总线频宽(bandwidth)以达到并行的目的,在硬件结构上的差异,RAID3和RAID5是不会出现在同一控制器上的,有很多厂商号称提供RAID0,1,3,5,其实3是假的,并无共轴同步并行操作能力,有厂商说明是Pseudo3(假的3)并不欺骗客户。
RAID4
RAID4也使用一个校验磁盘,但和RAID3不一样,RAID4的方式是RAID0加上一个校验磁盘,如下图:
磁盘0磁盘1磁盘2磁盘3磁盘4
A0A1A2A3P1
A4A5A6A7P2
……………
4N-34N-24N-14NPN
RAID4是以扇区作数据分段,各磁盘相同位置的分段形成一个校验磁盘分段(parityblock),放在校验磁盘。
这种方式可在不同的磁盘平行执行不同的读取命令,大幅提高磁盘阵列的读取性能;但写入数据时,因受限于校验磁盘,同一时间只能作一次,启动所有磁盘读取同一校验分段的所有数据分段,与要写入的数据做好校验计算再写入。
RAID4在读取数据时,有和RAID0同样好的性能,但校验盘则形成写入时的瓶颈,因为如果写入少于一个整体分段的话,需要一个RMWcycle(Read-Modify-Write),譬如写入一个数据分段,控制器首先把分段的数据和该分段的校验验值读出来,然后用校验值减去分段的旧数据,再加上新的数据,并计算出新的校验值,最后才把数据及校验值写入。
因为数据及校验值都要先读出来再写入,这就增加了磁盘的转动,读取时延(Latency)的时间。
但如果写入是一个整体分段(如A0)会有较好的性能,因为旧的数据不必读出来,控制器直接就利用要写入的数据计算新的校验值并直接写入所有的磁盘。
OAraid?
;磁盘阵列控制器是采用这种方式,所以OAraid?
;磁盘阵列的RAID4非常适于大型文件的应用。
RAID4如果校验磁盘故障,就变成RAID0,读取的性能没有影响,但写入的性能提升,因为不用计算校验值。
但如果其中一个数据盘故障,不管是对故障盘的读取或写入都必须把同一所有的分段读出来以恢复故障盘的数据,这使得RAID4性能降低。
RAID5
RAID5和RAID4相似,但避免了RAID4的瓶颈,方法是不用校验磁盘而将校验数据以循环的方式放在每一个磁盘中,如下图:
磁盘0磁盘1磁盘2磁盘3磁盘4
P1A0A1A2A3
A4P2A5A6A7
……………
4N-34N-24N-1PN4N
磁盘阵列的第一个磁盘分段是校验值,第二个磁盘至后一个磁盘再折回第一个磁盘的分段是数据,然后第二磁盘的分段是校验值,从第三个磁盘再折回第二个磁盘的分段是数据,以此类推,直到放完为止。
图中的第一个P1是由A0,A1,…,A3计算出来,第二个校验值分段,P2是A4,A5,…,A7计算出来,也就是校验值是由各磁盘同一位置的分段的数据所计算出来。
这种方式能大幅增加小档案的存取性能,不但可同时读取,甚至有可能同时执行多个写入的动作,如可写入数据至磁盘1而其校验值分段在磁盘2,同时写入数据到磁盘4而其校验值分段在磁盘1,这对联机交易处理(OPTP,On-LineTransactionProcessing)如银行系统、金融、股市等,或大型数据库的处理提供了最佳的解决方案(solution),因为这些应用的每一笔数据量小,磁盘输入输出频繁而且必须容错。
(接上)事实上,RAID5的性能并无如此理想,因为多数数据的修改,都要把同一校验值分段的所有数据读出来修改后,做完校验计算再写回去,也就是RMWcycle,所以RAID5和RAID4在写入上有相同的难题,但因RAID5校验值分散在各个盘的不同位置,相当程度地分散了负载,故有较好的性能,尤其是对小型数据。
正因为牵一发而动全身,所以:
R:
N(可同时读取所有磁盘)
W:
1(可同时写入磁盘数)
S:
N-1(利用率)
RAID5的控制比较复杂,尤其是利用硬件对磁盘阵列的控制,因为这种方式的应用比其他的RAIDlevel要掌握更多的事情,有更多的输入输出需求,既要速度快,又要处理数据,计算校验值,做错误校正等,所以价格较高;其应用最好是OLTP,至于用于大型文件,不见得有最佳的性能。
3.RAID的对比:
下面几个表是RAID的一些性质:
操作工作模式最少硬盘需求量可用容量
RAID0磁盘延伸和数据分布2T
RAID1数据分布和镜像2T/2
RAID2共轴同步,并行传输,ECC3视结构而定
RAID3共轴同步,并行传输,Parity3Tx(n-1)/n
RAID4数据分布,固定Parity3Tx(n-1)/n
RAID5数据分布,分布Parity3Tx(n-1)/n
RAID的性能与可用性:
RAIDlevel用户数据利用率频宽性能交易处理性能数据可用性
RAID010.2510.0005
RAID10.50.250.851
RAID20.6710.250.9999
RAID30.7510.250.9999
RAID40.750.250.610.9999
RAID50.750.250.610.9999
以上数据基于4个磁盘,传输块大小为1K,75%的读概率,数据可用性的计算基于同样的损坏概率。
4.RAID的概述:
RAID0
没有任何额外的磁盘或空间作安全准备,所以一般人不重视它,这是误解,其实它有最好的效率及空间利用率,对于追求效率的应用,非常理想,可同时用其他的RAIDlevel或其他的备份方式以补其不足,保护重要的数据。
RAID1
有最佳的安全性,100%不停机,即使有一个磁盘损坏也能照常作业而不影响其效能(对能并行存取的系统稍有影响),因为数据是作重复储存。
RAID1的并行读取几乎有RAID0的性能,因为可同时读取相互镜像的磁盘;写入也只比RAID0略逊,因为同时写入两个磁盘并没有增加多少工作。
虽然RAID1要增加一倍的磁盘做镜像,但作为采用磁盘阵列的进入点它是最便宜的一个方案,是新设磁盘阵列的用户之最佳选择。
RAID5
在不停机及容错的表现都很好,但如有磁盘故障,对性能的影响较大,大容量的快取内存有助于维持性能,但在OLTP的应用上,因为每一笔数据或记录都很小,对磁盘的存取频繁,故有一定程度的影响。
某一磁盘故障时,读取该磁盘的数据需把共用同一校验值分段的所有数据及校验值读出来,再把故障磁盘的数据计算出来;写入时,除了要重复读取的程序外,还要再做校验值的计算,然后再写入更新的数据及校验值;等换上新的磁盘,系统要计算整个磁盘阵列的数据以回复故障磁盘的数据,时间要很长,如系统的工作负载很重的话,有很多输入输出的需求在排队等候时,会把系统的性能拉下来。
但如使用硬件磁盘阵列的话,其性能就可以得到大幅度的改进,因为硬件磁盘阵列如OAraid?
;系列本身有内置的CPU与主机系统并行运作,所有存取磁盘的输入输出工作都在磁盘阵列本身完成,不花费主机的时间,配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 磁盘阵列 原理 相关 知识