| 
 咨询电话:010-51727811/12/13
当前位置: 首页 > 新闻中心 > 业内新闻 >
解析数据存储的根本(二)
时间:2012-07-23 09:20  来源:飞客数据恢复   作者:飞客数据恢复工程师
数据存储的容灾
容灾分为数据容灾和应用容灾。数据容灾可以保证数据不丢失,但不能保证服务不中断;应用容灾则更上一层楼,它在异地建立一套与本地数据系统相当的冗余系统,当灾难出现后,远程系统可以迅速承接本地应用系统的业务,保证服务不中断。在实际应用中,数据容灾依靠备份技术实现;应用容灾则必须依靠远程镜像技术和集群技术。在这里我们主要讨论的是数据容灾,也就是数据备份。
数据备份就是将数据复制到独立于工作磁盘的存储介质上面,从而保证数据的安全。从备份方式上面说有离线备份和在线备份,从备份等级上面说有完全备份和增量备份,从备份途径上说有LAN-Free和无服务器备份;从存储介质上面区分有磁盘和磁带。
离线备份可以说是备份的初级方式,但是由于目前企业环境不允许长时间停机甚至不允许停机,留给备份的时间越来越短,因此在一些关键系统中都是采用的在线备份的方式。快照技术将时间引入了数据存储,用户在使用当前数据的同时,也可以看到以前某个时间点的数据,并能通过它很方便地实现在线备份。
完全备份顾名思义很好理解,就是把整个数据无论新旧完全备份一次。而增量备份只是备份上一次修改以后的数据。增量备份包含有差别备份和累计备份:差别备份是从上次备份后修改过的文件的拷贝;累积备份是指自上一个完全备份后被修改的全部文件拷贝。如果企业数据量很庞大,完成完全备份的时间会很长,因此企业常常将两种备份方式结合使用。
目前数据备份主要方式有:LAN备份、LANFree备份和SANServer-Free备份三种。LAN备份针对所有存储类型都可以使用,LANFree备份和SANServer-Free备份只能针对SAN架构的存储。
基于LAN备份传统备份需要在每台主机上安装磁带机备份本机系统,采用LAN备份策略,在数据量不是很大时候,可采用集中备份。一台中央备份服务器将会安装在LAN中,然后将应用服务器和工作站配置为备份服务器的客户端。中央备份服务器接受运行在客户机上的备份代理程序的请求,将数据通过LAN传递到它所管理的、与其连接的本地磁带机资源上。这一方式提供了一种集中的、易于管理的备份方案,并通过在网络中共享磁带机资源提高了效率。
LAN-Free备份由于数据通过LAN传播,当需要备份的数据量较大,备份时间窗口紧张时,网络容易发生堵塞。在SAN环境下,可采用存储网络的LAN-Free备份,需要备份的服务器通过SAN连接到磁带机上,在LAN-Free备份客户端软件的触发下,读取需要备份的数据,通过SAN备份到共享的磁带机。这种独立网络不仅可以使LAN流量得以转移,而且它的运转所需的CPU资源低于LAN方式,这是因为光纤通道连接不需要经过服务器的TCP/IP栈,而且某些层的错误检查可以由光纤通道内部的硬件完成。
SANServer-Free备份LANFree备份对需要占用备份主机的CPU资源,如果备份过程能够在SAN内部完成,而大量数据流无需流过服务器,则可以极大降低备份操作对生产系统的影响。SANServer-Free备份就是这样的技术。
备份的物理设备有磁盘和磁带两种。磁盘备份速度快,恢复速度也快,但是备份容量没有磁带大且单位价格高;而磁带备份容量大、单位容量便宜,但是备份和恢复的时间消耗较长,企业可以灵活根据自己的数据量和预算情况灵活选择备份设备。不过随着SATA磁盘的出现情况有所变化,SATA磁盘的单位价格已经大大降低,磁盘有取代磁带的趋势,厂家推出的产品有VTL(VirtualTapeLib虚拟磁带库),设备备份和恢复速度很快,其价格又接近于传统的磁带库。
目前有些厂家推出了将磁盘和磁带结合的产品,利用高速磁盘作为缓冲器,先将备份数据写入磁盘,然后再写入磁带,这个就是D2D2T(DISKTODISKTOTAPE)。
 
存储系统的发展趋势
现代数据存储系统已经发展成为一套复杂的、集成程度很高的专用系统,然而随着这样存储系统的发展,复杂的系统结构带来了很多诸如管理复杂、价格昂贵、各存储厂家不好整合的种种问题。目前存储系统厂商也看到了存储系统存在的这些问题,并着手去解决这些问题。我们下面就一一的介绍存储系统的这些主要新趋势。
 
1.数据存储的结构化趋势(虚拟化存储、异构、INfiniband)
 
数据存储的结构随着存储系统的发展越来越复杂,现代的数据存储系统包含了网络设备、存储管理设备、存储设备等多种设备,然而由于没有类似网络的标准分层,各家厂商产品以及解决方案之间的兼容的情况不是很好。例如当一家企业购买了某种磁盘阵列产品之后,随着企业的发展需要更加完备的存储方案,然后该企业IT经理却沮丧的发现,新购买的NAS存储或SAN存储很难和原来的磁盘阵列整合在一起,企业不得不放弃以前的磁盘阵列产品,造成IT投资的浪费。
实际上数据存储的结构化也顺带解决了存储设备的异构问题,由于存储设备的不断发展。各种存储方案、存储产品、存储网络设备、存储接口的互操作性是个难题,有时候甚至是一个“不可能的任务”。存储系统如果能够提出一个类似网络分层的统一标准,这些问题将将得到解决。
现在厂商已经推出了一些部分解决问题的方案和概念,比如虚拟化存储和Infiniband。前者能够解决存储设备的异构问题,使得用户不必关心底层各种各样的存储设备,只需要虚拟化存储系统在后台解决系统的异构问题;Infiniband用来解决SAN的某些问题,是一种I/O总线技术。它将存储系统划分为Infiniband交换机、计算节点、I/O节点、存储节点,结构化的存储分层思想十分明显。不过由于只是在SAN之内解决问题,对存储系统的结构化没什么帮助。
 
2.虚拟化存储
由于目前存储系统已经日益的复杂和庞大,管理的难度已经大大增加。为了简化存储设备的安装和配置,有效的利用不同厂家、不同型号的存储设备形成一个统一的存储设备,则必须采用虚拟化存储技术。
虚拟存储是介于物理存储设备和用户之间的一个中间层,它屏蔽了具体物理存储设备的物理特性,呈现给用户的是逻辑设备。它所带来的最大好处是提供了一种简单有效的管理手段:在已经建立好的存储池上,用户可以方便地划分虚拟存储空间,当需要增加新的物理存储设备时,用户无需停止服务来对整个存储系统进行重新配置,只需要对存储系统进行简单的配置更改,就可以使新的存储设备加入到存储系统中。
虚拟化存储技术其实在很多厂家的产品中已经得到应用。比如NAS产品将磁盘阵列的细节隐蔽起来而只向客户端提供一个网络硬盘设备就是一种虚拟存储的应用,只不过我们这里所说的虚拟存储的概念对于后端传输网络、物理存储设备的异构特点包容更好。
在典型的网络存储设备的结构中,包含了前端主机、后端存储设备以及连接前后端的网络。在这样的结构中我们可以在任意一层中实现虚拟存储,因此虚拟存储包括如下三种:基于服务器的虚拟存储、基于存储设备的虚拟存储以及基于网络的虚拟存储。
 
基于服务器的虚拟存储虚拟化层以软件模块的形式嵌入到应用服务器的操作系统中。基于服务器的虚拟存储有以下特点:
首先基于服务器的虚拟存储的应用环境主要针对是服务器数量较少且以服务器为中心的环境。
其次是基于服务器的虚拟存储由于虚拟软件运行在服务器上,其虚拟软件必然占用服务器的CPU、内存等资源来实现各种功能,给服务器带来额外开销。由于和服务器操作系统紧密相关,在存储系统的异构上面不可能做的很好。
再次就是由于不需要额外再添加任何硬件,也不影响现有的存储系统的架构,因此基于服务器的虚拟存储是最容易实现而且成本最低的。
基于存储设备的虚拟化是将虚拟化层放在存储设备的适配器或控制器上。基于存储设备的虚拟存储有如下特点:
首先基于存储设备的虚拟存储的应用环境主要针对异构存储设备,适用于以存储设备为中心的环境。
其次由于国际上没有统一标准,各家厂家对于存储设备的虚拟化基本上处于各自都有自己一套方法的状态,因此各厂家的产品很难在同一环境下整合,削弱了系统的灵活性。
再次由于在存储设备上实现的虚拟化,对用户和管理人员是透明的,使用管理起来比较方便。