网络和网络储存技术的演变
近年来,与高速增长的数据存储的需求相适应信息存储技术也得到了高速的发展。主要的突破是存储系统的拓扑连接技术的发展和成熟。这是广大用户信息集中存储的客观需求在技术发展上的体现,现在流行的 SAN 、 NAS 和 CAS 这些网络存储技术的核心都是解决信息存储集中化的课题。
1 ) DAS 、 SAN 和 NAS 存储体系的界定
从下图可以看出,直连附属存储( DAS )可以看作一个三层的模型,而 NAS 和 SAN 可以看作四层模型。这多出来的一层是 I/O 路径上的网络层。 SAN 和 NAS 的不同之处是在于网络层相对于文件系统层的位置。在 SAN 中文件系统和应用在一起,而 NAS 中,文件系统处于远程和存储设备在一起。

图 DAS 、 NAS 和 SAN 的区别
网络存储(无论是 SAN 还是 NAS )相对于 DAS 的主要优点在于:它可以将所有服务器中的数据集中放置到那些能最可靠地访问、并能最有效地进行数据保护和管理的存储器中。实现业务处理和数据存储的分离。
2 ) SAN -存储局域网络
SAN 技术是传统的 DAS 技术的发展延续,是采用大量数据块访问方式的网络存储,它非常适合于格式化的数据库信息存储及管理的应用。 SAN 和 DAS 的主要区别在于 SAN 技术采用光纤通道 FC ,在主机和存储介质设备之间增加了专用的存储域交换机,构成了专门负责 I/O 传输的“后端”存储网络,实现了数据存储的网络化访问。
3 ) NAS -网络附属存储
NAS 是传统网络文件服务器技术的发展延续,是专业化的网络文件存储设备。 NAS 通过在 TCP/IP 之上的网络文件系统协议( NFS 和 CIFS ),为客户端提供数据存储和文件共享的服务。 NFS ( Network File System )是 UNIX 系统平台领域远程数据访问的事实标准; CIFS(Common Internet File System) 是 Windows 操作系统的标准。如下图所示。

4 ) iSCSI
iSCSI 协议定义了在 TCP/IP 网络发送、接收 SCSI - block (数据块)级的存储数据的规则和方法。 ISCSI 沿用在网络方面最通用、最成熟,且网络的基础建设非常完善的 TCP/IP 协议。
5 ) SAN+NAS+iSCSI 的集成解决方案
SAN/NAS/iSCSI 都是数据存储整合的技术手段,各有特点。 SAN 适用于数据库的应用,而 NAS 则在跨平台的文件级数据共享领域有着先天的优势, iSCSI 则可以看作 SAN 的应用在 IP 网络中的扩展。如果将三者有机结合在一起,就可以充分发挥各种网络存储的优势。满足更广泛的业务需求。

6 ) CAS — 新兴的内容寻址存储技术
CAS - Content Address Storage 即内容寻址存储技术。
数据类型即不是 SAN 中的数据块,也不是 NAS 的单纯文件,而是面向对象的固定数据,概念上类似于 Java 程序设计语言。根据应用的不同,这些对象型数据可以是电子邮件,医疗上的诊断数据(例如 X 光片、心电图、 CT 等检验数据),等等。
CAS 存储内容的寻址方式也很独特,对于已经存储的对象数据,提供特殊的数字指纹作为内容检索的索引。该指纹的算法可以确保全球的唯一性,因而可以满足查找保存数据的精确性。
7 ) SAN 、 NAS 、 iSCSI 和 CAS 技术的对比
|
SAN |
NAS |
iSCSI |
CAS |
协议 |
FC |
CIFS / NFS 文件协议 |
iSCSI 协议 |
Centera IP API |
保存的数据类型 |
数据块 |
文件 |
数据块 |
对象数据 |
存储内容 |
动态数据 |
动态数据 |
动态数据 |
静态、固定内容 |
地址类型 |
通用系统地址 |
内容数字密码 |
典型的应用 |
数据库类应用: OLTP 、 ERP |
文件共享:软件开发、电子邮件 |
小型的数据库 |
固定内容存储 |
数据和数据安全的需求
随着信息化的深入,存储的爆炸性增长使存储管理面临着巨大的挑战。现代政府、组织和企业的运作对存储的信息数据的依赖性也越来越高。任何的数据丢失或不可用,都会带来巨大的经济损失。
所以,在实现业务数据集中存储后,如何确保数据的可靠性以致业务的连续性,是当前政府、组织和企业中各级 IT 部门和信息中心所面临的挑战。因此,近几年来与网络存储技术相适应,数据本地备份和异地容灾技术也得到了长足的发展。
1 ) 带备份技术的发展
磁带库向近线存储 发展
磁带容量越来越大,磁带机备份和恢复的速度越来越快。再加上高速的自动磁带库的出现,使磁带这种已往总是被当作离线存储介质,逐步应用于近线存储的领域。磁带库中的关键设备是机械手,机械手的快慢(磁带的交换速度)是衡量磁带库性能的一个重要指标。
备份技术的演变
传统网络备份系统的局限性
如图所示,经典的网络备份系统包括备份服务器和直连的磁带机(或自动装载机、带库)、备份软件 ( 包括备份管理软件和客户端代理 ) 和网络。

图 网络备份
所有的备份数据都要经过生产网络传递到备份服务器中,再由备份服务器备份到磁带介质上。由于备份的数据流会造成网络的拥塞并使生产服务器的效率降低,因此必须小心选择备份的时间(备份窗口)和备份策略(全备份、增量备份或差分备份)。
随着数据量的不断增长,由于备份速度受到网络带宽的限制,用户往往不能够在规定的备份窗口内完成备份任务。而对于一些要求 7 × 24 服务和数据可用性的关键业务,又根本找不到适合的备份窗口。
所以在大数据量和高性能要求的情况下,传统的网络备份系统已经难以胜任数据备份的工作了。
SAN 网络备份的优势
如果将服务器和自动磁带库都接入 SAN 的网络,那么数据的备份可以经过“后端” SAN 的网络直接进行,因而不会造成生产网络的拥堵。

图 SAN 环境的 LANFree 的备份
Server-free 无服务器备份
SAN 网络的运行是十分灵活的,访问实际存储设备的单元,并不一定必须为服务器。它可以是任意的类型的 SAN 的组件,包括 Switch 、 Hub 等等。
因此,一个基于 SAN 的网络备份应用程序,向服务器提出请求,查询它位于 SAN 中的文件或数据库的数据信息。然后初始化一个数据移动的操作,让 SAN 网络环境中拥有所需智能和硬件的设备,将备份软件检索到的数据由存储设备直接拷贝到 SAN 网络中的备份设备中。
整个过程没有生产服务器的干预,实现了 ServerFree 的备份。(也成为第三方拷贝)。如下图所示。

图 SAN 环境的 ServerFree 的备份
2 )数据异地容灾 / 灾备技术的发展
数据在本地进行了有效保护后,为了应对极端的自然灾害,确保数据的绝对安全。数据的异地复制、容灾保护技术也得到了快速发展。尤其是在美国 911 恐怖袭击以后,数据的远程复制和容灾技术在全世界都得到了快速的发展和广泛的部署,是存储技术的一个新的热点。
数据异地容灾的级别
数据异地容灾的技术取决于业务系统对数据恢复时间点( RPO )和数据恢复时间( RTO )的具体需求。
按照业务系统对数据容灾的需求,将数据异地容灾解决方案分为三个等级:
入门级-可管理的磁带备份
高级-数据的远程复制
企业级-实时的应用切换
可管理的磁带备份
在业务对数据恢复的点和恢复时间要求不高时(一般几天或一周的恢复时间可以满足要求时),可以采用简单的自动管理的磁带备份、异地保存方式来完成数据的异地保护功能,
数据的远程复制
当业务对数据恢复要求较高时,可以采用同步或异步的数据远程复制技术。如果业务系统允许稍许(几秒~几个 I/O )的数据丢失,可以选用异步的数据复制技术;而如果业务系统不允许任何的数据丢失,则只能采用同步的数据复制技术。

但同步数据复制造成的延时对业务系统的性能影响较大,因而是主站点和备份站点的距离不能很远,通常不能够超过 30 公里。
而异步数据复制方式的则不会对业务系统造成延时,数据写入本地后,数据写操作即刻完成,数据复制的工作以后再逐步完成。所以,异步的数据复制会有数据的损失。如下图所示。

实时的应用切换
如果业务系统的连续性指标是至关重要的,在任何条件下都不能中断业务或业务恢复时间限制在秒级的范围内,那么只能采用最高级的数据容灾方式-应用系统的远程实时切换。

构建数据中心网络存储系统的一般步骤和策略
1) 进行详细的业务应用系统的数据调查和分析
业务系统数据调查的目标是:详细分类、统计各业务应用系统的数据类型和数据量,动态收集、分析数据 I/O (以及其他相关性能参数)的活动特性和规律;为了设计、优化和顺利实施数据存储系统提供反映各业务应用系统数据特性的第一手资料。形成整体性的对存储系统容量、支持的接入技术和配置软件的具体要求;并确定每一种应用系统最适合的存储应用方式。
通过业务系统数据调查,还可以为各业务系统建立起数据存储和系统性能的“基线”和一整套检测和分析方法,便于今后对各业务系统进行性能变化和数据增长的监控和趋势分析。为数据存储和业务处理系统能够按照业务发展的趋势进行预先的扩展提供事实依据。
2) 建设高速的 SAN 的网络
基础架构的选择,是网络存储系统构建的关键环节。应根据用户业务数据调查的结构和应用的特点,选定最适合的存储技术。最后在相应的存储技术领域中选择最好的产品。
一般情况下,在综合业务系统环境的数据中心。高速、实时性的数据库应用是不可或缺的。因此,根据前面对数据存储技术发展的描述,构建一个高速、强壮的 SAN 的网络,往往是数据中心存储系统构建的首要环节。

3) 结合多种存储技术以适应不同业务应用的需求
在构建 SAN 的网络环境后。依据数据调查的结论,针对不同的业务应用特点,根据实际需要分别引入 NAS 网关、 iSCSI 网关或 CAS 系统,以适应文件共享、小型数据库和固定内容等不同类型的应用。

实现所有系统数据的集中存储,将数据和业务处理分离,简化数据的管理,易于数据的备份和保护。
4) 数据的本地保护
数据集中存储后,应首先在本地采取 RAID 、快照、克隆和备份等一切可能的技术手段来保证数据的安全。其中,磁带备份仍然是基础的、非常可靠和经济的数据保护和恢复的有效手段。
如下图所示,将磁带库直接连入 SAN 的网络,可以实现高效率的 Lan_free 和 Server_free 的备份策略。提高数据备份和恢复的速度,降低备份操作对服务器和以太网络的影响,克服备份窗口的限制。

5) 数据的异地容灾
在实现数据的集中存储和本地保护后,对于更高的数据安全性的需求,可以进一步采用相应的数据异地容灾 / 灾备解决方案来满足。而容灾 / 灾备方案所采用的数据保护技术,需要根据业务应用对数据恢复目标( RPO )和恢复时间( RTO )的要求来确定。
在现阶段,基于磁盘阵列的同步 / 异步数据复制技术已经很成熟,可以满足绝大多数业务环境对数据容灾 / 灾备的需求,所以实际的部署也非常广泛。其中,异步复制技术由于对业务应用没有性能的影响,不受传输距离的限制,但有丢失数据的危险;而同步复制技术虽然不会丢失数据,但传输距离又受到严格,限制通常不超过 30Km 。
所以,最终的容灾系统往往综合两种数据复制方法,采用 3 点的数据复制和接力方式,以达到最高的数据可靠性和业务连续性指标。如下图所示。

首先,采用同步复制技术建立生产中心的同步容灾中心(同城异地),保证业务数据的安全和业务应用的连续性。
其次,通过异步复制技术建立远程容灾中心,异步复制同步容灾中心的生产数据。在极端的自然灾害等情况下,也能够实现对数据的有效保护,减少数据的损失。
|