1 引言
近年来,不少国家、省部级重点中专学校升格为高职院校,由于原来图书馆中的存储设备、技术良莠不齐,升格后,大多数院校数字图书馆的建设还处于重新规划或设计阶段。计算机多媒体技术、宽带通信技术,以及存储技术的高速发展,开辟了校园信息化发展的新前景,也开辟了数字资源建设的新前景。该学院作为一个行业性较强的高职学院,互联网基础好。为了建立具有学院特色的数字资源体系,必须加快学院图书馆的数字化进程。
2 高职院校数字图书馆现状及建设要求
高职院校数字图书馆是高职教育的信息服务机构,也是学院发展的"三大支柱"之一,有其自身独特的服务群体和知识层次。由于高职院校的发展刚刚起步,基本建设和教学仪器设备投入的资金都相当多,资金不足是各院校的通病,图书馆的经费怎样花,花到什么地方是关键。因此,要合理分配资金,从图书馆的实际出发,把资金重点投放到骨干专业、新增专业及现代化建设上,为图书馆可持续发展奠定良好的物质基础。设备和技术必须以满足数字图书馆的功能、特点需求为准则,重点强调"实用--满足功能需求;好用--满足可管理性;够用--满足可扩展性"三大原则并予以落实。同时,数字图书馆还应遵循平衡先进技术与简易应用原则、适度先进性与高性价比原则、产品功能与实际需求相匹配原则、可靠性与安全性并重等原则。
高职院校数字图书馆要具备的基本条件是:首先,要具备高性能高带宽的内部局域网;其次,要引入或购置先进的、可扩展的网络硬件设备,以实现或分步实现数字图书馆的扩展需求;第三,必须使用具有高速存取性能的海量存储技术以支持不断增长的超文本、图形图像等超媒体、视频音频等流媒体数字信息的存储需要;第四,具有较高的系统安全性,能确保系统不易被非法入侵或破坏。
3 SAN概述
存储区域网Storage Area Network(简称SAN),是由存储设备和系统部件构成的网络。它是关联着存储设备和服务器的网络,并与以太网有类似的架构。以太网由服务器、以太网卡、以太网集线器/交换机及工作站组成;SAN由服务器、HBA卡、集线器/交换机和存储装置组成。
SAN虽然性能优越,可扩展性好,但自1997年以来SAN采用了光纤传输方式,价格昂贵,大多数用户难以承受。在2003年,出现了基于普通IP协议和以太网的网络存储方式,即基于互联网小型计算机系统接口(Internet SCSI,简称iSCSI)协议的存储结构。iSCSI由IBM研究中心开发,是一个供硬件设备使用并可在IP协议上层运行的SCSI指令集。iSCSI技术采用通用的Internet协议(IP),将存储设备、服务器连入网络,可实现在IP网络上运行SCSI小型计算机系统接口协议,使其在诸如高速千兆以太网上进行路由选择,从而取代速度快但价格昂贵、实现复杂的光纤通道技术。
4 FC-SAN与IP-SAN简介
FC-SAN与IP-SAN性能比较如表1所示。
4.1 FC-SAN技术
FC-SAN应用光纤技术的SAN网络,传输介质为光纤网,性能高且使用广泛。光纤通道(Fibre Channel,简称FC),主要用于构建高传输速度的存储网络。光纤通道的相关技术标准是由国际信息技术标准委员会(INCITS)的T11技术委员会制定的。在架构上FC-SAN通常以光纤作为传输媒介,具备传输速度快,可靠性高,传输距离远等特点。目前,光纤通道的传输速度已经达到4 Gb/s,而传输速度为8 Gb/s的FC-SAN相关产品也已问世。
4.2 IP-SAN技术
IP-SAN是应用iSCSI技术的SAN网络,传输介质为IP网。IP-SAN是基于TCP/IP数据传输技术构建的存储区域网络,可将SCSI指令通过TCP通信协议传送到远方,以达到控制远程存储设备的目的。由于传送的封包内含有传输目标的IP位置,因此,IP-SAN是一种效率较高的点对点传输方式。
5数字图书馆存储选型
开放的、标准化的光纤通道技术使得FC-SAN使用非常灵活,FC-SAN不但克服了传统上与SCSI相连的线缆限制,而且极大拓展了服务器和存储之间的距离,从而增加了更多连接的可能性。改进后的扩展性能还简化了服务器的部署和升级,保护了原有硬件设备的投资。但是,FC-SAN也存在很多不足之处。首先是传输距离短,FC-SAN的传输距离通常不超过50 km。因此,FC-SAN不能有效地整合更多的主机与存储需求。虽然光纤通道技术有统一的标准,但各家厂商均有不同的解释。时至今日,互操作性仍是FC-SAN实施过程中存在的主要问题。随着IT技术的发展.所有IT产品价格也在下降,但基于FC-SAN的存储设备价格仍居高不下。该学院如果考虑使用FC-SAN,就不得不购置HBA、光纤交换机、光纤磁盘阵列、管理软件等,成本高。
iSCSI是一种在Internet协议网络上,特别是以太网上进行数据块传输的标准。它由多家存储厂商发起,并得到IP存储技术拥护者的大力支持。iSCSI是一个供硬件设备使用并可在IP协议上运行的SCSI指令集。简单地说,iSCSI是在IP网络上运行的SCSI协议。
用FC搭建的FC-SAN与用iSCSI搭建的IP-SAN实际区别是在于:在IP-SAN中,千兆以太网交换机代替了价格昂贵且只有FC-SAN专用的光纤交换机;客户端的Initiator或iSCSI卡代替了价格较高的主机HBA卡;具有iSCSI接口的高性价比的存储设备代替了光纤磁盘阵列。
FC-SAN具有良好的扩展性,而IP-SAN的扩展性更出色。在IP-SAN中,可以使用SCSI、FC、SATA、SAS等多种磁盘阵列来扩展IP-SAN容量。如遇较大数据块传输,对于千兆以太网的IP技术与基于4 Gb/s光纤的FC-SAN还有一定差距。但是,从发展趋势看,万兆以太网的实现与发展,使得IP-SAN的性能已得到较大提升,当前已有厂商推出万兆网络存储产品。
在安全性方面,iSCSI的安全规范包括Initiator和目标验证,以防未经授权的访问,同时只允许可信赖的节点访问。作为补充,IPSec可以提供安全保证,以防止侦听。光纤通道是工作在第二层的协议,原本并没有建立相应的安全机制以及安全通用协议,仅根据逻辑上的数据通道而定。
由于IP技术的普及和发展,利用iSCSI技术搭建的IP-SAN可以随着网络延伸至全球任意一个角落,从根本上解决了信息孤岛的问题。还可通过IP-SAN来连接各个FC-SAN孤岛。采用标准化数据传输通道、标准接口及虚拟存储管理技术,IP-SAN存储网络几乎可与所有种类的磁盘阵列兼容。产品的互操作性也将迎刃而解。
在数字图书馆的数据进行集中存储、管理和备份的过程中,必须依据不同数据的不同要求,充分发挥利用现有网络、资源的优势,合理构建数据存储方案,合理配置备份策略,实现数据的集中存储、分析和共享,以满足广大师生的访问需要。因此数字化图书馆构建的关键在于海量数据的网络存储和管理。目前,该数字图书馆存储选型是首要问题。
采用IP-SAN架构,是因为FC-SAN方案具有另一个缺点。当数据量达到存储系统理论值的50%之后,其性能下降非常快。原因在于后端磁盘通道是采用2条或4条光纤仲裁环来串接所有磁盘。磁盘是分享带宽的,而IP-SAN方案采用的是全交换架构,每块磁盘独享带宽,性能表现更高。这就如同网络中的Hub和交换机,FC-SAN方案中后端磁盘是如同采用Hub的方式连接起来的,磁盘共享总线带宽,当磁盘达到一定数量后,其性能下降非常快;而IP-SAN方案类似采用交换机的方案,磁盘独享带宽,因此性能更好。
6 结语
鉴于以上分析,该学院的数字图书馆建设原则是:
(1)开放性。立足长远发展,注重系统的可扩展性,以适应不断增长的数据存储要求;
(2)共享性。该学院的三个校区其数据资源实现一处购置,多处使用,满足共享,存储设备保障在多操作系统下最大限度地实现数据共享,而不是独占数据方式去分配设备;
(3)可管理性。具备方便的操作界面和灵活的管理模式,系统可以支持多种操作系统和多种数据库以及冗余路径的管理,具有灵活的数据迁移策略,具有方便的支持在线备份和灾难恢复功能。
存储选型要点:
(1)搭建一套新的IP-SAN存储架构且兼容现有的基于NAS存储架构,实现IP-SAN与NAS结合的综合存储架构;
(2)将各类资源服务器、数据服务器以及基于WEB应用的服务器,整体迁入IP-SAN存储阵列中;
(3)数据的备份、安全性等采用全冗余架构,为用户提供透明容错的数据访问机制;
(4)集中统一管理,使用高档的KVM,以增加空间的利用率,并提供高效便捷的维护手段。