本文作者Howard Marks是Networks Are Our Lives公司的首席科学家。这家公司总部位于新泽西州霍博肯,从事顾问工作。1987年以来,他一直专注于存储网络系统的分析和写作。
随着我在不断地想归档的问题,以及在网站博客上写了很多帖子,我认为,我应当把这些内容汇总起来,针对一整套数据的不同存储技术的总体拥有成本做一个计算。但是,随着我的构思不断深入,我也逐渐地意识到,即使是计算出来一个大约的存储数据的总体拥有成本(TCO),也不会在最终的期限内完成。取而代之的是,我最终决定放弃这个想法,做一个整体的成本计算,而精确的计算就放在以后来完成。
首先,让我们以带有保持力加强模型的NAS为例,就像带有SnapLock的NetApp filer.如果一个存储管理员计划使用这种类型的解决方案,那么他就必须考虑一些比较明显的因素,比如第二个NAS放在什么位置、复制软件、每平方英尺300美元的数据中心空间,以及5-7年后,当它们的NAS厂商宣布它们的NAS产品已经超过它的服务期限时,每年收15%的维护费和高额电费 .
现在,他们必须要将所有的数据迁移到一个新的存储系统上,或者如果他们从事的是像Pharma或者华尔街这样的产业,政府的规章制度就会需要他们的数据以一种不可修改、不可删除的方式来维护,而且,他们需要支付一笔相当昂贵的费用来迁移数据并且将各种类型的文档(在迁移过程中没有被修改)提交。现在,我作为一名顾问比较喜欢这种专业的服务,但是你可以把钱花在更有意义的事情上面。
因此,你就可以看到NAS的模型长达2-3代,而新的系统超过20年。而好消息就是,每一次新系统的成本都是它所取代的老一代的一半,并且具有更好的可维护性。
RAIN系统——就像日立的HCAP、Permabit或者NEC的Hydrastor可以让你为不可避免的硬件更换减少不必要的痛苦。从现在起算5年,当你的厂商停止对你当前的节点进行支持时(使用1TB硬盘),那么,你就可以添加新的节点,使得你的集群或者网格中达到8或者16TB的硬盘,并且告知系统,你想移除旧的设备。一天之后,你的系统就可以把所有的数据移到新的节点上,并且给你发送一个消息,告诉你,旧的节点已经可以被淘汰了。
压缩、数据防重复以及硬盘转速的下降都可以减少所占空间以及电能消耗,但是却不能够完全地消除它们。另外,你仍然需要在不同位置的两个集群,来做到切实地保护你的数据这一点。
在架系统的存储使用磁带、蓝光磁盘或者ProStor的RDX技术,它们是唯一的可移除的硬盘系统,并且有真正的工程在它之后,这样就可以极大地减少存储成本,因为在架存储并不消耗电能或者发热。除此之外,介质厂商并没有计算出来,如何让我们来维护架上磁带。
当你说明仅仅有大约35%的数据中心位置被实际用于机架空间时,一个高密度的数据放重复存储系统会存储大约每平方英尺75TB的数据。Aisles、UPSen以及PDUs以及其它类似的磁带会占据其它位置。因此空间上仅仅占了1/4,也要依赖于其存储密度。
那些基于归档系统的磁盘厂商已经对此做过一些评论,我对此要对他们表示感谢,计算磁盘系统(比如归档磁带)的总体拥有成本就像那些对待来自于ReCall或者Iron Mt.的备份磁带,它们把磁带的拷贝带到仓库。这个过程相当地耗费人力,并且使得访问归档数据非常困难。因此,当用户等待这些磁带从仓库拿过的过程,他们开始计算快送成本、很多的操作成本以及丢失的生产力成本。
当我谈论这种可移除的介质归档时,我就在想具体的不同模型,这些模型将数据写到主位置的两片介质中,并且复制这份数据到第二个系统,然后再复制到第三个系统。而仓库或者salt mine是第四个拷贝,并且,如果你有足够地想象力,你就可以从中心假脱机到磁带上。
在主位置上,最主要的归档数据仍然在磁盘上,带有MAID以及数据防重复功能,而在自动的库里面带有至少一个拷贝,作为第二层,可以保证归档的高密度性,同时使得这些数据放在离中心不远的地方。归档软件以及B&L的Vertices可以追踪所有的介质并且可以减少介质被放错位置的问题。
在架介质可以获得的数据密度超过每平方英尺200TB,也就是每平方英尺办公室的价格为35美元,这和每平方英尺数据中心的空间300美元的价格形成了对比。现在,你将需要一个操作者来链接介质,并且每天取2-3次数据,这并不需要一个全职的人来做,因为它所需要的成本比起那些从仓库里拿回箱子所需要的成本要低很多。
用于计算的最简单模型就是云归档。从你的云厂商获得每GB/mo的固定比率,然后付额外的钱来将让它们帮你把数据放在多个数据中心上,毕竟如果你自己要做的话就需要全部完成这些内容。然后,你需要支付一个网络连接的费用。很明显,这个保持期限可以增加到超过20年,而令人头疼的因素也会少很多。不久,我将给出详细的内容,也就是在完成全部的计算以后。