面对市场景气未明等状况,软硬件厂商莫不绞尽脑汁的端出各种有可能获得企业青睐的产品技术;就连一向低调的存储厂商也不例外,如更大力的鼓吹可透过删除重复数据等方式落实节流。但企业有必要全盘买单吗?
近一年来,存储厂商除开始向企业用户倡导可透过数据去重复化(Data Deduplication)技术缩减其花在采购存储设备的费用等观念外,也开始透过研发或购并等方式强化其的数据去重复化技术产品线。
其中是以七月中上演的EMC和NetApp两强相争之战最受市场关注——虽然一开始是由NetApp胜出,但最后仍是由EMC以21亿美金顺利买下数据去重复化技术领导厂商Data Domain.该举意味即便市场不景气,存储厂商也不放弃任何可吸引企业青睐,以及扩张市场的机会。但比较耐人寻味的问题是数据去重复化技术真有其前景吗?再者,EMC稍早之前买下的重复数据删除软件公司——Avamar——又该怎么办呢?
讨论资料去重复划技术是否有其前景前,得先明了该技术的本质是一种藉由去除重复性数据来减少存储需求的手法。举例来说,在未导入重复数据删除技术前,如果有人发了一封内含1 MB附文件的电子邮件给公司内的100位同事,那企业后台系统必须因应该附件存储100份拷贝、耗费100MB的存储空间。若导入重复数据删除技术,那系统只会保留一份拷贝,其他的99份拷贝则会以指向实体拷贝位置的指针取代。
也就是说,原先企业得挪出100MB的存储空间方能执行上述动作,现在只要有1MB、或是比1MB稍多一点(含指标)的存储空间即可。这样的好处是显而易见的。
它除了减少了企业花费在存储重复数据的空间需求外,也不再需要为了(远程)数据复制与传送等动作而投入巨资打造高网络带宽。
以重复数据删除技术来说,由于数据类型、数据变动率与重复性数据的数量等数据内容,要以全备份、间备份或差异量备份的方式进行数据备份,以及企业打算将备份数据保留多少时间等因素皆会左右该技术功效,因此,企业若是抱持引进该技术即可无碍的将肥胖的数据彻底瘦身一番的预设心态,恐怕会陷入结果不如预期的窘境。
既然如此,企业到底该如何透过删除重复数据落实节流呢?除了先花一笔大钱导入重复数据删除技术外,笔者建议企业或许可以先透过一些“无料”的手法将庞杂的已存储数据瘦身一番,其后再考虑是否要进一步采购其他的存储软硬产品。