免费论文查重: 大雅 万方 维普 turnitin paperpass

探索图书馆数据存储中存在理由及解决策略

最后更新时间:2024-03-22 作者:用户投稿原创标记本站原创 点赞:6715 浏览:21684
论文导读:
图书馆和阅览室的数据存储系统和其他行业的存储有几点不同,主要是:一是庞大的数据。一座中等的图书馆每年可增长10TB的数据。二是存储的时间久。图书馆的数据存储时间相对较久远,可以达到几十年甚至上百年。三是数据存储种类多。现在图书馆、阅览室存储的类型有影像文件、文字文件、声音文件等多种形态。四是较高的安全性。作为一个大型的图书馆,为了满足各种需求,可以利用数据压缩、相同数据可删除和自动寻找等技术,对数据进行分类和快速高效的管理。

一、图书馆、阅览室数据存储容量不足的理由与解决策略

1.利用压缩技术提高空间利用率

书籍等图书资料,其文件内以及文件间都具有一定的相似性,因此,Delta压缩技术可以对于这些文件之间的数据进行相互比较,从而删除其中的冗余数据,让数据的内容实现最小化。文件间相似程度越高,其被压缩的内存就越小。虽然这种压缩技术最后要在这种文件上产生一定的引伸数据,但是从美国加州大学方面所获得的数据显示,最后文件总的数据量只占原先数据的1%~4%左右。

2.利用消重技术提高空间的利用率

图书馆的数据进行存储时,一般都会对数据进行备份,而数据在进行了多次备份之后,就会产生一定的重复,因此,对于重复的数据进行删除,可以在备份时有效节省数据存储的空间。而对于重复备份的数据,可以将其划分为时间数据消重以及空间数据消重两种。而电子书籍等产生的数据,可归纳为自然数据的范畴,其特征主要在于:数据的变化频率较低、数据备份较完整、保存周期较长以及数据内容可以感知等。因此,针对这种情况,可以采用时间数据消重的方式进行消重。其消重技术具体如下所示:
首先,将数据文件划分为一组数据块,再按照技术的相关要求,提前设定每个模块内存的大小,可以设定为4k、24k等,模块的内存越小,消重的效率就越高。最后再对于每组数据块进行指纹计算,再以指纹为关键词进行Hash查找,如能够查找到与之相配的数据,则断定其为重复数据,再将该数据块的索引号进行储存;如果没有找到相应的数据块,则表示其为唯一的数据模块。

这种计算方式为物理文件做了很好的标识,其与逻辑标识相对应,最后通过Hash函数计算出数据模块的指纹。当对于一个文件进行读取时,首先是对其逻辑标识进行读取,之后再按照数据模块的指纹,依次从存储系统中读取与之相应的物理数据图书馆数据存储中存在的理由及解决策略相关范文由写论文的好帮手www.7ctime.com提供,转载请保留.,最后将文件的副本进行一定的还原。Hash的计算过程如下图所示:

二、数据备份理由与解决策略

图书馆和读者的相关数据对借阅、身份确认以及相关资料储存而言是最为重要的依据,因此,要长期稳定且安全地进行保存,就提高了对储存系统的性能要求。图书出入信息系统的最主要特点就是持续不间断地运转,储存系统的可靠性较高,对于数据的恢复能力也较强。除此之外,图书馆以及阅览室等各部门的专业化信息系统也越来越多,服务器数量呈现出不断上升的趋势,为了有效防止系统与系统之间的干扰,除了提高对于容量、备份以及容灾等方面的要求外,还要求备份数据能够进行统一管理,数据的恢复能力与速度也要较强。
众所周知,图书馆的数据量是非常大的,一所五千人的学校中,图书馆的电子图书数据就具有15TB之多。因此,备份方案不可以简单运用,因为大量数据进行备份时,需要花费很多时间。最好的策略就是,运用备份的相关功能,让复制的数据在保证该程序能够正常运转的情况下,还能够让客户端正常使用。而重要的数据备份可以通过冗余配置的主机或者硬盘进行备份。运用这种技术,当某个磁盘或者阵列出现理由时,不会影响整个系统的正常运转。

三、存储空间利用率低的理由与解决策略

目前,大多数高校图书馆存储设备的使用容量几乎都不到整个容量的一半。图书馆在管理的过程中,由于技术较为落后的设备,会经常性地通过整理碎片的方式来增加存储的利用率以及改善数据查询功能等。这种方式对于容量较小的存储而言具有一定的可行性,但当面对较大的数据机制时,就要花费较多的时间了。
对于某项应用来说,传统空间的分配机制一般是采用供给的方式进行,能够有效保证应用具有较充分的增长空间。如果这样的话,肯定会使得大量的空间产生闲置,不仅浪费了空间,而且还使能源遭受了一定的损失。自动精简配置属于一种较先进的存储空间管理系统,它可以帮助用户在保证系统管理效率的同时,有效提高存储空间的使用效率。它主要依据数据的空间系统进行相关分配的,因此几乎不存在较多的多余空间。
对图书馆的相关数据进行有效存储以及管理是非常重要的,这同时也是图书馆电子化发展的重要标志之一。与此同时,较好的数据管理可以在一定程度上提高客户的满意度,最终达到节约成本的目标。所以,我们在对图书馆的所有数据进行集中储存、管理以及备份的同时,要充分运用目前的相关数据,有效提高图书馆在市场中的核心竞争力。 全文地址:www.7ctime.com/wxlxlw/lw3624.html上一论文:简述2013年中国图书馆年会未来图书馆模式