免费论文查重: 大雅 万方 维普 turnitin paperpass

关于算法云计算数据库查询算法在图书馆数字服务中运用

最后更新时间:2024-02-14 作者:用户投稿原创标记本站原创 点赞:25467 浏览:110454
论文导读:法对数字服务实际应用做出了探索和论证。关键词:云计算图书馆数字资源1007-9416(2013)05-0156-01知识信息海量性增长是人类社会文明发展的必然产物,随着信息传播技术的不断进步,人们对信息的需求具有更高的要求,且阅读需求呈现出“个性化”、“专业化”、“多领域”的特点,检索的准确率、成功度与海量数据的分
摘要:基于云计算的图书馆数字资源服务已成为现在图书馆发展的必然趋势,云服务在图书馆的应用尚属起步阶段,本文从多数据库查询调度及资源优劣判断算法对数字服务实际应用做出了探索和论证。
关键词:云计算 图书馆 数字资源
1007-9416(2013)05-0156-01
知识信息海量性增长是人类社会文明发展的必然产物,随着信息传播技术的不断进步,人们对信息的需求具有更高的要求,且阅读需求呈现出“个性化”、“专业化”、“多领域”的特点,检索的准确率、成功度与海量数据的分散式存储成为人们获取资源过程中一对突出的矛盾。随着国家对公益性图书馆关注投入不断加大,经多年发展,公益性图书馆馆藏数字资源已初具规模,但知识检索推送也同样成为图书馆数字文化服务发展过程中面临的瓶颈问题。
1 云计算在图书馆数字服务中应用的意义
随着分布式计算、并行运算及网格运算等高端技术的发展,大数据的存储、处理、挖掘等深度应用变为可能,分布式、跨平台数据检索得到了较好的实现。Sun、Amazon、IBM、Google、微软等信息业领军企业都已深入云计算研究和开发中,并不断有规模化、完整化的产品投入使用,这也为图书馆数字文化服务提供了更好的平台。
以云计算为资源整合利用手段,对图书馆馆际、互联网际的资源进行虚拟化,从而帮助读者完成知识的深度搜索与发现,使读者在更加广泛的知识域内得到资源最大化的服务。其中,基于云服务的数据库查询算法成为图书馆数字文化云服务的关键技术环节。
2 基于云计算的数据库查询算法

2.1 连续读取特性在读者查询中的应用

研究发现,连续读取特性在基于云计算的数据库系统查询调度中具有较好的应用效果,将数据库中待查询数据中具有某些连续关系的数据进行重组,使其具有连续读取特性,同时按照此连续性的调度计划,将数据连续存储在计算机中,此方式可以提高云数据的随机读取速率,节约查询的执行时间。图书馆读者应用中,对单一数据库内信息进行查询已很难满需求,跨数据检索已成为使用中常见的操作。如表1.其中,为读者查询信息,为数据库,为数据库记录,如读者查询信息向数据库的记录及数据库的、行记录提出查询申请。综合四项查询请求可以看出,每个请求都需要分别对数据库、进行一次信息查询操作,即一次请求需要进行2次查询,平均查询次数为2。
通过数据重组使查询操作具有连续读取特性,见表2.查询请求、在重组后经过1次查询操作即可完成,仍需2次操作,综合表2数据来看,数据重组后的查询请求平均需要1.25次查询操作即可完成。由此可见,连续读取特性的数据重组在某些条件下可较高的提升数据查询效率。
通过图书馆读者访问查询的海量行为记录进行分析,以数据挖掘技术为手段,将具有较高使用关联性的信息进行资源数据重组,甚至建立相应的数据中心,提高检索性能的基础上,方便读者查询使用。

2.2 基于云计算的数字资源节点优劣度评判

互联网为载体的馆际数据资源服务,由于网络、服务器、web服务、环境等问题存在诸多不可预料的非稳定性因素;同时,数据库提供信息资源的准确性、完整度也成为评价数字资源优劣的重要因素。云计算条件下的数字资源服务因数据的重复性、多样性存在多个最优解,所以择优进行查询服务可有效解决供不应求、供不适求的问题,提高资源使用效能。
整体看来,“云服务”中各个数据中心及子节点构成一个无向图G(V,E),其中V是“云服务”中Area所有服务节点的集合,E是承载各节点服务的网络集合。择优选择服务节点,即在E中寻求最优路径,e∈Area。数字资源节点优劣度评判可根据各影响因素对服务的影响度进行判别,包括如下因素:(1)网络服务带宽:a_band(e),路径e网络的平均带宽;(2)服务消耗时间:deal_cost(e),路径e中各服务节点查询处理消耗时间;(3)传递消耗时间:sum_delay(e),路径e网络数据传输延迟时间总和;(4)查询数据总量:quer_size,路径e中读者查询信息量大小;(5)节点服务故障率:serv_fun(e),路径e中服务节点服务平均故障率;(6)节点资源差错率:data_mist(e),路径e中服务节点提供数据的平均差错率。综上因素,约束性函数设计如下:
选取最优路径的过程就是寻找满足限制条件论文导读:ationasafileallocationschemeonmultipledisksystems.ProceedingsoftheInternatio摘自:毕业论文小结www.7ctime.comnalConferenceonFoundationsofDataOrganization,KyotoJapan1985:74-80.上一页12
(1)中最小rest(e)值的过程,其中Ba、Mi、De、Co、Av为五个个约束条件的权重;Se、Su、Tb、Dc和Da为临界限制条件,根据不同的使用条件和读者对服务的容忍度进行定义。
参考文献
CHANGC,SHENJ.Consecutiveretrievalorganiza tionasafileallocationschemeonmultipledisksys tems[C].ProceedingsoftheInternatio摘自:毕业论文小结www.7ctime.com
nalConferenceonFoundationsofDataOrganization,KyotoJapan 1985:74-80.