免费论文查重: 大雅 万方 维普 turnitin paperpass

关于批量数字图书馆索引批量查重系统设计思想

最后更新时间:2024-01-14 作者:用户投稿原创标记本站原创 点赞:9644 浏览:35233
论文导读:
摘 要:数字图书馆索引批量查重系统是在数字图书馆查重工作难以进行的状况下产生,它的设计思想是根据部分关键性字段数据内容著录不规范的现状进行考虑的,最终提出了将不规范的关键性字段数据内容进行分割并设置索引的设计方式。本文具体分析了数字图书馆资源查重工作的现状和数字图书馆现有的信息服务系统,在此基础来探讨了基于索引批量查重系统的设计思想的主要内容和设计方式。
关键词:数字图书馆索引批量查重系统 设计思想
随着时代的发展,数字图书馆在社会建设和发展中的作用日渐突出,数字图书馆的全面建设要求各个单位特别重视资源的查重和比对工作,数字图书馆项目在新增资源的要求下,根据实践工作中出现的具体问题,提出了基于索引批量查重系统的设计思想。

一、数字图书馆资源的查重工作的现状

数字图书馆资源的查重相较于传统文献的查重方法并无太大的差别,但数字图书馆在运用计算机自动查重比对的过程中,时常面临着文献资源关键字段的著录不规范致使查重工作无法开展的难题。数字图书馆内的数字资源主要来自于公司直接销售产品的过程,但很多公司在著录上没有按照统一的、标准的文献著录规范方式进行著录工作,再者部分公司的录入人员对文献著录的录入规定和相关要求不太熟悉,在录入工作中,著录的数据内容混杂,更加重了数字图书馆资源的查重对比困难。
在不规范的录入和混乱数据的影响下,资源查重工作很难适应批量查重的需要,针对这种现状,数字图书馆提出了索引批量查重系统的设计思想,对不规范的数据进行了适当的改造,强调了必要字段索引的重要性。

二、数字图书馆现有的信息服务系统

目前数字图书馆在资源查重方面已经建立起了诸多的服务系统,为全面认识数字图书馆索引批量查重系统的优势,我们需要先了解其他服务信息服务系统的运作方式。

(一)门户服务系统

在数字资源不断丰富和发展的状态下,信息门户成为时行的概念,信息门户技术在数字图书馆的应用也相对普遍起来,最后形成了数字图书馆门户。数字图书馆门户主要是读者用来进行内容存取的信息网,它充分利用Web技术和互联网信息资源的应用系统,为顾客提供了智能化、个性化的资源查重服务系统平台。在这个平台上,用户可以根据自己的需要,更加自由便捷地获取图书馆门户中的数字资源。

(二)数字参考服务系统

在数字图书馆建立的数字参考服务也是在网络的基础上建立起来的,将用户、专家、学科知识巧妙联系起来的问答式服务。它通过电子手段进行参考服务,并运用不同步和同步两种不同的软件方式进行实时的电子参考服务。用户有什么疑问都可以在网络上提出来,专家再摘自:毕业论文格式模板www.7ctime.com
根据这些问题提供在线服务,进行一种人机协调的问答式服务。这是一种灵活的、个性化的信息服务方式,它参考了多种信息资源,在整个数字化空间实现资源共享和集成的服务,有助于数字图书馆的信息服务更快地发展下去。

(三)个性化信息服务系统

数字图书馆的个性化信息服务系统是基于用户的信息需求,巧妙利用现代化的信息技术和数字化信息资源向用户提供的能满足用户个性化需求的信息和服务。它主要包括服务内容的个性化和服务方式的个性化。在目前的发展过程中,个性化信息服务囊括了个性化信息服务、个性化信息服务、垂直门户服务、个性化知识挖掘服务和我的图书馆等服务项目,并紧密结合这些服务方式,为用户创建起基于数字图书馆的所有个性化资源与服务集合,以满足用户对专业资源的信息需求。

三、索引批量查重系统设计思想的主要内容

索引批量查重系统设计思想是一个抽象的概念,要了解它的主要内容,我们可以通过图书的具体查阅方式来了解。
在数字图书馆的资源图书中,图书的题名字段时常混杂着卷册号、版本号、副题名、卷册名、丛书名等多种内容,这些内容在没有完全统一的规定下,内容之间的各种分隔符号使用混乱,顺序的使用上也没有严格的要求。索引批量查重系统设计思想在图书的排名顺序上有着两种明确的方式方法。首先是ISBN+正题名的设计方式,其次是正题名+责任者+出版者+出版年的排序方法。
在实际著录中正题名和责任者之间的安排顺序是最常出现问题的字段。正题名字段的各种信息产生混杂时,两种信息之间一般都会使用符号进行分隔,在数字图书馆的书目信息数据库里便可以新增简洁明了的题名索引表,将含有分隔符号的各个部分通过程序的引导进行分割,形成题名的关键索引字段,并记录相应的文献内容,在查重对比工作进行前实施预处理工作。
在查重工作进行时,便可以直接利用索引进行查询,而不是传统的利用源书目数据库这种复杂的查询方式,索引查重结束后还可以利用记录号,还原书目信息,以便于人工浏览和确认的过程能够顺利进行。比如说ISBN图书在查重时就可以使用ISBN+正题名的方式完成比对,非ISBN图书就采用题名+责任者+出版者+出版年的方法进行查重比对。在完成索引后的数据记录工作后,还可以对数据进行必要的过滤和规范工作,完善数据的记录和查重前的预处理手段。

四、索引批量查重系统设计的方式

(一)索引表设计

源书目信息可分为本单位已有资源信息表和数字资源公司提供的销售书目数据库也就是拟采购的资源表两个不同的表格,在设计过程中需要详细注明ISBN、题名、责任者、出版者、出版年这些著录关键信息,并在索引表内根据记录号字段分为题名索引表和责任者索引表两种表格。在题名索引表中落实好记录号、题名、ISBN字段三种信息;在责任者索引表中完善记录号、责任者、出版者、出版年等相关元素。

(二)查重系统设计

索引批量查重系统主要分为三个模块,也就是索引建立和预处理模块、批量查重比对模块和查重结果信息还原及输出模块。在这些模块中,需要建立起适合的数据库和临时表格,用于存放查重的结果,并详细划分题名索引和责任索引,使系统能够更好地运行。
结束语:
数字图书馆索引批量查重系统的设计思想是一种先进的图书查重思想,它通过题名索引和责任索引的引导和题名字段的设置,规范了查重过程的数据指导,建立起了标准的必要的字段索引思想,并在索引批量查重系论文导读:
统的设计中巧妙运用起来,为查重工作建立起了预处理方案,从而方便了用户对于数字图书馆的专业化查重工作。
参考文献:
毕志蓉.数字图书馆基于索引批量查重系统的设计思想[J].现代情报,2008,28(3):110,113.
高隽娴.数学图书馆信息服务体系研究[J].兰台世界,2009,(12):79-80.
[3] 郑建明,钱鹏.国内数字图书馆建设模式研究——以国家数字图书馆与中国高等教育数字图书馆为例[J].大学图书馆学报,2011,29(1):41-46.