免费论文查重: 大雅 万方 维普 turnitin paperpass

研究推送基于数据挖掘技术读者信息推送系统结构设计怎么

最后更新时间:2024-02-20 作者:用户投稿原创标记本站原创 点赞:7312 浏览:20773
论文导读:者,推送特定的信息”为最终目标。信息推送的过程中,涉及到的信息很多。系统的设计过程中不可能做到面面俱到,因此,本系统的设计目标主要完成以下特定目标:1)获取读者信息,提供读者服务。根据读者的条码号,找出读者的类型和使用习惯。利用数据挖掘的技术手段向读者提供特定的有效信息。当读者用自己的号登陆书目查
摘要 本文基于关联规则算法的数据挖掘技术,对图书馆读者信息推送系统的结构进行了设计。系统目标为针对图书馆中日常产生的相关数据进行数据挖掘,为图书馆信息推送提供参考和决策支持,为系统的详细设计做好准备。
关键词 数据挖掘;关联规则;信息推送;系统设计
A文章编号 1674-6708(2012)79-0210-02
图书馆日常的读者借阅活动中,读者的借阅行为在图书馆信息管理系统中积累了大量的数据。但是,这些事务性的数据并没有发挥其应有的价值。这些数据的功能现阶段只是停留在简单的读者借阅历史查询上,没有经过加工、整理及应用。除此之外,读者在使用图书检索系统的过程中,有着大量的检索行为,这些检索行为也产生了大量的数据。如何利用这些海量的数据为读者提供更优质的服务就成了我们研究的重点之一。
本文的研究重点是基于图书馆日常的读者服务数据,通过使用数据挖掘的手段,分析读者的信息使用情况,最后提出一个可以为读者个性化信息推送提供参考的具体方案,借以有效提高高校图书馆的读者服务质量,提高图书馆的读者服务水平。鉴于系统整体比较庞大,因此本文只是讨论系统的总体结构设计,以为将来系统的详细设计做好准备。
1 系统目标
在图书馆提供信息服务的过程中,涉及的读者类型丰富,涉及的馆藏资源庞杂。系统的设计目标是为图书馆为读者提供个性化的信息推送服务提供辅助支撑。因此,系统的设计主要以“向特定的读者,推送特定的信息”为最终目标。
信息推送的过程中,涉及到的信息很多。系统的设计过程中不可能做到面面俱到,因此,本系统的设计目标主要完成以下特定目标:
1)获取读者信息,提供读者服务。根据读者的条码号,找出读者的类型和使用习惯。利用数据挖掘的技术手段向读者提供特定的有效信息。当读者用自己的号登陆书目查询系统、数据库检索系统时,可以判定读者身份,根据读者身份及读者信息使用习惯向读者推送相关信息资源,包括图书资源、期刊资源、电子数据库资源等;
2)分析入藏资源,制定推送计划。对于新入藏的信息资源,根据信息资源的特点,向特定的读者群提供信息推送服务。比如,当图书馆新到一批图书时,将新书书目中的部分图书推送给特定的读者群;
3)收集检索历史,优化资源配置。根据用户的书目检索历史记录,用户的数字资源检索记录等读者利用图书馆信息资源的情况,结合本馆的信息资源配置情况,调整图书馆的资源配置,如藏书配置、资源购置分配。专业信息建设计划等,扩大图书馆信息服务的满意度。
根据前文所述系统目标,系统的核心是利用相关馆藏数据及读者使用文献情况数据来服务读者信息推送工作。根据系统的输入和输出,将系统划分成数据接口模块、数据预处理模块、数据挖掘模块、用户接口模块共四个模块,每一层模块为上一层模块提供数据支持。
2 主要功能模块
在图书馆的实际应用中,伴随着图书馆的文献资源建设和图书馆的读者信息服务,会产生相当多的数据。但是,这些数据种类繁多。从数据的分布上,数据分布在不同服务器,不同平台,不同的数据库中;从数据的存储结构看,数据类型,数据库中相关数据的分布也不尽相同。因此,系统首先通过数据连接模块将这些数据进行整合,然后通过数据预处理手段,将数据规范化,解决异构问题,将数据统一到信息推送数据库中。最后,通过数据挖掘的手段,使用关联规则算法,得到相关的关联规则。用户接口模块利用这些规则,完成系统的既定目标。各模块的功能具体如下:
1)数据接口模块
作为最底层的模块,数据连接模块的功能,是对上层的预处理模块屏蔽底层数据库的连接细节,使得上层模块在进行数据库读写操作时,可以使用统一的接口和语法。目的是将上层模块从繁琐的数据连接中解脱出来,从而可以把精力放在具体的事务处理上,简化了数据预处理模块的结构,同时提高了系统的可维护性和扩展性,扩充新的数据源类型时,只要修改源于:如何写论文www.7ctime.com
数据连接模块就可以了。
数据接口模块,向下,通过.net框架中的类,使用OleDbConnection,SQL connection等连接Oracle、SQL Server等数据库,向上,为数据预处理模块提供统一的接口。
2)数据预处理模块
高质量的决策必然依赖于高质量的数据。数据预处理模块的功能是,在实施数据挖掘以前,利用数据连接层提供的数据,及时检测数据异常,尽早调整数据并规约待分析数据。为下面的数据挖掘工作提供干净、准确、简洁的数据。数据预处理模块通过对数据的清洗、集成、变换、简化操作后,将处理完成的数据导入读者信息推送服务数据库中,为数据挖掘工作做好准备。其基本流程如下:
(1)数据预处理模块首先利用数据连接模块从相关的数据库中抽取读者信息服务可以使用的数据表。因为各个数据库中的数据表有很多,但是可以为读者信息推送服务的数据表的数量是有限的,因此,数据预处理的第一步,就是将这些数据表从各个数据库中抽取出来,准备处理;
(2)从各个数据库中抽取出的工作表是各种结构杂乱的源数据。对于这些结构杂乱的源数据首先进行清洗,数据清洗的目的是除去源数据中的噪声数据和无关数据,处理遗漏数据和清洗脏数据,去除空白数据域的知识背景上的噪声,考虑时间顺序和数据变化等。主要包括处理噪声数据、处理空值、纠正不一致数据、更正明显的输入错误数据等;
(3)经过清洗的各种数据仍然是各个不同数据环境中的异构数据。数据预处理的工作接下来是对这些数据的合并处理,将多个数据源中的数据结合起来存放在一个一致的数据存储中。同时,在数据集成的过程中除去冗余数据;
(4)用于数据挖掘的各种数据在经过数据集成之后,需要将数据变换或统一成适合挖掘的形式。经过系统集成后的数据虽然在构造上是统一的,但是如果需要为数据挖掘提供数据支持,很多数据是不合适的。比如高度离散化的数据,必须通过重新分类离散的方式,将离散度降低。为后面的数据挖掘做好准备;(5)经过变换的数据基本可以满足数据挖掘的需求,但是在使用这些数据进行数据挖掘之前,还需要对这些数据进行简化。数据简化的过程论文导读:的情况给出馆藏的建设意见,为馆藏资源建设的决策提供支持。系统首先根据用户设定的时间段,对该时间段的读者使用图书馆资源的情况进行统计分析,然后利用数据挖掘的结果,即相关的关联规则,得到馆藏应有的资源配置分布。再跟馆藏资源的实际情况进行对比,得到最终的建设意见的结果。3结论本文进行了系统结构的设计
是在对发现任务和数据本身内容理解的基础上,寻找依赖于发现目标的表达数据的有用特征,以缩减数据规模,从而在尽可能保持原貌的前提下最大限度的精简数据量。
3)数据挖掘模块
数据挖掘模块的功能是利用经过预处理的数据,使用关联规则的Apriori算法,找出数据中关联规则。
数据挖掘使用的数据源是经过处理的数据,即信息推送数据库。根据给定的最小支持度和最小置信度给出相关的关联规则。为用户接口模块中的信息推送提供参考标准。
数据挖掘模块的过程主要是:
(1)扫描信息推送数据库,得到1-候选项目集C1;
(2)根据项目集的支持度的阙值,得到1-频繁项目集L1;
(3)根据L1得到2-候选项目集C2;
(4)根据2-候选项目集C2和最小支持度得到2-频繁项目集;
(5)重复第

三、第四步,直到候选项目集为空集;

(6)根据得到的频繁项目集,得到大于最小置信度的规则集合;
(7)对挖掘的结果进行评价和展望。
4)用户接口模块
用户接口模块主要功能是根据用户的输入及用户需求,参照数据挖掘的结构以及相关的数据环境,为用户输出目标数据。
根据系统的设计目标,用户接口模块主要包括三个部分:
(1)根据读者信息,输出文献信息推送单
当系统接收到读者信息时,首先从相关数据库中检测读者信息。然后根据读者信息,根据关联规则,找出满足系统设定置信度的关联规则。最后,根据关联规则从相关文献数据库中向读者推送文献。
(2)根据文献信息,输出推送读者列表
当系统接收到文献信息时,从文献信息数据库中查询文献的特征信息,然后根据系统设定的置信度和相应的关联规则,查询满足关联规则的读者信息列表,最终提交欲推送的读者列表。
(3)根据限定时间的读者文献使用情况,输出馆藏建设意见单
馆藏资源建设在图书馆建设中占有重要的地位。图书馆为了更好的满足读者需求,更好的契合读者的信息需求就必须及时的调整自己的馆藏资源建设。但是,在传统的馆藏资源建设过程中,绝大多数时候忽略了读者的重要性[27]。图书馆人更多的时候是根据自身主观的行为和特征去完善馆藏。因此,本模块的目的就是根据数据挖掘的结果和馆藏文献信息资源的情况给出馆藏的建设意见,为馆藏资源建设的决策提供支持。
系统首先根据用户设定的时间段,对该时间段的读者使用图书馆资源的情况进行统计分析,然后利用数据挖掘的结果,即相关的关联规则,得到馆藏应有的资源配置分布。再跟馆藏资源的实际情况进行对比,得到最终的建设意见的结果。
3 结论
本文进行了系统结构的设计。首先根据分析了系统的设计目标,然后根据系统的设计目标对系统的总体结构进行了设计。系统的总体结构划分成数据接口模块、数据预处理模块、数据挖掘模块和用户接口模块4个模块。最后,对系统的各个模块的工作原理和工作流程进行了设计,为下一步系统各个模块的详细设计做好了基础保证工作。
参考文献
Fayyad,U.,From Data摘自:毕业论文格式字体www.7ctime.com
Mining to Knowledge Discovery: An overview,In advances in Knowledge Discovery and Data Mining,p471-493.
戴稳胜,张阿兰,谢邦昌.数据挖掘的方法、流程及应用[J].中国统计,2004(07):53-54.
[3]周群.论数字图书馆数据挖掘系统模型研究[J].情报杂志,2006(11):97-99.
[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros, Personalization of Supermarket Product Recommendations,Data Mining and Knowledge Discovery,vol.5 11-32,JAN-APR 2001.