免费论文查重: 大雅 万方 维普 turnitin paperpass

论图书馆智能推荐系统数据挖掘技术

最后更新时间:2024-01-16 作者:用户投稿原创标记本站原创 点赞:13746 浏览:57805
论文导读:
摘 要:随着社会的发展和科技的进步,应用在图书馆领域的先进技术也与日俱增,图书馆能够为用户提供的服务越来越受到业内人士的关注。通过研究笔者发现,传统的数字图书馆一般无法给顾客提供个性化的准确图书推荐服务,因此本文中笔者提出了一种图书馆智能推荐系统,通过数据挖掘技术来实现智能推荐功能,分析数据挖掘技术中关联的适用理由和规则,并介绍设计框架和结构,最后得出结论,以期能够为业内的研究和应用者提供参考和借鉴。
关键词:图书馆;智能推荐系统;数据挖掘技术
中图分类号:TP31

1.13;TP18

随着社会的信息化飞速发展,图书馆在逐渐建设的过程中也吸纳了越来越多的数据,这些数据呈现复杂化和海量化的趋势,由此造成了一般用户在手工检索的过程中需要很大工作量的结果,用户在这样的检索中不仅很难准确找到所需的结果,而且图书馆也很难在这一过程中发挥更多的作用提供更好的服务。下文绍的智能推荐系统能够很大程度上缓解这一理由,对存储的海量数据进行挖掘和整理,通过用户的特征和偏好来预测用户行为,同事根据读者数据中的潜在模式和关系信息改善图书馆智能推荐系统。
1 智能推荐的核心技术
在智能推荐的技术领域,由数据挖掘技术产生的技术有如下三种:首先是关联规则推荐,其次是基于用户聚类的协同过滤推荐,最后是基于内容聚类的协同过滤推荐

1.1 三种推荐技术简介

(1)关联规则推荐。通过关联规则来进行推荐的过程是一个搜寻频繁相关的项集的过程,这一过程中通过对客户经常访问和搜索情况的记录和分析处理,找到客户的直观意向,探寻使用者的倾向,从而推荐出使用者在选择了某一选项之后最有可能选择的其他选项。
(2)基于用户聚类的协同过滤推荐。通过用户聚类来协同过滤推荐的策略一般是根据已有的最近邻技术,从用户的兴趣信息得到用户之间的远近程度,用户远近从兴趣度的相似程度来判别,最后根据最近邻用户找到目标用户,预测目标用户的兴趣来进行推荐。
(3)基于内容聚类的协同过滤推荐。根据内容聚类进行的协同过滤是通过对项目的实际内容进行分析,更多更好的利用计算机对内容的分析和特征提取来实现兴趣度的计算,不需要访问用户评价信息。

1.2 选择关联规则推荐技术的理由

根据以上信息可以看出,上述三种推荐技术的适用范围各不相同,通过内容协同过滤的策略在用户推荐之后再将推荐结果转给其他用户,能够实现良好的使用反馈,但是由于策略限制容易出现稀疏理由;通过用户类聚实现协同推荐的策略能够处理较复杂的非结构化对象,但是依旧存在冷启动和稀疏的理由。由此分析可以采取关联规则进行自动推荐,理由如下:首先,采用关联规则进行自动推荐不存在冷启动中的新用户出现理由,通过大量的对借阅记录的离线生成来寻找关联规则,这样既可在用户上线之后给用户提供推荐;其次,可以解决图书名称重复的理由,通过词库和语义的定义可以一定程度上改善产品名同一性的理由;最后,通过关联规则还可以进行离线抽取,能够良好的解决图书借阅在线费时的理由。
2 关联规则的概念及算法

2.1 关联规则的相关概念

关联规则的挖掘时挖掘数据集中项集之间有“联系”的关联,是数据挖掘领域的重要环节。设I={i1,i2,…,im}是项的集合,D是数据库事务的集合,每个事务T是不同项的集合,使得T包含于I。规则A,B在事务集D中成立,具有支持度s和置信度c,同时满足最小支持度阈值和最小置信度阈值的规则,就可以认为是知识输出的强关联规则。

2.2 关联规则的相关步骤

挖掘关联规则是一种非常重要的策略,Agrawal等曾在多年以前提出过一个Apriori算法,该策略首先会生成频繁项集,这也是决定挖掘效率的关键一步,之后通过对相应数据库的扫描,设置适当的支持度,计算数据库内容,找到频繁项集,为关联规则的提取提供基础,之后如果数据库中找到了频繁项集,则通过他们产生强关联规则,满足最小置信度和最小支持度。
3 图书智能推荐系统框架设计
为了进一步提高系统效率,且在设计关联规则算法时又需要对整个数据库进行扫描,所以需要在Offline部分处理规则生成。现拟将图书智能推荐系统的框架分为两个部分,分别是Online部分和Offline部分。这一流程可以从下图得到。如图1所示:
图1 图书智能推荐系统框架

3.1 Offline部分

这一部分是通过关联规则的挖掘和数据的准备来完成的。关联规则的挖掘是由频繁项集的扫描和关联规则生成这两部分组成,而数据准备则是将图书馆的web服务器实时用户文件和借阅历史进行扫描并生成相应文件。
首先进行的是数据准备工作,这一工作过程中会对数据进行必要的预先处理,规则挖掘的正确度和效率也受这一结果的影响。另外由于图书的历史数据和实时数据都存在大量冗余,也需要对数据进行必要的去噪和整理。之后进行的是关联规则的挖掘,这里会利用关联模式来发现用户浏览模式,通过对模式的分析得到读者的借阅规则,存储之后为后面的online部分服务。

3.2 Online部分

Online部分运用Offline部分生成关联规则的集合,并且在同一时间内记录和检测用户的浏览过程,动态地为用户推荐相应的链接或者书目操作等服务。图书馆智能推荐系统数据挖掘技术论文资料由论文网www.7ctime.com提供,转载请保留地址.由读者推荐和图书馆服务器组成,服务器记录用户的操作数据,读者推荐服务通过匹配读者行为数据和Offline部分产生的有趣规则,给用户进行图书推荐服务。
4 结束语
随着数字图书馆朝着越来越智能化的方向发展,图书馆需要提供给读者更加有针对性的图书自动推荐服务。通过本文的研究能够得到,可以将关联规则作为图书智能推荐系统的核心技术,提高图书馆的服务水平和质量,为图书馆管理提供数据支持。在今后的研究中还需要进一步对数据挖掘和关联规则进行深入研究,以期能够更好的改善图书馆的服务质量和效率。
参考文献:
[1]高凤荣,马文峰,王珊.数字图书馆个性化信息推荐系统研究[J].情报理论与实践,2003(04).
[2]姚罡,麦永浩论文导读:
,党选举.数据挖掘在电子商务推荐系统中的应用设计[J].计算机与现代化,2002(12).
[3]钱卫宁,魏藜,王焱,钱海蕾,周傲英.一个面向大规模数据库的数据挖掘系统[J].软件学报,2002(08).
作者简介:成果(1983-),男,辽宁营口市人,图书馆管理员,助理馆员,硕士,研究方向:图书馆信息化。
作者单位:大连理工大学,辽宁大连 116000