免费论文查重: 大雅 万方 维普 turnitin paperpass

浅析带查询推荐我国新闻检索系统计与实现设计与实现

最后更新时间:2024-02-14 作者:用户投稿原创标记本站原创 点赞:10369 浏览:36744
论文导读:
带查询推荐的我国新闻检索系统的计与实现设计与实现论文相关文献前1条苏祺;项锟;孙斌-基于链接聚类的Shark-Search算法[J];山东大学学报(理学版);【共引文献】 中国期刊全文数据库前4条陈军;陈竹敏-基于网页分块的Shark-Search算法[J];山东大学学报(理学版);、袁津生;郭艳芬-林业主题爬虫的算法研究与设计[J];计算机工程与设计;、黄名选-基于相关性-兴趣度架构的关联规则挖掘的查询扩展[J];图书情报工作;、吴羽萍;杨仁广-网络多媒体主题搜索算法比较研究[J];图书情报工作; 中国博士学位论文全文数据库前1条 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;刊全文数据库彭建波;对我国法律法规检索系统建设的深思[J];大学图书馆学报;、黄碧玉-多国文字情报微机检索系统[J];微型机与应用;1987年05期、朱鸣学;赵侠-《红楼梦》电脑检索系统在联邦德国[J];深圳大学学报;1988年Z1期、佚名-论档案文献基本检索系统及其相互关系——档案、图书、情报学互鉴研究之二[J];档案管理;1988年06期、唐焕文,姜冶,郭建,苏秀荣,高桂清;油田历史统计资料查询检索系统[J];大连理工大学学报;1989年05期、冯新宁,周中一,方宁德,王让定,冯百明;电子琴输入微机记谱与检索系统[J];兰州大学学报;1992年S1期、周山-一个综合实用的情报处理和检索系统[J];交通与计算机;1992年04期、汪红秋-单汉字检索系统查全率查准率的保障[J];情报学刊;1993年06期、朱猛;医学图书微机编目与检索系统[J];计算机系统应用;1994年03期、杜元洪,黄正东,茹家钜;《广后医学》文献微机检索系统[J];解放军医学情报;1994年04期 杨光复-论年鉴的检索系统和信息开发[A];创新与发展——云南省年鉴论文选(续集)[C];、许洁萍;袁斌;刘怡-音乐检索系统中用户哼唱旋律错误的研究[A];第二届和谐人机环境联合学术会议(HHME、张刚;孙健;丁国栋;米嘉;王斌-海量数据的索引与检索系统[A];全国网络与信息安全技术研讨会’、顾寄南;陈晓燕-检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会学术年会论文集(下册)[C];、徐英进;王愈;蔡锐;蔡莲红-一种基于“乐纹”的海量音乐检索系统[A];第二届和谐人机环境联合学术会议(HHME、刘超彪;宋鸿陟;司国东;傅熠-应用于移动学习的树木检索系统[A];第八届和谐人机环境联合学术会议(HHME、王宁;范志新;胡运发-虚拟图书馆检索系统的设计与实现[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年、高鹏;梁家恩;王晓瑞;徐波-一个面向海量视音频应用的快速关键音检索系统[A];第三届全国信息检索与内容安全学术会议论文集[C];、穆飞;李维佳;薛巍;舒继武-一种分布式信息检索系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];、张浩;黄厚宽-基于OAI协议的统一检索系统研究与实现[A];首届中国CAE工程分析技术年会暨
论文目录
摘要5-6
Abstract6-10
第一章绪论10-17

1.1研究背景和作用10-11

1.2国内外研究目前状况11-15

1.2.1URL去重的研究目前状况11

1.2.2网页去噪的研究目前状况11-12

1.2.3网页去重的研究目前状况12-13

1.2.4查询纠错的研究目前状况13

1.2.5查询推荐的研究目前状况13-15

1.3研究工作和内容15-16

1.4论文组织结构16-17

第二章相关理论知识17-24

2.1普通爬虫的抓取策略17

2.2URL去重17-19

2.3网页去噪19-20

2.4网页去重20

2.5查询词纠错20-22

2.5.1最小编辑距离20-21

2.5.2贝叶斯纠错21

2.5.3NGram纠错21-22

2.6查询推荐中的词语相似度计算22-23

2.6.1戴斯系数22

2.6.2互信息22-23

2.7本章小结23-24

第三章系统总体设计与架构24-29

3.1系统的需求分析24

3.2系统的总体设计24-26

3.3系统的主要构成26-28

3.1网页采集模块26-27

3.2网页预处理模块27

3.3查询词检索模块27-28

3.4本章小结28-29

第四章系统的具体设计与实现29-56

4.1网页采集模块29-35

4.

1.1网页抓取模块30-31

4.

1.2URL规范化模块31-32

4.

1.3URL去重模块32-33

4.

1.4网页去噪模块33-35

4.2网页预处理模块35-40
4.

2.1英文分词和短语抽取模块35-37

4.

2.2网页去重模块37-40

4.

2.3网页主题分类模块40

4.

2.4网页存储模块40

4.3查询词检索模块40-54
4.

3.1查询词补全模块42

4.

3.2查询词拼写纠错模块42-44

4.

3.3查询词推荐模块44-51

4.

3.4查询词索引文件模块51-54

4.4本章小结54-56
第五章系统的测试与分析56-66

5.1测试和开发环境56

5.2测试与分析56-64

5.

2.1网页采集模块测试56-58

5.

2.2网页预处理模块测试58-59

5.

2.3查询词检索模块测试59-64

5.3系统效果图64-65

5.4本章小结65-66

总结和展望66-67
参考文献67-71
攻读硕士学位期间取得的研究成果71-72
致谢72-73
附件73
查询推荐网页采集检索系统
参考文献
前1条 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;刊全文数据库彭建波;对我国法律法规检索系统建设的深思[J];大学图书馆学报;、黄碧玉-多国文字情报微机检索系统[J];微型机与应用;1987年05期、朱鸣学;赵侠-《红楼梦》电脑检索系统在联邦德国[J];深圳大学学报;1988年Z1期、佚名-论档案文献基本检索系统及其相互关系——档案、图书、情报学论文导读:计和实现;浙江大学;、张钰虹;面向辅助写作的英汉例句检索系统的设计与实现;东北大学 ;、李亮;基于主体的智能学习资源检索系统的研究;同济大学;、张宝华;结合社区结构的博客检索系统设计与实现;哈尔滨工业大学;上一页12
互鉴研究之二[J];档案管理;1988年06期、唐焕文,姜冶,郭建,苏秀荣,高桂清;油田历史统计资料查询检索系统[J];大连理工大学学报;1989年05期、冯新宁,周中一,方宁德,王让定,冯百明;电子琴输入微机记谱与检索系统[J];兰州大学学报;1992年S1期、周山-一个综合实用的情报处理和检索系统[J];交通与计算机;1992年04期、汪红秋-单汉字检索系统查全率查准率的保障[J];情报学刊;1993年06期、朱猛;医学图书微机编目与检索系统[J];计算机系统应用;1994年03期、杜元洪,黄正东,茹家钜;《广后医学》文献微机检索系统[J];解放军医学情报;1994年04期 杨光复-论年鉴的检索系统和信息开发[A];创新与发展——云南省年鉴论文选(续集)[C];刊怎样进入国际权威领域[N];中华读书报;、记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;、柯文;找音乐?会哼几句就行[N];人民日报;、本报记者 侯闯;让企业不再“眼花”[N];计算机世界;、;让法治细胞在网络上繁衍[N];人民法院报;、清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;实验与实用系统[N];计算机世界;、枫丹;企业搜索引擎 安全性能大盘点[N];中国计算机报; 中国博士学位论文全文数据库前3条 王君泽;基于大规模问答语料的理由检索系统[D];华中科技大学;、张毅波;中文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);、王镪;基于内容的海量音乐检索技术研究[D];北京邮电大学; 中国硕士学位论文全文数据库朱虎明;数字图书馆中统一检索系统的研究与开发[D];西安电子科技大学;、宋荣;采用人工评价策略对在线商店检索系统进行评价[D];复旦大学;、庄芳;高校BBS检索系统的设计与实现[D];复旦大学;、陈颖博;数字图书馆检索系统的研究及开发[D];华东师范大学;、李聪;基于哼唱的音乐检索系统[D];清华大学;、冯红君;化合物结构检索系统的设计及在维吾尔药资源库上的实现[D];新疆大学;、任杰;实时在线相似检索系统的设计和实现[D];浙江大学;、张钰虹;面向辅助写作的英汉例句检索系统的设计与实现[D];东北大学 ;、李亮;基于主体的智能学习资源检索系统的研究[D];同济大学;、张宝华;结合社区结构的博客检索系统设计与实现[D];哈尔滨工业大学;