免费论文查重: 大雅 万方 维普 turnitin paperpass

基于Heritrix网络学术获取研究-

最后更新时间:2024-03-15 作者:用户投稿原创标记本站原创 点赞:6071 浏览:21655
论文导读:、技术报告全文、专利全文等,由于内容全面、检索便捷、易获取、更新摘自:7彩论文网毕业论文下载www.7ctime.com快受到越来越多的关注。
[摘要]通过分析研究网络学术文献的主要来源、常用文件格式及Heritnx的工作原理,制定基于Heritrix的网络学术文献获取方案,从种子站点选择或抓取任务配置、文件类型和大小过滤以及学术文献判定等方面对整体方案进行具体设计和分析,并搭建实验平台,编写相关程序进行实验以验证该方案的可行性,最后指出后续研究方向。
[关键词]Heritrix学术文献文件格式PDF文档抓取
[分类号]G250 TP391
1 引言
学术文献是体现学术研究发展趋势和动态,能为教学科研和学习提供重要参考的学术成果。学术文献的类型包括:学术期刊论文、学位论文、会议论文、研究报告、工具书、专著等。图书馆利用自有的采购经费购买各类学术文献数据库,以满单位读者的需求。图书馆自有的馆藏资源外,网络学术文献资源颇为丰富,可作为图书馆馆藏资源的重要补充,教学科研者和学生可利用互联网获取具有参考价值的学术文献。随着网络的普及和发展,互联网作为网络学术文献的载体在学术界中的地位日益显著,提供的学术资源在广度和深度上都有了很大的发展,很多研究机构和研究者会在网络上公开其研究活动,并提供相关学术文献的资料下载,非常有效地促进各学科领域内的学术交流。有些网络学术全文资源,如期刊论文全文、学位论文全文、会议论文全文、技术报告全文、专利全文等,由于内容全面、检索便捷、易获取、更新摘自:7彩论文网毕业论文下载www.7ctime.com
快受到越来越多的关注。