免费论文查重: 大雅 万方 维普 turnitin paperpass

探讨基于单事件新闻多文档聚类及自动文摘设计与实现

最后更新时间:2024-04-18 作者:用户投稿原创标记本站原创 点赞:17928 浏览:74052
论文导读:报;1995年03期、郭俊文;中文科技文献自动文摘系统的研究;情报探索;1995年04期、杨建林;自动文摘的逻辑解释;情报理论与实践;、郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究;计算机应用;、黄河笑,郭俊文;中文科技文献自动文摘系统的研究;现代情报;1996年03期、刘挺,吴岩,王开铸;基于信息抽取和文本生成的自
基于单事件新闻多文档聚类及自动文摘的设计与实现论文相关文献税仪冬;瞿有利;黄厚宽-周期分类和Single-Pass聚类相结合的话题识别与跟踪策略[J];北京交通大学学报;、陈学昌;韩佳珍;魏桂英-话题识别与跟踪技术发展研究[J];中国管理信息化;、贾自艳,何清,张海俊,李嘉佑,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;、刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期、龙华;何中市;伍星;李双庆-基于依存内容单元的金字塔自动摘要评估[J];计算机工程;、王文欣,黄萱菁,吴立德;基于统计策略的汉语自动文摘系统研究[J];计算机应用与软件;、王萌,何婷婷,姬东鸿,王晓荣;基于HowNet概念获取的中文自动文摘系统[J];中文信息学报;、秦兵,刘挺,李生;多文档自动文摘综述[J];中文信息学报;、洪宇;张宇;刘挺;李生-话题检测与跟踪的评测及研究综述[J];中文信息学报;、王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期 中国博士学位论文全文数据库前3条 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;刊全文数据库税仪冬;瞿有利;黄厚宽-周期分类和Single-Pass聚类相结合的话题识别与跟踪策略[J];北京交通大学学报;、焦健;瞿有利-知网的话题更新与跟踪算法研究[J];北京交通大学学报;、胡思康;曹元大-Web网页知识获取技术[J];北京理工大学学报;、鲁明羽;姚晓娜;魏善岭-基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;、金博,滕弘飞,史彦军,虹;机辅写作:样本库中写作材料检索策略[J];大连理工大学学报;、许志凯;徐志明;李栋;李生-面向互联网新闻的话题检测与追踪[J];智能计算机与应用;、卫国平;陈俊杰;张健-基于概念语义的用户兴趣模型的研究[J];电脑开发与应用;、洪田玉;陈志刚-一种跨语言的自动摘要技术[J];电脑与信息技术;、钟祥睿-Web信息抽取研究[J];电脑知识与技术;、张瑛;张娅婷-动态文本会话抽取技术研究[J];电视技术; 王荀;李素建;宋涛;姜伯平-服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(刊全文数据库税仪冬;瞿有利;黄厚宽-周期分类和Single-Pass聚类相结合的话题识别与跟踪策略[J];北京交通大学学报;、吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;、鲁明羽;姚晓娜;魏善岭-基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;、吴昊;耿焕同-基于潜在语义分析的BBS主题发现算法研究[J];电脑知识与技术;、秦兵;刘挺;王洋;郑实福;李生-基于常问理由集的中文问答系统研究[J];哈尔滨工业大学学报;、刘挺,吴岩,王开铸;中文自动文摘系统CAAS的研究与实现[J];哈尔滨工业大学学报;1999年06期、赵华;赵铁军;张姝;王浩畅-基于内容分析的话题检测研究[J];哈尔滨工业大学学报;、万小军,杨建武;在线新闻主题检测系统的设计与应用[J];华南理工大学学报(自然科学版);、孙春葵,李蕾,杨晓兰,钟义信;基于知识的文本摘要系统研究与实现[J];计算机研究与发展;、李荣陆,胡运发;基于密度的kNN文本分类器训练样本裁剪策略[J];计算机研究与发展; 前3条 骆卫华;于满泉;许洪波;王斌;程学旗-基于多策略优化的分治多层聚类算法的话题发现研究[A];全国第八届计算语言学联合学术会议(JSCL-刊全文数据库王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期、郭俊文;中文科技文献自动文摘系统的研究[J];情报探索;1995年04期、杨建林;自动文摘的逻辑解释[J];情报理论与实践;、郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究[J];计算机应用;、黄河笑,郭俊文;中文科技文献自动文摘系统的研究[J];现代情报;1996年03期、刘挺,吴岩,王开铸;基于信息抽取和文本生成的自动文摘系统设计[J];情报学报;1997年S1期、沈玮杰;基于文献结构的自动文摘的初探[J];现代图书情报技术;、金博,史彦军,滕弘飞,艾景波;自动文摘技术及应用[J];计算机应用研究;、高小云,程慕胜;基于英文文本的自动文摘:技术与展望[J];清华大学教育研究;、汤晓鲁;李旎-手工文摘的评价与自动文摘的产生[J];贵图学刊;1998年02期 王红玲;黄超超;张;周国栋-面向冗余度制约的中文多文档自动文摘[A];中国计算语言学研究前沿进展(、万敏;罗振声;郭玉箐-自动文摘系统中的作用段划分理由研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];、李成城-基于修辞结构理论的自动文摘研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];、王萌;何婷婷;王晓荣-基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];、桂卓民;何婷婷;陈劲光;李芳-一种面向查询的多文档自动文摘系统实现策略[A];中国计算机语言学研究前沿进展(、刘德喜;姬东鸿-基于基本要素的文摘内容连贯性评测模型[A];第三届全国信息检索与内容安全学术会议论文集[C];、王萌;王晓荣;李春贵;唐培和-基于局部与全局信息的自动文摘算法[A];广西计算机学会年会论文集[C];、李立燕;杨国纬-中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-、李芳;何婷婷-面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];、;哈尔滨工业大学智能技术与自然语言处理研论文导读:
究室简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];
论文目录
摘要4-5
Abstract5-13
第一章绪论13-21

1.1研究的目的和作用13-14

1.2多文档自动文摘研究目前状况14-18

1.2.1国外的研究情况14-16

1.2.2国内的研究情况16-17

1.2.3多文档自动文摘句子评分算法17-18

1.3话题检测与跟踪技术研究目前状况18-19

1.4本文的研究工作19-20

1.5本文的组织结构20-21

第二章文本处理的关键技术21-35

2.1文本预处理21-22

2.

1.1中文分词21-22

2.

1.2过滤停用词22

2.2文本表示22-25

2.1向量空间模型22-23

2.2潜在语义索引(LSI)模型23-24

2.3概率潜在语义索引(PLSI)模型24-25

2.3文本特征选择25-27

2.4常见的几种文本聚类分类算法27-31

2.4.1分类算法27-28

2.4.2聚类算法28-31

2.5文本分类聚类的评价指标31-33

2.5.1文本分类的性能评价31-32

2.5.2文本聚类的性能评价32-33

2.6文本摘要的评价指标33-34

2.7本章总结34-35

第三章单事件新闻聚类系统35-49

3.1系统的总体设计思路35-36

3.2基于LDA模型的文本相似度计算36-45

3.1LDA模型介绍37-45

3.2基于LDA的文本相似度计算45

3.3基于LDA主题模型的文本分类和聚类45-48

3.1基于LDA主题模型的KNN新闻分类46-47

3.2基于LDA主题模型的Single-Pass文本聚类47-48

3.4本章小结48-49

第四章基于LexRank的单事件多文档文摘49-61

4.1多文档文摘系统的总体设计思路49-51

4.2基于知网的向量空间模型51-53

4.3基于LexRank算法的句子权重计算53-58

4.

3.1起源-PageRank算法53-54

4.

3.2LexRank算法介绍54-57

4.

3.3基于句子多特征与LexRank算法相融合的句子权重计算57-58

4.4文摘抽取58-60

4.5本章小结60-61

第五章实验结果分析61-69

5.1实验语料选择61

5.2实验环境61

5.3文本分类聚类实验61-64

5.

3.1基于LDA模型的KNN算法实验结果分析61-63

5.

3.2基于LDA模型的Single-Pass聚类实验结果分析63-64

5.4多文档文摘实验结果分析64-69
5.

4.1多文档文摘系统演示64-66

5.

4.2摘要生成结果及分析66-69

第六章总结与展望69-71

6.1论文工作总结69

6.2展望69-71

参考文献71-74
硕士在读期间科研成果介绍74-75
致谢75
多文档文摘KNNLexRankLDA主题模型LexRank
参考文献
前3条 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;刊全文数据库税仪冬;瞿有利;黄厚宽-周期分类和Single-Pass聚类相结合的话题识别与跟踪策略[J];北京交通大学学报;、焦健;瞿有利-知网的话题更新与跟踪算法研究[J];北京交通大学学报;、胡思康;曹元大-Web网页知识获取技术[J];北京理工大学学报;、鲁明羽;姚晓娜;魏善岭-基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;、金博,滕弘飞,史彦军,虹;机辅写作:样本库中写作材料检索策略[J];大连理工大学学报;、许志凯;徐志明;李栋;李生-面向互联网新闻的话题检测与追踪[J];智能计算机与应用;、卫国平;陈俊杰;张健-基于概念语义的用户兴趣模型的研究[J];电脑开发与应用;、洪田玉;陈志刚-一种跨语言的自动摘要技术[J];电脑与信息技术;、钟祥睿-Web信息抽取研究[J];电脑知识与技术;、张瑛;张娅婷-动态文本会话抽取技术研究[J];电视技术; 王荀;李素建;宋涛;姜伯平-服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(刊全文数据库税仪冬;瞿有利;黄厚宽-周期分类和Single-Pass聚类相结合的话题识别与跟踪策略[J];北京交通大学学报;、吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;、鲁明羽;姚晓娜;魏善岭-基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;、吴昊;耿焕同-基于潜在语义分析的BBS主题发现算法研究[J];电脑知识与技术;、秦兵;刘挺;王洋;郑实福;李生-基于常问理由集的中文问答系统研究[J];哈尔滨工业大学学报;、刘挺,吴岩,王开铸;中文自动文摘系统CAAS的研究与实现[J];哈尔滨工业大学学报;1999年06期、赵华;赵铁军;张姝;王浩畅-基于内容分析的话题检测研究[J];哈尔滨工业大学学报;、万小军,杨建武;在线新闻主题检测系统的设计与应用[J];华南理工大学学报(自然科学版);、孙春葵,李蕾,杨晓兰,钟义信;基于知识的文本摘要系统研究与实现[J];计算机研究与发展;、李荣陆,胡运发;基于密度的kNN文本分类器训练样本裁剪策略[J];计算机研究与发展; 前3条 骆卫华;于满泉;许洪波;王斌;程学旗-基于多策略优化的分治多层聚类算法的话题发现研究[A];全国第八届计算语言学联合学术会议(JSCL-刊全文数据库王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期、郭俊文;中文科技文献自动文摘系统的研究[J];情报探索;1995年04期、杨建林;自动文摘的逻辑解释[J];情报理论与实践;、郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究[J];计算机应用;、黄河笑,郭俊文;中文科技文献自动文摘系统的研究[J];现代情报;1996年03期、刘挺,吴岩,王开铸;基于信息抽取和文本生成的自动文摘系统设计[J];情报学报;1997年S1期、沈玮杰;基于文献结构的论文导读:
自动文摘的初探[J];现代图书情报技术;、金博,史彦军,滕弘飞,艾景波;自动文摘技术及应用[J];计算机应用研究;、高小云,程慕胜;基于英文文本的自动文摘:技术与展望[J];清华大学教育研究;、汤晓鲁;李旎-手工文摘的评价与自动文摘的产生[J];贵图学刊;1998年02期 王红玲;黄超超;张;周国栋-面向冗余度制约的中文多文档自动文摘[A];中国计算语言学研究前沿进展(、万敏;罗振声;郭玉箐-自动文摘系统中的作用段划分理由研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];、李成城-基于修辞结构理论的自动文摘研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];、王萌;何婷婷;王晓荣-基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];、桂卓民;何婷婷;陈劲光;李芳-一种面向查询的多文档自动文摘系统实现策略[A];中国计算机语言学研究前沿进展(、刘德喜;姬东鸿-基于基本要素的文摘内容连贯性评测模型[A];第三届全国信息检索与内容安全学术会议论文集[C];、王萌;王晓荣;李春贵;唐培和-基于局部与全局信息的自动文摘算法[A];广西计算机学会年会论文集[C];、李立燕;杨国纬-中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-、李芳;何婷婷-面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];、;哈尔滨工业大学智能技术与自然语言处理研究室简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C]; 中国重要报纸全文数据库前2条 ;浙江天宇信息技术有限公司[N];中国计算机报;、张雪峰;信息检索技术的新视角[N];中华读书报; 中国博士学位论文全文数据库韦福如;基于图模型多文档自动文摘研究[D];武汉大学;、李鹏;面向主题的多文档自动文摘关键技术研究[D];上海交通大学;、张琳;基于引用聚类的多文档自动文摘技术研究[D];大连海事大学;、蒋昌金;基于关键词提取的中文网页自动文摘策略研究[D];华南理工大学;、杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;、陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;、赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;、周文;基于概念的若干知识表示模型及相关策略研究[D];上海大学;、刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;、陈莉萍;英汉语篇结构标注理论与实践[D];上海外国语大学; 中国硕士学位论文全文数据库孟威;面向微博的自动文摘研究[D];昆明理工大学;、张瑞玲;教学资源自动文摘系统的研究与设计[D];北京交通大学;、孟庆富;生物医学多文档自动文摘系统设计与实现[D];哈尔滨工业大学;、张元虹;基于主题划分的中文单文档自动文摘系统的研究[D];昆明理工大学;、张;基于主题模型的中英文多文档自动文摘[D];苏州大学;、祝振媛;基于信息分类的网络书评多文档自动文摘研究[D];南京大学;、王攀;中文多文档自动文摘的研究与实现[D];北京邮电大学;、谢静芝;面向循证医学的多文档自动文摘技术研究[D];大连海事大学;、桂卓民;基于事件的多文档自动文摘系统的研究[D];华中师范大学;、付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;