免费论文查重: 大雅 万方 维普 turnitin paperpass

简述基于桶二次聚类新闻热点话题挖掘及应用

最后更新时间:2024-04-05 作者:用户投稿原创标记本站原创 点赞:17154 浏览:72630
论文导读:
基于桶的二次聚类新闻热点话题挖掘及应用论文相关文献前7条李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;、闵可锐;赵迎宾;刘昕;赵泽宇;闫华-互联网话题识别与跟踪系统设计及实现[J];计算机工程;、骆卫华;于满泉;许洪波;王斌;程学旗-基于多策略优化的分治多层聚类算法的话题发现研究[J];中文信息学报;、洪宇;张宇;刘挺;李生-话题检测与跟踪的评测及研究综述[J];中文信息学报;、王步康;王红玲;袁晓虹;周国栋-基于依存句法分析的中文语义角色标注[J];中文信息学报;、刘挺;车万翔;李正华-语言技术平台[J];中文信息学报;、刘海涛;依存语法和机器翻译[J];语言文字应用;1997年03期【共引文献】 中国期刊全文数据库税仪冬;瞿有利;黄厚宽-周期分类和Single-Pass聚类相结合的话题识别与跟踪策略[J];北京交通大学学报;、焦健;瞿有利-知网的话题更新与跟踪算法研究[J];北京交通大学学报;、刘海涛-翻译的复杂网络视角[J];北华大学学报(社会科学版);、付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军-基于实体识别的在线主题检测策略[J];北京大学学报(自然科学版);、王跃龙;姬东鸿-汉语树库综述[J];当代语言学;、鲁明羽;姚晓娜;魏善岭-基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;、许志凯;徐志明;李栋;李生-面向互联网新闻的话题检测与追踪[J];智能计算机与应用;、张瑛;张娅婷-动态文本会话抽取技术研究[J];电视技术;、谢林燕;戚银城;孙卓-地点信息在话题检测中的应用[J];电子科技;、潘文富;郭友实-网络舆情监测技术研究综述[J];福建电脑; 斯·劳格劳;华沙宝;萨如拉-基于统计策略的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(刊全文数据库赵华;赵铁军;张姝;王浩畅-基于内容分析的话题检测研究[J];哈尔滨工业大学学报;、贾自艳,何清,张海俊,李嘉佑,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;、于满泉;骆卫华;许洪波;白硕-话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;、李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;、骆卫华;于满泉;许洪波;王斌;程学旗-基于多策略优化的分治多层聚类算法的话题发现研究[J];中文信息学报;、王丽杰;车万翔;刘挺-基于SVMTool的中文词性标注[J];中文信息学报;、周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期、刘挺,王开铸;关于歧义字段切分的深思与实验[J];中文信息学报;1998年02期、刘挺;车万翔;李生-基于最大熵分类器的语义角色标注[J];软件学报;、宋丹;王卫东;陈英-基于改善向量空间模型的话题识别与跟踪[J];计算机技术与发展; 中国博士学位论文全文数据库前1条 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);刊全文数据库吴扬扬;雷庆;陈锻生;YOKOTA Harou-一种从XML数据中发现关系信息的策略[J];软件学报;、马力-用自适应蚁群算法求解集中网站的WEB搜索优化策略[J];沈阳航空工业学院学报;、夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;、刘宏彬,邓,路松峰;聚类布尔和分类数据[J];华中科技大学学报;、陈建斌,宋翰涛;基于属性分布相似度的超图高维聚类算法研究[J];计算机工程与应用;、刘辉;桑金歌-基于聚类协作过滤的个性推荐系统的实现[J];微计算机信息;、闵敏-基于聚类协作过滤的商品个性化推荐系统的实现[J];制造业自动化;、吕晓敏-基于项目聚类和评分预测的协同过滤推荐算法研究[J];中国管理信息化;、刘芳;薛蕾-利用链接分析技术监测可疑外汇资金流动[J];计算机工程与科学;、伊莉娜;王培东-基于聚类的移动查询技术研究[J];科技创新导报; 刘海波;郑德权;赵铁军-基于相似度线性加权策略的检索结果聚类研究[A];中国计算语言学研究前沿进展(学校论文集[C];、丁海波;肖桐;朱靖波-基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];、梅艳;袁南儿;周德泽-基于神经网络模式识别的信息融合[A];1999中国制约与决策学术年会论文集[C];1999年、武森;金海燕;高学东-数据挖掘中CABOV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];、杜方键;杨宏晖-K均值聚类优化集成学习[A];、秦兵;刘挺;高晔-多文档集合中逻辑主题的确定[A];NCIRCS、张健沛;李连江;杨静-个性化搜索引擎排序算法的研究与改善[A];第三届全国信息检索与内容安全学术会议论文集[C];、穆向禹;浦剑涛;张树武;徐波-基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];、饶鲜;李斌;杨绍全-用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];
论文目录
摘要5-6
Abstract6-11
第一章绪论11-15

1.1研究背景及作用11-12

1.2国内外研究目前状况12-13

1.3本文的研究内容13-14

1.4论文的组织结构14-15

第二章相关理论和技术15-23

2.1中文文本处理15-18

2.

1.1中文分词15-16

2.

1.2特征向量提取16-17

2.

1.3文本相似度计算17-18

2.2话题检测与跟踪技术18-19

2.1话题检测18

2.2话题跟踪18-19

2.3文本聚类19-22

2.3.1文本聚类概述19

2.3.2传统文本聚类算法19-22

2.4本章小结22-23

第三章基于桶的二次聚类Single-P论文导读:题词语倒排索引的相关话题发现50-514.4实验结果51-554.4.1实验数据514.4.2实验结果及分析51-554.5本章小结55-56第五章系统设计与展示56-655.1系统总体框架56-575.2系统设计57-615.2.1文档预处理模块57-585.2.2分词加权及向量生成模块58-595.2.3话题聚类模块59-615.3系统演示61-645.4本章小结64-65结论65-67参考文献67-70致谢
ass算法23-44

3.1中文文本预处理23-26

3.

1.1NLPIR的中文分词23-24

3.

1.2分词过滤24-25

3.

1.3TF-IDF特征词提取25

3.

1.4文本向量化25-26

3.2文档相似度计算26-27

3.3基于桶的二次聚类Single-Pass算法27-35

3.1传统话题检测算法27-28

3.2分桶算法28-30

3.3桶内Single-Pass聚类30-31

3.4桶的合并31-33

3.5二次聚类话题检测算法33-35

3.4分布式框架设计35-39

3.4.1设计背景35-36

3.4.2理论性能及并行性分析36-37

3.4.3分布式框架37-39

3.5实验结果39-43

3.5.1实验环境39

3.5.2实验数据39

3.5.3评测标准39-40

3.5.4实验结果及分析40-43

3.6本章小结43-44

第四章话题演变发现44-56

4.1基于演变的话题模型44-45

4.

1.1话题演变分析44

4.

1.2多质心三层结构话题模型44-45

4.2基于三层结构话题模型的话题演变发现45-50
4.

2.1基于话题逆文档频率特征项权值调整45-46

4.

2.2基于调整向量的话题演变检测46-48

4.

2.3基于TF-IDF统计的话题主题词语发现48-49

4.

2.4基于信息增益的子话题关键词生成49-50

4.3基于话题主题词语倒排索引的相关话题发现50-51

4.4实验结果51-55

4.1实验数据51

4.2实验结果及分析51-55

4.5本章小结55-56

第五章系统设计与展示56-65

5.1系统总体框架56-57

5.2系统设计57-61

5.

2.1文档预处理模块57-58

5.

2.2分词加权及向量生成模块58-59

5.

2.3话题聚类模块59-61

5.3系统演示61-64

5.4本章小结64-65

结论65-67
参考文献67-70
致谢70-71
附件71
话题检测话题演变基于桶的预分类话题模型二次聚类
参考文献
陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;刊全文数据库赵华;赵铁军;张姝;王浩畅-基于内容分析的话题检测研究[J];哈尔滨工业大学学报;、贾自艳,何清,张海俊,李嘉佑,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;、于满泉;骆卫华;许洪波;白硕-话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;、李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;、骆卫华;于满泉;许洪波;王斌;程学旗-基于多策略优化的分治多层聚类算法的话题发现研究[J];中文信息学报;、王丽杰;车万翔;刘挺-基于SVMTool的中文词性标注[J];中文信息学报;、周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期、刘挺,王开铸;关于歧义字段切分的深思与实验[J];中文信息学报;1998年02期、刘挺;车万翔;李生-基于最大熵分类器的语义角色标注[J];软件学报;、宋丹;王卫东;陈英-基于改善向量空间模型的话题识别与跟踪[J];计算机技术与发展; 中国博士学位论文全文数据库前1条 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);刊全文数据库吴扬扬;雷庆;陈锻生;YOKOTA Harou-一种从XML数据中发现关系信息的策略[J];软件学报;、马力-用自适应蚁群算法求解集中网站的WEB搜索优化策略[J];沈阳航空工业学院学报;、夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;、刘宏彬,邓,路松峰;聚类布尔和分类数据[J];华中科技大学学报;、陈建斌,宋翰涛;基于属性分布相似度的超图高维聚类算法研究[J];计算机工程与应用;、刘辉;桑金歌-基于聚类协作过滤的个性推荐系统的实现[J];微计算机信息;、闵敏-基于聚类协作过滤的商品个性化推荐系统的实现[J];制造业自动化;、吕晓敏-基于项目聚类和评分预测的协同过滤推荐算法研究[J];中国管理信息化;、刘芳;薛蕾-利用链接分析技术监测可疑外汇资金流动[J];计算机工程与科学;、伊莉娜;王培东-基于聚类的移动查询技术研究[J];科技创新导报; 刘海波;郑德权;赵铁军-基于相似度线性加权策略的检索结果聚类研究[A];中国计算语言学研究前沿进展(学校论文集[C];货韩锦 邹云峰高华;基于RFM模型的聚类分析算法在期货公司客户分类中的应用[N];期货日报; 中国博士学位论文全文数据库陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;、程文娟;基于文本挖掘的定向性信息分析研究[D];合肥工业大学;、马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;、蔡维玲;基于聚类的图像分割和分类器设计的研究[D];南京航空航天大学;、张伟;基于WWW的聚类引擎研究[D];重庆大学;、张利军;大规模机器学习理论研究与应用[D];浙江大学;、雷景生;神经网络的分类、聚类功能及其规则抽取研究[D];新疆大学;、邵增珍;物流匹配理由的调度模型和算法研究[D];山东师范大学;、张震;基于流量测量的高速IP业务感知技术研究[D];解放军信息工程大学;、钱晓东;基于神经网络等技术的数据与文本聚分类研究[D];天津大学; 中国硕士学位论文全文数据库吴少凯;基于桶的二次聚类新闻热点话题挖掘及应用[D];华南理工大学;、寇艳艳;电子商务推荐系统中用户聚类理由与用户兴趣变化理由研究[D];中国科学技术大学;、朱光楠;基于聚类的搜索可视化呈现系统的设计与实现[D];北京邮电大学;、陶克;大本体分块与映射策略的研究与实现[D];中南大学;、张俊英;基于谱聚类的图书目录重构[D];浙江大学;、王斌;双层数据流聚类框架的设计与实现[D];吉林大学;、蔡博文;高维数据集中离群数据挖掘策略的研究[D];合论文导读:肥工业大学;、刘晓燕;基于聚类的入侵检测系统研究;青岛大学;、于世东;多维数据可视化技术的研究及应用;沈阳工业大学;、戴金;改善K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用;北京交通大学;上一页123
肥工业大学;、刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;、于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;、戴金;改善K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;