毕业论文
职称论文发表
论文 论文发表
7彩论文网专业提供论文与 表服务其次提供论文范文免费阅读
经济论文| 管理论文| 法学论文| 教学论文| 教育论文| 新闻传播| 财政税收| 财务管理| 市场营销| 物流论文| 教师论文| 保险论文| 心理学| 图书馆>
会计论文| 医学论文| 文学论文| 英语论文| 医院管理| 护理论文| 政治论文| 哲学论文| 医药论文| 计算机| 社会学| 艺术| 科学| 工程| 文化| MBA
关于简述基于桶的二次聚类新闻热点话题挖掘及应用(2)网站位置: >> 新闻传播论文 >> 社会传播学论文 >> 浏览文章
简述基于桶的二次聚类新闻热点话题挖掘及应用(2)

论文导读:题词语倒排索引的相关话题发现50-514.4实验结果51-554.4.1实验数据514.4.2实验结果及分析51-554.5本章小结55-56第五章系统设计与展示56-655.1系统总体框架56-575.2系统设计57-615.2.1文档预处理模块57-585.2.2分词加权及向量生成模块58-595.2.3话题聚类模块59-615.3系统演示61-645.4本章小结64-65结论65-67参考文献67-70致谢

ass算法23-44

3.1中文文本预处理23-26

3.1.1NLPIR的中文分词23-24

3.1.2分词过滤24-25

3.1.3TF-IDF特征词提取25

3.1.4文本向量化25-26

3.2文档相似度计算26-27

3.3基于桶的二次聚类Single-Pass算法27-35

3.3.1传统话题检测算法27-28

3.3.2分桶算法28-30

3.3.3桶内Single-Pass聚类30-31

3.3.4桶的合并31-33

3.3.5二次聚类话题检测算法33-35

3.4分布式框架设计35-39

3.4.1设计背景35-36

3.4.2理论性能及并行性分析36-37

3.4.3分布式框架37-39

3.5实验结果39-43

3.5.1实验环境39

3.5.2实验数据39

3.5.3评测标准39-40

3.5.4实验结果及分析40-43

3.6本章小结43-44

第四章话题演变发现44-56

4.1基于演变的话题模型44-45

4.1.1话题演变分析44

4.1.2多质心三层结构话题模型44-45

4.2基于三层结构话题模型的话题演变发现45-50

4.2.1基于话题逆文档频率特征项权值调整45-46

4.2.2基于调整向量的话题演变检测46-48

4.2.3基于TF-IDF统计的话题主题词语发现48-49

4.2.4基于信息增益的子话题关键词生成49-50

4.3基于话题主题词语倒排索引的相关话题发现50-51

4.4实验结果51-55

4.4.1实验数据51

4.4.2实验结果及分析51-55

4.5本章小结55-56

第五章系统设计与展示56-65

5.1系统总体框架56-57

5.2系统设计57-61

5.2.1文档预处理模块57-58

5.2.2分词加权及向量生成模块58-59

5.2.3话题聚类模块59-61

5.3系统演示61-64

5.4本章小结64-65

结论65-67

参考文献67-70

致谢70-71

附件71

话题检测 话题演变 基于桶的预分类 话题模型 二次聚类

参考文献
陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;刊全文数据库 赵华;赵铁军;张姝;王浩畅-基于内容分析的话题检测研究[J];哈尔滨工业大学学报; 、贾自艳,何清,张海俊,李嘉佑,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展; 、于满泉;骆卫华;许洪波;白硕-话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展; 、李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用; 、骆卫华;于满泉;许洪波;王斌;程学旗-基于多策略优化的分治多层聚类算法的话题发现研究[J];中文信息学报; 、王丽杰;车万翔;刘挺-基于SVMTool的中文词性标注[J];中文信息学报; 、周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期 、刘挺,王开铸;关于歧义字段切分的深思与实验[J];中文信息学报;1998年02期 、刘挺;车万翔;李生-基于最大熵分类器的语义角色标注[J];软件学报; 、宋丹;王卫东;陈英-基于改善向量空间模型的话题识别与跟踪[J];计算机技术与发展; 中国博士学位论文全文数据库 前1条 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);刊全文数据库 吴扬扬;雷庆;陈锻生;YOKOTA Harou-一种从XML数据中发现关系信息的策略[J];软件学报; 、马力-用自适应蚁群算法求解集中网站的WEB搜索优化策略[J];沈阳航空工业学院学报; 、夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索; 、刘宏彬,邓洪志,路松峰;聚类布尔和分类数据[J];华中科技大学学报; 、陈建斌,宋翰涛;基于属性分布相似度的超图高维聚类算法研究[J];计算机工程与应用; 、刘辉;桑金歌-基于聚类协作过滤的个性推荐系统的实现[J];微计算机信息; 、闵敏-基于聚类协作过滤的商品个性化推荐系统的实现[J];制造业自动化; 、吕晓敏-基于项目聚类和评分预测的协同过滤推荐算法研究[J];中国管理信息化; 、刘芳;薛蕾-利用链接分析技术监测可疑外汇资金流动[J];计算机工程与科学; 、伊莉娜;王培东-基于聚类的移动查询技术研究[J];科技创新导报; 刘海波;郑德权;赵铁军-基于相似度线性加权策略的检索结果聚类研究[A];中国计算语言学研究前沿进展(学校论文集[C];货 韩锦 邹云峰 高华;基于RFM模型的聚类分析算法在期货公司客户分类中的应用[N];期货日报; 中国博士学位论文全文数据库陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学; 、程文娟;基于文本挖掘的定向性信息分析研究[D];合肥工业大学; 、马赓宇;基于HMM的时间序列聚类与识别[D];清华大学; 、蔡维玲;基于聚类的图像分割和分类器设计的研究[D];南京航空航天大学; 、张伟;基于WWW的聚类引擎研究[D];重庆大学; 、张利军;大规模机器学习理论研究与应用[D];浙江大学; 、雷景生;神经网络的分类、聚类功能及其规则抽取研究[D];新疆大学; 、邵增珍;物流匹配理由的调度模型和算法研究[D];山东师范大学; 、张震;基于流量测量的高速IP业务感知技术研究[D];解放军信息工程大学; 、钱晓东;基于神经网络等技术的数据与文本聚分类研究[D];天津大学; 中国硕士学位论文全文数据库吴少凯;基于桶的二次聚类新闻热点话题挖掘及应用[D];华南理工大学; 、寇艳艳;电子商务推荐系统中用户聚类理由与用户兴趣变化理由研究[D];中国科学技术大学; 、朱光楠;基于聚类的搜索可视化呈现系统的设计与实现[D];北京邮电大学; 、陶克;大本体分块与映射策略的研究与实现[D];中南大学; 、张俊英;基于谱聚类的图书目录重构[D];浙江大学; 、王斌;双层数据流聚类框架的设计与实现[D];吉林大学; 、蔡博文;高维数据集中离群数据挖掘策略的研究[D];合 全文地址:http://www.7ctime.com/shcbxlw/lw21310.html
论文写作技巧论文写作技巧

关于简述基于桶的二次聚类新闻热点话题挖掘及应用(2)论文范文由7彩论文网整理编辑提供免费阅读硕士毕业论文