简论基因基于聚类混合基因选择策略生
最后更新时间:2024-03-07
作者:用户投稿本站原创
点赞:24286
浏览:109114
论文导读:基因微阵列数据形态16-172.2.3基因表达数据的预处理17-182.2.4基因微阵列数据的运用18-192.3基因选择策略19-272.3.1过滤法20-232.3.2缠绕法23-252.3.3嵌入式策略25-272.3.4混合法272.4聚类27-312.4.1相似度计算策略28-292.4.2聚类算法29-312.5小结31-32第3章基于特点相似性聚类的混合基因选择算法32-453.1概述
摘要:基因芯片可以同时检测一个生物样本的所有转录因子活性。与传统的实验工具不同,基因表达芯片能够使我们对细胞在基因水平上有一个全局的认识。该技术已经被广泛运用到很多领域,如发现新的肿瘤亚型以及肿瘤分类。基因表达芯片所产生的海量数据显著特点是维度高,样本少以及大部分基因与疾病或肿瘤分类无关。基因选择不仅可以帮助我们找到有很好判别分类能力的基因,而且能够降低计算的时间与空间复杂度。由此基因选择显得相当重要。本论文主要的探讨工作如下:提出了基于特点相似性聚类的混合基因选择策略。基因表达谱数据有维度高、样本少的特点。由此数据通常有很高的冗余性。大量冗余基因的有着不仅计算开销高昂而且很难找到相关基因。在本论文中我们首先用过滤法依据基因变量的打分值对其排序,然后采取特点相似性聚类算法对基因进行聚类并删除冗余基因。我们用四个公开的基因表达谱数据集来检验我们的策略。我们用支持向量机作为分类器来检验候选基因的分类预测准确率。实验结果证实我们的策略能够取得不错的分类准确率。基于聚类的混合基因选择策略往往都是依据某种相似度衡量标准将基因分布到多个簇中,然后以每一簇中挑选出一个打分最高的基因。由于聚类策略的差别,这种代表性基因选择方式,往往忽略了簇中某些重要信息,由此在本论文中我们利用最大团查找算法,以每一簇中挑选一个或者多个基因作为候选代表基因。实验结果证明我们的策略是有效的。关键词:基因芯片论文基因表达谱论文基因选择论文聚类论文
本论文由www.7ctime.com,需要论文可以联系人员哦。摘要4-5
Abstract5-6
目录6-8
插图索引8-9
附表索引9-10
第1章 绪论10-13
参考文献53-57
致谢57-58
附录 A 攻读学位期间所发表的学术论文及所参加项目58-59
摘要:基因芯片可以同时检测一个生物样本的所有转录因子活性。与传统的实验工具不同,基因表达芯片能够使我们对细胞在基因水平上有一个全局的认识。该技术已经被广泛运用到很多领域,如发现新的肿瘤亚型以及肿瘤分类。基因表达芯片所产生的海量数据显著特点是维度高,样本少以及大部分基因与疾病或肿瘤分类无关。基因选择不仅可以帮助我们找到有很好判别分类能力的基因,而且能够降低计算的时间与空间复杂度。由此基因选择显得相当重要。本论文主要的探讨工作如下:提出了基于特点相似性聚类的混合基因选择策略。基因表达谱数据有维度高、样本少的特点。由此数据通常有很高的冗余性。大量冗余基因的有着不仅计算开销高昂而且很难找到相关基因。在本论文中我们首先用过滤法依据基因变量的打分值对其排序,然后采取特点相似性聚类算法对基因进行聚类并删除冗余基因。我们用四个公开的基因表达谱数据集来检验我们的策略。我们用支持向量机作为分类器来检验候选基因的分类预测准确率。实验结果证实我们的策略能够取得不错的分类准确率。基于聚类的混合基因选择策略往往都是依据某种相似度衡量标准将基因分布到多个簇中,然后以每一簇中挑选出一个打分最高的基因。由于聚类策略的差别,这种代表性基因选择方式,往往忽略了簇中某些重要信息,由此在本论文中我们利用最大团查找算法,以每一簇中挑选一个或者多个基因作为候选代表基因。实验结果证明我们的策略是有效的。关键词:基因芯片论文基因表达谱论文基因选择论文聚类论文
本论文由www.7ctime.com,需要论文可以联系人员哦。摘要4-5
Abstract5-6
目录6-8
插图索引8-9
附表索引9-10
第1章 绪论10-13
1.1 探讨动机10
1.2 探讨近况10-11
1.3 探讨目的11-12
1.4 论文结构安排12-13
第2章 相关论述知识13-322.1 基因13-15
2.2 基因微阵列15-19
2.1 基因微阵列流程15-16
2.2 基因微阵列数据形态16-17
2.3 基因表达数据的预处理17-18
2.4 基因微阵列数据的运用18-19
2.3 基因选择策略19-27
2.3.1 过滤法20-23
2.3.2 缠绕法23-25
2.3.3 嵌入式策略25-27
2.3.4 混合法27
2.4 聚类27-31
2.4.1 相似度计算策略28-29
2.4.2 聚类算法29-31
2.5 小结31-32
第3章 基于特点相似性聚类的混合基因选择算法32-453.1 概述32
3.2 策略32-40
3.2.1 过滤法33-34
3.2.2 基于特点相似性的聚类策略34-35
3.2.3 分类器35-39
3.2.4 交叉认证39-40
3.3 实验结果40-443.1 Leukemia 数据集实验结果浅析比较40-41
3.2 Colon 数据集实验结果浅析比较41-42
3.3 CNS 数据集实验结果浅析比较42-43
3.4 Prostate cancer 数据集实验结果浅析比较43-44
3.4 小结44-45
第4章 基于聚类和最大团查找算法的混合基因选择法45-514.1 概述45-46
4.2 策略46-49
4.2.1 噪声基因删除46-47
4.2.2 冗余基因删除47
4.2.3 代表性基因选择策略47-49
4.3 实验49-504.4 小结50-51
结论51-53参考文献53-57
致谢57-58
附录 A 攻读学位期间所发表的学术论文及所参加项目58-59