简论链式反应基于支持向量机生物数据策略
最后更新时间:2024-02-27
作者:用户投稿本站原创
点赞:19350
浏览:83763
论文导读:构建352.2.5评估策略35-372.3结果与讨论37-422.3.1表达谱的相关性37-382.3.2不同特点的重要量38-412.3.3采取不同特点的预测结果比较41-422.4本章小结42-43第三章凋亡蛋白亚细胞定位的预测43-523.1引言43-453.2材料与策略45-483.2.1数据来源45-463.2.2氨基酸替换矩阵463.2.3蛋白质序列数值刻画策略46-483.3结果
摘要:近几十年来,公共数据库中的生物分子数据正以指数型的速度在增加。正是因为生物学对这些大量数据的处理和浅析的需求,以而引发了生物信息学的诞生。它是利用数学、信息科学的论述、策略和技术去探讨生物大分子以及它们的序列、结构和功能。在生物信息学中,机器学习策略已经成为解决这些生物学不足的一个重要手段。本论文的工作主要是探讨了基于支持向量机的生物序列分类不足的预测策略,其主要的贡献如下:在第二章,我们提出了一种预测拟南芥基因调控联系的计算策略。利用已有的调控数据,我们构建了拟南芥基因调控联系的正、负样本数据集。通过将基因表达谱数据和转录因子及其靶基因序列信息的结合,我们提出了一种新的特点向量来表示每一对基因转录调控联系。然后我们选用了支持向量机和夹克刀测试来验证提出的策略。实验的结果显示,我们的策略取得了98.39%的准确度,94.88%的敏感度以及93.82%的特异性。在第三章,我们提出了一种新的伪氨基酸模型来预测凋亡蛋白的亚细胞定位不足。我们采取了氨基酸的替换矩阵和协方差变换来提取蛋白质的序列特点并构建其特点向量。这种表示策略不仅定量的描述了蛋白质序列中氨基酸之间的差别性,而且考虑了部分氨基酸的序信息。通过与其他策略结果的比较,可以看出我们的策略达到了一个较好的预测精度。在第四章,我们构建了一个预测PCR扩增难易程度的数学模型。目前,对于PCR扩增不足大多数探讨者主要关注的是实验历程,包括引物的设计等等,而对于PCR模板的浅析却及其少见。在本论文的探讨中,我们主要关注DNA模板这一PCR实验对象,利用k-mer对DNA序列进行数值刻画,然后通过支持向量机对189条人类染色体的外显子序列进行了PCR扩增难易程度的预测。预测的结果表明我们的策略是可行的。关键词:生物信息学论文支持向量机论文转录调控论文蛋白质亚细胞定位论文聚合酶链式反应论文
本论文由www.7ctime.com,需要论文可以联系人员哦。中文摘要7-9
Abstract9-11
目录11-13
第一章 绪论13-30
4.
第五章 总结与展望64-67
致谢76-77
攻读博士学位期间的探讨成果77
摘要:近几十年来,公共数据库中的生物分子数据正以指数型的速度在增加。正是因为生物学对这些大量数据的处理和浅析的需求,以而引发了生物信息学的诞生。它是利用数学、信息科学的论述、策略和技术去探讨生物大分子以及它们的序列、结构和功能。在生物信息学中,机器学习策略已经成为解决这些生物学不足的一个重要手段。本论文的工作主要是探讨了基于支持向量机的生物序列分类不足的预测策略,其主要的贡献如下:在第二章,我们提出了一种预测拟南芥基因调控联系的计算策略。利用已有的调控数据,我们构建了拟南芥基因调控联系的正、负样本数据集。通过将基因表达谱数据和转录因子及其靶基因序列信息的结合,我们提出了一种新的特点向量来表示每一对基因转录调控联系。然后我们选用了支持向量机和夹克刀测试来验证提出的策略。实验的结果显示,我们的策略取得了98.39%的准确度,94.88%的敏感度以及93.82%的特异性。在第三章,我们提出了一种新的伪氨基酸模型来预测凋亡蛋白的亚细胞定位不足。我们采取了氨基酸的替换矩阵和协方差变换来提取蛋白质的序列特点并构建其特点向量。这种表示策略不仅定量的描述了蛋白质序列中氨基酸之间的差别性,而且考虑了部分氨基酸的序信息。通过与其他策略结果的比较,可以看出我们的策略达到了一个较好的预测精度。在第四章,我们构建了一个预测PCR扩增难易程度的数学模型。目前,对于PCR扩增不足大多数探讨者主要关注的是实验历程,包括引物的设计等等,而对于PCR模板的浅析却及其少见。在本论文的探讨中,我们主要关注DNA模板这一PCR实验对象,利用k-mer对DNA序列进行数值刻画,然后通过支持向量机对189条人类染色体的外显子序列进行了PCR扩增难易程度的预测。预测的结果表明我们的策略是可行的。关键词:生物信息学论文支持向量机论文转录调控论文蛋白质亚细胞定位论文聚合酶链式反应论文
本论文由www.7ctime.com,需要论文可以联系人员哦。中文摘要7-9
Abstract9-11
目录11-13
第一章 绪论13-30
1.1 课题背景及作用13-23
1.1 生物信息学的进展背景13-15
1.2 生物信息学基础知识15-22
1.3 生物信息学的探讨作用22-23
1.2 生物序列分类预测策略的探讨近况23-28
1.2.1 生物序列的数字化符号表示23-25
1.2.2 分类预测算法—-支持向量机25-28
1.3 本论文主要内容的结构安排28-30
第二章 拟南芥基因调控联系的预测30-432.1 引言30-32
2.2 材料与策略32-37
2.1 数据来源32-33
2.2 序列特点的构建33-34
2.3 阳集数据样本的构建34-35
2.4 阴集数据样本的构建35
2.5 评估策略35-37
2.3 结果与讨论37-42
2.3.1 表达谱的相关性37-38
2.3.2 不同特点的重要量38-41
2.3.3 采取不同特点的预测结果比较41-42
2.4 本章小结42-43
第三章 凋亡蛋白亚细胞定位的预测43-523.1 引言43-45
3.2 材料与策略45-48
3.2.1 数据来源45-46
3.2.2 氨基酸替换矩阵46
3.2.3 蛋白质序列数值刻画策略46-48
3.3 结果与讨论48-513.1 不同替换矩阵对结果的影响48
3.2 与其他策略结果的比较48-51
3.4 本章小结51-52
第四章 基于模板 DNA 的 PCR 扩增难易预测52-644.1 引言52-54
4.2 材料与策略54-58
4.2.1 数据来源54
4.2.2 实验策略54-58
4.2.3 模板序列的数值刻画策略58
4.3 结果与讨论58-634.
3.1 模板 DNA 的 GC 含量58-59
4.3.2 结果浅析59-61
4.3.3 不同 k-mer 的预测结果比较61-63
4.4 本章小结63-64第五章 总结与展望64-67
5.1 全文工作总结64-65
5.2 未来工作展望65-67
参考文献67-76致谢76-77
攻读博士学位期间的探讨成果77