简析增量基于SOINN-GMM说话人识别
最后更新时间:2024-01-18
作者:用户投稿本站原创
点赞:5205
浏览:16929
论文导读:学习高斯混合模型。我们将这种基于自组织增量学习神经网络(SelfOrganizationIncrementalLearningNeuralNetwork,SOINN)和高斯混合模型的办法应用于说话人识别中。SOINN能不仅够自适应的给出合理的初始聚类,还能给混合模型提供合适的混合度。在说话人识别体系中,首先由SOINN和期望最大化算法来进行初次训练,形成一个初始
摘要:在过去的几十年中,高斯混合模型广泛且成功的被用于说话人识别的探讨中。为了处理动态增长的数据集和GMM初始化不足,从及在少量训练数据下得到高效的学习结果,本论文提出一种自适应增量学习办法,称为增量学习高斯混合模型。我们将这种基于自组织增量学习神经网络(Self Organization Incremental Learning Neural Network, SOINN)和高斯混合模型的办法应用于说话人识别中。SOINN能不仅够自适应的给出合理的初始聚类,还能给混合模型提供合适的混合度。在说话人识别体系中,首先由SOINN和期望最大化算法来进行初次训练,形成一个初始模型,然后通过增量学习不断地丰富和优化模型。实验的语料库为2006年的第一届语音分离挑战赛数据库。实验结果表明增量高斯混合模型在大多数状况下优于传统高斯混合模型。在体系结构方面,本论文提出一个增量学习说话人识别体系,体系中包含四个模块,分别是特点提取模块,训练模块,识别模块和增量学习模块。在预处理中利用了VAD办法去掉语音段中的静音段,特点提取时利用改善的MFCC系数作为特点参数,在训练时利用SOINN(?)高斯混合模型作为模型办法。本论文针对说话人模型的自适应性,可增量学习和鲁棒性做了从下几个方面的努力:(1)在特点提取阶段,为了使语音参数能更加精确地代表说话人的个性语音特点,我们利用了语音活性检测办法。将语音中的静音段去除掉,只留下纯语音段供体系学习和识别,提升语音特点的准确性,提供了能让体系能达到更高识别率的前提条件。在梅尔倒谱系数中利用了动态系数办法,以系数层面提供了一种抗噪办法。(2)在模型训练阶段,利用自组织增量学习神经网络代替K-means办法,给模型提供更好的适应性和准确性,克服了K-means办法需要预先确定模型混合度的缺点,以而让体系更具适应性和推广性。(3)在模型训练完成后,加入增量学习模块,提供一种自适应的增量学习办法,能很好的满足体系增量学习的要求,使体系能适应动态增长的数据集。关键词:增量学习论文说话人识别论文高斯混合模型论文自组织增量学习神经网络论文
本论文由www.7ctime.com,需要可从关系人员哦。摘要4-5
Abstract5-7
目录7-11
第一章 引言11-21
3.
结66-68
第五章 说话人识别体系与实验分析68-78
第六章 总结与展望78-80
参考文献80-85
致谢85-86
摘要:在过去的几十年中,高斯混合模型广泛且成功的被用于说话人识别的探讨中。为了处理动态增长的数据集和GMM初始化不足,从及在少量训练数据下得到高效的学习结果,本论文提出一种自适应增量学习办法,称为增量学习高斯混合模型。我们将这种基于自组织增量学习神经网络(Self Organization Incremental Learning Neural Network, SOINN)和高斯混合模型的办法应用于说话人识别中。SOINN能不仅够自适应的给出合理的初始聚类,还能给混合模型提供合适的混合度。在说话人识别体系中,首先由SOINN和期望最大化算法来进行初次训练,形成一个初始模型,然后通过增量学习不断地丰富和优化模型。实验的语料库为2006年的第一届语音分离挑战赛数据库。实验结果表明增量高斯混合模型在大多数状况下优于传统高斯混合模型。在体系结构方面,本论文提出一个增量学习说话人识别体系,体系中包含四个模块,分别是特点提取模块,训练模块,识别模块和增量学习模块。在预处理中利用了VAD办法去掉语音段中的静音段,特点提取时利用改善的MFCC系数作为特点参数,在训练时利用SOINN(?)高斯混合模型作为模型办法。本论文针对说话人模型的自适应性,可增量学习和鲁棒性做了从下几个方面的努力:(1)在特点提取阶段,为了使语音参数能更加精确地代表说话人的个性语音特点,我们利用了语音活性检测办法。将语音中的静音段去除掉,只留下纯语音段供体系学习和识别,提升语音特点的准确性,提供了能让体系能达到更高识别率的前提条件。在梅尔倒谱系数中利用了动态系数办法,以系数层面提供了一种抗噪办法。(2)在模型训练阶段,利用自组织增量学习神经网络代替K-means办法,给模型提供更好的适应性和准确性,克服了K-means办法需要预先确定模型混合度的缺点,以而让体系更具适应性和推广性。(3)在模型训练完成后,加入增量学习模块,提供一种自适应的增量学习办法,能很好的满足体系增量学习的要求,使体系能适应动态增长的数据集。关键词:增量学习论文说话人识别论文高斯混合模型论文自组织增量学习神经网络论文
本论文由www.7ctime.com,需要可从关系人员哦。摘要4-5
Abstract5-7
目录7-11
第一章 引言11-21
1.1 生物识别技术11-12
1.2 说话人识别概述12-19
1.2.1 说话人识别的基本概念12-14
1.2.2 说话人识别探讨的运用与前景14-16
1.2.3 说话人识别技术进展历史16-17
1.2.4 说话人识别近况17-18
1.2.5 语音特点参数提取办法18
1.2.6 说话人识别的主要学习对策18-19
1.3 实验环境19-20
1.4 论文的主要探讨内容20-21
第二章 语音信号特点参数提取办法21-342.1 语音的基础知识21
2.2 语音产生的原理21
2.3 语音信号预处理技术21-22
2.4 常用的特点提取办法22-31
2.4.1 语音的数字化处理22
2.4.2 端点检测22-26
2.4.3 预加重26-27
2.4.4 分帧加窗27
2.4.5 线性预测系数极为倒谱系数27-29
2.4.6 梅尔倒谱系数29-31
2.5 去噪办法31-33
2.6 小结33-34
第三章 说话人识别模型34-503.1 支持向量机(SVM)35-39
3.1.1 支持向量机原理36-39
3.2 隐马尔可夫模型(HMM)39-433.
2.1 HMM前向后向算法40-42
3.2.2 HMM的训练算法42-43
3.3 高斯混合模型(GMM)43-493.1 高斯混合模型的定义极为基本概念43-49
3.4 小结49-50
第四章 基于SOINN-GMM的增量学习50-684.1 自组织增量学习神经网络(SOINN)50-52
4.2 基于SOINN-GMM的增量学习52-60
4.3 增量学习高斯混合模型原理及推导办法60-62
4.4 利用高斯混合模型时遇到的不足62-66
4.1 高斯混合模型阶数不足62-64
4.2 协方差矩阵不足64-65
4.3 概率密度函数为0不足65-66
4.4 高斯混合模型局部最优不足66
4.5 小论文导读:结66-68第五章说话人识别体系与实验分析68-785.1实验数据与实验平台685.2说话人识别体系评估68-765.2.1实验特点参数68-695.2.2模型的训练69-705.2.3实验结果与分析70-765.3小结76-78第六章总结与展望78-80参考文献80-85致谢85-86上一页12结66-68
第五章 说话人识别体系与实验分析68-78
5.1 实验数据与实验平台68
5.2 说话人识别体系评估68-76
5.2.1 实验特点参数68-69
5.2.2 模型的训练69-70
5.2.3 实验结果与分析70-76
5.3 小结76-78第六章 总结与展望78-80
参考文献80-85
致谢85-86