基于高斯混合模型的说话人识别算法研究

被引量 : 0次 | 上传用户:aulifo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类获取信息的主要来源之一,也是最方便、最有效、最自然的交流工具。说话人识别技术在近三十多年的时间里取得了很大的进步,这种技术的应用为人类的日常生活带来很大的便利。本文构建了一个基于高斯混合模型的说话人识别系统。在完成了多项基本性能的测试和比较的基础上,对模型参数初始化和系统判别中的某些环节进行了改进,提高了系统的识别率。本文的工作主要有以下几个方面:(1)系统构建:采用C++和Matlab混合编程方式,并在VC++6.0的环境下架构了基于高斯混合模型的说话人识别系统。包括声音读取和采集模块、预处理模块、特征参数提取模块、参数训练模块和识别模块。(2)性能研究:主要研究了特征选取和高斯混合模型参数选择对系统性能的影响。在特征参数提取方面,研究了LPC、LPCC、MFCC三种主流特征参数,实验表明,采用MFCC特征参数比采用其他两种特征参数有更好的识别效果;针对高斯混合模型,研究了模型的阶数对系统识别率的影响,分析了阶数过大或过小对系统的负面影响,并结合实际情况进行了选择;提出在EM算法的迭代过程中设置协方差阈值,并对不同阈值条件下的识别率进行实验对比,证明了将协方差阈值设置为0.1的普适性和可行性。(3)系统改进:考虑到少量的孤立点数据就会对K-均值算法的聚类结果产生很大的影响。因此,提出了聚类均值点与聚类种子相分离的思想,并对K-均值算法进行了相应地改进。实验表明,改进后的算法比传统K-均值算法具有更高的准确性。同时,采用三角不等式原理,解决了K-均值算法的时间开支问题;在识别阶段,由于说话人的个性特征时长变动性以及受到噪声等干扰的影响,某些语音测试帧对于非目标模型的得分反而大于目标模型,从而导致误判。因此,针对系统判别准则中常用的传统概率打分法,提出了对语音帧得分进行加权的改进方法,并验证了该方法的有效性。
其他文献
民事执行制度的改革与完善是历届全国民事诉讼法学研讨会的重要议题之一。中国民事诉讼法学研究会2016年年会的主题为"民事执行的理论与立法研究"。与会专家学者围绕制定《强
中国民事诉讼法学研究会每年举办一次年会,较为集中、全面地研讨一段时期内民事诉讼法学的热点、重点与难点问题,从某种意义上讲,它体现了该年度我国民事诉讼法学研究的总体
能源是为人类的生活和生产提供各种动力的物质资源,掌控着国家未来的命运。我国土地辽阔,各地能源分布不均,管道运输解决了这一问题,使各地能源的供应得到了保障。焊接以及法兰连接是管道传统的连接方式,虽然优点很多,但是由于其自身缺点所造成的功能失效也不容忽视。为解决管道传统连接方式的不足,各国专家学者探索其它的管道连接方式,形状记忆合金管道连接件便是其中一种。形状记忆合金具有超弹性、形状记忆效应、高阻尼及
目的描述2002年中国人群的饮食行为、体力活动和体重指数(BMI)的流行水平,以及在不同教育水平、职业和地区人群中的分布。方法应用17个问题,利用2002年普查人口进行加权,计算
由于煤层气田"低产、低压、低渗"和地区地形复杂,相对高差较大的特点,不同程度地加大了工程设计与建设的难度,开采与输送成本相当较高。通过对煤层气田集输工艺特点的详尽分
雨水泵站是京沪高铁无锡东站站区市政配套工程的重要组成部分,用于将站区南北下沉广场、高铁大雨篷的雨水提升排放至站区外河道,本工程共设雨水泵站4座,通过合理的设计,使雨
主要介绍FORTRAN语言在边坡稳定计算中的应用。毕肖普法是众多边坡稳定计算方法中较为考虑周全的一种。毕肖普法的最大优点是考虑了条间力与孔隙水压力的作用,但是其计算过程
介绍了西江引水工程泵站级数、取水泵站及配水泵站的设计情况,对二级和三级泵站加压方案中管道运行压力、经济性及系统控制复杂性进行了分析。泵站级数采用二级,设置取水泵站
我国虽有《中华人民共和国食品安全法》,但没有"从农场到餐桌"的整个食物链综合管理的法律。随着社会、经济和科学技术的发展,人民生活水平的不断提高,也需要进—步完善现行
渤海在新生代经历2次强烈的沉降阶段,海域内各断裂活动对渤海盆地的演化发育产生重要影响。以渤海40°N以南海域单道地震资料为基础,对研究区内断裂活动性进行研究,结果表明: