噪音环境下的说话人识别

来源 :成都理工大学 | 被引量 : 1次 | 上传用户:cjc013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号处理技术是信息社会不可或缺的技术,说话人识别是语音信号处理的一个重要研究领域。说话人识别研究历史较长,仍有许多问题有待研究解决,噪音环境下的说话人识别即是其一。本文研究噪音环境下说话人识别的方法技术。 全文共分六章。第一章,研究背景;第二章,语音信号处理基础;第三章,语音增强;第四章,语音信号的端点检测;第五章,说话人识别和特征参数提取;第六章,基于隐马尔可夫模型的说话人识别;最后是结论、建议与致谢。 通过对语音信号处理和说话人识别的系统学习和研究,取得了以下成果: (1)提取出语音信号的美尔倒谱和一阶差分美尔倒谱参数。 (2)应用减谱法的原理,通过对噪声统计分析,实现了对输入语音信号的增强处理,提高了语音的清晰度和可懂度,接近还原出原始语音信号。 (3)通过对噪声特性的分析,设计了自动识别背景噪声的端点检测方法,并提出了基于子带减法的带噪语音端点检测算法。自适应区分准静音环境和噪音环境,并检出字或词组的语音序列。 (4)设计了识别系统中使用的隐马尔可夫模型的数据结构,应用自左至右和各态历经两种隐马尔可夫模型实现了说话人识别,并对两种模型使用了相同的数据进行训练和测试,对每一种模型应用不同长度的训练和识别数据,测试了得到理想识别结果最短训练和识别数据长度。
其他文献
学位
论文课题源自于中科院物联网中心合作的无线宽带监控及信息传输项目,结合边疆特点,实现链状无线宽带传输设备研制和监测信息传输。本文研究了无线宽带传输设备中的核心模块—
本文通过对荣华二采区10
期刊
随着后基因组学时代的来临,生物科学的研究也从单个基因功能的研究转向了同时对多个基因甚至整个基因组的研究。整合生物学(Integrated Biology)和系统生物学(Systems Biology
学位
本文从中小型软件企业的实际情况出发,以CMMI 为过程框架,结合GQ(I)M 理论,引入并应用SPC 技术和数据拟合的方法,将软件过程信息量化,使软件企业更加清晰、高效的理解、控制
随着智能终端和移动互联网的高速发展,爆炸式增长的移动数据业务量给移动网络带来了巨大的压力:不仅迫使空中接口技术不断革新,也推动了移动网络部署的转变,即由过去的全部由
在以金融控股公司为主要混业经营形式的背景下,券商在经纪、投资银行、自营和资产管理业务等方面都将受到一定的冲击,各业务发展将出现新的格局,券商应着力于提高各业务核心
程序性死亡是由基因控制,细胞主动、有序的死亡方式。Metacaspases作为caspases-like蛋白酶可能在植物细胞程序性死亡(PCD)中扮演重要角色。前期研究表明,小麦颖果腹部维管组织韧皮部筛分子(Sieve elements,SEs)的发育属于一个特殊的PCD过程,成熟的SEs具有正常细胞活性,并且担任养分运输功能。本实验对小麦颖果SEs发育过程中PCD特征,以及该过程中II型meta
电视制导是现代战争中应用较为广泛的一种精确制导方式,它建立在视频信号实时传输的基础之上。传统电视制导系统在传输中使用模拟视频信号,所需带宽较宽、易受干扰;硬件复杂、体
近年来,多传感器信息融合(数据融合)在军事和民用领域都引起了强烈的关注,并得到了广泛的应用。目前世界各军事大国竞相开始投入大量人力、物力和财力进行信息融合技术的研究,安