基于含噪语音的说话人识别研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:vince_yang_666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术及移动互联网技术的快速发展,说话人识别作为一种特殊生物识别技术主要用于特定场合的说话人身份鉴定。该技术在司法鉴定、身份确认、军事国防、远程控制、信息安全等领域得到广泛应用,是模式识别和人工智能领域中的研究热点。在训练与测试环境均为干净语音环境下,说话人识别系统识别率较高,然而,受制于环境噪音,在实际应用中说话人识别系统的训练与测试环境不匹配,系统识别性能降低。因此,如何有效提高噪声环境下说话人识别系统性能成为了关键的研究点。本文主要对语音增强、特征提取等相关方面的内容进行研究,提出了一种非负矩阵分解优化算法,研究了深度学习用于特征提取的识别效果,以解决因噪声因素带来的不利影响,提高系统识别率。最后设计相关的图形用户界面完成语音信号录制和识别结果显示。本文主要研究内容如下:1.提出了一种非负矩阵分解优化算法。分析了谱减法和传统非负矩阵分解算法的优缺点,提出非负矩阵分解优化算法对含噪语音信号进行处理,得到具有较好语音质量的重构语音。结合各算法优势,将谱减法、非负矩阵分解算法以及非负矩阵优化算法的幅度进行加权融合,进一步增强算法泛化能力。实验证明,与传统语音增强算法进行对比,相同条件下非负矩阵分解优化算法的增强效果更优。与单一语音增强算法相比,融合算法在大多数噪音环境下具有较好的增强效果。2.提出了深浅层特征融合的特征提取方法。本文采用深度自动编码网络对含噪语音信号进行特征提取,基于深度置信网络的自动编码器能有效过滤语音中的噪声成分,挖掘浅层特征中隐藏个性信息的深层表示,将深层特征与浅层特征输入i-vector模型后进行分数级融合。实验表明与噪声环境下单一特征参数相比,融合特征能更全面地描述说话人信息,提高系统识别率。3.设计了基于MATLAB的图形用户界面。利用MATLAB自带工具箱和内置函数设计说话人识别平台界面。通过录制语音信号以及识别说话人对系统平台进行测试,结果表明平台具有较好的可交互性。
其他文献
P2P网络借贷是互联网技术和经济发展相结合的必然产物,对我国经济发展具有重要的意义,但是随着行业的发展不断深入,风险也随之加剧。究其根本原因是P2P行业的借贷利率定价不
随着医药卫生改革的不断深化与发展,目前军队医院财务管理和会计核算工作也面临着新的转变,军队医院财务管理和会计核算工作已经不能够满足目前新医改政策下医院财务方面工作
鉴于以往云制造资源的评价问题在评价指标体系和评价方法方面的不足,在制造业节能降耗的背景下考虑了云制造资源需求方和云制造平台运营商两个评价主体,建立云制造资源评价指
目的:探讨代谢综合征(MS)患者冠状动脉病变程度与MS各指标的关系。方法:选择吉林大学第二医院疑诊冠心病患者共225例,年龄在45~73(52.44±6.82)岁,并行冠状动脉造影检查。确
肝癌是威胁人类健康的一个主要的问题,每年有超过70万人被确诊患有这种癌症。在肝癌治疗过程中往往会出现耐药性问题,导致有效的治疗药物不断减小,到最后会出现无药可用的问
如今,社会的快速发展进一步带动了建筑行业的发展,建筑工程项目不断增加,对于建筑工程要求越来越高,在建筑工程中也引进了越来越多的施工技术和管理方法。但是就目前的情况来
自全球经济危机爆发以来,世界经济陷入低潮。美国、日本和欧洲,作为经济体量最大的地区,由于他们的需求量的降低,使得全球其他国家包括中国在内,出口额度随之大量减少。与此同时,更严峻的问题是制造成本的上升。原材料、能源、土地、劳动力成本的增加,使得我国制造业丧失了一直以来的产品价格优势。低成本是中国制造企业的竞争优势之一,正是凭借着价格低的土地、资源和劳动力,才吸引了其他国家来中国投资建厂,中国目前正在
研究目的本研究的目的是界定医疗机构整合概念,总结提炼医疗机构整合的基本路径,探讨医疗机构整合的可持续发展条件,并初步构建医疗机构整合效果评价框架,从而为我国医联体建设和评价工作提供实践和决策参考,为相关研究拓展思路。研究内容本研究从政策文件、科研文献和具体案例分析三个角度,提出我国医疗机构整合的概念性定义和操作性定义,梳理我国医疗机构整合路径并加以总结和提炼,进一步探讨医疗机构整合的可持续发展条件
目的:分析胸腰椎爆裂骨折后路撑开复位间接减压内固定术后椎管内骨块吸收回纳与临床因素之间的关系。方法:本研究共纳入61例无脊髓神经损伤症状的胸腰椎爆裂骨折患者。所有患