噪声环境下说话人特征参数提取算法研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:sdliule
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术属于生物特征识别技术的范畴,也是目前最热门的生物特征识别技术之一。随着互联网的进步和人工智能的兴起,说话人识别技术在实际生活中的各个领域都有广泛的运用。说话人识别技术中特征参数的提取和建立识别模型是整个说话人识别系统的两个关键部分,其中说话人语音特征参数的提取是整个系统中最为关键的一部分,直接影响到说话人识别系统整个性能的好坏,是许多科研学者在这方面研究的重心。由于目前很多应用都是基于比较理想的环境下进行的,常用的一些主流说话人特征参数都能达到比较高的识别率。然而,在实际应用中,获取语音周围的场景是在复杂的、非理想的环境中进行的,此时用常用的特征参数提取算法在这种非理想的环境下会导致说话人识别系统的性能明显下降。因此,论文主要针对噪声环境下说话人特征参数提取算法进行研究,在分析了目前主流的特征参数的基础下,论文提出了几种改进说话人特征参数的提取算法,在仿真环境以及在Android移动客户端进行实际环境下的系统验证。实验结果表明,论文提出的新的特征参数提取算法相较于传统的特征参数提取方法,说话人识别系统性能有一定的提升,鲁棒性更好。论文的主要论述内容如下:(1)详细介绍了一种汉明自卷积窗的实现过程,语音预处理过程中采用汉明自卷积窗,减少频谱能量泄露,有利于后面说话人特征提取。(2)总结了目前说话人特征参数的几种表现形式,详细的介绍了基于梅尔滤波器组的梅尔倒普特征参数的提取算法以及基于Gammatone滤波器组的听觉特征参数提取过程实现。(3)提出了一种基于Gammatone滤波器组的改进方法的特征参数提取算法以及两种组合特征参数的实现方法。两种实验表明,在噪声环境下本文提出改进特征参数和两种组合特征参数在说话人识别系统中表现良好的识别性能和鲁棒性。论文最后对论文中提出的改进说话人特征参数算法作了分析与概括,并指出论文中存在的不足之处。此外,针对论文存在的问题,指明改进方法以及未来课题的研究重心。
其他文献
本文研究传统媒体与新媒体的优劣,思考传统媒体与新媒体融合的基本方向和具体实现举措,从人才培养、体现本土特色、强化沟通四方面入手进行总结,以供参考。
文章旨在通过分析初中信息技术课面临的问题,探讨解决的方案,力争在课堂上激发学生学习兴趣,从而逐渐增强学生的动手能力和实际操作能力,让学生在课程中真正找到信息技术实用
建设于堆积体上的溢洪道,因堆积体的特性使得其下地基具有承载力低、稳定性差、沉降量大且不均匀等弱点。泄槽段地基的不均匀沉降引起的底板拉裂、沿横缝处错开等均会在高速
<正>2元一斤买来的普通豆腐,经过简单加工后便成为"极品香豆腐",转手就卖6-8元,而且非常热销。杨长兴专做饭店生意,批发日售300斤,纯利近千元;曾爱丽、窦朝霞打包按份卖,一天
期刊
目的:以退休人员社会支持、自尊及心理健康的现状为基础,分析社会支持、自尊和心理健康之间的关系。方法:本研究采用社会支持评定量表、自尊量表、老年抑郁量表、费城老年中
目的:采用紫外吸收光谱法研究奥扎格雷与牛血清白蛋白(BSA)之间的相互作用。方法:将奥扎格雷与BSA溶液按一定比例混合,考察不同pH、温度、反应时间、药物用量对其相互作用的影
按照磺胺间甲氧嘧啶-恩诺沙星2ml(含磺胺间甲氧嘧啶0.1g,恩诺沙星0.05g)试验剂量,对20只大白鼠进行腹腔注射,常规饲养8d未见任何死亡,故测得大白鼠对该药物的最大耐受剂量(MTD)大于0.5g
本文以台湾问题白皮书官方英语译文中所犯的错误为例,说明在翻译中应当理解每一个句子、短语和词的真实含义以及它在上下文中所起的作用,善于发现和解决疑点,避免难以理解的逐字
作为国家中小学教育质量综合评价改革实验区,长沙市于2014年启动中小学教育质量综合评价改革。在《中国学生发展核心素养》思想指导下,长沙市结合当地教学实际编制了《2018长
目的:对超声应用于甲状腺肿合并甲状腺癌诊断中的临床价值进行分析。方法:选取112例结节性甲状腺肿合并甲状腺癌患者进行观察,所有患者均接受超声检查和病理学检查,根据病理