【摘 要】
:
现今,运用语音技术越来越来方便人类的生活。语音技术经常被用于听写、交互和识别。同时语音技术属于生物识别认证中的一种。说话人识别是语音技术中一种较为常见的应用形式。使用识别系统比对识别提取的特征参数,进而能够准确地识别说话者。本文以非特定人文本内容无关的说话人识别为研究对象,针对常见的系统做出改进,在不增加识别的时间的前提下,有效提高了识别的准确率。本文所做工作主要包括:(1)针对说话人识别特征参数
论文部分内容阅读
现今,运用语音技术越来越来方便人类的生活。语音技术经常被用于听写、交互和识别。同时语音技术属于生物识别认证中的一种。说话人识别是语音技术中一种较为常见的应用形式。使用识别系统比对识别提取的特征参数,进而能够准确地识别说话者。本文以非特定人文本内容无关的说话人识别为研究对象,针对常见的系统做出改进,在不增加识别的时间的前提下,有效提高了识别的准确率。本文所做工作主要包括:(1)针对说话人识别特征参数进行了优化。常用的特征参数为LPCC和MFCC参数。MFCC依据人耳听觉特性,包含了语音频率结构的时间变化信息,具有更好的鲁棒性,所以更多的被使用。然而MFCC易被模仿,因此,我们添加了一个常见的语音特征参数——基音周期到说话者识别系统中。基音周期包含有关语音频率结构的信息,不容易模仿。故将MFCC和基音周期二者结合,在不影响识别时间的前提下,实现了说话人的识别率的提升。(2)针对说话人识别模型进行了优化。常见的语音识别体系中通常采用高斯混合模型,然而单一的高斯混合模型识别的数据量通常很大,导致识别时间过长。本文针对识别时间和识别率联合做出优化。提出一种新的思路,先用DTW计算语音样本间基音周期的最短距离,同时用GMM的识别方法计算需要测试的语音的梅尔倒谱系数。这样运用两个模型的识别结果共同进行判断,使得识别结果更准确;算法同时对DTW采取放宽端点限制的优化方法。实验表明,这种DTW和GMM相结合的说话人识别模型在提高识别准确率和减少识别时间方面有了明显的改进。
其他文献
目的:观察健脾平肝汤结合电疗、耳穴治疗儿童抽动秽语综合征的临床疗效。方法:将96例抽动症患儿采用随机数字表法随机分为2组,治疗组50例给予健脾平肝汤结合电疗、耳穴治疗;
从深度传感器中获取的人体三维骨骼节点信息,由于其数据量较小而且数据形式相对简单并能完整表达人体的动作信息,从而引发了人们对基于骨骼节点的行为识别方法的深入研究。虽然现存的很多基于骨骼节点的行为识别方法取得了很好的识别效果,但暴露的问题依然很多。首先,现存的大多数研究行为识别方法通常是从全局考虑人类行为,而人体四肢这些局部区域却对人类行为的预测起着重要的作用。其次,因为人体行为的改变是一系列节点相互
多环芳烃(PAHs)是环境中普遍存在的一类持久性有毒有机污染物。大量研究证实,多环芳烃具有慢性毒性和致癌、致畸、致突变的“三致”作用,已引起各国环境科学工作者的广泛关注
根据比较优势理论,运用显示比较优势法并结合成本分析进行综合比较中国与其他主产国及其周边国家大豆的比较优势,从中得出启示,并提出相关建议.
以往关于亩产量的研究方法存在较多弊端,影响了研究成果的可靠性。根据中国传统农学关于农业生产取决于"天"、"地"、"人"三大要素的经验总结,可以用一种新的方法对1823—1833
目前,三峡库区大多数工业企业的废水经简单预处理后,直接排入市政排水系统,与生活污水合并共同处理。由于工业废水成分、性质的复杂性和多变性,且多数工业废水存在有毒有害物质,大
自我延迟满足是自我控制的核心成分,对幼儿的社会性发展有着深远的影响。幼儿的自我延迟满足能力可以在一定程度上预测个体在成长过程中各个阶段的人际交往能力和社会适应能力。但是研究表明,由于家长的溺爱和过度保护,我国一些幼儿呈现出任性无助、依赖性强和自我延迟满足水平较低的特点,这些特点反映了在学前阶段应该重视自我延迟满足水平的培养。5-6岁的幼儿自我延迟满足发展水平趋于稳定,而且能灵活运用一些延迟策略。因
机械化和信息化是现代物流的两条支柱,就像人的两条腿,只有协调发展,才能实现物流的高效运转。西方国家物流企业完成了机械化之后,迅速步入信息化,并正在向智能化方向发展。
介绍了应用于单片机矩阵键盘扫描原理,在行列扫描原理基础上通过配对行列扫描结果并进行"或"运算的编程方法,在C语言环境下,通过if语句实现矩阵键盘任意编码的目的。