【摘 要】
:
说话人识别和语音识别是涉及语音模式识别的两大并列研究课题。近年来,说话人识别系统主要是基于隐马尔科夫模型和高斯混合模型(实质上也是一种隐马尔科夫模型)的。说话人识
论文部分内容阅读
说话人识别和语音识别是涉及语音模式识别的两大并列研究课题。近年来,说话人识别系统主要是基于隐马尔科夫模型和高斯混合模型(实质上也是一种隐马尔科夫模型)的。说话人识别系统可以分为与文本有关、与文本无关和带提示文本的三类。本文对基于隐马尔科夫模型的与文本有关的说话人识别系统进行了比较系统的研究。凡是模式识别都包含三大研究课题:切分、特征抽取和用于训练和识别的模型。说话人识别也不例外,包含说话人语音切分、说话人的个性特征参数抽取和用于说话人训练和识别的模型(主要有隐马尔科夫模型和高斯混合模型)。本文就是围绕着三个方面对基于隐马尔科夫模型与文本有关的说话人识别系统进行讨论和研究的。语音切分方面,作者提出了一种改进的基于多线程技术的语音切分算法。说话人的个性特征参数提取一直是个研究热点。目前人们并不清楚哪些声学特征能够有效地描述说话人的个性特征,从而实现语义信息与说话人个性信息的分离。对此,本文尝试性地提出一种基于Fisher线性判别法则(LDA)的梅尔倒谱特征参数提取方法。本文还对隐马尔科夫模型进行全面的讨论,包括模型的基本思想、基本算法及应用中应注意的问题。实验结果表明,基于多线程技术的语音切分算法能够很好的满足系统的实时性要求;本文提出的特征参数提取方法能够显著提高系统的性能。
其他文献
本文通过将缺陷扣分法、加分法、预警机制等管理要素引入供方评价过程,为企业提供一套全新的动态扣分供方评估方法。希望通过该方法的引入,降低企业合格供方管理的成本,提升
随着茶饮料的发展,国内外越来越关注对速溶茶粉产品的研究和开发。主要介绍了速溶茶粉产品的保健功能、发展历史、类型,对速溶茶粉新产品研究和开发中存在的问题进行了探讨,
"河东"地域称谓承载了重大的历史文化内涵,该称谓经历了长时段的演变。商代是"河东"称谓的萌生期,指河济之间,与后来的"河东曰兖州"意义相同。后世常用的晋西南意义的"河东"
建立了四轮全向移动机器人的运动学模型和动力学模型,并分析了四轮全向移动机器人执行器的机械特性。在此基础上,利用反馈控制设计了四轮全向移动机器人的运动学控制器,利用
肥胖症的诊断及必要的检查稻寺秀邦等所谓肥胖即指体内过剩的脂肪组织蓄积状态.故肥胖的正确判定应以实测的体内脂肪量(率)作为理论依据。但准确且简便的进行体内脂肪量的测定并
在美国,管得最少的政府就是最好的政府——有限的政府观念深入人心,而教育更是宪法赋予国民的权利,公权在教育领域的能力是有限的,这样,各类教育组织、团体、协会得以充分发
拆迁房屋的合理性、适当性与公民既有房屋产权的安全性之间,应根据市场经济的性质达到应有的相称与均衡。然而,追求急剧做大企业的商人与“经营城市”追求政绩乃至个人利益的
从论述提高固定资产投资效益的重要性入手,对镇海炼化1994年改制以来固定资产投资情况进行分析;对固定资产投资所取得的良好经济效益和影响固定资产投资效益的主要因素进行分
本文基于汽轮机故障诊断及智能化电厂需求,根据汽轮机厂多年运维经验结合互联网、大数据平台开发了汽轮机厂独特的专家知识库系统。介绍了该系统整体功能、系统流程,并且说明