基于FISHER品质的中文姓名语音识别技术

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:arllar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前广泛使用的语音识别算法包括矢量量化(Vector Quantization, VQ),高斯混合模型(Gaussian Mixture Model, GMM),隐马尔可夫模型(Hidden Markov Model, HMM)等。这些经典的语音识别算法是基于模式匹配的方法实现,这使其在语音分类中的性能受到挑战,尤其是在对相近的中文姓名语音的分类中。近年来提出的支持向量机和上述模型有根本的区别,其本质是一种判别式模型,因此对于相近模式有较强的识别性能。经典的语音识别模型能够对不定长语音建模,而支持向量机具有更强的分类能力,因此如果能够将二者结合起来,则可能充分发挥它们的优点。支持向量机中使用的核方法为我们提供了途径。Fisher核的提出首次实现了将概率模型与支持向量机等判别式分类器相结合,并应用于生物同源性检测中。Fisher核中的关键参数,即Fisher品质(Fisher score),表示了待分类模式通过概率模型提取的特征向量。本文就是试图通过语音识别中的概率生成模型(GMM, HMM)推导Fisher品质,并将其用于语音识别。Fisher品质可以将不定长语音特征序列映射到固定长度的品质空间,作为支持向量机分类的特征空间。本文对语音识别的经典算法(VQ, GMM, HMM)进行了比较深入的考察,并开发了基于PC的姓名语音身份验证系统。算法之间的联系为推导Fisher品质提供了方便,因此本文首先从简单的GMM入手推导Fisher品质,再过渡到通过HMM求取Fisher品质。对于从HMM求取Fisher品质,本文从HMM的训练算法中用到的前向-后向变量入手,利用这些变量表示模型最终输出概率,并且将其转换为矩阵形式,为推导和理解提供了方便。基于对Fisher品质的本质作用的分析,本文对Fisher品质空间做了扩展,在扩展品质空间中引入了新的品质向量。并从泰勒级数展开式的角度论述了各类品质向量的物理意义的不同,最后通过实验验证了扩展品质空间有利于分类性能的改善。本文通过对经典语音识别模型的实验,比较了不同算法的性能,揭示了生成模型在对相近语音,特别是相近中文姓名语音的识别中具有较高的误识率。通过利用线性和非线性支持向量机分类的实验,验证了Fisher品质空间及扩展的品质空间是有效的特征空间,通过将生成模型与支持向量机相结合,可以提高对相近
其他文献
随着我国冶金行业的快速发展,经济有效的利用低品位有色金属资源,对我国的可持续发展具有重要意义。作为提取冶金的两大技术之一,湿法冶金的显著优点在于对原料中有价金属综
表面三维形貌检测是获取零件表面形态特征的一种重要手段,也是记录、比较和复制物体形态特征的基础,它在机器视觉、自动加工、工业检测、产品质量控制和生物等领域具有重要意
本文选择冷连轧机负荷分配优化计算为研究课题,深入研究了本钢1850mm冷连轧机负荷分配的实现方法,并针对其缺点与不足,提出了新的负荷分配优化算法,取得了一定的成果。 利用了
国内电熔镁砂的生产一般采用低电压高电流的埋弧炉进行熔炼,电能消耗巨大,属于高耗能行业,在企业的生产过程中,电能消耗波动较大,很容易对当地电网造成冲击,按照规定,当地供
视频序列分析是机器视觉领域中的一个十分活跃的分支,它的一个土要应用就是视频序列中运动目标的检测、跟踪和识别,利用视频成像技术获得目标序列图像,再从序列图像中分割出运动
对于解决无委托板坯匹配问题,本文设计了一个启发式算法。其思想是采用分组的策略降低问题的求解规模而不影响解的质量,然后对合同和板坯进行优先级排序。按照合同优先级从高到
给出了蒸汽发生器检修用机械手的控制系统的设计,软件系统和硬件系统的设计方案,分析了控制系统功能。 给出了机械手的运动学求解方法。该机械手虽然是六DOF机械手,但由于其
盲信号分离在信号处理领域中日益显示出其重要性,而独立分量分析是其中的重要组成部分。由于现实生活中信号十分不规则,目前提出的算法大多只能针对某类信号分离,鉴于目前在I
目前,在中间包钢水连续测温时,复合黑体空腔钢水连续测温传感器得到十分广泛的应用。传感器采用双套管的设计结构,这严重影响了传感器的响应速度和稳定性,内管会在高温下发生
随着汽车工业的发展,人们对于高性能轮胎的需求越来越旺盛,这就对轮胎生产企业的产品质量提出了更高的要求。挤出机是轮胎生产线的关键设备之一,在众多工艺影响因素中,熔体温