小语音库的语音识别及实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:SLANGELA
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的深入研究和广泛应用,语音识别技术已基本成熟并逐渐应用于人们生活中的各个领域。本文对中小字表孤立词和连续词语音识别系统进行仿真,从而对提高正确分割率和识别率的算法进行探索。 本文按照一个特定人语音识别系统的处理过程,从信号预处理(数字采样、预加重滤波、加窗分帧)开始,分别介绍了语音信号的基础知识、实用化模型、端点检测、特征参数提取、语音训练和识别方法,并对每个步骤可用的几种方法进行了对比分析。其中本文对传统的连续词端点检测分割算法,进行了改进,成功地提高了分割正确率。最终,根据所选参数和语音分割识别算法编制了一个特定人小词汇量语音识别软件。论文具体的研究工作为: 第一,研究语音信号的预处理和特征参数提取。内容涉及了语音信号的数字化、加窗处理、预加重滤波、端点检测,及时域特征向量和变换域特征向量。 第二,研究特定人孤立词和连续词分割识别算法,包括基于能量和过零率的端点检测以及分割算法,DTW识别法,HMM识别法以及神经网络识别法。 第三,分析比较端点检测和分割结果,对传统的端点检测和分割算法进行了改进,并提出了一种利用短时能量的图像特征,根据图像的波峰波谷而进行语音分割的新算法。经实验证明在特定的背景要求下,该算法取得了比较好的正确分割率。 第四,设计并实现了一个特定人孤立词和连续词识别系统。进行了相关实验,对实验结果进行了讨论和分析。
其他文献
数字图像处理最早出现于20世纪50年代,之后随着计算机的发展而发展起来。它主要是通过计算机来对图像进行处理分析和计算。然而数字图像数据量很大,其中包含很多不相关的信息
对于企业经营而言,生产管理的首要任务就是选择所要生产和销售的商品,然后通过选择合适的销售地点、产品价格以实现自己利润的最大化。从利润最大化的角度出发,生产者往往希望能选择一个最有利于自己的位置,同时这种位置的差异代表了产品的差异。企业通过降低产品价格可以增加市场占有,然而利润可能增加也可能减少,所以企业在定价时需综合考虑。同时在现实的市场竞争中许多信息是不可知的,故在不完全信息下的市场分析也非常重
变点检测是统计学研究的热点课题之一,有很多学者对正态回归模型的变点检测研究做出了不少成果.t回归模型是正态线性回归模型的推广,但它比正态线性回归模型具有更强的稳健性和
在本文中研究了与Yang-Baxter算子相关的三个主题:同态代数与q迹,Yang-Baxter代数及余代数的构造和量子B∞-代数,量子拟shuffle代数。它们是各自对应的经典对象的量子化,即用Yan
在multi-team博弈中,基于同一联盟中的参与人合作而不同联盟中参与人相互竞争以及参与人选取不同调整策略的假设,本文研究具有不同类型有限理性调整策略下的multi-team博弈的动
本文针对一个具有Ⅱ型功能反应函数的捕食被捕食系统,分别采用两种不同的方法保证了系统的稳定性。首先,采用模糊动态模型建模,通过模糊推理设计自适应模糊控制器,为了克服系
长期以来,目标高分辨定向技术作为阵列信号处理的一个重要分支,是国内外集中力量研究的重点。该项技术的突破对声纳、雷达、通讯、地质勘探、生物医学工程等多项国防和民用建设