基于HMM连续语音识别中关键技术的改进算法研究

被引量 : 0次 | 上传用户:engcourse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类最自然、最方便的交流工具。在现场交流中,它传播速度快,可以在黑暗中便捷的传播,是图片、文字或者按钮等其他视觉、触觉信息无法替代的工具。随着计算机技术的发展,和计算机进行语言交流,使之理解人类语言成为人们的梦想和追求,而实现它的首要前提是使机器能够识别人类语言,即语音识别。语音识别技术已取得巨大成就,形成了隐马尔可夫模型(HMM)等有效识别技术,但语音识别仍存在着一系列问题亟待解决与改进,如对环境和说话人的自适应性、抗噪声干扰性、声音模型和语言模型的完善化、训练工作量和识别速度的优化等。本文以提高语音识别对环境的适应性及优化识别算法为主要目的,基于现代信号处理理论提出了一些新算法和新方案。主要内容和创新性成果如下:1.分析了语音识别技术的现状和现有理论,并指出存在的不足。2.为了降低语音信号特征参数求解算法的复杂性,针对基音周期,本文提出了利用变长短时自相关函数和变长短时平均幅度差函数计算。这些方法通过降低加、乘法计算次数来减少计算量,原理上也体现了数学中滑动平均的思想。仿真实验结果表明,与原有的短时自相关和短时平均幅度差函数方法比较,新算法在估计准确率相同的情况下,可节省50%的计算时间,大大提高了算法的效率。3.针对线谱频率参数,本文分析了求解原理和计算过程,提出先求的根来确定参数的所在区间,然后再利用二分法进一步迭代缩小区间的新算法,相较于固定步长的算法,迭代次数要少很多。仿真实验及分析表明,新算法与其他三种传统算法相比,各种运算次数明显减少,乘法运输量仅为其他算法的13%~58%,且更加易于工程实现。4.语音端点的检测是语音识别的一个重要组成部分。传统的基于能量或过零率等特征的语音端点检测,在强噪声环境下,往往不能达到理想效果。实践表明直接通过人眼对语音波形图或频谱图进行端点检测往往比使用传统的自动检测方法更好,所以用图形处理替代人眼识别可得到一种新的端点检测方法,实验表明该方法效果良好。5.针对HMM方法的训练经常趋于局部优化的缺点,提出采用禁止搜索算法进行HMM识别的全局优化。利用禁止搜索算法的短期记忆、广义启发的全局搜索特点,使HMM模型参数达到全局优化,论文给出了禁止搜索算法作用于HMM的详细步骤,统计仿真实验结果表明,TS-HMM能更好的达到全局最优。
其他文献
2011年,全球对外直接投资(FDI)流量达到15086亿美元;中国吸引FDI流量1160亿美元,对外直接投资(ODI)601亿美元。~1由跨国公司主导的国际贸易和世界经济正在加快复苏,世界和中国
运用SWOT分析法对我国高校手机图书馆发展的优势、劣势、机会、威胁四个维度进行具体分析,并在此基础上提出相应的发展策略与建议。
随着知识经济时代的到来,全球经济与科技都在飞速发展,面对瞬息万变的经济环境,现代企业越来越重视人力资源在企业管理中的重要作用。随着社会主义市场经济体制的不断完善与
在职业学院语文教学过程中,自主性学习是其必不可少的组成部分和艰巨重大的教学任务,具有非常重要的现实意义和极其深远的历史意义。许多职业院校在这方面也做了大量有益的理
托·斯·艾略特(1888—1965)是二十世纪英美文学史上最重要的诗人之一,同时也是有极大影响的文学批评家。他提出的“非个性化”和寻找“客体关联物”的创作手法对于现代西方
兴趣是人们主动积极从事某种活动的原动力,也就是说,人们之所以热衷于某项活动,是兴趣使然。具体到小学生的数学学习中也是如此,教师要想让学生热爱数学学习,并且自觉主动地
本文目的是探讨非典型抗精神病药物所致恶性综合征(NMS)的临床特征,为临床早期诊断和治疗提供参考。抗精神病药物所致NMS是一种严重的药物不良反应,几乎所有的抗精神病药物均
[目的]评价术后乳腺癌患者焦虑、抑郁和生活质量状况。[方法]采用一般调查问卷、生活质量测定量表、焦虑自评量表和抑郁自评量表对116例术后乳腺癌患者进行问卷调查。[结果]
留守儿童存在以自我为中心,学习缺乏自觉性、积极性以及交际少、自我封闭等心理特征突出的问题,针对这些问题,我在教学中有针对性地开展教育,将爱心、诚心、信心、耐心、真心
在我国绿色电力证书交易市场中,定价机制对绿色电力证书交易市场功能有重要影响。在可再生能源绿色电力证书核发及自愿认购交易制度框架下,本文分析了我国绿色电力证书价格的