基于神经网络的语音识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:gisbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术具有重要的理论价值和广阔的应用前景,近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善,人们越来越希望让机器能够理解人类的自然语言,这种需求使得语音识别技术有着十分广阔的发展前景。一直以来,语音识别研究大部分以线性系统理论为基础,主要包括应矢量量化(VQ)、动态时间规整(DTW)与隐马尔可夫模型(HMM)等技术。然而,人的发音实际上是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性渐渐显示了出来。语音识别技术若要取得突破,就必须引入非线性理论的方法。近年来,人工神经网络(ANN)等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。本文对语音识别的主要过程进行了详细的介绍。在语音的特征参数提取阶段,本文着重介绍了实际应用中经常使用的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)等。本文主要研究了基于BP神经网络的语音识别,并提出了基于MFCC与LPCC混合参数的语音识别方法,以更好地表现语音的特征,避免传统的分段线性处理所产生的局限性,提高了识别性能。实验结果显示,该方法比传统的MFCC参数的语音识别方法具有更好的识别性能。本文还对识别系统中的BP神经网络进行了优化,改进了性能,缩短了训练时间,为将来移植到嵌入式系统中打下了良好的基础。
其他文献
提出了一种基于图像处理技术的自动测量系统,介绍了其基本组成结构和功能。用C++语言编程,实现了对微小尺寸的自动测量。大量的实验结果表明该方法能够有效规避人为因素引起的测量误差,测量精度可以达到0.005mm。对实际测量中的效率和准确性都有很大程度的提高。
1.目的:随着社会的不断进步,人们生活水平的不断提高,肥胖人数急剧上升,肥胖不仅给生活带来诸多不便,影响身心健康甚剧,且易导致高脂血症、糖尿病、冠心病及脑卒中等并发症。
计算机技术的应用和发展是二十一世纪时代变革的重点,随着科技的不断进步,社会诸多行业对专业技术过硬、动手实践能力强的计算机人才需求逐步扩大,这就需要各类学校对计算机
口腔颌面外科手术,尤其是正颌外科手术,主要针对面部骨性形态异常的患者,其目的不仅要改善功能,而且要恢复美观、悦人的外貌。为了获取最好的手术效果,需要在手术前选择一个
随着社会信息技术的迅速发展,我国的很多行业逐渐取得了很大进步,先进的计算机技术已经被广泛应用于各个领域中,在其中发挥着重要作用。
本文介绍了因材施教的定义及意义,并从教学形式、教学目标的设定、教学方法及手段、考核评价方式等方面研究了因材施教在"民汉一体化"课程中的具体实施过程。
美育是素质教育的一个重要组成部分。“美可启智、美可辅德、美可健体、美可促劳”,它是实现历史学科价值,彰显历史社会教育功能的重要体现。在新一轮基础教育课程改革中,美
摘 要 目的:了解上海松江區小学生跌倒伤害流行病学特征和影响因素,为开展相应干预措施提供科学依据。方法:采用整群抽样方法,抽取松江区4所小学3 715名小学生为研究对象进行问卷调查,其中男生1 928人,女生1 787人,平均年龄10.3岁。由学生和家长共同完成问卷,分析小学生的跌倒伤害的现状和影响因素。结果:上海松江区小学生跌倒伤害发生率为10.9%,男生(OR=1.370,95%CI:1.10
中风后抑郁障碍(post stroke depression,PSD)是指脑卒中后出现的抑郁状态,表现为情绪低落,自责自罪,兴趣减低等临床症状。是脑血管疾病常见的并发症之一。PSD对中风后临床症