基于ANN和HMM模型的口吃语音识别研究

被引量 : 0次 | 上传用户:bbben
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
口吃是一种言语疾病,随着人工智能的发展,计算机的普及以及智能医疗的需求,智能识别口吃类型逐渐被提到日程上来并具有重要研究意义。本文基于语音识别的基础,结合口吃语音的特点选择谱包络作为口吃语音特征参数,构建人工神经网络(ANN)和隐马尔科夫模型(HMM)实现口吃语音自动识别的过程。论文首先介绍了语音识别的基础及当前语音识别的发展情况,并分析了口吃语音识别研究的历史、现状与难点以及口吃识别分类的流程方法。本文构建的口吃语音库语音类别共有四种,分别为停顿语音,重复语音,拉长语音和流利语音,结合当前研究现状采取了两种手动切割方法获取口吃语音,对语音进行预处理,包括预加重、平稳性分帧,然后提取谱包络特征系数LPCC作为参数并采取灰色关联度算法和等部分划分方法进行规整。接下来论文详细讨论应用神经网络和隐马尔科夫模型进行口吃语音识别的分析过程和设计思想:神经网络选取三层感知器前馈结构,并采取误差反向传播算法对口吃语音进行训练和识别;隐马尔科夫模型选取从左到右的连续模型并建立了对应不同口吃类别的四个模型,应用Baum-Welch算法训练,其中采用了分段K均值算法优化,最后使用Viterbi算法进行识别。论文最后进行算法实现及实验,实验结果表明口吃类别的识别率较为理想。论文结尾总结了实验中的不足和存在的问题以及今后口吃识别的发展前景。
其他文献
随着对铁矿的不断开采,铁矿资源越来越少,这就导致开采中遇到的地形问题越来越多,其中急倾斜地下铁矿开采即为其中之一,本文将就急倾斜地下铁矿采矿方法进行相关探讨和研究。
概括了国内外企业理论中有关企业核心竞争力研究的主要成果并指出了其中的不足之处,进而明确了本文的研究方向,即,从两个方面展开对企业核心竞争力的研究,一方面从有关概念、
近年来我国公路交通事业快速发展,十二五期间高速公路总里程已突破12万公里,随着高速公路网络不断完善和延伸,建设高速公路的工程地形条件、地质条件等也更加复杂,跨海湾桥梁
当前,我国处于社会转型关键期和社会矛盾突显期。频繁发生的群体性事件则成了这一特定历史时期社会各种矛盾的集结点和导火线,已成为影响当前社会和谐稳定的重要因素。而且,
本文利用常规气象观测资料、EC、NCEP2.50×2.50的6h分析资料,着重从高层环流特征、水汽条件、热力层结条件、动力触发机制等方面对"7.20"吉林中部地区大暴雨天气过程进行综
中国古典园林风流千载,独具韵味,在世界造园史上具有不可忽视的重要地位,她那独特的造园理论与造园技艺,千百年来都让人们趋之若鹜,对于今日的风景园林规划设计也仍然具有十
对风花菜、肾叶打碗花两种优势耐盐饲用植物的形态特征、分布、生物学、生态学特征及经济价值进行了研究,有利于人们更好地认识、利用及保护植物。
以塔里木河流域为例,探讨了区域之间的水权配置流程,主要包括水权配置的准备、配置草案的拟定和配置方案的确定3个子程序。配置流程强调透明性、民主性和互动性。民主协商和
我国有色金属期货价格与股票价格相关性研究,旨在度量期货市场与股票市场之间的互相影响程度以及期货市场对股票市场的价格发现功能。本文通过格兰杰因果检验、Johansen协整
我国经济增长呈现出"两高一低"(高投资、高出口、低消费)的特点,中国逐渐成为全球第一大制造国。然而,面对新的国际背景,我国制造业发展面临巨大的国际压力,转型升级成为当务