非特定人连续语音识别的理论、分析和实验

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:chyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非特定人连续汉语数字语音识别在电话语音网关、家电遥控、工业控制、信息查询系统等领域有着广泛的应用,无论在小词表语音识别系统还是大词表语音识别系统中都具有重要的理论意义和实用价值。由于汉语具有发音短、混淆性高、方言多的特点,汉语数字语音识别比英语数字语音识别难度更大,成为目前汉语语音识别领域的热点和难点问题。 以隐马尔可夫模型为典型代表的统计方法,对动态时间序列有很强的建模能力,在参数、结构和训练方法的选择上有很大的灵活性,成为目前主流的语音识别方法。然而,由于隐马尔可夫模型是基于统计的方法,模型的训练需要大量的样本,采集样本和训练模型的工作量大,对样本数据的信息利用率不高;出现概率少的样本容易得不到充分的训练而引起误识。 本文主要研究连续汉语数字音节的建模问题,提出一种新的人机结合的数字音节特征提取方法,从连续数字语音中提取出建模和测试用的数字音节样本集,把高维空间点覆盖理论应用于非特定人连续语音识别,建立各数字音节的高维空间点覆盖神经网络模型,并使用测试集进行建模正确性验证,验证结果正确率达到97%以上。该模型用于一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识
其他文献
在生物质发酵现场,对生物燃气的检测包括对其组分变化的在线监控和组分信息的准确分析。通常,生物燃气组分检测采用化学分析和光谱分析等方法,这些方法存在操作繁琐、检测成
网络考试作为一种新的考试手段,将现代远程教育和传统教育的优势结合,提高效率,节省资源。为了保证学生在网络条件自主考试的公正性,本文提出一种基于虹膜识别的网络考试系统
本文的主要研究内容是电话转接系统中的语音识别引擎。语音识别技术是电话转接系统能否实现智能化服务的关键。文章阐述了将声学模型的生成过程和词表分离开,用HTK和大量连续
  从20世纪50年代技术创新推出了螺杆式塑料注射成型机至今已有50多年的历史。本文对大型注塑机电脑控制系统设计进行了研究。文章探讨了注塑机控制系统主控板的硬件设计方
  立体视觉是从多幅摄自不同视点的图像通过匹配获取场景三维信息的技术,虽然已经有了许多不同的匹配算法,但是要同时准确高效的获取深度信息仍然是一个难题。  本文提出了
车联网技术连接车与车、车与道路、车与后台监控终端,实现汽车的控制、调度、管理和故障诊断及辅助驾驶等,是未来汽车技术的发展趋势。  在车联网技术体系中,连接车内网和
灵活交流输电系统(FACTS)是电力电子技术在电力交流输电系统中应用的一个重要方面,而统一潮流控制器(UPFC)能分别或同时调节输电线路的电压、阻抗和相角以及对线路的有功和无功潮流进行快速、有效的控制,是一种最灵活的FACTS控制器。论文介绍了UPFC的结构、工作原理、数学模型、应用研究进展等。 作为一多输入多输出(MIMO)系统,UPFC各控制通道间存在交互影响,严重时会导致系统失去闭环稳
本论文的研究工作以现代信息社会为背景,以网络技术和智能主体技术为基础,探索了信息资共享的理论、方法与实践途径。首先研究了信息、信息管理以及信息资源共享的相关理论;然后
车牌图像自动识别系统是计算机视觉和模式识别技术在智能交通领域的重要应用,在车牌识别的过程中存在着大量的不确定信息。粗糙集理论以信息系统为研究对象,能有效地分析和处
随着分布式计算环境日益普遍,开发分布式数据挖掘算法变得日益重要。在实际的挖掘过程中需要有效地利用约束条件来提高挖掘效率。本文主要研究讨论在分布式环境下基于约束条