非母语英文字母识别、汉语数字识别及其应用系统研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:BBQChris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非母语英文字母、汉语数字语音识别同属小词表的语音识别,对它们的研究具有重要的实用意义。尽管语音识别技术已经取得了很大进展,但由于英文字母自身存在严重的语音混淆现象,以及非母语语音的变异性太大等原因,目前的语音识别算法精确识别非母语英文字母仍然十分困难,识别效果达不到可实用水平。汉语数字识别,虽经过多年研究在PC平台和实验室条件下取得了高性能,但在具有广泛应用价值的嵌入式平台实现上,仍有许多工作需要做。本文首先探索性地研究了非母语英文孤立字母语音识别,然后针对实用需要对汉语孤立数字及数字连接串识别系统进行了研究,设计实现了基于嵌入式平台的汉语数字识别系统。 我们在讨论英文字母识别的主要技术和困难的基础上,实现了一个基本的英文字母识别系统,该系统采用了MFCC参数,使用了决策树方法建立上下文相关的基于音素单元的HMM声学模型及基于Viterbi帧同步算法进行识别搜索。我们还采集了一个非母语英文字母的语音库用于训练和测试。然后本文分析讨论了自适应方法对于非母语英文字母识别的作用,采用了简单快速的MLLR自适应方法,经实验取得了很好的效果。 本文还训练了音素级别上的高斯时长模型纳入段长信息,对识别率进行了提高。 本文还研究实现了高性能孤立汉语数字语音识别系统,并提出了一种目标范围限制下的孤立数字连接串的识别方式,这种方式一方面对模型空间和识别程序资源要求比较小,另一方面由于目标范围的限制提高了串识别结果的正确率,有利于在嵌入式平台上的实现及应用。在这里,采用了MCE区分训练模型,结合时长和音调特征等方法提高模型精度,系统性能达到实用效果。 最后,本文介绍了嵌入式DSP平台的特点,设计了基于DSP平台实现语音识别系统的框架结构,并通过在手机通信中应用的实例对应用前景做了展望。
其他文献
随着社会进步,出现了各种新的问题,如人口老龄化、各种环境污染的增多及残疾人数量的增大,人们急需一种机器人来解决这些问题。而双足机器人与人类的形状接近,能够很容易适应人类
Web Services是在现有的各种异构平台的基础上构筑的一个通用的与平台无关、语言无关的技术层,各种不同平台之上的应用可以依靠这个技术层来实现彼此的连接和集成。Web Servic
本文详细研究了基于静态CCD摄像机的室内移动机器人全局定位方法及其应用,并结合Pioneer2-DX移动机器人进行了实验研究。 本文建立了室内移动机器人全局定位环境模型。所用
本文分析了危机及危机应急处理相关概念、性质和应急决策的基本理论。阐述了航天发射的基本过程和特点。结合航天发射的复杂性和高风险性等特点,设计了一个航天发射事故应急系
该论文以统计模型为基础,在参考了大量前人工作的基础上,对汉语词法分析、口语句子切分和机器翻译评估进行了较为深入的探讨和研究.汉语词法分析是大部分中文处理的第一步,其
本文针对油井套管最常见的井径异常和裂缝缺陷,利用涡流无损检测技术,将一个载有交变电流的检测线圈探入套管,套管的井径异常和裂缝直接表现为与检测线圈距离的变化。在测量
该文的主要工作是研究不同遥感图像的融合及应用问题.首先,它详细地说明了数据融合技术产生和发展的背景以及数据融合技术特点和应用方向,并引出遥感图像融合的概念和应用研
随着Internet的发展和后PC时代的到来,嵌入式系统成为当前IT产业的焦点之一,呈现巨大的市场需求。但同时大量的嵌入式应用也对嵌入式设备的性能提出了更高的要求。8/16位单片机
进入21世纪,我国经济的可持续发展面临的能源和环境问题越来越突出。燃料乙醇作为燃料具有节能和环保的优点,在国际上广受重视。玉米油作为乙醇生产的重要的副产品,具有很好的经
随着计算机硬件和视觉理论的发展,计算机视觉技术逐渐开始应用到工业生产中,利用计算机视觉进行三维测量也已经成为测量领域中一个重要组成部分。在计算机视觉技术中一个难题就