语音变化分析及其在孤立词识别中的应用

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:zwfyazl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术近年来取得了长足的发展,伴随着计算机和手机等体积小巧的便携式设备的普及,尤其是进入网络时代以后,各种基于语音识别的应用不断涌现。特别的,孤立词识别作为语音识别的一种由于其具备计算效率高、存储空间小和易于实现的优点,尤其是在实现中小词汇量的系统时既简单又高效,在特定场合中拥有广泛的应用。但是在实验室环境中表现良好的自动语音识别系统,在实际应用中却不得不面对由通道特性改变、背景噪音的干扰以及说话人特性变化等语音变化因素引起的系统性能严重下降的局面。因此语音变化对于语音识别系统影响的研究已经引起了学术界和工业界的关注。本文在调研引发语音变化的主要因素、孤立词识别技术及鲁棒性语音识别技术研究现状的前提下,在满足语音变化条件的语料库上分析通道特性和说话人情感状态对于语音识别三个层面:特征层、模型层和得分层的影响。然后本文在基于模板的和基于隐马尔可夫模型(HMM)的孤立词识别框架下研究对通道特性和说话人情感状态具备鲁棒性的孤立词识别技术。在基于模板的方法中本文通过基频修正算法、聚类选择模板的方法和通用向量方法(CVA)来提高系统对说话人情感状态的鲁棒性。而在基于HMM的方法中我们通过在特征层进行倒谱均值减和在得分层进行得分规整来提高系统对于通道变化的鲁棒性。实验结果表明这些方法不同程度的提高了孤立词识别系统对于通道变化和说话人情感状态引发的语音变化的鲁棒性。最后我们将鲁棒性孤立词识别技术在实际领域中进行了初步应用。本文的主要工作包括:1.采集与制作了汉语孤立词库MIWAC。2.在不同的语料库上通过多种手段分析了通道特性和说话人情感状态影响语音识别系统的特征分布、模型区分性和得分分布的规律。3.利用语音变化分析结果,在基于模板的和基于HMM的框架下研究了对于通道特性和说话人情感状态具有鲁棒性的孤立词识别技术。4.将提出的鲁棒性孤立词识别技术在移动媒体信息检索和家用电器控制领域实现了初步应用。
其他文献
随着互联网上的文本信息量呈指数式增长,自然语言处理作为计算机智能处理海量文本信息的关键,已成为目前的一个研究热点。当前国际自然语言处理的研究热点有机器翻译,情感分
近年来,随着信息量的迅速增长以及信息承载和传输技术的飞速发展,人们对于显示设备的分辨率、显示效率、视觉效果的要求日益增强。传统的单台普通投影仪虽然价格合理,但是分
近些年,将P2P技术运用到移动无线网络环境中,逐渐引起学术界和产业界的重视,衍生出的新课题移动对等网络(MP2P)是目前计算机和通信技术领域的研究热点之一。开展这项研究对于
近年来,伴随着互联网络的快速发展与壮大,各种各样形式的信息也随之而来,在为用户提供大量信息的同时,也给用户从中获取有价值的信息增加了更多的困难。因此如何能够从如此众
在无线传感网络中,每个传感器节点的能量有限,难以随时对传感器节点补充能量,所以能量是整个网络中的一项重要资源,决定了整个网络的生存时间。因此,根据无线传感网络的特点
随着计算机网络技术的不断发展,网络规模的不断扩大,网络应用的日益增加,原有的网络故障管理系统由于功能单一、操作复杂、效率低下,已越来越难适应用户的需求。如何保证网络
GB18240.7规定了基于局域网的大中型商业企业管理信息系统(MIS)进行税控功能改造的规范,该标准适用于用于生成、存储和传输普通税控发票数据的税控数据采集模块、网络税控器
目前,计算机、数码照相机、数码摄相机等作为消费类电子产品已经进入到越来越多的家庭,由此产生大量的数码照片,对于照片的处理,传统的方法是冲印出来进行欣赏、保存,这样不
目前,兵器工业某研究所自然环境试验中心对材料表面腐蚀特征进行共享和管理主要是通过文本检索的方法。文本检索方法受人的差异和经验等因素的影响,首先,难以保证检索结果的
软件工作量估算对软件开发项目起着至关重要的作用,是项目计划和控制的基础,是保证软件开发顺利完成的重要手段。随着机构公司对项目管理要求的不断提高,软件工作量估算也越