语音识别后文本处理系统中文本语音信息评价算法研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:popopan22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今语音识别技术迅猛发展,已经开始在许多领域进行应用,但依然存在许多问题。首先,由于背景噪音、说话人口音和表达方式的不规范以及新词的不断出现,实际环境中语音识别的正确率一直不尽如人意。而且,语音文档检索开始大规模应用,有许多语音识别后文本需要进行大规模处理。因此,我们采取对语音识别后的结果进行后处理,以此改善语音识别效果。本篇论文主要基于教育部科学技术研究重点项目“语音识别结果的鲁棒性理解方法关键技术研究”,该项目旨在通过对语音识别结果进行分析,得到更加正确,完整的语音识别结果。在此项目研究背景下,本文在完成一个完整的语音识别后文本处理系统中对文本语音信息评价算法进行了深入研究。本文的主要研究内容和工作有:1.拼音语法知识库的搭建。对拼音N-gram模型与数据平滑介绍和对比分析,得到更加合适中文拼音的语法模型与数据平滑方法,并介绍如何搭建使用不同语法模型和平滑方法的拼音知识库。2.语音识别结果锚点词的定位。对连续拼音N-gram模型进行分析和评价,总结相应规律,辅助应用拼音稳定度,最后得到锚点词的确定方法。3.纠错候选建议。该部分在介绍拼音混淆规则后得到相应的相似拼音并转换成对应候选词。为了对候选词进行打分,使用拼音相似度来衡量与原拼音的接近程度。4.应用算法至实际系统。将上述算法实际应用到一个完整的语音识别检错纠错系统中,介绍其系统框架与具体实现,解释本文工作在其中发挥的作用,对比分析实际应用效果。
其他文献
随着图像应用需求以指数级的增长以及图像、视频设备的普及,在互联网中存在着越来越多的图像资源。如何有效的组织、管理、索引这些海量的图像数据以方便用户的检索是一个巨
伴随社会经济的持续发展,沉管灌注桩技术被广泛应用在土建工程施工中,其有效的提高了建筑桩的承受力度,减少了建筑结构的沉降问题发生频率,解决了建筑沉渣的问题,是建筑技术
主办单位:中国造纸学会、福建省科学技术协会、华东七省市造纸学会承办单位:福建省造纸学会地点:福建农林大学学术交流中心时间:2015年9月19、20日会议宗旨:前瞻海峡两岸造纸
连续相位调制(Continuous Phase Modulation,CPM)是一种相位连续的非线性数字调制方式。包络恒定的特性、较高的频谱效率和功率效率使得CPM在遥测、卫星和移动通信领域都得到
随着网络的不断发展,网络的复杂性和异构性的不断增强,使得网络管理变得十分复杂,对网络管理提出了更高的要求。传统的网络管理协议SNMP在网络配置、传输效率和安全性等方面
论文完成了软件GPS接收机的设计与实现。该GPS接收机通过一个GPS中频数据采集器与计算机上的定位软件配合使用实现定位功能。论文研究重点在于接收机基带信号处理算法的研究
随着经济的不断发展,工业与民用建筑工程日益增多.现代的建筑在高度上越来越高,而地基深度却越来越深,对地下水的处理要求也比以往传统建筑的要求高出许多.众所周知,一旦地下
随着网络技术的快速发展,人们的交流变得更加快捷和方便,但是通过网络存储和传输数据的安全性也更加受到人们的关注。由于越来越多的加密算法被破解,使得设计安全有效的新算
天波雷达因其探测距离远、监视范围广、性价比高、反隐身和抗低空突袭能力强等优点,受到了世界大国的重视,被广泛应用在各类国防军事和海态监测等民用领域中。相较于常规雷达
3G无线通信系统能够为人们提供更高速的无线传输能力,更优质的业务体验,和更丰富的服务内容,从而使通信变得更加迅速、多元、普及。TD-SCDMA系统是我国提出的具有自主知识产