基于实例语境的语音识别后文本检错与纠错研究

来源 :北京邮电大学 | 被引量 : 15次 | 上传用户:xxk2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是非常重要的人机交互技术,但要得到广泛实用化还需进一步提高语音识别正确率。用自然语言理解方法研究语音识别后文本的检错纠错,将是提高语音识别性能的一个重要研究方向。本文提出基于实例语境的语音识别后文本检错纠错方法,以语境信息为主,综合利用语法、语义、语境多种信息资源对语音识别后文本进行检错纠错,提高文本的鲁棒性理解。主要研究工作和成果有:1.研究语境知识的表示和计算。本文提出了基于实例的语境表示方法,用语境关联度来度量语境知识。在此基础上,构建了语境知识库。2.研究句子相关度的计算方法。本文采用基于词语相关度加权的方法。词语相关度包括了词语语义相似度和词语与语境核心词的语境关联度,并且考虑了词序因素。3.将以语境信息为主导,综合语法、语义信息的自然语言理解算法应用于语音识别后处理,设计了基于实例语境的语音识别后文本检错纠错系统。该系统包括定位锚点词、实例抽取、检错和纠错四个模块。根据语法的拼音分析和语境的核心词表来定位锚点词;根据综合了语义和语境的句子相关度计算来抽取实例;最后在实例语境中考察语境和谐度,进行检错并纠错,输出优化文本。经过实现与系统测试,验证了该方法的可行性和有效性,使语音识别正确率提高了约20%。
其他文献
作为一种典型的微波测量仪器,网络分析仪虽然已经在射频和微波测量领域获得广泛应用,但其准确性要求也越来越高;数据校准作为网络分析仪的关键技术值得深入地研究。由于不同
《甘肃省道地药材认定管理办法(试行)》出台。日前,岷县中信中药材农民专业合作社等5家企业被任命为首批甘肃省道地药材(当归)生产企业和基地。《办法(试行)》规定,凡在甘肃行政区域
期刊
语言是折射社会生活的一面镜子,社会价值观影响着人的语言使用。在英语使用中,性别歧视现象屡见不鲜。性别歧视是由于人的价值观的不同而产生的,这种不公平的价值观来源于社
铁路部门与国计民生息息相关,而且对信息系统的依赖性非常高,一旦出现故障和意外,将导致整个铁路运输生产受到严重影响,并将造成严重的社会影响和后果,因此铁路信息系统的风
我国经济高速发展伴随的是高额的社会和经济成本,面临着越来越严重的“资源瓶颈”和“环境瓶颈”问题。近年来,全国也发生了多次大范围、持续性的霾过程,正是由于我国废气中
在目前的低油价形势下,煤化工产品市场竞争日趋激烈,行业发展不容盲目乐观。通过分析煤化工行业现状和国家相关政策,总结煤化工建设项目前期管理工作重点为"一个前提、一个基
近半个世纪以来,对飞行员选拔与训练的预测研究一直在航空心理学研究领域中占有主导地位。多年来的研究表明,认知和心理运动测试以及对人事档案评价等已成为预测飞行员选拔与
伴随着电子商务的发展,通过网络购物已经逐渐被消费者所接受,同时据权威机构调查报告显示我国网购用户的年龄大多集中在18至30岁之间,月收入集中在1000至3000元,同时以企业白
采用无梯度优化方法——混合元胞自动机方法进行体积约束下柔顺机构多目标拓扑优化设计。以应变能最小化和互应变能最大化为目标,以结构体积为约束,采用标准化方法定义多目标
1病历摘要患者,男,58岁。因“咳嗽、咳血丝痰3个月余”入院。