大词汇量连续语音识别系统中统计语言模型的研究

被引量 : 24次 | 上传用户:limanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是模式识别领域的一个重要的研究课题,它的发展将会对未来的人机交互界面带来极大的影响。而在语音识别的研究中,大词汇量、非特定人、连续语音识别是最困难,最具有挑战性的一个课题。目前虽然已有许多大词汇量连续语音识别系统问世,但是其性能还远远达不到大规模应用的要求,对于它的进一步研究具有重要的实际意义。 语言模型是描述自然语言内在规律的数学模型。随着语料库语言学的崛起,基于语料库的统计语言模型逐渐取代了传统的人工编制的语言学文法,被广泛地应用于自然语言处理的各个应用领域。 本文研究的目的是建立基于词上下文的汉语统计语言模型。首先讨论了统计语言模型的构造原理、评价标准和存在的一些问题。建立了一个具有一定规模、分类齐全的语料库,并完成了语料库的预处理、分词方案。采用CMU_Cam_Toolkit工具包完成语言模型的训练和评价工作。此外,进行了大量的实验,从预处理方案、训练语料的规模、数据平滑方法、语料的搭配情况,词表文件的选择,工具包使用参数的设置等方面对语言模型进行了优化和改进,使语音识别系统识别率有了显著提高。 本文针对模型文件中的词表文件建立了一个音字转换系统,这个模块用于将语音识别系统中的声学模型和语言模型连接起来,具有十分重要的作用。解决了多音字处理问题,提出将多音字分的读音分为低频音和高频音的处理方法,解决了多音字词语注音时需要人工干预的问题,并且提出了一种有效的数据结构方法,大大提高了汉字拼音搜索匹配的速度。这个模块也可用于声学模型的拼接训练,不需要在识别内容改变的情况下重新进行整词训练,节省了大量的人力物力。 本文系统的介绍了大词汇量连续语音识别系统的整体模型和各个组成部分,并阐明一个可靠的语言模型对于提高连续语音识别系统的识别正确率,起着至关重要的作用。相对于已发展得较为成熟的声学模型来说,语言模型还有极大的发展空间。
其他文献
红色影视剧的应用价值——思想政治教育功效早已得到社会的肯定,而如今高校在大学生思想政治教育工作方式方法上陷入瓶颈,如何将两者有机结合,把红色影视剧纳入高校大学生思
当前,全球正在加快布局下一代互联网产业体系。为顺应时代潮流,在气象科学传播领域,创作出更有吸引力的科普作品,才能提升气象科学传播力。本文从图解科普的优势入手,系统分
志愿服务行为的内化力量便是志愿精神,志愿服务是建立在个体或组织自愿的前提下,不计较报酬并通过积极作为服务社会和他人的行为。志愿精神是全人类最宝贵的精神财富、高尚的
目的为了解我国保健食品现状,为保健食品产业发展提供参考。方法以国家食品药品监督管理总局网站数据库为数据源,对获批的保健食品的年度总数、功能、剂型、地区等情况进行了
加热炉是炼油企业的主要耗能设备。利用烟气余热回收技术可以在相当程度上降低加热炉排烟温度,使加热炉运行中的热效率得到相应的提高,进而提高能源利用率,这对于炼油企业降
<正> 大体积混凝土体内外温差大,容易产生超自身约束的温度应力,造成结构开裂破坏。大体积混凝土的施工中所采取的一切措施,都是为了有效地控制混凝土的温升,减小温差。所以
当前中国的高等教育宏观布局正处于结构化调整的重要时期,伴随着我国侧供给结构性改革工作的持续推进和地方区域经济的加速转型升级,推动本科职业教育发展是优化我国人才结构
本文阐述了休闲农业景观和生态规划的内涵,认为休闲农业景观生态设计的核心是土地利用规划和生态环境设计,从理论和实践两个角度探讨休闲农业景观生态规划的原则和方法,提出
随着微博、微信等以“微”为表征的新媒体技术的蓬勃发展,“微文化”悄然而生,并以其“微言大义”的内涵和“无微不至”的外延,以一种“微而不微”的力量影响和改变着大学生
飞行器工作环境复杂,影响其结构安全的不确定因素很多,例如结构中用的材料物理性能数据可能与实际的有所差别;名义尺寸也可能与实际的不完全一致;计算模型中引用一些假设也会使实