特定领域的汉语语言模型平滑算法比较研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:liongliong484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了完成特定领域的语音识别任务,利用有限的语料建立高性能的语言模型成为提高系统性能的关键.针对此问题,对特定领域的语言模型进行了研究.提出了利用高频新词来加强模型的领域特征的方法,采取了两种方案:一种是将高频新词直接加入原有字典,并在训练过程中增加这些新词的权重,使模型更能表达与领域相关的特征;一种是基于高频新词统计出一个和领域相关的小词表,并对这两种方案进行了比较研究.通过实验研究了适合汉语语言的平滑策略.最后,实验结果表明,对于特定领域问题,语言模型平滑算法对模型性能影响较大;采用适合汉语的Witte
其他文献
2005年6月13—17日,中国气象局与中国农林水利工会赴我省气象部门就职工工资福利待遇和国办文件落实情况进行了调研,省局领导和人教处同志协同调研组先后到果洛、海北2个州局和
随着分布式服务的发展,服务提供者一方面总是期望提供尽可能通用的服务,而另一方面却期望能够细致地区分每个用户可以调用的服务,现有的RBAC模型很难解决这种矛盾。论文在研究现
一个ElGamal签名方案的变种被提出。在此基础上,提出了一个在random oracle model中可证安全的可追踪(t,n)门限签名方案。在这个全新的门限签名方案中,签名人的身份可以在需要的时
Adhoc网络节点能量受限的路由协议的研究是目前的一个热点,IETF的MANET小组提出的几种经典的路由协议,属于最短路由,即最小跳数路由,没有考虑能量因素。由于Adhoc网络中的节点是
据《Scientia Horticulturae》的一篇研究报道(http://dx.doi.org),来自西班牙米格尔埃尔南德斯埃尔切大学的P.Legua等人研究了14种不同砧木对无核克里迈丁桔总酚、有机酸、糖和
文章详细描述了如何在内核空间对QT电源管理模块提供底层支持,并且提出了基于Qt/Embedded电源管理的技术实现.主要包括LCD与背光管理和电量检测。
移动IP借助定期广播的代理通告完成移动检测。与移动IP原本应用的无线局域网环境不同,在移动Ad Hoc网络中频繁的广播会造成广播风暴。现有的集成移动IP与移动Ad Hoc网络的方案
本文对档案数字化文件的保管利用特点、安全性、真实性等方面存在的问题加似分析,并提出相应的对策, 以便将来更好的保存、管理和利用信息化电子文档。
本文应用模糊数学的理论,采用相对评估指标,对青藏高原发生的雪灾进行客观的评估。结果表明,对于已发生的雪灾,其评估结果更加趋于客观、合理,符合实际情况。
10月下旬,桂林市地产南丰蜜桔成熟上市,市场批发价5-6元/kg,零售价6~8元/kg,与往年同比,销售价格明显上涨。本年度桂林市地产南丰蜜桔产销主要特点:一是前几年新种幼树进入结果期,收获