面向大规模语料的语言模型研究新进展

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:weiyideta21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
N元语言模型是统计机器翻译、信息检索、语音识别等很多自然语言处理研究领域的重要工具.由于扩大训练语料规模和增加元数对于提高系统性能很有帮助,随着可用语料迅速增加,面向大规模训练语料的高元语言模型(如N≥5)的训练和使用成为新的研究热点.介绍了当前这个问题的最新研究进展,包括了集成数据分治、压缩和内存映射的一体化方法,基于随机存取模型的表示方法,以及基于分布式并行体系的语言模型训练与查询方法等几种代表性的方法,展示了它们在统计机器翻译中的性能,并比较了这些方法的优缺点.
其他文献
iOS是什么?iOS是苹果公司推出的操作系统,也是iPhone、iPad和iPod touch的基础所在。随着ios系统的不断更新,智能手机界面的要求也越来越简约大气,从而使设计师不断开始探索
中国远程开放教育被教育部确定为“人才培养模式改革试点项目”,相对于传统成人教育模式和普通高等教育而言,开放教育有其非常明显的教学模式和学习模式特色。作为检验、评价开
随着社会的不断进步,我国城市化的工业建设在不断的发展,人口也不断地增长,给城市的环境带来了越来越多的污染,而污水污染也是一个重要的问题。随着当前环境污染问题引起了越
体育产业是以体育健身休闲、体育竞赛表演和体育用品制造与销售为主营业务的产业链,在《国务院关于加快发展体育产业促进体育消费的若干意见》(国发[2014]46号)政策东风的推
南京大学罗小龙博士的《长江三角洲地区的城市合作与管治》一书近日已有商务印书馆出版,这是近年来中国城市与区域管治研究领域的代表性著作之一。本书以长江三角洲地区为研究
<正> 识字教学在小学一年级的语文教学中占有重要地位。通过识字教学,儿童掌握了大量字词,就为阅读与写作奠定了良好基础。自从党提出教学改革的号召以来,许多老师在如何提高
猪传染性腹泻通常在冬春季节容易发生,任何年龄的猪都能够感染,其中哺乳仔猪、断奶仔猪以及育肥猪感染后都会出现发病,具有较高的死亡率,特别是小于10日龄的仔猪能够达到100%
新时代,网络消费伴随着信息化时代的到来得到普及,网络的发展影响着商品购买、柜台发展和产业变革的进程。网购模式的多样性带给人们便利,也带来了很多隐患。中国互联网络信
采用Instron5882万能材料试验机研究了混合稀土加入量对含铁1.2%的ZL101合金组织和力学性能的影响。结果表明:适量RE的加入可有效抑制高铁ZL101合金中的针状Fe相,细化α-Al晶
汽车司机疲劳驾驶是引发交通事故的一个重要原因,许多国家正积极进行疲劳报警器的研究.本文在比较各种疲劳的生理特征后采用PERCLOS,设计了一套红外采集系统减少环境的干扰,