改进机器翻译中的句子切分模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:xueliping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着统计机器翻译系统训练语料的不断增加,长句子的数量越来越多,如何有效地利用长句子中的信息改进翻译质量是统计机器翻译系统面临的主要问题之一。该文基于Xu的句子切分模型,提出了一种在训练阶段切分长句子的方法,该方法利用自动获取的边界词概率和切分后子句对的长度比例来指导切分过程,从而得到更符合语义信息的句子切分结果。在NIST测试集上的实验结果表明,该方法获得了最大0.5个BLEU值的提升。
其他文献
<正> 在黄金生产全泥氰化炭浆厂中,最后一段流程的关键设备是解吸电解设备。1987年5月红花沟金矿150t/d炭浆厂建成,适用于全泥氰化炭浆法提金工艺的解吸电解设备也试制成功。
堆浸氰化提金工艺是处理低品位氧化金矿的有效方法。文中谈了堆浸法的适用性、所用原材料、技术操作及经济效益。按现行价格,堆浸一吨原矿可获利4—16元。 Heap leaching of
财产性犯罪在法定刑设置上,必须考虑不同财产性犯罪的社会危害性差异这一因素。此文通过对贪污罪、业务侵占罪、盗窃罪的比较分析,论述了财产犯罪法定刑的设定根据问题,认为各类
海南抱伦炭浆厂,建成投产后,通过采取正确的生产调试措施,经一个月的生产调试,使生产就达到了设计指标:处理能力230t/d,金总回收率93.04%.
后沟金矿自行设计的蒸汽加热解吸柱已生产两年。本文介绍了蒸汽加热解吸柱的使用情况,并与电加热解吸柱进行了对比,前者具有突出优点和较明显的棼术经济效益。
《中国声乐艺术史》是中国声乐艺术的一部史学专著,明晰了中国声乐艺术的开端与发展脉络。
主要介绍了基于规则、基于实例和基于统计等3种主流机器翻译方法,探讨了自然语言处理技术和机器翻译中基于规则的理性主义方法和基于统计的经验主义方法的优缺点,结合机器翻
吸附了金的活性炭称之为载金炭.在解吸电解之前都要对载金炭进行含金量测试,测试过程对载金炭的最低取样量一直无人研究,文章展开对载金炭最低取样量的定性研究,即对载金炭的
"ZAO"制作换脸视频背后的风险,不仅涉及个人身体隐私风险,其越来越优化的技术普及所产生的真假信息,更将考验媒体人的新闻甄别能力。文章通过分析照片处理软件和视频合成产生
2005年5月,选择镇江内江湿地具有代表性的裸地、荫草群落和芦苇群落,分别代表植被群落的不同演替阶段,测定不同群落、不同层次的光照强度、气温、土温和空气相对湿度,研究其植物