基于多译文的中文转述语料库建设及转述评价方案

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wangxq198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转述语料是转述现象研究的基础。针对目前学术界中文转述语料稀缺的现状,该文以《简爱》的多个中文译本为基础,通过句对齐得到五万句级别的平行转述语料(1)。使用无监督的小句对齐和词对齐算法,从语料中挖掘到九千多对词汇转述知识。同时,还复现和改进了机器翻译测评指标Meteor,使得该指标更适合于中文转述句子的测评,并构造了一个中文句子转述测评数据集,以便对不同的转述知识和评价指标进行比较。实验表明,该文算法挖掘到的词汇转述知识在封闭测试中不逊于《同义词词林》。
其他文献
悠久灿烂的祖国传统文化,开拓推动了建筑艺术的发展,向世人展示了东方文明的无限魅力。就研究室内空间艺术而言,古人"屏风"的创举,至今仍带给我们一种古老而又清新的韵味并为
认知语言学是一门新兴的学科,隐喻研究作为这门学科的重要组成部分,它不仅是人类重要的认知模式,也是人们认识世界和理解世界的一门工具。本文基于英国国家语料库(BNC)和北京大
高校图书馆读者网上留言的内容主要集中在图书馆日常管理、文献资源建设、流通服务工作和参考咨询服务四大方面。分析读者网上留言平台的3个组成要素,发现读者网上留言服务平
石油工业在国民经济中具有十分重要的作用,而钻井工程在石油工业中占有重要地位。对于油田的勘探开发,钻井工程的重要性不言而喻。然而目前钻井工程仍然存在着一些问题,严重
<正>"当遇到困难裹足不前时,不轻言放弃,而是时常问问自己:我有没有将所有的可能性都做过尝试?我想这应该是一个作风严谨的科研工作者应有的素质。"——王昌涛行将在法国巴黎
<正>在当代医疗技术高度发达的时代,如何保护患有严重疾病的老年人和濒临死亡的人,以及他们是否可以安乐死,成为了紧迫而重要的问题。然而在当代西方伦理学的探讨中,人的尊严
探讨网络环境下基于IP的测发系统中信息交换格式的约定问题,并综合目前已在使用的一些传输约定,给出一个约定的样本。 This paper discusses the convention of information
<正>一、坚持人大工作的正确政治方向,增强工作实效,提高履职能力人民代表大会制度是我国的根本政治制度。随着建设社会主义法治国家和全面建设小康社会进程的不断推进,人大
<正>研究目的:直拳在拳击比赛中的应用。研究方法:文献资料法,数理统计法,录像分析法。研究结果:直拳是在比赛中运用最多,最简单的拳法,在比赛中合理的运用直拳对比赛胜利有
会议
目的探讨肺静脉血流频谱识别二尖瓣血流频谱假性正常化的临床意义及价值.方法临床确诊为原发性高血压病患者69例.根据超声心动图,分为左室肥厚组和非肥厚组.28例正常对照组.