融合概念对齐信息的中文AMR语料库的构建

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:a348956376
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的AMR语料库。该文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从CTB中选取了6 923句进行人工标注,
其他文献
Baculoviruses are the only nuclear replicating DNA-containing viruses that encode their own DNA-directed RNA polymerase (RNAP). The baculovirus RNAP is specific
Cydia pomonella granulovirus (CpGV ) 在苹果果园为幼鳕蛾控制作为生物代理人被用于许多年。到 CpGV 的墨西哥紧张的电阻在德国,法国和意大利在果园被检测。一个实验室昆虫
伊斯蒂莎沟封闭剂是一种光敏固化窝沟封闭剂,具有长期有效防龋、不易脱落、耐磨强等性能.近年来,本人运用其对6~13岁127例儿童进行防龋治疗,收到满意的疗效,现报告如下.
一个流行性感冒 H3N2 病毒, A/swine/Shandong/3/2005 (Sw/SD/3/2005 ) ,在东方中国在一个农场上与呼吸疾病从猪被孤立。基因分析表明 Sw/SD/3/2005 从似人类的 H3N2 病毒是有
<正>2015年中国经济面临前所未有的经济下行压力。官方公布的数据显示,GDP增长速度排在最后六位的分别是辽宁、山西、黑龙江、吉林、河北以及内蒙古。中国经济时报调研组为了
血浆病毒的核糖核酸负担广泛地作为最相关的参数被接受估计猿的免疫不全的地位和前进病毒(SIV ) 感染。精确地测量病毒的核糖核酸层次,一出一步舞荧光灯的量的试金基于 SYBR
Ebola 的 glycoprotein (GP ) 是在病毒的信封上形成尖铁的唯一的结构的蛋白质。GP 包含二个子单元, GP1 和 GP2,由一张二硫化物契约连接了,它分别地为受体绑定和膜熔化负责。在
中文分词是中文信息处理的基础,在语音合成、中外文翻译、中文检索、文本摘要等方面均有重要应用。在中文分词的任务中,存在的主要问题在于可用有效特征较少,分词准确率较低,
昆虫 parasitoids 和 baculoviruses 在天赋和昆虫的战略生物控制起重要作用。二个寄生虫是在普通宿主以内的经常的竞争者,许多研究集中于 baculoviral 宿主感染在 parasitoid
智库是为政策制定者解决经济、政治、文化、社会和外交等领域重大问题出谋划策的专业机构,也是社会分工精细化和决策科学化、民主化的产物。在当今世界,智库已经成为现代国家治