【摘 要】
:
人名识别常被作为命名实体识别任务的一部分,与其他类型的实体同时进行识别。当前使用NER方法的人名识别依赖于训练语料对特定类型人名的覆盖,在遇到新类型人名时性能显著下
【机 构】
:
中国科学院软件研究所中文信息处理实验室,中国科学院大学
【基金项目】
:
国家自然科学基金(61433015,61572477,61772505),中国科协青年人才托举工程(YESS20160177).
论文部分内容阅读
人名识别常被作为命名实体识别任务的一部分,与其他类型的实体同时进行识别。当前使用NER方法的人名识别依赖于训练语料对特定类型人名的覆盖,在遇到新类型人名时性能显著下降。针对上述问题,该文提出了一种基于数据增强(data augmentation)的方法,使用新类型人名实体替换的策略来生成伪训练数据,该方法能够有效提升系统对新类型人名的识别性能。为了选择有代表性的特定类型人名实体,该文提出了贪心的代表性子类型人名选择算法。在使用1998年《人民日报》数据自动生成的伪测试数据和人工标注的新闻数据的测试结果中,
其他文献
音乐教育哲学原理对于音乐教师具有十分重大的意义,音乐教师应了解哲学的基本问题,并在音乐教学实践中加以应用,才能使音乐教学工作更加出色。笔者将通过讲述观摩广州市玉岩
基本情况国家标准化行政主管部门批准组建并授权的技术组织。第一届委员会于1992年成立,目前为第三届。现有委员46人,其中主任委员1人,副主任委员2人,秘书长1人。秘书处单位:
“能攻心则反侧自消,自古知兵非好战;不审势即宽严皆误,后来治蜀要深思”——成都武候祠里,清人赵藩的这副对联引起了无数后来的企业家的“深思”:如何才能准确地为自己的企业号脉
在分析单位冲激函数δ(t),单位跃函数U(t)的一般定义与本质的基础上,指出了一般定义的局限性,并导出了单位冲激函数δ(t)的一种新定义,进一步论述了与此相关的单位阶跃函U(t)的一种定义的重要意
约翰内斯·奥克冈是佛兰德乐派最重要的代表人物之一,对文艺复兴时期的音乐发展有着承上启下的历史意义。本文通过对华语学术界中涉及奥克冈的社会身份、工作机构的名称
欧盟新的电磁兼容指令2004/108/EC,7月20日起实施。本文就是根据指令要求,主要介绍声音和电视广播接收机及类似设备电磁兼容测试项目,然后将目前电磁干扰和电磁抗干扰所要求
本文介绍的光山古瓷窑位住于城西39公里南向店乡天灯村,四个古瓷烧造区分布在大别山北麓的一片浅山区里。这四个古窑区相距远者约1000米,近者300米,据考证,天灯村这样规模的
牛居油田东营组马圈子油层为牛居油田主要油层。该油层沉积相环境为一套河湖交互相,陆上辫状河沉积砂岩可划分为河道底部沉积单无和河道充填砂坝沉积单元;水下辫状况道粒度变细
怎样成为一名好老师话题是常话常新的课题。本文就中学音乐教师的现实,以音乐教育家为榜样,谈几点成为好老师的认识。
2017年,在众多娱乐节目中,由湖南卫视打造的《歌手》吸引了观众的眼球,除了音乐上带来的视听盛宴,节目中张杰、迪玛希翻唱而导致的侵权事件引起热议,激起了大众对于音乐版权