多场景文本的细粒度命名实体识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:furong2599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别一直是数据挖掘领域的经典问题之一,尤其随着网络数据的剧增,如果能对多来源的文本数据进行多领域、细粒度的命名实体识别,显然能够为很多的数据挖掘应用提供支持。该文提出一种多领域、细粒度的命名实体识别方法,利用网络词典回标文本数据获得了大量的粗糙训练文本。为防止训练文本中的噪声干扰命名实体识别的结果,该算法将命名实体识别的过程划分为两个阶段,第一个阶段先获得命名实体的领域标签,之后利用命名实体的上下文确定命名实体的细粒度标签。实验结果显示,该文提出的方法使F1值在全领域上平均值达到了80%左右。
其他文献
问:我与男友约会了一段时间后,渐渐意识到对方不是自己想要共度一生的人。可是,因为都是主内肢体,我实在不好意思提出分手。但若勉强交往下去,对双方都有害无益。我当怎么办?一
期刊
口语能力作为重要的语言交际能力,是学生语言能力终生发展的重要因素,但却也是一直困扰中职英语教学的问题。在中职英语口语教学中一直存在课程内容单一、教学泛化、教学资源
人力资源服务行业是一个充满竞争的行业。客户是否续约,关键在于服务质量,但还要考虑其他因素,例如关系疏远、负责人更换、同行竞争等。无论哪种原因导致的人力资源供应商转
期刊
随着全球经济一体化进程的不断深入,企业的贸易活动越来越多。依靠传统的管理模式、沟通手段和工作方式已经无法适应业务发展的需要,需要通过贸易管理系统的设计与实施来改变
针对目前配电网综合电气节能技术单一,尚无系列化关键技术,节能设备存在固有缺陷等问题,文章提出了高压配电网高品质节能的无功动态补偿与谐波治理混合系统、低压配电网低成
总结了目前我国大中城市电网无功设备配置、运行和管理等方面存在的主要问题,提出了适应于大中城市电网无功规划的技术原则,分别给出了城市主网、城市高压配电网、城市中压配
<正> 一个财政收入不过亿元,人均 CDP仅占全市人均 CDP 的2/3,且经济发展缓慢的穷县,如何实现存款业务的快速增长,这一直是沙洋支行270名员工苦苦思索的课题。近年来,尤其是2
欧盟在全球植物药市场的地位举足轻重,开展欧盟注册对中药国际化具有重要意义。回溯国内对中药欧盟注册法规的研究已有10余年,仍存部分认识偏差和研究不足。该文旨在系统分析
没有正确的环境意识,就难以有积极的环境行为。随着我国城镇化运动的不断发展,城市人口日益增多,城市环境治理的压力巨大,需要我们付出更多努力进行治理,为此首先需要提升城
《中华人民共和国外商投资法》的实施将带来外商投资企业法律适用的变化,协调该法与《公司法》在调整外商投资企业组织和行为方面的关系,厘清变化的内容和边界,准确把握相关