多特征融合的中文命名实体链接方法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:mijun123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法。现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究。本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率。对比实验显示,本文提出的命名实体链接方法
其他文献
科学数据是一种重要的战略资源,科学数据管理的相关研究与实践受到广泛的关注。通过观察和研究科学数据的利用情况可以发现科学数据的管理需求,科学数据管理又能促进科学数据
大规模品牌连锁网吧的出现,对网吧行业走出混乱无序的经营现状有着积极的作用。然而,连锁网吧的前景依然令人忧虑。
为了促进同一学术领域的科研合作团队的组建,提高科研效率,本文基于网络表示学习对多个领域科研合作推荐模型进行研究。将基于节点位置的网络表示学习模型与融合网络结构的网
1 前言 近10年来,我国电力工业建设已向高电压、大容量和密集型的方向发展,许多大中城市也都在同步进行城网改造。其中采用110kV和220kV高压大容量电力电缆,以“高压进城”形
广州地区地方电厂自动化管理系统介绍广州电力工业局金波1前言90年代初,广东省经济迅猛发展,电力缺口较大。在"多家办电"政策鼓励下,全省电力事业发展很快,装机容量增长迅速,一大批燃煤
计算机硬件性能的提升和云计算技术的发展提高了科技文献信息检索的速度和多类型数据聚类问题,但检索的对象还不能直接进入文献内容的事实知识,因而难以实现智能化的科技文献
PC就是站在IT山头上的一颗消息树。虽然是老产品老市场,但进入者不断就说明没有人敢轻视它。而一些新的商业元素也给PC加入了新活力,比如数码产品的兴起,家电和PC的融合,PC摆脱同
中外银行之间的差距,除了资本金实力、服务观念、业务范围等方面的因素之外,更存金融制度所带来的竞争环境的差异。中国金融市场存在的制度隐患或许正是国内银行业普遍性问题的