论文部分内容阅读
摘 要:实体链指是近些年提出的一项自然语言处理任务。本文从实体链指的概念出发,介绍了实体链指的研究目的和意义,评测和语料,以及实体链指的主要方法。本文将实体链指与相关研究进行对比分析,将实体链指分为候选生成和候选排序两个部分分别阐释,并重介绍了实体链指的几种常见的排序方法。最后本文给出了实体链指技术的发展趋势。
全文查看链接
1.1 实体链指的定义
全文查看链接
尽管Wikipedia规模很大,但也无法保证从中获得实体的全部名称,因此有些名称变形也将无法从命名实体词典中得到相应的候选实体集合。在精确匹配的基础上,Varma等[6]加入了部分匹配,Lehmann等[9]加入了模糊匹配的方式,用以提高候选生成的召回率。
全文查看链接
首先,基于图连接度的方法可将上下文构造成为一个图。图中的节点为候选实体与上下文中的实体及其指称。如果候选实体的Wikipedia页面包含了一个上下文指称,就从此候选实体节点向上下文指称节点引一条有向边;如果上下文实体的Wikipedia页面包含了候选实体,就从此上下文节点向候选实体引一条有向边。基于图连接度的方法将选择出度或入度最大的候选实体作为链指结果。
全文查看链接
[7] ZHANG Wei, SIM Y C, SU Jian, et al. Entity linking with effective acronym expansion, instance selection, and topic modeling. WALSH T, editor, IJCAI 2011[C]//Proceedings of the 22nd International Joint Conference on Artificial Intelligence, Barcelona, Catalonia, Spain, July 16-22, 2011:1909–1914.
全文查看链接