融合页面结构与内容的在线百科实体标注方法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:tonnyliu2042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线百科实体标注目的是标注出属于特定类别(如人名、地名、机构名等)的实体。百科实体标注对大量的应用,诸如实体消歧、实体关系挖掘、知识库构建都很重要。百科实体特征可以分为结构特征(属性框、标题、类别等)和内容特征(页面正文)。现有的标注方法大多只考虑一种特征或者一种分类器,导致F1值较低,无法充分发挥两种特征的优势。因此,提出了融合页面结构特征和内容特征的在线百科实体标注方法。该方法考虑了两种特征对标注结果的影响,分别构造分类器,并且对结果进行线性组合,能够更准确地实现百科实体的实体标注。实验表明,该方法在
其他文献
在一些实际的复杂网络中,网络的管理者为了自身利益最大化和风险最小化,需要做出一些决策,但是现有的研究也只是针对某一实际复杂网络所做的决策,缺乏通用性,也忽略了复杂网络中大
目的分析肺结核、肺癌并存30例误诊原因.方法通过对30例误诊的肺结核合并肺癌临床资料进行回顾性分析.结果发现18例原有肺结核病史者,其中13例因痰菌、PCR、结核菌素试验阳性
针对车牌无法识别的车辆,研究了一种车脸定位及识别方法。该方法分为两个阶段:首先,使用Adaboost算法进行车脸定位,并利用经验矩形方法进行定位改进;其次,在定位出来的车脸区域提取SIFT(scale-invariantfeature transform)和SURF(speeded up robust feature)局部不变性特征,利用这两种不变性特征的叠加及位置约束改进匹配算法,与标准车型数据
数据流外包服务验证问题受到广泛的关注。目前主流的外包数据查询验证技术是基于Merkle哈希树(Merkle Hash tree,MHT)的,但是其具有验证对象较大,验证过程存在冗余,安全性低,无
[目的]为了探索生长在长期受选矿废水污染土壤上的草本植物对锌的富集与转移特征。[方法]通过对花石头河沿岸3个样区土壤和5种草本植物根部、茎叶进行采样处理与分析测试,研