基于关键证据与E2LSH的增量式人名聚类消歧方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:itwmh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎中关于人名的相关文档往往数据量庞大,且数据为增量式更新过程,新文档出现的时间与规模都存在不确定性。现有的方法多为全局的人名聚类方法,在处理大规模数据时往往效率较低,且无法实现增量聚类。本文提出了一种基于关键证据与E。LSH的增量式人名聚类消歧方法。对于初始文档集,采用全局的人名聚类方法,保证聚类性能且能有效控制全局聚类的文档规模,提高聚类效率。对于增量文档集,利用提出的关键证据与E。LSH方法生成候选文档集,极大降低了需要计算相似度的文档规模,提高方法效率。实验结果表明,本文提出的增量式人名聚类消
其他文献
本文研究了知识网络中的文献共被引网络,它形成着一个学科的知识基础,是学科知识输入和转移的重要知识之源。文章在总结和梳理了共被引网络的一般研究方法后,采集了1900~2012年图
一、2000kV封闭式交流试验装置日本昭和电线电缆有限公司最近研制的2000kV封闭式交流试验装置,具有许多优点,是目前世界上最大的用于电缆击穿试验的装置。1.结构布置这套试验
上个月的月底,是上市公司规定的预披露时间。如果过去一年经营情况发生了重大变化,需要在月底之前予以预先披露。尽管之前人们对于有的公司比如乐视网的亏损已经有所心理准备,但
针对车辆纵、横向跟踪的强耦合、非线性特性,设计了基于自适应模型预测控制理论的轨迹跟踪控制器。同时考虑纵、横向跟踪控制,并引入线性变参数模型(LPV),把纵向速度对横向跟
一元复始,万象更新。经过精心策划和准备,2019年第一期杂志送到了您的手上。也许您是我们的老读者,希望杂志“彩装”亮相带给您小小的惊喜,更希望您能潜心品鉴提出宝贵意见。
目的研究老年股骨颈骨折患者在治疗过程中采用全髋关节置换术与人工股骨头置换术治疗方式的临床效果。方法选取2015年3月至2019年3月海门市第五人民医院收治的股骨颈骨折60例
肿瘤-药物-基因语义关系的及时发现和获取,在肿瘤个体化用药中发挥着重要作用。本文收集并整合了肿瘤、药物和基因相关的科学文献数据,设计并实现了面向肿瘤个体化用药的文献挖
近日,生态环境部发布新版排污许可证承诺书(样本)、排污许可证申请表(试行)及排污许可证格式,2016版《排污许可证管理暂行规定》废止。
未来的世界,“一切皆有可能”。成功的应对一定是有着一个执着而坚定的内心世界,尊崇、敬畏、忠诚于你所从事的事业。积极因变而变,你就会从容地走向未来,
尽管大型基建投资在降温,宏观杠杆要下降,但是还有乡村振兴战略,还有建设美丽中国战略,发展是要务,春光依旧好。