基于非主属性离群点检测的实体匹配

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:liuhong89332
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决互联网上不同源中同一实体描述多样性的问题,提出一种基于非主属性离群点检测的实体匹配方法。利用非主属性值消除主属性值不同带来的歧义,非主属性值可较快排除不匹配实体,极大提高匹配效率。该匹配方法在一定程度上克服了离群点匹配在传统奇异值分解中不能应用在大规模数据的弊端,其基于规则的方法对数据进行粗筛选,降低实体对的数据规模;根据离群点检测模型做进一步筛选,得到初步的实体对集;根据生成的实体对集进行采样,利用机器学习选择合适的匹配器并训练来获取匹配对。实验结果表明,该方法使准确率和召回率得到提高,其有效性得
其他文献
泛非主义即非洲民族主义,它先后促成了非洲统一组织和非洲联盟的建立,今天仍在指导实现非洲的复兴梦.本文解读泛非主义产生根源和历史演变的特征,有助对非洲民族主义和非洲现
成语,作为中华民族语言中特有的精华,以其凝练的语言形式和丰富的文化内涵而广为流传。在“汉语热”不断升温的今天,外向型学习词典中成语条目的编纂却一直未受到足够的重视。文
以天津海河沉管隧道为背景,采用有限元模拟并结合现场监测资料,研究沉管隧道水下基槽边坡的稳定性与合理坡率.结果表明:基于基槽边坡的安全系数、开挖和回填土方量、基槽回淤
为提高鲣鱼暗色肉利用率和附加值,以鲣鱼暗色肉为原料,采用酶解法制备抗菌肽。通过单因素实验,以对大肠杆菌抑菌率为指标,得到优化的酶解条件范围,然后通过响应面法得到最佳
以固阳县历年实施的土地整治项目为研究区,分析土地整治项目实施中存在问题,针对存在的问题提出了对策和建议,结合新型城镇化建设的思路与发展速度,加强对土地整治工作推进速
基于造纸企业1998—2013年的非平衡面板数据构建动态面板模型,采用一般矩估计方法(GMM)克服内生性问题,明确政府补贴与造纸企业出口的因果关系,检验政府补贴对造纸企业出口扩
每年的3月3日是全国“爱耳日”,旨在唤起全社会关注老年人听力健康,推进我国老年人听力残疾预防与康复工作,造福广大老年人及其家庭.
本文主要介绍了西门子S7-300系列PLC在回转窑控制系统中的应用。通过人机界面和PLC实现电气设备的启停、仪表参数监控等,并通过PROFIBUS总线将其他厂商的电子信号连接到系统
目的探讨儿科护理管理中安全管理模式的应用效果。方法选取2015年2月—2016年2月86例患儿,采取常规护理,设定为对照组;选取2017年5月—2018年5月86例患儿,在对照组基础上实施
分析了温州农业电子商务发展的现状,认为温州农业电子商务面临的问题主要是商务市场体系不健全、农产品标准缺失、农业信息化建设水平低、物流滞后、农民观念落后、复合人才