基于聚类汇总的记录匹配算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:yellue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
记录匹配算法在异构数据的集成和数据开采等领域应用广泛,其主要任务是找出来自不同数据源中代表同一对象实体的记录,这些记录具备相似的属性和属性值.为避免组合爆炸问题,现有的记录匹配算法不再对数据库中的记录数两两匹配,而是结合排序策略和静态聚类匹配方法实现,但这种静态方法不适应数据的动态变化.因此,本文提出基于聚类汇总的记录匹配算法,该算法可以解决静态方法导致的匹配记录丢失问题,同时能够减少计算量,提高匹配记录搜索效率.
其他文献
VIA定义了一种低延迟、高带宽的数据传输模型,成为集群系统通讯技术的工业标准.本文介绍VIA的产生背景和结构特征,详细阐述了清华大学在Myrinet L ANai 9硬件上实现的VIA原型
霜降过后,蔓叶纷披枯黄的稼穑一派成熟的景色,这时正是采挖山药的时节。在河南省怀庆地区泌阳县一带,只见山药产地薯蔓莽莽,进前观看,那深紫色的叶片被寒凝的白霜打得枯萎凋
已是早晨近10时了,当笔者急匆匆赶到广汉市东方机械厂时,厂长何志德正端着一大碗饭菜,边看材料边往嘴里塞。“这么晚才吃早饭?”笔者问。站在一旁的厂党委书记张德友忙解释说
本文首先对IPSec协议体系进行了复杂性和安全性分析,在此基础上讨论了若干改进措施,这些改进不仅简化了某些繁琐概念,也更有效地增强了该协议的安全性能.
图象内容的检索需要确定图象之间的相似性。本文给出了一个基于颜色直方图相似性的匹配模型,然后描述了基于颜色直方图匹配方法的实现,讨论了这个方法在图象相似性上的度量性能。
本文运用统一建模语言,对移动计费数据采集子系统的逻辑结构和物理实现进行了介绍.首先,利用类图和顺序视图对系统中对象的静态结构和动态行为进行了详细分析,然后运用物理视
主成分分析(PCA)是自动人脸识别的常用方法。在基于传统K-L变换的PCA人脸识别方法的基础上,提出了一种基于比例因子的PCA人脸识别的改进方法。研究表明,较之K-L变换,基于比例因子的方法更有效,合理选取比例因子和主成分是提高识别准确率的关键。
[摘 要]空间中两直线的位置关系——垂直和平行,是学生的学习难点。对比分析了“垂直与平行”的各种教学方式,得出空间观念的形成是要建立在灵活的空间想象能力上的,而空间想象能力的培养需要借助空间到平面投影的实验操作,进而给出行之有效的教学方法。  [关键词]垂直与平行;分析;改进; 尝试  [中图分类号] G623.5 [文献标识码] A [文章编号] 1007-9068(2019)08-0021
不久前去江苏省泰兴市参观学习,看到一向“门前冷落车马稀”的统战部、市志办、台侨联合会人来人往,门庭若市。一批批乡镇和企业负责人登门求援,请他们帮助联系中外客商,引进
中共自贡市委统战部在自贡市委的领导和省委统战部的指导下,以贯彻全国全省统战工作会议精神为契机,以振奋精神,努力开创统战工作的新局面为目标,抓住重点,突破难点,在全面解