基于划分的集合相似连接

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:givenalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集合相似连接(setsimilarityjoin)是指在给定的数据集中,按照基于集合间覆盖关系的相似度计算方法来衡量数据之间的相似度、并找出所有相似度不小于给定阈值的数据对的操作.集合相似连接作为一种新的基本操作在很多领域中有重要应用.随着社会网络、移动应用以及在线服务的发展,使得数据收集的效率和规模得到了很大的提高,同时给相似连接操作带来新的挑战.根据集合相似的必要条件,提出了相似集合之间的差异度.利用差异度和鸽巢原理,提出了一种新颖的基于数据划分的集合相似连接计算方法,该方法对集合进行自适应的均衡划分
其他文献
超疏水聚氨酯材料因其具有独特的特性,在国防、日常生活和许多工业领域中具有广阔的应用前景,并成为聚氨酯(PU)领域的重要研究方向之一。笔者综述了超疏水聚氨酯的制备技术,并
中国古代诗学批评在诗歌创作发生论上,十分注重自然界景物的变化对诗人创作的触动和感发作用;在对诗歌文本的分析上,往往将一首诗视为一个完整的生命有机体,以人体各要素或动