劣质数据库上阈值相似连接结果大小估计

来源 :计算机学报 | 被引量 : 0次 | 上传用户:phenix519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
劣质数据普遍存在于现代数据管理系统中,严重影响了数据的质量,从而降低了数据的实用性以及数据的价值,这为数据管理带来了新的挑战.当前,已经有不少管理劣质数据的数据模型被提出,实体关系数据模型是其中一种,其中每条元组表示一个现实世界中的实体.该模型允许劣质数据的存在,给出了衡量数据质量的方法,并且可根据用户对结果质量的需求给出达到一定质量的查询结果.鉴于该模型的特点,传统的查询代价估计方法不再适用,需要新的代价估计技术.文中研究如何估计连接操作结果的大小,提出了在应用局部敏感Hash算法对属性值聚类的基础上,
其他文献
在饲料工业化生产过程中,各种作业机械在完成各自功能任务的同时,易产生粉尘. 就其性质来讲,大体分为不易收集的干粉尘和应该回收利用而无法回收行业中的难以解决的湿粉尘.
期刊
据广州市饲料行业协会2014年12月对广东省28种饲料原料价格跟踪统计,截至12月25日,有5个品种价格稳定,15个品种价格下跌,8个品种价格上涨。维生素类和蛋氨酸价格继续下跌,进
当代CMP处理器通常采用基于LRU替换策略或其近似算法的共享最后一级Cache设计.然而,随着LLC容量和相联度的增长,LRU和理论最优替换算法之间的性能差距日趋增大.为此已提出多种Cac
1月26日,江西农业大学猪遗传改良与养殖技术国家重点实验室主持完成的研究论文“全基因组重测序揭示猪环境适应性的分子机理及可能的属间杂交现象”论文,在国际上首次采用新一
2016年前三季度, 年初玉米价格开始延续去年低迷行情,价格连续下跌至4月初. 即使5月、6月出现暴涨行情, 与去年同期相比仍处于较低位置,豆粕价格略高于去年同期,同时,国内生
期刊
改革开放以来,农牧行业经过30多年的发展,正值传统农牧业向现代农牧业转型时期。何去何从?
支持向量机(SVM)方法通过核函数进行空间映射并构造最优分类超平面解决分类器的构造问题,该方法在文本自动分类应用中具有明显优势.XML文档是文本内容信息与结构信息的综合体,
能量是饲料的重要组成部分,也是动物生长、生产等所需的主要养分之一.饲料中的能量不能完全被动物利用,因此,准确评定饲料中的能值能有效提高能量利用率,节约饲料成本.净能体
期刊
联盟形成是多Agent系统中的一个关键问题,寻求能极大化联盟值总和的最优联盟结构是NP完全的.Sandholm等人已经证明,要建立最坏情况下的限界k,搜索联盟结构图的最底两层是必要且是
本文综述了抗菌肽的研究概况、主要抑菌机制及其在水产动物饲料的应用现状,分析了抗菌肽在应用中的问题,并对其在水产动物饲料中的应用前景进行了展望.
期刊