最小哈希相关论文
针对真实世界大数据应用,以区块链为基础设施,构建支持数据溯源、隐私保护、以患者为中心的数据共享平台,开发了原型系统,进行了关......
随着数字信息的爆炸式增长,备份系统中的重复数据越来越多,造成了存储资源和网络带宽的极大浪费,同时增加了处理重复数据的开销。数据......
随着信息社会的发展,信息作为一种战略资源和生产要素已经成为社会正常运转和企业生命线的基础。但是,当前的信息或数据质量水平并......
随着大数据时代的到来,信息科学技术不断迅速发展,数据规模呈现快速增长趋势,但在大量相关数据中,数据质量问题普遍存在。数据质量......
采用视觉词袋模型表示图像,以快速检测空间上部分重合图像对的最小哈希算法为基础,提出一种对局部重合图像聚类即数据挖掘的方法,......
[摘 要]哈希表由于能夠实现高效的数据存储和查找,操作时间可达到O(1)级,所以其被广泛应用于信息安全、操作系统、数据挖掘和生物信息......
特征匹配是图像识别中一个基本研究问题。常用的匹配方式一般是基于贪婪算法的线性扫描方式,但只适用于低维数据。当数据维数超过......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
大数据时代,数据的处理和应用受到了极大关注,重复数据清洗作为数据预处理的一部分,影响着数据预处理的效率和结果。主要针对重复......
图聚集技术是将一个大规模图用简洁的小规模图来表示,同时保留原始图的结构和属性信息的技术。现有算法未同时考虑节点的属性信息......
随着近年来高通量基因表达谱数据的涌现,集成多个不同实验条件的表达谱数据,并挖掘在多数据源都保守的基因共表达团,成为预测基因......