一种有效的挖掘数据流近似频繁项算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:skybey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域有着广泛的应用.在数据流模型下,算法只能一遍扫描数据,并且可用的存储空间远远小于数据流的规模,因此,挖掘出所有准确的数据流频繁项通常是不可能的.提出一种新的挖掘数据流近似频繁项的算法.该算法的空间复杂性为O(ε^-1),每个数据项的平均处理时间为D(1),输出结果的频率误差界限为ε(1-s+ε)N,在目前已有的同类算法中均为最优。
其他文献
在数据流环境下,聚类算法不仅需要有较高的聚类质量,同时需要有实时处理速度.因而,提出了一类基于图形处理器(graphics processing unit,简称GPU)的快速聚类方法,包括基于K-means的基
猪瘟是由猪瘟病毒(CSFV)引起的一种传染性很强、致死率极高的热性传染病。临床表现为高温、微血管变性而引起全身出血、坏死、梗塞。继发或并发细菌或其他病毒感染等,病程多种多
超分辨率图像复原是当今一个重要的热门研究课题.鉴于双边滤波优良的噪声抑制性和鲁棒的边缘保持性,提出一种双边滤波导出的广义MRF(Markov random field)图像先验模型.广义MRF模型不仅继承了双边滤波在阶数大邻域中的双重异性加权机制,且简洁地建立了双边滤波与Bayesian MAP(maximum a posterior)方法之间的理论联系.同时,由广义MRF模型导出了一种各向异性扩
本文主要探讨如何加强支导线检核的方法,以弥补支导线测量容易出错的缺陷,增加测量成果的可靠性。
目的 通过比较电视胸腔镜(video-assisted thoracoscopic surgery,VATS)下肺癌根治术与常规开胸肺癌根治术的淋巴结清扫情况,探讨电视胸腔镜应用于Ⅰ期肺癌根治中淋巴结清扫的
钢纤维的存在阻滞了基体混凝土裂缝的产生和发展,与普通混凝土相比,呈现出良好的抗拆折、抗拉、抗冲击和抗疲劳等力学性能,以及收缩率小,韧性好,耐磨耗能力强等优点。本文对钢管拱
目的 通过对病理确诊的105例肺内磨玻璃影患者其临床特点、CT图像及结果,研究肺内磨玻璃密度影良、恶性的危险因素。方法 根据纳入、排除标准筛选出本院经病理确诊的肺内磨玻
目的 探讨电子支气管镜下CO2冷冻治疗良性气管狭窄行支架置入后肉芽组织增生的疗效.方法 总结27例良性气管狭窄行支架置入术后肉芽组织增生的患者资料,分析电子镜下CO2冷冻治
动态多层Web系统在运行时会受到许多不确定性因素的影响.同时,在不同的负载模式下具有不同的性能特性,需要不同的性能模型进行描述.为消除不确定性因素对系统性能的影响,基于反馈
中国计算机学会信息保密专业委员会定于2007年9月中旬在湖北省襄樊市召开学术年会。此次学术年会由国家保密局指导,国家保密技术研究所主办,湖北省保密局、沈阳东软软件股份有限公司承办。欢迎同行专家、学者、科研工作者和信息保密管理工作者积极投稿(论文集为国家正式出版物)。现将征文有关事宜通知如下:
期刊