挖掘滑动窗口中的数据流频繁项算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:w168730018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
滑动窗口是一种对最近一段时间内的数据进行挖掘的有效的技术,本文提出一种基于滑动窗口的流数据频繁项挖掘算法.算法采用了链表队列策略大大简化了算法,提高了挖掘的效率.对于给定的阈值S、误差ε和窗口长度n,算法可以检测在窗口内频度超过Sn的数据流频繁项,且使误差在εn以内.算法的空间复杂度为O(ε1),对每个数据项的处理和查询时间均为O(1).在此基础上,我们还将该算法进行了扩展,可以通过参数的变化得到不同的流数据频繁项挖掘算法,使得算法的时间和空间复杂度之间得到调节.通过大量的实验证明,本文算法比其它类似算法具有更好的精度以及时间和空间效率.
其他文献
数据模型的研究是目前数据空间中研究的主要问题之一,是数据空间管理系统提供其它服务的基础.由于数据空间中多种异构性数据资源的共存和松散连接的特点,有必要提出一个有效
期刊
当前城市建设工程之中,市政排水工程是整个城市建设之中最为重要的一个环节,随着我国逐渐对现代城市的排水、排污等方面的重视程度逐渐增加,在进行排工程施工之中,选用绿色环
通过试验,总结出刺果茶藨子嫩枝扦插条材选择与处理、扦插时间与基质配置、扦插后期管理等配套技术措施,以期为刺果茶藨子扩繁与种质资源保护提供技术支持.
本文主要研究了脱硫石膏制备硅酸盐水泥的相关内容,主要概述了硅酸盐水泥的制备和检测过程,利用脱硫石膏制备硅酸盐水泥不仅可以节约成本,还可以减少脱硫石膏带来的二次污染.
论文先对R矩阵采用一种新颖的Cholesky分解方法,再根据定点DSP的特点对其递归公式进行相应的改进,然后与传统的Cholesky分解方法相比较。仿真表明,改进的Cholesky分解方法具有良好的数据精度和可行性。
期刊
在构建四翅滨藜(Atriplex canescens)全长cDNA文库中通过随机克隆测序并进行EST分析基础上,得到1个四翅滨藜甜菜碱醛脱氢酶(betaine aldehyde dehydrogenase,BADH)的cDNA序列