【摘 要】
:
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少
【基金项目】
:
湖南省教育厅科研资助项目(08B040)
论文部分内容阅读
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少挖掘最大频繁项集的时间。理论分析和实验结果证实了该算法在时间和空间上的有效性。
其他文献
利用INRAIMpRH(含118克隆),将猪细胞视黄醇结合蛋白基因1(RBP1)和猪血浆视黄醇结合蛋白基因4(RBP4)分别定位在猪13号和14号染色体上。利用半定量RT-PCR方法,对这2个基因在成年五指
植物病原细菌通过不同的分泌途径将毒素及酶类分泌到胞外,每种途径均具有自身的特点及局限性,主要有4种类型的分泌系统。本文着重介绍Ⅱ型分泌系统与植物病原细菌致病性的关系
为了降低计算代价,在CLIQUE算法的基础上引入了便利网格和障碍网格等概念,提出了便利体和障碍物下基于网格的聚类算法(GBSCFO)。GBSCFO首先利用CLIQUE算法生成微簇,然后在微簇的粒度上计算障碍距离。通过理论分析和实验验证,GBSCFO具有较好的时间复杂度和聚类效果。
从杜长大母猪的肠系膜脂肪中提取基因组RNA,用RT-PCR扩增脂蛋白脂酶(lipoprotein lipase LPL)基因,获得1条约689bp的片段,以pGEM-T Easy vector为载体,将该基因片段克隆到大肠
对目前主流操作系统的文件大小分布和空间占用、网络文件服务环境下的文件读取请求和视频下载点播等典型应用进行了统计分析,总结了对交换文件、小尺寸文件和访问集中文件进行优化的必要性和可行性。基于目前已有的存储器件,提出了基于统计结果的混合加速外存储体系结构及相应的调度算法。实验结果表明,可以缩短I/O响应时间,提高传输率,改善系统性能。
基于直角坐标系研究一类在一族无向双环网络G(N;±1,±s)(1〈s〈N)中直径、平均距离均达到最小值的双优双环网络DG(N;±1,±s)的仿真图形特征及其分布特性,计算出4
为了解决传统仲裁机制故障覆盖率和故障诊断成功率低的问题,针对容错计算机,提出了一种基于仲裁处理器的仲裁机制,并设计了仲裁系统和仲裁算法。其中仲裁处理器使用三模冗余系统和芯片级的容错设计技术,仲裁算法采用分级方式,同时采用自检测和心跳监测相结合的故障监测机制,有效地解决了单点故障和检测成功率低的问题。最后通过故障注入方式验证了仲裁系统的可用性。
以真实蚁群算法为基础,提出了一种分布式信息检索下的移动agent动态迁移算法。该算法有如下特点:a)Agent能根据当前主机的状态,自主选择下一个负载轻的主机移动;b)Agent能找到一条开销最小的路径移动。仿真结果表明,该算法与固定路由算法相比,性能提高80%以上,并且算法无须依赖集中的迁移模块。蚁群算法分布在各节点中,提高了系统的容错性,具有分布、并行的特点。
对两个无证书部分盲签名方案进行了分析,指出这两个方案都是不安全的。对于第一个方案,类型Ⅱ敌手即恶意私钥生成中心KGC可以利用在系统参数生成阶段生成的含有陷门信息的系统参数计算出目标用户的密钥,从而冒充该用户伪造签名;对于第二个方案,类型Ⅰ敌手通过替换用户的公钥伪造该用户的签名。
在稳健的波束合成器中,采用对角负载的校正方法能有效克服误差影响。与传统的对角负载稳健波束合成器相比,新算法一方面综合考虑多种误差影响,建立相应数学模型;另一方面,在求解最优对角负载值时,对协方差矩阵进行了预处理,消除了部分误差影响,从而使对角负载校正方法更加有效。计算机仿真证明了新算法的有效性。