【摘 要】
:
数据流序列模式挖掘是数据挖掘研究中的一个重要分支,是在多数据流数据中挖掘频繁子序列的过程。传统的序列模式算法具有内存消耗大,不适应数据流数据及执行效率低等特点,因而无
论文部分内容阅读
数据流序列模式挖掘是数据挖掘研究中的一个重要分支,是在多数据流数据中挖掘频繁子序列的过程。传统的序列模式算法具有内存消耗大,不适应数据流数据及执行效率低等特点,因而无法直接移植使用。同时数据流具有快速、连续、无约束等特征。候选模式修剪不足,模式兴趣度等因素考虑不足是目前的数据流序列模式算法存在的主要问题。首先,提出一种基于有向图的数据流增量的频繁项集的算法IMIGM。该算法使用增量方法仅仅一次扫描,就能挖掘在线多数据流。设计数据结构有向图用来存储随机访问的项集。当这些事物达到滑动窗口的容量时,top-k频繁项集将通过遍历有向图输出。通过删除旧的事物,替换成新的事物,有向图将被更新。同时,整个挖掘过程重复执行。其次,提出一种基于有向图的数据流序列模式算法IMSPGM。为了研究数据流中的序列模式,可以把数据流按等长的时间划分为不同的段。一个窗口中可以有多个片段,窗口每次滑动1个片段。该算法使用增量方法仅仅需要一次扫描,同时设定了片段支持度阈值min_sup和窗口支持度阈值MIN_SUP。一个叫有向图的数据结构用来存储频繁序列。当这些事物达到滑动窗口的容量时,频繁序列将通过遍历有向图输出。通过删除旧的片段,替换成新的片段,有向图将被更新。最后,在软件安全漏洞的检测方面,结合实际的应用,对提出的算法进行一种实例分析。本文实验使用MyEclipse开发工具,通过java语言实现。通过实验证明算法在运行效率,内存使用以及算法可扩展性等方面具有优越性。
其他文献
电子商务合同的无纸化和电子商务交易空间的虚拟性,使得数据电文的自动交易可以在无人控制的环境下进行,这也使得它对交易制度提出了新的要求,对传统法律提出了新的挑战。在
菽庄吟社与上海南社在发展规模、存续时间、创作成就、声势影响等方面均旗鼓相当;然而,由于它们各自形成的社会历史背景不同,人员构成及态度倾向各异,社团宗旨、革命要求、文
独立董事制度在优化上市公司治理、规范上市公司运作、信息披露等方面发挥了积极的作用,对我国资本市场的健康发展具有积极意义。但是,独立董事制度在我国实施时间不长,仍然
由于音乐学科教育学研究与哲学、美学、社会学、心理学、教育学、物理学、历史学、民族学等多种学科有着密切的联系和交叉,因此,从考察柯达伊(Kodaly Zoltan)、奥尔夫(Karl O
实现充分就业是一个国家实行宏观经济政策的目标之一 ,但在现实生活中 ,即使在发达的市场经济国家中 ,也不能完全消除失业现象。西方经济学家长期关注失业现象 ,各派学者深入
分析了输配电线路安全稳定运行的重要性,对输配电线路的特点进行了阐述,并探讨了提高输配电线路的运行、维护和管理等方面的措施。
本文对伊犁河流域一个哈萨克族村落的婚嫁消费进行调查,探讨哈萨克族婚姻支付、婚姻中介、通婚范围以至婚姻的缔结方式等方面发生的变化,分析哈萨克族婚嫁消费的特点,从补偿
<正>目前在鱼种养殖过程中普遍存在投饵过剩、滥用药物的现象,从而引起水质恶化,池塘生态系统严重失衡,导致病害频发,给养殖业造成了一定损失。推广健康生态养殖已经成为一种
品牌符号的表意,先后经历裸物、牌子、名牌再到奢侈品这四个阶段,从第一阶段逐次进入最后一个阶段,是形成文本与意义间自然联系、不断累积丰富意义的过程,也是一个修辞过程。
目的探讨保守治疗桡骨远端骨折临床疗效的相关影响因素。方法回顾性分析2009年1月至2013年6月病历资料,按标准纳入177例保守治疗的桡骨远端骨折患者,采用单因素筛选和多因素L