基于序列模式的手机病毒挖掘系统的设计与实现

被引量 : 1次 | 上传用户:zhouqiangjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从数据挖掘的概念被提出到现在,数据挖掘的思想和方法已经在许多行业都有了比较深入和成型的应用,其领域跨度包括计算机互联网行业、生物科学行业和金融行业等。尤其是在如今的信息时代,数据的量级呈爆炸式增长,数据挖掘成了一个从海量数据中提取有用信息的必不可少的工具数据挖掘中的关联挖掘算法已经在诸多领域被证明是一个有效的算法,但是由于算法本身的原因,它得到的关联规则无法表示事务之间具有的时序关系,针对这个问题,研究人员提出了序列模式挖掘算法。本文比较深入地研究了序列挖掘相关算法,包括按照水平方向产生频繁序列模式的GSP算法、AprioriAll算法和PrefixSpan算法,以及按照垂直方向的SPADE算法,但是这些基本的算法都存在空间和时间复杂度过高的问题。对于上述问题,首先针对西门子手机病毒挖掘引擎中实际数据的情况,依据数据挖掘中数据预处理理论提出了实际的预处理方案,使得原始数据能够适应本项目中的挖掘算法应用;然后依据SPADE算法思想,利用多叉树结构有效地产生了频繁序列模式集,并结合闭合序列模式理论,提出了一种新的闭合序列模式判别方法,这是本文的核心。本项目从效率和有效性的角度上,通过对比实验,证明了基于S-List的闭合序列模式挖掘(SLCSP)算法时间复杂度和有效性都具有良好的表现,其中在IBM序列数据生成器上实验说明SLCSP算法相比较CloSpan算法在效率上的优越性,在实际病毒数据挖掘中,验证了算法的有效性。
其他文献
为了提高电动汽车再生制动能量的回收和利用效率,在分析电动汽车典型循环工况制动时驱动电机的工作特点,并在同步旋转坐标系下考虑铁损的感应电机动态数学模型制动时能量转换
目的了解干燥综合征国际合作联盟(Sjgren’s International Collaborative Clinical Alliance,SICCA)研究提出的结膜角膜染色评分(ocular staining score,OSS)在干燥综合征
针对当代中国的信仰危机问题,不少学者企图通过重塑宗教信仰的方式来解决问题,可是"敬鬼神而远之"的儒家文化传统决定了这条道路对中国恐怕是行不通的。鉴于中国古老悠久的以
"丰田车召回门"的影响还在扩散,丰田章男还处在十字路口。近日,又有国内比亚迪电动汽车电池安全事故发生,似乎与汽车有关的变故事故的阴影总是在我们的记忆中挥之不去。而比
湖北恩施枫香坡侗寨是一个在几乎没有原生态文化积淀的基础上建构起来的新型民族村寨。其建构是在地方政府的主导下,带动村民参与的自上而下的引导性文化建构,建构后的村寨是
<正>请先看清代查慎行的《舟夜书所见》一诗:月黑见渔灯,孤光一点莹。微微风簇浪,散作满河星。这首诗的一、二两句描写的是静态景物,三、四两句描写的则是动态景物。诗中运用
<正>阅读理论认为,任何阅读理解与读物本身所承载的信息总是绝对地存在着距离,距离的大小取决于阅读者的阅读水平,但距离不可能消失。误读是阅读理解与读物所承载的信息距离
极简主义设计风格引领世界家具设计风潮,不管是在欧美设计强国,还是在亚洲家具大国中国,乃至世界每个角落,极简主义家具以其用最经济的花销,借助最优秀的工艺手段,采用最简洁
瞿佑的《剪灯新话》在其"自伤与伤世"的创作原则影响下,呈现出独特的美学风貌,这种感伤特质不仅影响了作品中的环境描写,更与小说主题建构息息相关。这种心态的成因可追溯至