最大频繁子图挖掘算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:ericwu8756
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是通过仔细分析大量数据揭示有意义的关系、趋势和模式的过程,图挖掘是数据挖掘的一个分支,它的研究任务包括频繁子图挖掘和最大频繁子图挖掘。与频繁子图挖掘相比挖掘最大频繁子图并不丢失信息,而且挖掘最大频繁子图得到少量的结果有助于对结果的理解和应用,但是当前的算法中仍然存在子图同构的问题,本文的重点内容如下。首先,当前算法中规范编码计算效率很低,本文基于结点不变的原则提出新的规范编码计算方法,提高规范编码的计算效率。并且提出应用有向无循环图来计算支持度的方法,该方法通过节点之间的关系来判断某图在图集中是否存在超集,进而计算它的支持度。其次,针对判断两个频繁k子图是否可以进行连接时的子图同构问题,提出了FSG-MaxGraph算法。算法提出两个定理,在删除边进行子图同构之前应用定理进行判断,减少子图同构判断的次数。再次,针对当前算法存在的挖掘难度大的问题,提出Top-Down算法,Top-Down算法通过改变挖掘策略来避免计算最大频繁子图的所有子图的支持度,降低挖掘难度。最后,通过实例以及实验对FSG-MaxGraph算法、Top-Down算法挖掘效率和正确性进行验证,同时通过理论与实验相结合判断这两种算法分别在哪种情况下具有相对更高的挖掘效率。
其他文献
立体匹配是立体视觉中的关键技术之一,其核心问题是将同一个空间物理点在不同图像中的映像点对应起来。立体匹配是三维重构的基础,匹配的结果直接关系到三维重构的效果。但由
无线移动视频由于其带宽有限以及移动终端设备本身处理器频率和电池能耗的限制,对视频压缩提出新的要求,要在较高的压缩比例下,减少计算复杂度,并取得令人满意的视觉效果。一方面
糖类作为生命体中的重要大分子,在一系列生命活动中扮演极为重要的角色。与蛋白质的直链构型不同,糖是分支构型的树形结构,这使得糖的鉴定非常困难。质谱技术的高灵敏度、高特异
近年来,随着视频获取设备的普及与发展以及网络传播能力的增强,视频逐渐成为信息的主要载体。无论是社交平台还是娱乐媒体亦或城市安全监控,社会的方方面面都对视频数据的依赖与
随着无线通信技术的发展和多媒体新业务的出现,通信领域呈现出宽带移动化和移动宽带化的趋势,“宽带”和“移动”成为无线通信系统两个最重要的特点。在这样的背景下,IEEE提出了
随着我国卫星通信产业的迅猛发展,卫星通信产业链已逐步形成,但专用卫星终端测试系统严重缺乏。具备自主知识产权的GMR-13G(GEO-Mobile Radio interface-1the3rd Generation)卫
随着我国经济的发展,矿山建设正在如火如荼的展开,然而由于矿山建设管理模式不同和业务需求变化大,使得面向对象技术和基于组件的设计思想无法解决重用和可维护性问题,矿山建
矿井水文地质工作直接影响到煤矿的安全,尤其是矿井水害对煤矿生产影响极大。在矿井建设和生产过程中,大气降水、地表水和地下水都可能通过各种通道涌入矿井,造成矿井突水事
尽管计算机辅助设计软件(Computer Aided Design,简称CAD)目前被广泛地应用于建筑设计、机械制造等领域并极大地提高了工作效率,但在功能和交互方面还存在一定的改进余地。在功
随着移动设备、无线网络技术的不断发展、成熟和普及,移动应用所涉及的领域不断拓宽,在线地图服务也日益成为移动地图服务的发展趋势。然而,由于移动设备硬件和无线网络带宽等因