基于部分标记图的频繁子图挖掘算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xuhailinxhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘在科学研究和实际应用领域都取得了巨大的成功。随着数据挖掘技术的发展和实际应用的需要,数据挖掘的对象逐渐由传统的项目集数据扩展到了结构化的数据,如路径,树,图等复杂结构,因此,图形挖掘成为了当前数据挖掘研究领域的热点。和传统数据集挖掘中频繁项目集是挖掘任务的基础一样,图形挖掘任务中,频繁子图(即图集数据库中最频繁的子结构)是图形挖掘的基础。但是频繁子图挖掘的复杂性要远远大于项目集挖掘,因为频繁子图挖掘的核心问题是同构测试,而图的同构测试已经被证明是一个NP完全问题。随着研究的深入,迄今为止人们已经提出了许多高效和可伸缩的频繁子图挖掘算法,如gSpan, Gaston等.但是,目前的算法大多都是对有标记图进行数据挖掘,对部分标记图要么无法挖掘,要么没有对部分标记图做特定优化处理,为此,本文提出了一种基于部分标记图的频繁子图挖掘算法:PLSG(Partially Labeled based Structural Graph Mining)。PLSG算法提出了部分标记图的精确匹配和模糊匹配的概念,并据此对部分标记图进行预处理,首先将部分标记图转换为全部标记图,再对其进行频繁子图挖掘。为了达到算法的高效性和可伸缩性,PLSG使用了很多优化方法,诸如用规范化标记避免子图同构测试、采用边→路径→树→图的候选子图生成策略达到尽早剪枝等。本文通过大量的实验结果表明:(1)对部分标记图挖掘时,无论是精确匹配还是模糊匹配,PLSG都能对部分标记图进行高效的挖掘。(2)对全部标记图进行挖掘时,PLSG算法在一定程度上优于Gaston算法。
其他文献
Ad hoc网络也称无线自组网,是由一组带有无线通信收发装置的移动节点自组织而成的多跳网络。由于Ad hoc网络中节点的移动性、资源受限、同时充当路由器以及无网络中心等特点,
学位
近年来,随着科技学技术的飞速发展,人们的生活、工作、学习都向着现代化方向迈进。在教育领域,无论是教授方式、还是学习方式,都发生了巨大的变化。教授方式由以往的传统教师与学
当今的网络需要为用户提供更多、更快和更安全的服务。提供多样性服务需要以数据包分类为基础,数据包首先根据包头中的相关域(一般为源/目的IP地址、源/目的端口号和协议五个
近年来,世界各国先后建立了四通八达的交通运输网络,交通工具与道路建设的同步跃升,的确带来了一系列严峻的交通问题,导致了巨大的物质与经济损失。因此,仅靠修建道路与交通
随着信息化建设的不断深入,各政府部门、企事业单位都根据各自的业务需求建立各自的信任域(在同一安全策略管理范围内的域)并开发各自的应用系统。而信息化的发展使得这些单
无线传感器网络是一种基于大量具有传感功能的小型移动设备所构造的网络,主要用于收集、传播和处理传感信息。当前,由于微机电系统(MEMS)与无线网络技术的进步,使得人们能够
随着应用软件的不断丰富,信息安全面临的挑战也日益严峻。一般来说,软件安全问题大都由代码缺陷引起。因代码缺陷产生的安全漏洞,很可能被攻击者利用,进而达到窃取信息、控制
识别视频中的人体行为在计算机视觉领域逐渐引起了广泛的关注,它的目标是自动识别出未知的视频或者图像序列中人的行为。然而,如何有效快速地识别视频中的行为仍然面临诸多挑
随着科学技术的不断进步,信息的安全性变得越来越重要。基于公钥密码体制的数字签名技术在确保信息完整性、认证性、不可否认性等方面发挥了重要的作用。椭圆曲线密码体制的