基于相似性度量的图模式挖掘研究

被引量 : 0次 | 上传用户:longzhi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们利用信息技术生产和搜集数据的能力大幅提高,数据资料的规模急速膨胀,我们已经被淹没在数据的汪洋大海中。作为大规模数据处理和决策支持的关键步骤之一,数据挖掘受到了人们的广泛关注,而频繁模式挖掘是其中一个重要的研究课题,其研究重点是发现数据中的特征信息,即模式。近年来,频繁模式挖掘技术已经广泛运用于各个领域,但是,随着数据挖掘越来越多的运用于新的领域,原来的频繁模式挖掘方法已经无法适应问题的需要。这是因为这些方法都以项集为基本操作对象,而现实生活中万物皆有内在的联系,彼此之间构成一张复杂的网,因此用图模型来抽象相关领域的问题更加符合真实情况。在图模型下,频繁模式的挖掘即是在图中寻找频繁出现的子图。本文在分析已有图模式挖掘算法的基础上,提出了基于相似性度量的图模式挖掘方法SBPM(similarity based pattern mining),它首先利用一个高效的枚举算法找出图中所有规定大小的子图,然后基于图的顶点及顶点周围结构的相似性度量两个图之间的相似性,在获得的相似性基础上对这些子图进行聚类分析,将相似子图聚为不同的类别,最后从频繁的相似子图类别中诱导出图模式。该方法能够直接找到指定大小的模式,并且通过相似性度量避免了子图同构操作,有效地提高了模式挖掘的效率。通过多种真实网络数据的验证,SBPM算法能够准确、高效地挖掘出图中蕴含的模式。
其他文献
为了解决现有农业行政执法系统中存在的信息服务手段不足等问题,以及适应和满足日益扩展的执法业务需要,提出一种面向微服务的农业执法系统设计方案。构建服务于多部门分级管理
用PCW-7-甲苯络合萃取剂处理富马酸废水,萃取液用碱液反萃回收,每立方米废水可回收9 kg富马酸,其含量大于97%.研究了影响萃取效果的相关因素,确定了适宜的工艺条件.
《国家新型城镇化规划(2014—2020年)》提出,坚持以人为本的城镇化建设,推进功能混合和产城融合,在集聚产业的同时集聚人口,防止新城新区空心化。习近平总书记在党的十九大报
写作作为一种交际手段,有时是有确定交际对象(即写作对象)的。写这类具有固定交际对象的文章,作者应注意自觉根据交际对象的特点,采取有效的写作方法,使文章为交际对象所接受
目的探讨白塞病(BD)合并肺部病变特点,以提高对该病认识。方法分析1999—2012年收住广州医科大学附属第一医院、广州呼吸疾病研究所确诊BD合并肺部病变12例患者临床、实验室
1986年9月我国第一家破产企业沈阳防爆器材厂被拍卖。近年来我国法院受理的破产案件平均每年达6000件左右。《最高人民法院关于审理破产案件若干问题的规定》中规定:“破产财
目前,党中央、国务院各类文献中一律采用城镇化概念。城镇化与城市化之间仅一字之差,涵义有什么不同,为什么都要统一到城镇化"官方口径"上去,值得认真地研究。改革开放以来,
<正>慢性前列腺炎(CPT)是泌尿科的常见病和多发病,本病具有临床症状及表现复杂、治愈率低而复发率高,患者心理压力大,多数与男性不育有一定的关系等特点。由于CPT的病因、发
<正>杨绛先生的散文向来得到很高的评价:"严谨的写实作风使她的散文浑然本色,亲切可感;对道德尊严的执着追求使她的散文充满了人格的感召力;有距离的审美观照、美丑善恶互现
<正>1996年1月至2008年1月共收治尺神经卡压患者193例,其中前臂腱鞘囊肿致尺神经卡压患者12例,占0.6%。采用手术切除腱鞘囊肿、尺神经松解术取得良好疗效,现报告如下。