【摘 要】
:
随着包括化学情报学、生物信息学、计算机视觉、视频索引、文本检索以及Web分析在内的广泛应用,图作为一种一般数据结构在复杂结构和它们之间相互作用建模中变得越来越重要。
论文部分内容阅读
随着包括化学情报学、生物信息学、计算机视觉、视频索引、文本检索以及Web分析在内的广泛应用,图作为一种一般数据结构在复杂结构和它们之间相互作用建模中变得越来越重要。为了进一步进行特征化、区分、分类和聚类分析,挖掘频繁子图模式已经成为一项重要的任务。近年来,频繁子图挖掘已经成为数据挖掘中一个活跃和重要的课题。
本文对基于图论的经典频繁子图挖掘算法进行了系统的研究和全面的总结,在此基础上提出了基于深度优先策略的频繁导出子图挖掘算法CISM(ConnectedInduced Subgraph Mining)。CISM采用基于顶点的扩展策略。首先扫描图集,找到图集中的频繁点,并把非频繁点从图集中删除,降低问题的规模;然后找到图集中的频繁边,将频繁边按支持度降序排列;接下来对每一条频繁边进行深度优先搜索,扩展生成候选导出子图,找到该边的所有候选导出k-子图,紧接着对这些候选导出k-子图进行支持度计数,得到频繁导出k-子图,再由这些频繁导出k-子图找到频繁导出(k+1)-子图,直到不能找到更大规模的频繁子图,即完成对该频繁边的所有扩展;然后将该频繁边从图集中删除,进入另一条频繁边的扩展;该方法能够有效地减少冗余子图的生成,提高挖掘的效率。通过真实的PTE化合物数据测试,CISM算法能够准确、高质量地挖掘图集中的频繁导出子图。
其他文献
随着计算机技术的发展,计算模式正逐步向“随时随地为人们提供服务”的普适计算过渡。随着网络技术和嵌入式技术的发展,各类便携、移动以及3C融合的产品逐渐融入并影响人们的
当今社会,各种调度规则与人工智能技术的结合已经成为目前调度问题研究的热点。基于知识库的调度是在一个群体中,建立知识库实现优化,作为一个关键模块,调度规则与知识库结合
虚拟现实技术是利用计算机生成一种高逼真的模拟环境,并可通过多种传感器接口,使用户“沉浸”到此环境中,从而实现用户与该虚拟环境之间的交互。目前,虚拟现实技术己广泛应用
嵌入式系统自诞生以来飞速发展,使得PDA、Pocket PC和智能手机等移动设备也迅速普及,基于移动设备的各种多媒体应用也逐渐丰富起来。2D图形显示已越来越不能满足人们对图形真
未来互联网体系架构需要得到大规模部署和验证。路由器是组成互联网基础设施的核心设备,解决互联网在安全可信、服务质量、移动管理、大规模路由等方面存在的问题采用的主要
无线传感器网络综合了传感器技术、计算和通信技术,成为计算机科学领域一个活跃的研究分支。在无线传感器网络体系结构中,网络层的路由技术对无线传感器网络的生命周期至关重
在日新月异的信息时代,大数据的出现给我们对于数据存储和处理带来了新的问题与挑战。在生物识别技术领域中,指纹识别技术的地位越来越重要,在身份识别和信息安全中发挥的作
随着Internet和宽带网的快速发展,流媒体应用已经成为当前Internet领域中的重要应用之一。流媒体技术通过多媒体形式能够呈现出比传统的文本格式更为直观和丰富的信息内容。
当前即时通信软件的开发主要是从协议的底层来进行研究,主要利用的是几大开源协议栈以及基于这些协议栈之上的通信API接口等。如何从现有开源协议或应用API或第三方软件着手
在当今信息爆炸的时代,人们面对着大量没有经过整理的原始数据时,将会茫然不知所措,而自动文摘技术能给人们提供更有力的信息加工技术和工具,但时下出现的自动文摘系统,特别