不确定图的代表实例发现算法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wtuye262626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络及生物网络等许多领域的数据都可建模成边带有存在概率的不确定图。不确定图上的查询与挖掘问题具有广泛应用。目前,不确定图数据查询与挖掘问题面临很多挑战,其中最重要的挑战是计算代价非常高。因为不确定图上的精确查询需要对指数级别数量的实例进行评估,所以即使一个简单的查询问题在不确定图上都成了#P-完全问题。现有的不确定图数据查询与挖掘算法通常基于采样技术。采样技术需要对不确定图的所有可能世界进行随机采样,并在大量获得的样本上进行相关的查询处理,因此计算代价较高。为进一步提高不确定图查询与挖掘问题的效率,本文研究不确定图代表性实例发现算法,即从不确定图的所有实例中找出一个或多个最能代表不确定图期望结构特性的实例。这样可以在这些代表性实例上做查询,进而在很大程度上提高查询效率。本文主要有以下贡献。本文提出基于三角形的代表性实例的概念,其目标是保留不确定图的顶点度分布与三角形度分布。该概念引入了三角形度的结构特性度量,克服了现有方法片面采用顶点度的不足。本文证明寻找基于三角形的代表性实例问题是NP完全问题。本文提出基于三角形的代表性实例发现算法。基于随机边交换的方法,该算法可精确高效地获得不确定图的基于三角形的代表性实例,解决了现有方法查询效率低的问题。本文提出寻找多个代表性实例的算法框架。该框架基于分层采样的思想,用本文提出的两种分层策略和选边策略将不确定图的所有实例集合划分成多个互不相交的子集。通过将该框架与基于三角形的代表性实例算法相结合,提出多个基于三角形的代表性实例发现算法。该算法克服了单个代表性实例算法不能很好地解决概率性查询问题的不足。本文提出一系列基于代表性实例的不确定图查询处理算法,包括顶点度分布查询、顶点三角形度分布查询、三角形计数查询、聚集系数查询、最短路径查询及可达性查询。本文做大量实验来证明基于三角形的代表性实例能准确且高效地解决很多不确定图上的查询问题,如聚集系数查询及最短路径问题。除此之外,多个基于三角形的代表性实例还能有效地解决类似可达性查询的概率性查询问题。
其他文献
现有的工作流引擎在设计上往往与具体的业务领域相关,在实现上通常与具体的业务逻辑存在代码粘连,这样导致引擎的通用性差。研究发现,工作流引擎主要具有两项功能:流程调度功
关联规则挖掘是数据挖掘领域中一个重要研究方向,频繁模式挖掘是关联规则、时序模式挖掘等应用中的关键技术和步骤,而数据流频繁模式挖掘又是当前频繁模式挖掘的一个热点问题
伴随着互联网的迅猛发展,各类信息琳琅满目,从而导致用户在信息面前出现迷失现象。因此,研究如何为不同的用户提供不同的服务,已经成为亟待解决的问题。Web个性化推荐系统通
基于视频序列的图像超分辨率重建技术是指在低分辨率图像序列彼此之间存在子像素位移的前提下,利用低分辨率图像序列之间的冗余信息,构造出比其中任何一幅低分辨率图像分辨率
随着计算机技术、网络技术的快速发展,无线视频监控在工业生产的远程监控中应用越来越广泛。研制灵活可靠、性价比高的远程无线视频工业监控系统具有非常重要的实际意义。针
近年来,计算机技术、多媒体技术的迅猛发展给人们的生活带来了日新月异的变化,人们每天都在接收大量的信息,在大量的多媒体信息当中,视频数据占有很大比重,随着视频数据的日
随着社交网络广泛应用,人们每天在社交网络上发布信息和交友。社交网络上的用户信息包括个人隐私类信息(护照号码和银行账号等)和非隐私类信息(购买记录,网页浏览记录等)。用
随着现代通信和计算机技术的不断发展,金融业在基于各类电子渠道的创新银行业务也应运而生,网上银行在人们生活中起到越来越重要的作用,因此人们对网上银行提出了更高的要求
能耗效率是无线传感器网络设计中的一个热点问题。由于无线传感器的节点通常用电池供电,一个高效的传感器网络要求优化路由协议,能够平衡功率消耗,从而延长整个网络的生命周期
微粒群算法是一种模拟鸟群飞行的群智能优化算法。由于其收敛速度较快,在优化一些多峰高维问题时易陷入局部极值点。作为微粒群算法的一个研究内容,拓扑结构具有提高种群多样