【摘 要】
:
一直以来,图作为处理大规模数据的典型数据模型得到了广泛关注,比如蛋白质交互(Protein-ProteinInteraction,PPI)网络、交通网络、社交网络、RDF数据等都可以抽象为图。随着
论文部分内容阅读
一直以来,图作为处理大规模数据的典型数据模型得到了广泛关注,比如蛋白质交互(Protein-ProteinInteraction,PPI)网络、交通网络、社交网络、RDF数据等都可以抽象为图。随着数据处理技术的提高,人们对数据的准确性要求也越来越高,数据采集和处理中带来的噪声和错误逐渐纳入研究范围,研究对象从确定型数据扩展为不确定型数据,模型也拓展为不确定图模型,即在确定图的基础上增加了概率维度。由于概率维度的增加,导致确定图中的研究成果不能直接应用于不确定图,需要探究新的方法。目前基于不确定图上的研究问题很多,比如子图匹配查询、最短路径查询、可达性查询等,本文着重研究不确定图上基于距离阈值的可达性查询和基于概率阈值的模式匹配问题。 针对不确定图上基于距离阈值的可达性查询问题,本文通过分析满足可达性条件的可能图实例的特点,定义了图实例分类树结构,给定任意可能图实例,根据遍历条件遍历图实例分类树,根据最终所达的状态便可知该实例的可达性。为了减小图实例分类树的信息冗余度,本文提出了基于双向遍历的优化分类树构造算法。最后本文设计了基于图实例分类树的抽样方法来估计基于距离阈值的不确定图可达概率,并通过理论分析和实验验证了算法的有效性。 针对基于概率阈值的不确定图模式匹配的问题,目前完全相同的研究成果尚未出现,本文在给出问题定义的基础上,给出了相应的解决方法:为了减小模式图的规模,在数据预处理阶段对模式图进行了化简;在基于概率阈值的可达性查询中本文采用filter-verify模式的判断方法加快了判定速率;最后给出了匹配查询过程算法并在合成数据和真实数据上验证了方法的有效性。
其他文献
软件水印是软件版权保护的重要手段,它通过向目标程序嵌入标志版权所有者的特定信息来达到身份认证的目的。根据嵌入水印时刻的不同,软件水印分为动态软件水印与静态软件水印,其
SAR图像分割是SAR图像理解的前提和基础,对后续的分析和解译具有重要影响。而SAR图像极不匀质区域的方向丰富,尺度多变,是SAR图像分割的难点所在,本团队提出的SAR图像层次视
IEC61850通信协议体系是国际电工委员会在电力行业制定的国际通信标准,它作为基于通用网络通信平台的变电站自动化系统唯一国际标准,现在在各国电力行业获得了广泛的使用,我国也已经把该标准采纳为电力行业标准。但IEC61850在安全性方面没有做出相应的规范,使得该标准不能保证通信双方的数据机密性、完整性,而且还不能进行身份认证。近年来,如何保证电力系统的网络安全,已经成为一个热点课题。本文为了解决I
雾霾天气条件下,户外成像系统获得的图像严重退化。如何有效去除雾霾影响,改善图像质量,获得用户感兴趣的有用信息,一直是计算机视觉和图像处理领域研究的热点之一。近年来基于偏
随着互联网的普及和发展,人们获取信息的方式也在不断变化。不同的信息获取方式对于信息服务的技术也有不同的要求。一个总的趋势是逐渐由用户主动“拉取”信息转变成信息服务
传统的缓存策略主要基于内存缓存,采用读写速度作为最终目标,随着固态硬盘SSD的出现,传统的缓存设计思路不再适用,由于固态硬盘存储介质Flash的读写特性以及擦写次数限制,如果将传
近年来,各种以流媒体技术为核心的产业,如视频点播、网络电视、视频分享网站等飞速发展,而流媒体视频的版权保护问题也日益严重。视频水印技术是一种有效的版权保护手段。但
无线传感器网络是由大量传感器节点自组织形成的网络,主要用来感知并收集监测区域的信息。由于信息的完整性会直接影响用户决策的正确性,且传感器节点的电源能量、通信能力和计
合成孔径雷达SAR是遥感技术领域的重要进展,用来获取地球表面的高分辨图像。其对国民经济的各个方面意义重大。深度学习是近年来提出的一种类脑学习的机器学习理论,深度学习理
机房是承载学校信息化建设和网络交换设备的重要基础设施,其安全性和运行状态关系到校园网络安全和学校信息化的正常运行,因此对机房环境进行实时远程监控以及建立报警和预警机