超大规模社交图上的子图匹配问题研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:pretter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是一种以顶点和边为基础形成的一种结构化数据表现形式,相比传统的数据库表形式,具有非常灵活的表达能力。近些年来,Twitter, Facebook,微博,微信等社交工具的出现,产生了超大规模的社交图数据。如何处理超大规模的图数据成为了非常关键的研究问题。子图匹配问题是图数据处理领域中的一个非常基础和重要的问题。图上的搜索,模式挖掘算法都必须基于快速的子图匹配算法。子图匹配问题是一个NP难问题,前人的研究工作中给出了一些纯算法的解法,这些方法难以处理十几万顶点以上规模的图数据。也有一些工作通过建立索引的方式来处理大规模的图数据,但是这些索引的规模都是图规模的超线性函数,在图规模达到上亿级别的社交图时,索引的存储代价过大,无法实现。分布式图数据库的出现使得存储和操作超大规模的图数据成为现实。本文的工作以微软亚洲研究院(MSRA)研究的分布式图数据库Trinity为底层图数据存储引擎,研究了超大规模图上的子图匹配问题,提出了一个使用线性索引,基于快速图搜索的剪枝技术和大规模并行计算技术的子图匹配算法,论证了算法的正确性,完备性和不重复性。实验表明我们的算法具有很好的响应时间和可扩展性,说明了在大规模图上进行快速子图匹配的可行性。
其他文献
企业知识管理系统的构建及应用正引起广泛的关注。由于不同企业以及同一企业的不同时期的需求往往存在差异,因此如何使知识管理系统具有通用性,能够随着需求的变化进行灵活配置
XDCHECK是一个针对C/C++程序的静态安全检查工具。本文的主要工作是设计并实现XDCHECK中用于收集程序符号信息的符号表子系统。本文分析了XDCHECK工具的框架设计,以及其安全检
在计算机“虚拟人”的研究过程中,对于塑造具有真实感动作表情的“虚拟人”来说,三维头发的仿真研究是必不可少的。作为“虚拟人”研究的一个部分,头发的仿真和动态实现十分复杂
近年来,网格技术成为计算机领域的研究热点,网格数据管理在不同领域的应用研究得到科研人员越来越多的关注。在电力系统研究领域中,数据管理系统要求数据资源具备较高的安全
随着计算机网络的不断发展和普及,网络入侵不仅数量剧增,而且攻击手段也日趋复杂,这使得入侵响应技术对保护系统安全性显得尤为重要。目前的入侵响应大都只是在入侵检测系统
传统信息检索方式下,由于信息资源缺乏统一的语义描述,因而难以进行更深层次的信息挖掘.如何使被管理的信息资源具有应用程序可以理解的含义,从而使其可以在理解其内容的基础
本论文以海洋环境数据挖掘系统的分析、设计、研究与实现为主体,主要讨论基于海洋环境数据库或水文气象数据仓库(集市)的数据挖掘技术的研究,以Oracle数据挖掘工具为基础,对其工
本文对面向自强3000的集群管理系统的实现进行了研究。文章开发了一套适用于自强3000高性能集群计算的集群管理系统,该系统可运行在RedHatLinux7.3以上版本的平台上。该系统的
随着Web服务技术不断成熟,其在异构系统集成应用中的优势日益突出,基于Web服务的应用集成技术成为企业信息系统研究的热点。方便实用的Web服务应用接口也成为基于Web的应用集
软件复用被认为是改善软件质量和提高软件生产力最有希望的技术。为了支持复用,软件开发过程必须考虑两个方面的问题:为复用开发和用复用开发。本体逐渐成为构建信息系统、提