一种基于增量分区的社交网络数据管理与维护方法

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:songchuans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  社交网站作为在线交流的最新形式,吸引了数以亿计的用户,同时产生了海量数据。为此,如何存储大量的用户及其交互信息成为了社交网站的一个挑战。在深入分析了社交网络数据的特点之后,提出了一种用来描述社交网络中用户交互行为的交互关系有向图模型,该模型可以很好地反映用户交互的一些特性;提出了一种采用增量方式对社交网络进行分区的方法,该方法具有很好的可扩展性并能较好地解决数据本地化问题;构建了一套存储、管理与维护社交网络数据的系统。最后通过Facebook网站的数据对系统进行了测试。
其他文献
  贝叶斯网(BN)作为一种重要的概率图模型,是统计型不确定性知识表示和推理的基本框架.如何从海量数据中学习BN,是目前云计算环境下海量数据中不确定性知识推理及相关应用
会议
现有网络安全风险研究仍然存在基础概率不准确和严重性模型缺失等问题.文中首先基于变电站电力监控系统框架提出“边界-本体防护”模型来描述系统入侵威胁,根据历史数据的机
针对电力系统暂态稳定预防控制在线计算的复杂性,提出一种基于生成对抗网络的暂态稳定预防控制方法.通过将暂态稳定预防控制建模为样本空间映射问题,该方法利用数据驱动方法
  世系记录了数据产生和演化的过程,基于世系信息计算不确定性数据查询结果的不确定性,可提高处理的效率.贝叶斯网是不确定性知识表示和推理的基本框架,以有效支持基于世系
会议
  针对现在数据流查询与管理系统存在的不足,本文基于Aurora开发了支持CQL的数据流管理系统Conger,系统演示包括CQL示例查询的注册、解析和执行等。
  如今的互联网领域时刻都在产生海量的数据,文本数据是重要的组成部分。在这些文本数据中,存在大量的近似复制文本,这些相似程度很高的文本对给相关处理程序增加了额外负担。
在智能电网中,精准的数据采集是整个系统安全与经济运行的基础.随着信息与物理系统融合的不断加深,各类大数据应用与实时控制等任务对采集高频数据的要求不断提高.然而,提高
  图数据结构具有较强的模拟复杂结构的能力,能够很好地表达数据对象之间的关联,广泛地用于各领域非结构化数据建模。为解决大量数据子图查询处理中的不确定情况,本文提出了基
  针对物联网数据具有的海量性、异构性、时空敏感性、序列性及数据流式等典型特性,提出适用于单个存储节点的物联网异构时空数据统一存储模型Hestus,通过分层应用架构模式
  如何处理缺失值一直是数据库领域中一个值得关注的问题,缺失值问题的研究对于提高运算效率和保证系统健壮性具有重要意义。云环境中海量数据的稀疏性使缺失值问题变的更加
会议