SOOP:Efficient Distributed Graph Computation Supporting Second-Order Random Walks

来源 :计算机科学技术学报(英文版) | 被引量 : 0次 | 上传用户:Mondy_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
The second-order random walk has recently been shown to effectively improve the accuracy in graph analysis tasks.Existing work mainly focuses on centralized second-order random walk (SOW) algorithms.SOW algorithms rely on edge-to-edge transition probabilities to generate next random steps.However,it is prohibitively costly to store all the probabilities for large-scale graphs,and restricting the number of probabilities to consider can negatively impact the accuracy of graph analysis tasks.In this paper,we propose and study an alternative approach,SOOP (second-order random walks with on-demand probability computation),that avoids the space overhead by computing the edge-to-edge transition probabilities on demand during the random walk.However,the same probabilities may be computed multiple times when the same edge appears multiple times in SOW,incurring extra cost for redundant computation and communication.We propose two optimization techniques that reduce the complexity of computing edge-to-edge transition probabilities to generate next random steps,and reduce the cost of communicating out-neighbors for the probability computation,respectively.Our experiments on real-world and synthetic graphs show that SOOP achieves orders of magnitude better performance than baseline precompute solutions,and it can efficiently computes SOW algorithms on billion-scale graphs.
其他文献
微塑料在海洋、湖泊等水体中频繁检出,但在饮用水中有关微塑料的研究甚少,其在饮用水中的存在现况和健康效应仍难以确定.文中阐述了近年来微塑料在饮用水中的存在现况、健康效应,分析了混凝沉淀、砂滤、臭氧氧化-活性炭过滤工艺对于微塑料的去除效率,并展望了微塑料在饮用水领域中的研究进展,对当前饮用水中微塑料研究存在的问题提出了建议.
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.030  摘 要: “数字电子技术”是计算机、电子类专业的重要核心专业课程,针对目前教学方法过于死板枯燥、理论与实验脱节的问题,提出利用LabVIEW虚拟仪器技术对课程内容进行设计,实现动态教学演示的教学方法。以编码器和触发器分别作为组合逻辑电路和时序逻辑电路的代表,在教学中演示不同输入参数下的结果呈现,增加课堂的互
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.013  摘 要: 为快速准确地从海量新闻中挖掘用户需求,解决短文本语义关系单薄、篇幅较短、特征稀疏问题,提出一种融合语义知识和BiLSTM-CNN的短文本分类方法。该分类模型将新闻短文本预处理成Word2Vec词向量,通過卷积神经网络提取代表性的局部特征,利用双向长短时记忆网络捕获上下文语义特征,再由Softmax
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.031  摘 要: 根据教育部制定的培养学生计算思维能力教学要求,结合医学院校中数据库课程教学现状分析,提出以计算思维培养为导向的线上/线下混合教学改革策略,通过重组教学内容、优化教学设计,在课程教学中进行实践应用。实施效果证明,采用新的混合教学模式可以达到提高学生学习主动性,培养学生计算思维方法的教学目标。  关键
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.021  摘 要: 随着信息技术的发展,传媒产业的发展趋向信息多元化、网络融合化、虚拟生态化,从而对综合型新媒体人才的需求显著增长。社会需求和人才供给之间的矛盾关系,反映出当前我国主流单系化教育模式的不足。因此需要优化培养体系,以“通识”为基础,“专业”为发展,建立有利于培养“一专多能”模式人才的方略。  关键词:
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.006  摘 要: 语音识别中的一个重要的分支就是关键词检索。虽然在英语上的关键词检索已经成熟,但是低资源的语音,比如维语的语音关键词检索研究缓慢,仍需要更深入的研究。文章在维吾尔语语数据集thuyg20上,先在GMM-HMM(Gaussian Mixture Model Hidden Markov Model)声学
Reinforcement learning as autonomous learning is greatly driving artificial intelligence (AI) development to practical applications.Having demonstrated the potential to significantly improve synchronously parallel learning,the para-llel computing based as
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.028  摘 要: 在教学中尊重学习风格差异性,对贯彻执行因材施教原则及体现工程教育OBE理念具有重要作用。基于Felder-Silverman学习模型,对90名研究生的学习风格进行调查分析,获得受测试学生在信息的加工、感知、输入、理解四个维度上的学习行为偏好。针对学习风格差异提出相应教学方法、教学设计改进策略,以提
Big data analytics applications are increasingly deployed on cloud computing infrastructures,and it is still a big challenge to pick the optimal cloud configurations in a cost-effective way.In this paper,we address this problem with a high accuracy and a
为了提高PACS的医学影像处理的效率和准确性,在三维智能剪刀技术的基础上,结合三维图形处理和医学影像处理技术,设计和开发了智能PACS。不仅可以管理医学影像资料,还可以高效自动地辅助医生对脏器和肿瘤进行分割标识,医生可以在这些数据的基础上对肿瘤的疗效和预后进行准确的评估。该系统不仅在算法层面有所创新,而且把最新的学术成果应用到医疗应用第一线,有重要的理论价值和强烈的应用需求,对公共卫生起到明显促进