【摘 要】
:
社区是数据图中符合一定结构及紧密程度要求的子图。社会学中的关系网络,生物学中的蛋白质网络等网络中都存在着联系紧密的社区。社区搜索的目标是从图中得到符合定义要求且包含查询顶点的社区,社区发现的目标是从图中获得所有符合定义要求的社区。实际应用中用户对社区结构有着多样化的需求,现有的基于子图连通性的社区定义主要是以完全连通子图作为社区的基础连通结构,通用性不足。针对以上问题,本文给出了相应的解决方案,主
论文部分内容阅读
社区是数据图中符合一定结构及紧密程度要求的子图。社会学中的关系网络,生物学中的蛋白质网络等网络中都存在着联系紧密的社区。社区搜索的目标是从图中得到符合定义要求且包含查询顶点的社区,社区发现的目标是从图中获得所有符合定义要求的社区。实际应用中用户对社区结构有着多样化的需求,现有的基于子图连通性的社区定义主要是以完全连通子图作为社区的基础连通结构,通用性不足。针对以上问题,本文给出了相应的解决方案,主要贡献如下:首先,提出基于可指定形状—motif—连通性的MCC(Motif-Connective Community)社区定义,可以协助用户自由指定社区的基础连通结构。在此基础上,提出针对MCC社区的社区搜索算法MPCS算法。其基本思想是从查询点通过motif实例向外扩展搜索,将所有符合连通条件的motif实例都归入同一集合,集合中所有motif实例包含的顶点构成的导出子图即为所求社区。此外,给出针对MCC社区的社区发现算法MPCF算法,其基本思想是求得数据图上所有的motif实例,并根据阈值要求判断motif实例之间的连通性并分入不同的集合,每一个集合中motif实例包含的顶点构成的导出子图对应着一个社区。进一步,提出针对motif实例搜索过程及所属社区判断过程的剪枝优化技术来提升效率。其次,提出基于MP-index索引的社区搜索算法和社区发现算法。通过预先存储数据图中所有motif实例及相连关系,使得MP-index索引可以避免大量对motif实例的重复求解,可以快速求得各个阈值情况下的MCC社区,进而完成社区搜索或者社区发现问题的求解。最后,基于多个真实数据集进行实验,在不同阈值要求及不同motif要求的条件下,实验结果验证了MCC社区定义的有效性,两种剪枝优化技术和MP-index索引的高效性。
其他文献
在真实世界的数据集中,数据缺失的情况非常普遍,例如:交通数据、人口统计信息数据、医疗数据等。数据的缺失导致了数据质量下降、诸多信息丧失,在机器学习的研究中,如果将这种残缺的数据作为模型的数据集,模型系统中表现出的不确定性将会更加显著,还会导致模型对数据信息的挖掘走向混沌的状态,最后得到不靠谱的输出。如果利用常用的算法来分析不完整的数据集,不仅会增加建模的难度,还会给后面的分析留下隐患。现有的大多数
<正>本书收录了2023年专利代理师资格考试大纲以及与考试密切相关的法律、行政法规、司法解释、部门规章和国际条约等的最新文本,完整地体现了我国与专利有关的最新法律、行政法规、司法解释、部门规章的修改情况,是广大考生复习、备考的权威参考工具书。
叙述了铷、铯资源在全世界及我国的分布特点。综述了近年来铷、铯矿石的处理方法与铷、铯金属主要的制备技术研究进展,针对其中的离子交换、溶剂萃取等工艺的原理、特点进行了分析与总结。简述了铷、铯金属近些年在量子计算、特种玻璃及电子元件等领域的应用现状与前景,并对其未来的发展进行了展望。
视网膜血管的表征变化与许多综合性疾病的早期诊断密切相关,对血管结构的性状分析是疾病诊疗的重要依据。基于计算机的视网膜血管自动分割技术,能够降低视网膜血管分割任务的资源消耗、节约专业医师的人力成本,是计算机视觉和医学图像分析领域研究的热点问题,基于上述背景,本文针对深度学习视网膜血管分割方法的标签获取、血管拓扑结构增强、多任务学习三个方面进行了研究:(1)提出了视网膜图像血管标签自动提取算法。近年来
服装衣长、领型等标签信息在电商平台的销售过程中起着重要作用,但是传统通过人工标注的方式费时费力,并且非常容易产生错误。为了解决该问题,本文依托课题组服装云交易平台,将计算机视觉与深度学习技术应用于服装标签识别,提出了一种改进的Inception-v4服装标签识别模型,并将其应用到服装上架过程中。服装商家只需上传服装图像,系统就能自动识别服装标签,再经过商家校对后存入数据库中,提高服装标签的准确率的
高光谱图像包含丰富的光谱和空间信息,且具有较高的光谱分辨率,图谱合一的特性使得高光谱图像在对地遥感观测等研究领域中,表现出较高的应用价值。然而,复杂的地物分布和有限的图像空间分辨率所引起的混合像元问题,往往限制着高光谱图像实际应用的准确性。为了从高光谱图像中提取更精细的信息,为后续研究和应用提供更精确的数据参考,光谱解混成为了高光谱图像处理中的一项关键技术,旨在提取构成高光谱图像每个像元的纯物质端
生物体内存在一套复杂的基因调控机制,这种调控机制控制生物的生长发育过程,研究者将这种调控机制定义为基因调控网络(Gene regulatory networks,GRNs),基因调控网络是理解生物系统的重要工具。随着单细胞测序技术的快速发展,单细胞转录组学数据的规模越来越大,准确的从大规模转录组学数据中推断基因调控网络对于理解生物调控过程至关重要。近年来已经有研究者提出了大量算法对基因调控网络进行
社区指的是网络中内部连接紧密但与外部连接稀疏的子网络。k-core社区是指图中的一个连通子图且该子图中的每个顶点的度都大于等于k。由于k-core社区可以在线性时间内求解的特点常被用于其他社区结构的求解。当前对于k-core社区的搜索主要是通过KHT(k-core hierarchy tree)索引来实现,该索引通过将图遍历转化为树遍历来加快查询速度,但在查找目标社区时,依旧存在遍历效率低的问题,
某炼油化工企业汽车成品油装车油气回收装置在运行过程中因为吸收塔压力高,导致装置联锁停车。通过对变量记录的分析,找到了事件发生的原因,并在控制措施落实等方面给出了对策和建议。