基于非负矩阵分解的多任务聚类和动态社团检测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xuruiqi8627361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,数据的大规模增长致使工程领域中产生了大量具有高维性,动态性,层次性和相关性的复杂数据。针对复杂数据的研究对科技的进步具有重要意义。多任务聚类和动态社团检测作为研究复杂数据的重要方式,受到了学者们越来越多的关注。多任务聚类共同学习多个任务,通过在相关任务间迁移知识提升每个任务的聚类性能。社团检测通过揭示节点间相互关系,找出紧密相连的节点簇,使得簇内节点强连接,而簇间的节点弱连接。动态社团检测跳出静态网络社团检测的局限,结合网络的时序性对社团进行检测。然而,数据的复杂性降低了现有算法在系统功能研究上的准确性,极大的阻碍了多任务聚类和动态社团检测算法的发展。非负矩阵分解(Non-negative Matrix Factorization,NMF)不仅能够提取数据的潜在特征,且可直接用于数据聚类,在复杂数据聚类分析领域受到越来越多的关注。然而,NMF方法仍存在一些问题:(1)NMF模型为欠定方程,致使方程解不唯一;(2)NMF结果不稳定,严重受到随机初始值的影响。为减弱这些问题带来的影响,论文改进了NMF算法并提出了基于模型相关性的多任务聚类算法(MTMC)和基于共正则化非负矩阵分解的动态网络社团检测算法(ACr-ENMF)。论文的主要贡献概括如下:(1)基于模型相关性的多任务聚类算法,构建了联合学习任务内聚类和任务间聚类的多任务学习框架。具体地说,考虑多任务数据维度高、噪声大的特点,任务内聚类采用对称非负矩阵分解(Symmetric Non-negative Matrix Factorization,SNMF)对数据进行降维,通过引入线性回归预测任务内聚类标签,降低直接采用SNMF聚类的不稳定性,提高聚类准确性;任务间聚类利用二部图联合任务与特征进行共聚类,将任务内参数迁移至任务间模型,加强对不同任务间相关性的学习。MTMC算法通过参数迁移将任务内聚类和任务间聚类联合至同一优化模型中,并且通过交替迭代优化得到聚类结果。(2)基于共正则化非负矩阵分解的动态网络社团检测算法,在动态网络进化社团检测中同时考虑了聚类精度和聚类漂移。ACr-ENMF算法利用相邻时刻网络信息的相关性,将前一时刻的特征信息迁移至当前时刻进行社团聚类,进而将不同时刻的时序信息关联起来。具体地说,为了提高动态进化社团检测的准确性,利用前一时刻的网络和社团描述聚类漂移,并通过共正则化将其纳入到ACr-ENMF的目标函数中。ACr-ENMF算法不仅约简了维数、降低了时间复杂度,且更好地描述了动态社团的演化规律。(3)为了验证所提算法的性能,论文在3个多任务数据集和4个动态网络数据集上与现有最先进的相关算法进行实验对比,并采用不同的测量方法消除测量指标带来的误差。实验结果表明,所提算法在各种测量方法上明显优于其他算法。
其他文献
在中美博弈的背景下,国家面临的重大问题愈加复杂,其解决途径已超出了单一学科的范畴,跨学科知识相互融合成为发展趋势。党中央、国务院高度重视交叉学科发展,习总书记在科学家座谈会上鼓励高校开设交叉学科专业,倡导加强跨学科学术交流。学科交叉主题蕴含着学科发展前沿和重大突破,对其有效识别能够帮助研究者挖掘新的学科生长点。但现有识别方法存在角度单一、输出结果简单等问题,缺乏考虑作者的自组织性,不利于有组织地攻
学位
随着电子商务市场的兴起以及国内日益完善的物流网络,使得网络购物已经成为和线下实体购物一样重要的存在。电商平台作为网络购物的载体也得到快速的发展,并且近些年平台间的竞争也越加激烈,而促销就是平台间竞争的重要方式之一。促销可以帮助平台发掘潜在需求,挤占对手的市场份额,而且对提升平台与卖家利润也十分有益,但平台促销的同时要兼顾促销所带来的成本,否则会导致需求上升而利润下降。同样,面对平台促销时,卖家要决
学位
随着生物技术的迅速发展与我国人民日益增长的卫生医疗需求,我国生物医药产业也在高速增长,一方面生物医药企业的发展符合国家从医药大国转向医药强国的需求,另一方面也为投资者带来了更多的投资渠道。这无疑对生物医药企业的投资需求与估值提出了要求,对企业进行合理的估值一直是投资中的重点。长久以来,学术界已有多种不同的估值方法,但是不同的方法存在多种差异,估值结果也有区别,如何选择合适的估值方法是个问题。生物医
学位
随着互联网医疗的快速发展,在线健康社区越发成为用户获取健康信息服务的重要平台。但是,由于许多用户缺乏一定的医疗知识和健康素养,加上在线健康社区的网络虚拟性和信息冗杂性,其中的健康信息真实性难以判断,导致许多在线健康社区的用户对社区平台上的健康信息的信任度一时难以提高。用户担忧万一自己采纳的是错误的健康信息来改善自己的健康状况,可能会拖延自己的治疗进展,耗费时间与金钱,甚至危及自己的生命健康。所以,
学位
快递服务质量对电子商务企业的客户体验存在显著的直接影响,在新冠肺炎疫情防控常态化背景下,线上消费习惯的延续与巩固更凸显了快递服务质量对电子商务企业在市场竞争中的关键性。快递系统作为一个复杂系统,除了存在于系统内部的组织协调外,与外部也存在着大量物质、信息和能量等的交换。在快递配送过程中,交通事故、恶劣天气和网络瘫痪等意外的发生会导致快递服务的中断或延迟等,使快递系统的可靠性降低,电商企业的破损和运
学位
随着共享经济以及“绿色环保、低碳出行”理念的兴起,共享电动汽车这一新兴项目正在蓬勃发展。同时,这使得人们的出行方式和出行行为发生了一定的改变。现如今,越来越多的人们开始使用共享电动汽车或者共享行程等方式出行。与公共交通相比较,共享电动汽车可以给人们提供更高的出行舒适度;同时,相较于使用公共交通出行需遵循既定的路线和时间表,共享电动汽车可以允许人们更加灵活的进行出行安排。自2017年开始,共享电动汽
学位
目标检测的目的是找到目标的位置,并判断出目标所属类别,而高准确率且低运行时延的目标检测算法一直是计算机视觉领域学者们研究的一个核心技术。随着深度学习的迅速发展,基于深度学习的目标检测算法性能越发强大,使用深度学习实现目标检测成为一个趋势。本文以FPGA和DSP芯片为核心,设计并实现了一个具有实时目标检测功能的嵌入式系统。以下为本文的主要工作内容与改进点:(1)经过资源评估和芯片选型,本文选用XC7
学位
随着研究及应用的不断深入,无人机逐渐从人工操作、单机、预定路径飞行和单任务发展到智能化、大规模机群、动态路径飞行和多任务。因此,实现无人机之间、无人机机群与控制中心之间数据和控制消息的高效传输逐渐成为研究热点。相比传统自组织网络,无人机节点的高机动性使其网络拓扑更易发生变化,对路由算法性能要求更高;同时,无人机一旦升空,电池能量也无法得到补充,通信能量开销也变得无法忽视。因此,亟需研究一种能量开销
学位
作为现代战争中的“千里眼”,合成孔径雷达(Synthetic Aperture Radar,SAR)可以对环境进行实时二维成像,是获取战场情报的关键设备。其先进的工作体制以及优越性能使得对SAR进行干扰面临着诸多挑战:对SAR的压制干扰对干扰功率需求较高;对SAR欺骗干扰所需侦察参数难以实时精确获得,并且对计算资源需求较高。本文从SAR成像技术的基本原理出发,针对工程实践中SAR干扰技术实现难点,
学位
随着现代信息处理技术及图像传输技术的飞速发展,人们对数字图像能够表达信息的能力要求越来越高。图像超分辨率(Super-Resolution,SR)是一种提高数字图像分辨率的技术,在数字图像处理领域应用广泛。图像超分辨率可以将低分辨率(Low-Resolution,LR)的图像重建恢复出一张高分辨率图像(High-Resolution,HR)。高分辨率技术通常在硬件和软件层面上实现,在硬件层面上,图
学位