复杂网络数据模式挖掘与演化分析研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:lxj13050621544
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,数据通过“量化一切”形成数据世界。由于数据是世界的客观反映,所以数据的分析挖掘工作可以指导人们认识世界、改造世界。随着信息技术的发展普及,社会和企业都产生了海量的数据资源,需要被分析利用。同时,网络化是现实世界的普遍特征和内在规律,自然元素、物种人群等各种对象元素相互影响、相互依赖形成网络系统。由于数据产生的客观性和普遍性,数据世界中的数据资源基本上都是刻画网络化现实世界特征规律的网络化数据。另外,由于数据产生的弱约束性以及强覆盖性,收集的数据资源在客观、准确刻画现实世界的同时,具有多源多态、复杂异构特征。所以,当前数据处理的主要对象为海量的复杂异构网络数据。新型的复杂异构网络数据对传统数据处理技术产生了巨大的挑战。为了分析挖掘新型的复杂异构网络数据,本文探索研究基于数据特征的、面向现实需求的新型数据处理理论和模型。复杂异构网络数据主要包括网络结构数据、网络行为数据以及网络内容数据,本文从不用角度、不同需求、不同方法对复杂网络数据进行模式挖掘和演化分析研究,凝练复杂网络数据处理的研究范式和计算框架,探索复杂网络数据蕴含的科学问题、问题相关数据的特征规律以及问题的求解方案,构建复杂网络数据处理的技术体系。具体研究内容和创新点包括:1.基于标记传播的网络结构模式整体检测分析算法针对复杂异构的网络拓扑,以社团结构为主体、同时考虑网络节点的不同角色进行多尺度、多层次网络结构模式的挖掘研究,提出一个基于标记传播过程的网络结构模式发现算法LINSIA。LINSIA通过允许节点同时拥有不同的网络标记从而能够识别枢纽节点和重叠社团,通过构建多层次网络结构树并进行最优层次分割从而发现网络的多层次、多尺度结构模式,通过标记选择和标记更新策略的创新提出与网络异构程度相适应的标记传播过程,从而发现离群节点、避免极大社团。实验结果表明LINSIA算法性能良好,其关于网络结构模式挖掘的综合性解决方案对网络结构数据的分析研究工作具有重要的理论意义。2.面向最优网络分裂的节点中心性度量方法本文面向最优网络分裂问题,从微观角度探索网络的结构和功能特征,提出基于邻居节点度信息熵和本地结构聚类密度的ECI节点中心性。实验结果表明,ECI中心性在网络分裂过程中性能明显优于传统的CI中心性。同时,基于局部结构信息的ECI中心性取得了媲美全局性方法的分裂效果。本文通过分析ECI中心性的性能表现和网络结构特征之间的关联关系,对ECI中心性的适用范围进行讨论,为最优网络分裂问题中的节点中心性选择提供指导。另外,通过借鉴物质传播和热传导物理过程,本文在迭代更新框架中定义非线性混合更新机制,从而提出PIRank节点中心性。该中心性整合物质传播和热传导过程对网络重要节点的不同偏好,能够发现具有不同特征的网络重要节点。实验结果表明,PIRank节点中心性对最优网络分裂问题性能表现良好。3.基于节点位置漂移模型的动态网络演化预测算法针对动态演化网络,提出一种结合节点位置漂移模型和链路预测方法的网络演化预测算法。此工作首先提出以网络平均最短距离为指导的相似性度量WSD。然后,基于动态演化网络的聚集特性和时效特性定义邻居节点对中心节点的时空影响力,并以引力场的视角比较邻居节点的时空影响力强度和本地网络的固有结构强度,从而提出更新中心节点网络位置的时空漂移模型。算法基于此漂移模型推理动态网络未来的结构状态,并基于未来的网络结构状态预测未来的网络链路。实验结果表明,本文提出的相似性度量WSD与其它经典方法相比性能更优,结合位置漂移模型能够准确预测网络演化。4.基于个体转发行为建模的在线社交网络信息传播演化预测方法针对信息传播过程,提出基于微观个体转发行为估计的多尺度信息传播预测方法MScaleDP。MScaleDP适用于不同规模的信息传播过程、不依赖于任何全局信息。MScaleDP将信息传播过程分解为微观个体转发行为集合以及承载转发行为的网络拓扑结构。对于微观个体转发行为,MScaleDP从多个维度构建转发特征,并以二分类模型进行建模。MScaleDP考虑信息级联传播与标记传播方法LPA的内在一致性,以微观个体转发模型替代LPA的标记更新机制,并通过对LPA传播过程进行限制提出了 AULPA级联传播预测算法。实验结果表明结合个体转发行为估计模型和AULPA级联传播预测算法,MScaleDP能够全面、准确的预测信息传播,性能优于传统方法。本文还对影响信息传播的主要驱动机制进行了挖掘分析,发现时效特征和内容特征是信息传播的主要影响因素。综上,本文围绕复杂网络数据的模式挖掘和演化分析展开了研究,针对四个方面的问题提出了解决方案,并进行了大量的实验验证。实验结果表明,本文发现的特征规律以及提出的模型算法准确有效、性能优良。本文工作成果不仅具有重要的理论意义,也具有广泛的实际应用价值。
其他文献
作为对高校非中文专业大学生开设的一门公共必修课,大学语文是提高学生人文素质和文化修养的重要课程,也是构建和谐社会的必要条件。因此,丰富大学语文的课堂教学内容,创新教
苏格拉底一生致力于探索伦理哲学和公众教育,“知识即美德”是苏格拉底在伦理学上的重要命题。“知识即美德”观蕴涵着去私存理、智中存美、德行可教等伦理哲学,不失为别具一格
以ASP.NET为例,SQL Server做数据库存储对如何实现权限通用化管理系统的通用化进行详细分析探讨.基于RBAC技术详细分析系统的功能需求,对数据库主要表进行设计,详细讨论用户
学校档案是学校发展轨迹的体现,是学校通过各种评估不可缺少的重要成分之一,它对学校发展具有重要的作用。本文通过分析学校档案管理现状,从加强领导的重视,树立和增强广大师
新课程改革形势下,语文教学被赋予了新的时代要求与使命。在一线教学实践中,探究语文教师角色转变与知识结构调整,语文教学手段的有效延展及语文课后作业呈现形式的多元化问
语文课程标准明确指出,阅读是学生的个性化行为,不应以教师的分析来代替学生的实际阅读;应让学生在主动积极的思维和情感活动中加深理解和体验,有所感悟和思考,受到情感熏陶,获得思
【摘 要】分析网络化教学中数控机床虚拟维修系统在校企合作教学的应用,阐述网络化校企合作教学模式的可行性、网络化校企合作教学模式的组织,为数控机床维修网络化教学提供借鉴和参考。  【关键词】校企合作 数控机床维修 网络化 校企合作教学模式  【中图分类号】G【文献标识码】A  【文章编号】0450-9889(2013)04C-0053-03  一、网络化校企合作教学模式的提出  2010年开始的全国
针对PCB热可靠性试验周期长、成本高和重复性差等问题,基于传热学和材料学的基本原理,建立了PCB有限元传热模型,从PCB热特性、价格和环保等方面综合对比和分析了优化布局、强
红细胞中的Hbs脱氧后经疏水作用聚合成束状纤维,引起膜蛋白异常激活,Cl--K+共转移及Ca2+依赖型K+通道活力增强,K+外流,使细胞脱水变形。Hbs的浓度、脱氧程度及HbF浓度影响Hbs束状
语文教学的主要任务是培养学生的听说读写能力,提高学生的语文综合素养。小学低年级语文教学要注重对学生说与写方面的训练。语文教师在小学低年级学生说写能力培养过程中,不