在线社会网络的结构化分析方法及应用研究

来源 :哈尔滨工程大学 | 被引量 : 3次 | 上传用户:baicaiyunai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
继科学计算和生命计算之后,面向网络化社会系统的社会计算已然成为学术界的研究热点和前沿课题。社会网络结构分析是社会计算的核心问题之一,深入理解社会网络的结构特性有助于提高社会生产效率、缓解社会矛盾、提高社会收益、解决社会问题,因此具有广阔的应用前景。现有的社会网络结构分析方法大多面向静态网络,无法满足在线社会网络的演变要求。此外,网络结构分析中固有存在的一些技术难点,如算法时间复杂度过高、需要先验知识、结构形态受限、数据维度过高等,同样限制了该领域的发展。针对传统社会网络结构分析方法中存在的不足,本着对现有方法进行改进、完善和发展,本文一方面研究如何设计在线式社会网络结构分析框架以满足在线网络的实时性要求,另一方面研究如何设计更具前瞻性的方法和理论以解决社会网络模体识别中存在的技术难点,最后,利用网络模体的结构特性,解决应用系统中存在的具体问题。归纳而言,本文的研究内容主要包括以下4个方面:(1)多关系社会网络社区识别方法研究。相比于单质网络社区识别,多关系社会网络中的社区结构是隐含的、难以发现的。现有方法大多从结构表达能力上看待异构社区结构,进而多采用全局优化方法。这类方法在某些特定的网络类型求解中可能具有一定的优势,但缺乏普适性。例如当异构网络各层级内部的社交关系差别很大时,全局优化会使识别出的社区结果偏离真实社区,因此精度较低。此外这类方法忽略了各网络层级之间的关联性,因此社区内部节点间的交互程度可能很低,从而失去现实意义。本文将异构社区识别任务视为社交个体的局部选择过程,首先通过度量异构网络层间吸引力、同质网络节点游走可达概率,提出异构网络随机游走模型;然后对随机游走路径施以同社区互可达性约束,将各子网节点间的相似性度量,建模为随机游走的可达性度量;最后,将相似性函数推广到层次聚类,异构社区识别任务可以在较短的时间内迭代完成。(2)在线社会网络社区识别方法研究。静态网络社区识别中普遍存在的社区重叠问题、参数依赖问题、社区形态约束问题在动态网络环境下的解决难度更大。一方面,已经被广泛认可的静态社区识别技术或理论大多无法适用于动态网络;另一方面,某些参量在网络演变时可能对社区结构造成不可预料的改变,这给动态社区识别中的实时性、精准性要求带来了严峻的考验。为解决这些问题,我们提出社区稳定性这一概念替代传统的基于结构的社区定义。社区稳定性基于节点间的同质性吸引,因此稳定状态的社区结构应满足社区内部节点具有较强的互吸引力,而分处于不同社区的节点尽可能不具有任何吸引力。该方法避免了传统社区识别中的结构约束,因此社区可以具有各种形状;进一步讲,社区稳定性的天然存在使得算法不必依赖于各种输入参数;由于社区边缘节点可能同时被不同的稳定核心吸引,因此所识别出的社区结构具有重叠性。在动态社区识别方面,我们将在线社区识别问题转化为社区稳定性的校准问题,进而动态社区结构可通过对历史社区校准而得。(3)在线社会网络结构压缩方法研究。如果按数据存储规模进行划分,社会网络压缩研究可分为无损压缩和有损压缩两种。本文关注于网络结构的规模缩减,因此属于有损压缩的研究范畴。无损压缩方法虽然能够避免压缩损失,但存在压缩率极限,无法满足用户的实际需求。而在有损压缩中,时间开销过高、结构表达能力较弱、对动态网络匹配性较低是亟待解决的关键问题。本文提出一种基于结构相似性整合的两阶段动态网络压缩框架。在第一阶段,通过证明将压缩损失的差异性优化,转化为压缩过程中节点合并的局部选择优化,从而证明了静态网络压缩序列的线性时间复杂性;在第二阶段,以稳定压缩损失为前提,校准前一时刻的压缩表达以此避免算法的重复执行,在满足在线社会网络演变要求的同时提高了压缩效率。(4)在线社会网络社区结构应用研究。在结构分析的应用层面,我们关注于移动互联网中的蠕虫遏制问题。现有的蠕虫遏制方案大多面向单质网络,无法遏制蠕虫的混合传播。此外,网络动态性带来的结构改变加大了蠕虫病毒的遏制难度。针对这些问题,我们提出一种基于社区的混合蠕虫双向反馈遏制系统。该系统借助了社区结构对蠕虫病毒的捕获能力。首先对社区边缘节点施以门禁免疫策略将蠕虫控制在社区内部;然后,提出分布式蠕虫标签转发策略,使未被蠕虫感染的节点快速达到免疫状态,从而降低了蠕虫在社区内部的传播速度;最后,提出一种节点信任性评估方法,通过收集节点的GPS信息、历史安全记录、交互频率,对可信性较低的节点限制通信,以此防止混合蠕虫的协同感染。
其他文献
随着自动化技术、嵌入式技术、计算机技术、无线通讯技术的迅速发展,远程电力抄表系统成为了电力部门管理、分析、处理各种电量数据的一种重要选择措施。本文作为远程电力抄表
在日趋复杂的软件需求世界中,人们一直在寻找一种根本的、普遍适用的软件体系结构,以有效的开发出高质量的应用软件。这种寻求导致采用了许多新的抽象和工具。近年来基于插件
在多Agent系统中,智能Agent通过相互作用实现协作问题求解和相互间行为的协调,通信是Agent实现相互作用的桥梁,是Agent之间协作的基础和重要手段,没有通信就不可能有协作和协
根据初始化信息的来源不同,视频分割方法可分为有监督分割、半监督分割和无监督分割三种。有监督和半监督的视频分割是将手动标注的像素种子点作为样本训练分割模型,该分割模
随着网络技术的不断发展和信息化普及,人们从互联网获取内容类型、访问模式、数据量等需求的变化,网络体系结构也随着不断的发展。从起初的框架改进演变成现在的架构革命,以内容
随着人们对高速率数据业务的需求呈爆发式增长,无线通信的频谱资源稀缺日趋严重。而目前的频谱分配策略依旧采用授权的静态分配方式,许多已被授权分配的频段经常处于空闲状态
计算机辅助排样,又称为CAN(Computer Aided Nesting),是广泛应用的计算机辅助技术之一。CAN广泛的应用于电气机械制造业、服装制造业、家具制造业、交通运输设备制造业等行业
随着计算机及网络技术的发展,特别是宽带时代的到来,计算机网络作为信息社会的基础设施已经渗透到了社会的各个领域,网络与传统产业日见紧密的结合,使得普通用户对网络的依赖
随着Internet和Web的迅猛发展,数据库技术也开始与Web产生了紧密的联系,一种新兴的技术-Web数据库技术出现了,并且开始在数据库的应用中发挥着越来越重要的作用,它所使用的B/S系
肺癌是当今世界各国常见的恶性肿瘤,已成为绝大多数国家癌症死亡的主要原因。肺癌早期多无症状或症状轻微,不易发现,待到发现时往往已有转移。因此,提高早期肺癌的检出率是提