基于复杂网络的开源软件社区中影响力节点识别方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:yuanrang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开源软件社区通过邮件将世界各地的开发者紧密联系起来,研究开源软件社区网络能够帮助认识开源软件的发展方向。具有高影响力的开发者能够加快软件项目的研发进度,高影响力的软件项目能够吸引更多优秀的开发者,通过关注具有高影响力的开发者和软件项目能够有效的预测未来技术趋势。然而,开源软件社区网络结构复杂,包含多种类型节点,单节点间存在多种交互关系,组节点与组节点也存在复杂的间接关系。用于识别传统网络中影响力节点的方法无法对开源软件社区网络进行建模,把复杂网络进行扁平化映射,转化为传统网络求解会造成大量信息损失,进而导致影响力节点识别不准确。为解决上述问题,本文对开源软件社区网络多种节点间的直接关系进行建模,提出了多层二部网络模型,利用节点间影响力的传递性求解具有影响力的开发者和项目。对于组节点间的关系,通过异质超图建模开源软件社区网络,减少节点关系进行扁平化映射造成的信息损失,更加准确的识别具有影响力的节点。本文的主要工作如下:(1)提出了一种基于多层二部网络的影响力节点识别方法,称为M-Bi Rank(Multiplex Bipartite Ranking Method)。该方法首先把开发者与软件项目的交互关系抽象为单层网络;其次根据不同交互关系中节点的耦合性把开源软件社区建模为一个多层二部网络;最后通过层间传递关系融合多种节点的影响力,并把最终趋于稳定的影响力值作为节点最终的影响力。(2)提出了一种基于异质超图的影响力节点识别方法,称为HHG2Rank(Heterogeneous Hyper Graph Ranking Method)。该方法主要分为两个阶段:构建异质超图模型阶段,通过开发者间的关注关系和软件项目间的依赖关系构建多元多维异质超图;影响力传递阶段,开发者和软件项目的影响力通过异质超图模型进行相互增强,趋于稳定的迭代结果即为开源软件社区网络中的节点影响力。(3)本文在真实的开源软件社区网络Git Hub中进行了大量的实验,对所提出的方法进行了验证。实验表明,本文提出的方法能够更准确的识别开源软件社区网络上具有高影响力的开发者和软件项目。
其他文献
人类探索太空取得的成就与集成电路技术密不可分,卫星、飞船以及星际探测器等航天器中的系统都是由集成电路实现的。处于宇宙中的航天器面临的辐射环境越来越复杂,因此对集成电路可靠性的需求也不断增加,同时芯片上晶体管的密集度随器件工艺的进步而增加,单粒子效应成为了航空系统失效的主要原因。锁存器单元也是芯片中不可缺少的部分,对其进行抗辐射加固可有效降低集成电路发生软错误的概率。本文以65nm CMOS工艺为基
由于云计算技术不断地完善与发展,云虚拟机资源的分配问题吸引了众多研究人员的关注。一些满足不同经济属性的云资源拍卖机制应运而生。然而,这些机制很少考虑云虚拟机分配过程中数据的安全性。一旦关键的信息被泄露,对于拥有该数据的公司或者组织可能会造成不可估量的损失。因此,隐私数据的安全性是云虚拟机分配过程中亟需解决的问题。安全多方计算技术能够在没有可信第三方的情况下,基于每个参与方的数据进行联合计算,同时保
近年来,一维(1D)纳米结构由于其独特的理化性质、优异的传输特性、大的比表面积以及良好的稳定性而受到广泛关注。以In2O3为代表的1D金属氧化物纳米材料已经被广泛应用于场效应晶体管(FET)的沟道层材料。同时,采用具有高介电常数的栅介质材料代替传统的Si O2栅介质薄膜不仅可以提升器件的电学性能,还可以降低FET器件的驱动电压和功耗。本论文通过简单有效的静电纺丝工艺制备了铟基纳米纤维以及ALD工艺
聚类分析能够充分挖掘无标记样本的内部特征,在未知数据标签和数据分类个数的情况下,自主地将数据集中的数据划分为若干子集,是一种重要的无监督学习方法。目前,该方法已被广泛应用于与人类生活息息相关的多个领域,如决策制定、语音识别、模式处理等。对于聚类分析而言,选择好的聚类算法和合理的最佳聚类数(Optimal cluster number,Kopt)对最终的聚类结果都有着十分重要的影响。但现有的聚类方法
灵敏放大器(Sense Amplifier,SA)是SRAM(Static Random Access Memory)读取过程中的关键模块,它决定了SRAM读取过程的时间、功耗和准确性。随着SRAM存内计算与神经网络的深入结合,灵敏放大器功能单一和面积开销大的问题变得越来越突出,与此同时,神经网络中Sigmoid激活函数复杂的硬件实现也是神经网络存内计算设计中的一个难点。为了有效的解决上述问题,本
微流控技术作为一种操控或处理小尺寸流体的技术,能够在消耗少量样品的情况下进行生化分析。微流控技术具有反应速度快、灵敏度高、样品消耗少的优点,因此广泛应用于化学检测、生物医药等领域。其中开放式液滴微流控系统由于结构简单,方便观察和处理液滴,而且交叉污染的风险低而受到广泛的关注。在微流控技术中,静电力和介电电泳力作为控制微流体的常用方法,具有响应速度快、灵敏度高、功耗低的优点,但通常需要较高的电压。高
软件定义车联网的设计初衷主要是为了利用新型的网络架构来提升传统车联网的交通效率和行驶过程中车辆的安全性。但由于网络本身具有开放性,应用时必须考虑通信过程中的安全性以保护车辆的隐私,防止恶意用户散播虚假消息或是破坏系统。因此,如何确保通信过程中安全有效的消息传输,以及提高突发事件的处理速率,是目前亟需解决的关键问题。本文对面向软件定义车联网的隐私保护认证机制进行了研究,并根据研究结果提出了两个方案,
生物医学文本挖掘技术能够自动挖掘出海量生物医学文献中关键性的生物医学知识,对于构建生物医学知识图谱和数据库具有重要推动作用。生物医学命名实体识别作为文本挖掘中的最基础性任务之一,目标为提取文本中的生物医学实体信息。目前已有众多基于深度学习的算法被用于识别生物医学领域内的命名实体。但由于生物医学实体存在一词多义、实体边界难以准确界定以及标签数据的缺乏,导致现有算法识别效果不佳。多任务学习通过在相关联
随着科技发展,智能设备的功能不断扩充,产生的数据量快速增长,移动感知系统成为研究热点。在移动感知系统中,数据请求者会发送数据采集的任务给众多用户,用户利用智能设备收集感知数据并上传给数据请求者进行数据统计和分析。但是,由于感知数据中包含了用户的敏感信息,在数据采集过程中容易出现个人隐私泄露等安全问题,因此,研究保护用户个人隐私的方法变得十分重要。安全数据聚合技术是有效的个人隐私保护方法之一,主要步
作为一种IV-VI族半导体,硫化铅(Pb S)具有带隙窄、玻尔半径大等独特的性质,通过调整纳米结构的尺寸,其能带可在红外至可见光光谱大范围调谐,在诸如光伏材料、红外探测器等领域具有重要的应用前景。理解光生载流子的驰豫和输运过程,对半导体器件性能的改进至关重要,然而目前纳米硫化铅中的自由载流子和激子的相互作用等动力学过程仍有待探索。时间分辨太赫兹光谱(TRTS)由于能同时获得频率和时间分辨的光电导信