开源软件社区开发者的贡献评估方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xiaohan5213250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开源社区和开源软件发展迅速,越来越多的开发者参与到开源项目中,众多的开发者在一个具体项目中的表现行为和担任的角色是不同的,开发者的行为包括代码活动和非代码层面的社交化活动,他们的活动行为推动着项目的发展,一个项目的演化过程是由所有开发者的贡献累积推动的。通过对开发者的贡献特征进行研究,能够帮助研究人员发现开发者对项目的具体影响,对开发者的贡献组成研究,能够指导项目拥有者理解不同开发者的开发偏好,从而合理地进行人员配置。本文给出一个通用的面向Github开源社区数据研究方法,包括数据爬取与特征变量的抽取,将异构数据源合并整理到结构化数据库,并发现一种高准确合并同一真实身份但是不同提交身份信息的算法。通过引入贡献能力雷达图、贡献演化年轮图和平行坐标线性图等多种可视化挖掘技术,降低了多维变量挖掘研究中的复杂度,在对个体贡献的演化分析中总结出开源项目中四大类角色,并发现长期开发者跨版本贡献的特性。在已有的相关研究中,对开发者贡献指标进行深入挖掘和解释说明的研究很少,本文重点研究了开发者贡献评估所涉及的指标,研究开发过程中开发者的各种活动与贡献的关系,对度量指标进行了较为深入的分析和挖掘,最终从众多观测指标中选择出了3个比较显著的变量用于评估贡献量,这三个变量分别是开发者增加代码的行数、修复缺陷的数量和参与评论的次数,在研究过程也证实和发现了一些开发规律。本文利用软件仓库数据挖掘技术并结合多种可视化挖掘技术研究开源环境下开发者的贡献特性以及贡献演化规律。研究包括与贡献相关的度量指标间的相关性和重要性排序,并在度量指标的基础上按照版本分割开发者贡献,研究个体开发者的贡献演化过程,并最终通过逐步回归技术建立多元线性回归模型,进一步筛选贡献度量指标,最终对模型做了现实意义的解释,该模型适用在大型开源项目中对众多开发者的贡献评估。
其他文献
本文对魏晋南北朝书法品评和审美标准进行了系统的考察。指出骨、筋、肉、气,形质和神采以及工夫和天然构成了当时书法品评的三大标准体系,并进一步揭示了三大标准的内在关系
"生态环境是关系党的使命宗旨的重大政治问题,也是关系民生的重大社会问题。"习近平总书记在全国生态环境保护大会发表重要讲话,站在党和国家事业发展全局高度,全面总结党的十
古体诗作为中国诗歌文化中的瑰宝,成为中学诗歌教学的重点部分之一。它在结构上所表现出的韵律特点,蕴含着丰富的声韵美和节奏美,体现了诗歌文化独有的底蕴,也成为了中华民族
为科学有效地评价机动车辆保险经营风险,通过对影响机动车辆保险的各种指标的定性分析,借助内部的统计数据,构建机动车辆保险风险评价指标体系,应用层次分析法得到各指标的权重,建
本文主要讲了多媒体教学的优越性,教学中存在的误区,以及运用多媒体教学时应注意的问题,希望对广大教师运用多媒体进行教学,有所帮助。
目的:观察针刺联合三痹汤治疗腰肌劳损的临床疗效。方法:50例随机分为治疗组和对照组各25例。治疗组用针刺联合三痹汤治法,对照组口服复方氯唑沙宗片。结果:总有效率治疗组96
《烧马棚》是福克纳著名短篇小说之一。小说讲述了美国内战后南方白人农民阿伯纳一家的生活经历。战后美国南方生产关系的调整,使白人农民承受着物质和精神的双重冲击,阿伯纳
首先,小学一年级儿童在生理发育上达到了一个新高度,小肌肉群趋于成熟,能初步掌握正确的握笔姿势,可以控制比较精细的动作;其次,一年级儿童形象思维比较突出,对汉字直观形态
欧阳修自传《六一居士传》是具有高超叙事技巧和深刻哲思意蕴的杰出传记文本。从中西叙事学的视野来加以分析,《六一居士传》呈现出元叙事信号功能与意象妙用的结构技巧、叙
建立了基于超高效液相色谱-四级杆-静电场轨道阱高分辨质谱联用(UPLC-Q-Exactive Orbitrap)快速筛查和确证定量饲料中16种硝基咪唑类药物的分析方法。饲料样品经含0.1%甲酸的