面向大众化协同开发的贡献审查关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ZHANQIWEI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在GitHub社区,越来越多的项目开始使用基于Pull-request(PR)的协同开发模式,这种开发模式激发了大众的创造力和贡献热情,任何一个开发者都可以通过向项目主版本库提交PR的方式为他们感兴趣的项目贡献代码。由于大众贡献者的编程水平层次不齐,为了保证他们所贡献代码的质量,每一个PR在被接受前都要经过审查。不同于传统的代码审查模式,GitHub上的贡献审查是一种社会化、轻量级的审查模式,它的执行过程更透明、开放、自由,任何社区成员均可以参与到一个PR的审查讨论中。这些特性方便了贡献审查过程中参与者之间的交流,提高了审查者的工作效率,因此这种模式被GitHub项目广泛采用。然而,由于缺乏统一的协调管理机制以及严格的执行步骤和规范,这种贡献审查模式的效率和质量难以得到保证,容易导致重复的大众贡献不能被及时地发现、大众贡献中所隐含的缺陷不能被完全发现等问题。因此,探索高效、可靠的大众贡献审查技术是当前大众化协同软件开发亟待解决的问题。本论文立足于GitHub开源社区中的大众贡献数据,围绕大众贡献审查的效率和质量问题,在不同角度展开了分析和研究。主要工作与贡献总结如下:第一,在大众贡献审查的重复性方面,提出了重复PR检测的问题,并提出了自动化检测方法。对于一个新提交的PR,我们通过综合利用它所包含的文本信息和变更信息,计算它与历史PR的相似度,返回一组与它最相似的PR列表,从而避免贡献审查者对实现相同功能的重复PR执行额外冗余的审查工作,第二,在大众贡献审查的全面性方面,提出了能够自动化识别PR审查过程所涵盖审查点的模型。我们首先通过人工调研的方式构建了一个针对审查点的二级分类体系,进而,我们提出的两阶段混合分类模型在人工标注数据集的训练下,能够自动地识别审查评论所涉及到的审查点,以实时地展示一个PR都经受了哪些方面的审查。这种方法可以辅助审查者判断某个PR的贡献审查是否全面,以便做出更有针对性的审查评论。第三,在大众贡献审查的兼容性方面,我们提出了为大众贡献推荐跨项目的审查者。首先,我们利用Stack Overflow社区中用户的群体标记行为以及GitHub社区中贡献之间的引用关系构建了软件关联库。基于此关联库,我们推荐相关项目的核心开发者和活跃贡献者参与到该项目的贡献审查中,从而让审查者更广泛地了解来自各个利益相关方的意见,做出更能兼容各方需求的决定。
其他文献
生物资产作为农业经济的重要经济要素,如何对生物资产的价值进行确认和计量,在农业经济领域一直处于争议之中。而果树作为经济林的重要组成部分,果树创造的价值在提高农民经
有源矩阵有机发光二极管显示器(AMOLED)被称为下一代显示技术。AMOLED与传统液晶显示器相比,具有更宽的视角、更高的刷新率和更薄的尺寸。同时,AMOLED也逐渐向柔性显示的方向发
随着新课程改革和素质教育的推进,人们越来越重视学生核心素养的培养和综合素质的提高,特别是提升学生的创新能力和实践能力。但是在实际的课堂教学中依然存在“满堂灌”的现
英语阅读教学在一线教学中既是重点也是难点。《义务教育英语课程标准》(2011版)指出:初中毕业学业考试中的阅读应该考查学生对语言材料的理解能力以及从语言材料中获取信息
学位
随着互联网技术发展以及5G时代的到来,云计算和云存储已经融入了我们的生活。由于个人存储资源的有限,以及现在的云存储资源的便利性,很多用户选择向云存储服务商购买服务。
由地震诱发的顺层岩质边坡失稳危害性巨大且破坏能力极强,因此研究地震作用下顺层边坡可靠度问题是一个热门的课题。首先,本文针对目前顺层边坡可靠度求解常用方法(蒙特卡洛
在全民学习、终身学习的学习型社会,中职学生需要具备终身学习的能力。良好学习习惯是终身学习能力的重要表现,也是提高学习效率的关键。然而,中等职业学校学生在学习习惯上
在现实中,人们接收的数据通常由多种不同模态的特征构成。这些数据往往缺失类别标注,从而使人们无法准确接收想要的信息,因此需要对多模态数据进行聚类。多模态数据聚类任务
无线体域网(Wireless Body Access Networks,WBAN)是一种在人体表面或者内部节点组成的短距离无线通信网络,可以实现人体健康状况的检测、体征信息的采集和传输,在医疗、保健