针对开源软件缺陷自动分派的开发者推荐方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:safafaffaf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多开源软件都是Internet的重要组成部分,例如Sendmail、Apache、Linux、MySQL等。同时,开源软件也是支持全球电子商务的IT基础架构的重要组成部分。Gartner在2011年发布的一项调查报告中指出,超过一半的被调查公司已经采用了开源软件作为其IT战略的组成部分。开源软件的流行,固然是因为开源软件开放、灵活、低成本等诸多优势,然而不可否认的是,开源软件的高质量才是其成功的基石。开源软件的缺陷管理是其软件质量保障的一种重要手段。目前,大型的开源软件项目大多利用缺陷追踪系统(如Bugzilla、GNATS、JIRA等)收集和管理缺陷信息,并协助开发者处理这些缺陷。开源软件的缺陷是由软件的开发者、测试人员和普通用户,以缺陷报告的形式提交到缺陷追踪系统。随着缺陷报告的不断提交,缺陷数目变得十分庞大,人工进行缺陷的分派也成为一个非常耗时、易错的过程。所以,如何进行缺陷的高效分派是大型开源软件缺陷管理的一个棘手问题。为了提高缺陷分派的效率,许多自动或半自动化的缺陷分派方法被相继提出。这些方法归结起来就是利用缺陷报告的各种信息,采用信息检索和机器学习的方法,同时结合多种手段,例如图理论、主题模型、评分机制等,进行开发者的推荐。为了提高推荐的准确率,往往同时推荐多个开发者来解决同一个缺陷。针对缺陷的分派问题,首先,本文提出了一种简单易用的针对软件缺陷自动分派的开发者推荐方法,其核心思想是利用LDA主题模型(刻画开发者技能)、开发者合作网络(刻画开发者之间的合作关系)构造(内容+关系)混合策略。针对大型开源软件项目Eclipse和Mozilla的十万级已修复缺陷的实验表明,在选取合适的参数和分派策略情况下,本文所提方法的开发者推荐的准确率分别达到了 46.7%和33.4%,比基准的LDA + kNN方法的推荐准确率分别提高了 209.3%和131.9%,从而验证了其有效性。另外,通过对缺陷分派过程中缺陷再分配次数较多的缺陷进行深入分析,结合开源软件开发者协作网络,总结了关于开发者的16个特征,通过统计方法确认9个与开发者再分配路径长度(再分配次数)的相关因素(特征),并进一步约简到4个核心特征,以此构建基于机器学习方法进行开发者分派的特征。将缺陷分派问题视作分类问题的一个实例,通过这些构造的开发者特征构建分类器,进行开发者的推荐,取得了较高的推荐准确率。
其他文献
陇南市现有60所校园足球特色学校,为甘肃省校园足球活动的开展提供了强有力的支持。但陇南市校园足球特色学校足球活动实际开展状况如何,遇到了何种困境,是值得研究的问题。
作为模糊集合论和直觉模糊集合论的推广,中智集合被用来描述现实世界中存在的不确定、不精确、不完整和不一致的信息。区间中智集合和多值中智集合是中智集合的子类,它们通过区间值和多值的形式对事物进行描述,而不仅仅是一个特定的数字,能够保留事物更多的有效信息。针对图像分割领域中存在的模糊信息,本文在中智图像分割方法的基础上,提出了基于区间中智集和多值中智集的图像分割方法,并通过实验分析说明了本文方法的有效性
随着世界羽毛球男子项目竞技水平的不断发展与提高,羽毛球男子双打与单打项目的打法特征开始日益分化,各国教练员根据运动员自身特点的差异,对男子双打打法产生了不同的理解与认识,因此,促使许多优秀双打组合逐渐形成相对独立成熟的打法方式与特点,从而导致男子双打打法特征差异性逐渐扩大。但由于现阶段对打法特征及其制胜规律概念的认识模糊,指导思想的概念并不统一,未能找到男子双打打法特征共性与异性特点以及制胜方式的
降雨天气往往导致监控视频质量下降,会使图像背景产生畸变现象。而远处的雨水条纹累积会产生类似于雾或霾的大气遮蔽效应,近处的条纹会产生高光现象,遮挡背景。当降雨量较大
随着全球化步伐的加快,越来越多有经济能力以及技术能力的部分人群选择移民出国。面对这样一个大环境下,很多国家也开始对移民政策进行不同程度的调整,受移民政策调整的影响,
在干旱区,为了增加农作物产量,通常使用地膜覆盖地表用以抑制蒸发,提高水分利用率。从陆气相互作用角度而言,大面积地膜覆盖显著改变了地表陆面参数,并阻断了土壤与大气间的
随着全球经济回暖,人们对生活质量的追求也越来越高,在节假日期间出游是大家的第一选择,也造成在商场、游乐园以及风景区等公共场所人群拥挤的情况常常出现,极易发生人群踩踏
随着桥梁工程建设水平的不断发展,以大跨径桥梁、柔性桥梁等为代表的新结构、新材料桥梁工程的建设规模也得到显著提升,它们为人类的生产、生活带来了极大的便利。然而桥梁在
超级电容器作为一种重要的能量储存装置,因其具有比传统电容器更高的能量密度、比电池具有更高的功率密度而受到广泛关注。电极材料的性质是决定超级电容器性能是否优异的关
从遥感图像中提取建筑区域面积对于评估一个地区的发展程度具有重要的意义。光学遥感图像易受天气影响,还会发生云雾遮挡,而具有全天时、全天候成像特点的合成孔径雷达(Synth