基于相似检测的交互式缺陷报告工具的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:f40042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高质量软件的开发需要及时、高效的缺陷收集和处理机制。在开源项目中,缺陷追踪系统(Issue-tracking System)被广泛用于记录和追踪用户反馈,特别是软件缺陷。因为开源项目中存在许多缺乏技术经验的用户,因此项目中存在相当数量的、由他们提交的低质量缺陷报告1。其中,信息缺失和重复报告是报告质量低下的主要原因。为了完善缺失的信息,项目成员(包括审核者、开发者和管理者)和报告者需要花费大量时间和精力进行交流。这不但降低了报告修复的效率,还损害了报告者的体验。重复报告很可能导致项目成员重复的工作,而发现、检测重复报告的工作本身也耗时耗力。项目成员的时间极为宝贵,如果他们被过多的低质量缺陷报告干扰,就无法及时高效地修复软件缺陷。  目前,许多研究工作致力于提高报告的质量,主要分为重复检测和质量反馈两个方面。前者主要采用自然语言分析等方法,计算缺陷报告间的相似度,并由此检测重复报告。这部分工作大都假定被检测的报告具有完整的信息,然而这个假设对于大量存在的、信息缺失的报告并不成立(它们往往由缺乏经验的报告者提交)。后者主要探索影响报告质量的因素,通过对缺陷报告质量进行建模,指导报告者完善缺陷报告。这部分工作主要针对报告中存在的基本的、具有共性的问题,指导报告者完善报告(例如,提示报告者添加相关截屏)。然而,缺陷往往有各自的特殊性,报告者需要更有针对性的建议来完善报告信息。  针对上述问题,本文通过挖掘和分析Gnome、Mozilla等项目的近941k条缺陷报告2,总结现有的缺陷处理流程,分析低质量报告的特点,并设计和实现了一个基于相似检测的交互式报告工具Intereport。Intereport以挖掘项目的缺陷历史为基础,采用交互的方式,根据提交报告的描述,提示报告者提交报告所需要补充的信息,并检测重复报告,从而减少信息缺失的报告及重复报告的提交。本文的贡献在于:1、提出了一个基于相似检测的交互式报告完善方法。对新提交报告,该方法根据自然语言相似度及堆栈相似度检测相似报告及重复报告,根据相似度分布判断信息是否缺失,并利用最大信息增益原理分析相似报告,进而生成建议,指导报告者完善报告。2、基于上述设计,本文使用MongoDB、Flask及Bootstrap实现了基于B/S架构的交互式缺陷报告工具Intereport。作为实验评估,本文从Gnome项目中随机抽取了5条报告,使用Intereport检测它们在项目中的重复报告。结果显示,Intereport检测出的重复报告列表(最大长度为7)中,有50%~60%的列表包含了真正的重复报告。此外,本文还提供了3个案例,展示了报告者如何通过Intereport的指导,逐步完善报告的过程。
其他文献
电子政务是经济与社会信息化的先决条件.一个国家的信息化需要来自多方面力量的推进,其中,政府作为国家组成及信息流的"中心节点",在社会信息化的进程中起着责无旁贷又无可替
该文在考虑无穷对象可逼近和可近似计算的问题、以及增量式计算的正确性问题时,发现关键在于研究计算的极限行为,在李未提出的形式系统序列极限研究的基础上,该文以过程模式
地球物理学家,测井工程师早就梦想到井下去漫游,测井技术已经发展了70年,测井技术的发展历经了四个阶段:模拟测井、数字测井、数控测井、成像测井,现在正处于成像测井阶段.随
论文在分析地下水数值模拟技术现状的基础上,从有限元前处理技术到对有限元数值模型求解两个方面进行了研究.网格剖分是有限元分析前处理的主要工作.通过对网格剖分技术现状
由于网络计算机资源以及相关应用重要性的快速增长,威胁这些应用的入侵行为成了一个亟待解决的关键问题。入侵检测技术是继防火墙、数据加密等传统安全保护措施后新一代的安全
入侵检测,作为信息安全保障体系结构中的一个重要组成部分,很好地弥补了访问控制、身份认证、防火墙等传统保护机制所不能解决的问题.在这方面的研究国外从二十世纪八十年代
集群计算正日益成为企业和科研群体在挖掘资源潜力、整合计算能力方面所青睐的技术.从本质上说,集群计算是分布式计算的一种,它利用网络将某个环境内各种各样的资源集成一个
各类信息系统(MIS)的建立和应用产生了巨大的社会和经济效益.地理信息系统(GIS)作为信息系统中的重要一类日益受到人们的关注.信息系统是对现实世界的计算机模拟,而地理信息
该文首先研究图像的低级物理特征,综合运用图像的颜色、纹理和形状特征进行图像检索,并在此基础上,引入相关反馈技术和语义查询技术,便图像的低级物理特征和高级语义特征联系
随着计算机网络技术的飞速发展,信息共享变得更加方便和容易,人们可以更加方便快捷地通过网络获得所需要的信息.但是,网络的负面影响也开始显现,各种反动组织和罪恶势力利用