基于软件仓库的个体软件过程能力度量技术研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:wra207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自60年代出现软件危机以来,世界各国政府、计算机软件研究机构和组织在软件工程化方法、技术和工具的研究、开发和实践方面投入了大量的人力、物力和资金。人们认识到,要高效率、高质量和低成本地开发软件,必须以改善软件生产过程为中心,实施过程指导的软件生产与质量管理。个体软件过程(PSP)是由卡内基·梅隆大学软件工程研究所的Humphrey领导开发的。它是一种可用于控制、管理和改进个人工作方式的自我持续改进过程。随着软件工业界对软件过程改进需求的日益增长,PSP的研究成为了软件组织为达成完全(从宏观到微观)量化过程管理研究中的一个热点课题。研究表明高水平的个体软件过程能力是软件项目成功的关键,如何进行有效的个体软件过程能力度量是PSP中的一个核心问题。   软件过程能力度量的准确度依赖于历史数据的积累,只有积累了大量客观充分的历史数据,软件过程度量所得到的结果才会更准确,对未来的过程改进才有指导意义。然而,工业生产中常见的协同软件开发,使得PSP能力指标的收集十分困难,例如,当一个软件系统由多人编码实现时,PSP能力的度量就面临着如何识别其中每个开发者所贡献的代码量,所引入的缺陷率以及所带来的程序复杂性等问题。同时,PSP能力度量问题本身具有多指标输入输出、规模收益可变以及需要考虑决策者偏好的特点,因此亟需一种面向PSP能力度量的量化分析方法,用于解决具有这类特点的量化度量问题。   由于软件仓库(版本控制系统及缺陷跟踪系统等)已经被广泛应用于大多数的软件项目开发之中,同时其中蕴含了丰富且极具价值的历史开发数据,这些数据和整个项目开发周期中开发人员的行为紧密相关,是个体软件活动的最直接反映,为PSP能力度量研究提供了大量客观的数据支持。因而本文提出了一种基于软件仓库的个体软件过程能力度量的新方法。该方法可分为两个步骤:基于软件仓库的PSP能力指标挖掘,以及支持PSP度量的量化分析模型。   首先本文通过充分研究当前常用的软件仓库数据挖掘技术,重点分析针对版本控制系统和缺陷跟踪系统的数据挖掘方法,提出了一种在协同工作环境中,基于软件仓库的PSP能力指标挖掘方法,并定义了四组指标进行详尽的分析,从理论和实践的角度,保证了PSP指标数据集的准确、客观和合理性   其次本文提出了一种基于数据包络分析(DEA)和层次分析法(AHP)的混合模型—PSPADA—用于PSP能力的度量分析,更进一步,还从理论上证明了PSPADA模型的正确性和可行性,并建立了与之相关的三个核心算法(综合决策者偏好,建立参考集和估计规模收益)。该模型能够同时解决多目标决策、可变规模收益以及主观决策者偏好的问题。应用该模型进行PSP指标数据的度量分析,其反馈的量化结果更为客观、更易理解,能有效地指导个体开发者实施个人软件过程改进。   然后,本文还实现了该度量方法的原型工具PSPstat。PSPstat实现了PSP指标收集和PSP能力度量分析的功能。它支持从软件仓库中自动挖掘多种PSP能力指标数据,使用PSPADA进行评价计算,并提供丰富的图形界面,展示指标数据和度量结果。PSPstat易于扩展,在设计上考虑了对多种版本控制系统、多种缺陷跟踪系统、多种程序语言、多种度量指标以及多种量化方法的支持,为进一步的研究和工作准备了必要的基础。   最后,在实例研究中,通过两个实验对本文提出的PSP能力度量模型及方法进行了验证。实验一的研究对象是一个标准的PSP数据集,侧重于从理论角度对PSP能力度量模型中的PSPADA方法进行有效性验证,证明PSPADA方法在结合决策者偏好的前提下,能有效度量个体软件过程的能力。实验二则以一个开源软件项目iEdit为实验对象,获得了一个包含近百名个体开发者的大型工业数据集,因此在实验中,着重展示了该方法从工业软件仓库中挖掘个体软件过程能力指标的优势。   从本文的研究中可以看出,该基于软件仓库进行PSP能力指标挖掘的方法,可以保证度量指标的客观公正性,且将指标收集过程自动化,节省了大量的人力物力。同时其中的PSPADA度量模型能够在考虑决策者偏好的同时,有效的进行多指标、规模收益可变的量化评估,给出合理的度量结果,并指导未来的改进方向。因此该PSP能力度量方法对度量个体软件过程的能力,帮助软件企业建立IPRP薪资策略将有着显著的推动和促进作用。
其他文献
随着网络技术的快速发展和网络规模的迅速增长,网络安全问题日益突出。入侵检测技术作为一种全新的、主动的安全手段,越来越显示出其重要性。 本文首先介绍了入侵检测系统的
可视化是将信息和知识转化为一种视觉形式,帮助我们加深对大规模复杂数据间相互关系的理解,使我们获的新的洞察并做出有效的决策。B/S应用架构的出现、Web服务器端和客户端技术
学位
随着校园网络的不断发展,校园网内的资源日益增多,然而这些资源的利用率却非常低,造成了资源的浪费。而与此同时,大型科学研究由于计算资源的不足而无法完成。一方面是校园网内的
学位
网络内容分析系统最核心问题之一是字符串模式匹配。串匹配是计算机领域最基本的问题,经过多年的研究,已经获得很多经典的算法。但是,传统的串匹配算法遇到了一个瓶颈,精确单模式
P2P文件共享是目前Internet上最主要、最成功的对等网络(Peer-to-Peer,P2P)应用,而且P2P文件共享应用已经成为当今互联网流量的重要组成部分。然而由于P2P文件共享系统中参与节点
互联网多媒体业务和传统业务具有不同的服务质量和用户感受要求,需要采取相应的机制进行区分优先级的业务流带宽实时保证。对比现有的两类解决方案,虽然基于网络的方法能够实施
随着社会的不断发展,人类对能源的需求越来越大。作为世界上最重要的传统能源之一,石油被广泛地应用在工业、农业、军事等各个领域。为了获取更多的石油资源,必须加大石油勘
学位
近十几年来,随着数字图像及视频获取设备在人们生产及生活中的日益普及、计算机存储介质成本的不断降低、互联网技术的迅速发展,同时随着人们对视觉媒体的日益关注,许多企业、机
学位
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,出现了信息超载的问题。解决信息超载问
智能配用电通信网覆盖配用电终端到配电业务主站之间的一系列通信实体,包括通信线路设施和通信设备等,其承载着一系列电力发电、运输与使用之间的接入通信业务,是智能电网通信网