论文部分内容阅读
众包是互联网环境下一种新兴的分布式解决问题的生产方式。众包模式可帮助企业获得全球化的人力资源,显著降低开发成本,提高生产效率。采用众包模式开发软件是未来软件发展的一个重要趋势。但由于网络用户的水平、经验相差很大,众包模式下任务的完成质量具有较大波动性,质量控制己被认为是众包模式的一个重大挑战。目前国内外对众包的研究主要集中在理论方面,仅有少数学者分析了非软件类众包任务的完成质量,对软件众包任务质量的研究极为不足。
本文的主要研究目的是识别众包模式下影响软件质量的主要因素和规则,建立质量预测模型,以帮助企业更好的理解软件众包模式,在实际众包过程中采取适当的措施提高软件质量。
首先,本文在深入分析众包模式特征和总结现有质量相关研究的基础上,从众包平台、开发人员、任务基本信息、规模及复杂度和设计特征这5个方面提出了21个众包软件质量的潜在影响因素,并指出了各因素的度量方法。
然后,本文提出了众包软件质量分析与预测的方法。该方法通过相关性分析,筛选出与质量显著相关的因素,用于建立质量预测模型。利用多元逐步回归技术可迭代选出最少变量建立最优回归模型的特点,使用其建立质量定量预测模型,识别质量的显著影响因素并量化各因素的影响效果。采用C5.0决策树算法,建立质量的定性预测模型,并从中提取出影响质量优劣的规则。
最后,本文以TopCoder软件众包平台为研究案例,将质量分析与预测的方法应用于该平台的实际软件众包数据上,分别建立了逐步回归模型和决策树模型,识别出影响质量的6个主要因素和7条规则。其中,6个主要影响因素分别是开发人员最高技能等级、近期平均质量得分、规格说明文档长度、同时期任务数量、参与任务人数和设计质量。通过分析影响质量的规则,发现同时期任务数量大于22个、开发人员最高技能等级大于1259分、参与任务人数大于26人、开发人员的平均信誉度大于32.9%、或者设计质量大于87.52分时,企业获得优质软件制品的概率较大。根据TopCoder平台的实验结果,本文为企业提高软件众包任务质量提供了4条参考建议:选择平台上任务数量较多且平均质量得分较高的时期发布软件任务;吸引较多的、技能等级较高的开发人员参与任务;严格控制软件的设计质量;减小软件任务的规模。