跨项目软件缺陷预测中数据预处理技术研究

来源 :哈尔滨师范大学 | 被引量 : 0次 | 上传用户:bazhahai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机互联网的不断升级和发展,人们对于软件的需求日益提高,虽然软件在日常生活中能够为人们提供极大的便利,但是软件缺陷问题所产生的巨大代价使人们受到了沉重的打击。软件缺陷预测技术是解决软件缺陷问题的重要手段之一。随着机器学习在软件缺陷预测领域上的应用,在同项目软件缺陷预测取得了较好的成绩。然而与同项目相比跨项目的软件缺陷预测技术更具有实际的意义。在跨项目软件缺陷预测的研究过程中,人们发现直接使用大量的数据进行跨项目软件缺陷预测往往会产生不好的预测效果,这是由于跨项目软件缺陷预测中存在类不平衡、特征差异等问题。而数据预处理技术可以缓解类不平衡和特征差异等问题,因此在跨项目软件缺陷预测中数据预处理技术至关重要。本文主要的工作是:(1)针对特征差异的问题,本文提出了一种过滤式特征选择方法CPFrFs(Cross project of feature selection and feature redundancy),通过该方法能够筛选出的特征集合具有低特征冗余度和高特征相似度的特征集合,以此特征集合构建的迁移的特征集合数量相较于原特征集合数量少,以此提高了跨项目软件缺陷预测的效果。(2)针对类不平衡的问题,本文提出了一种混合采样方法MSKsmote(K-means mixed smote method),该方法删除噪音点,剔除边界点上模糊的多数类数据以及增加边界点上的少数类数据能够使得边界点更为的清晰,以此达到数据平衡。(3)为了进一步提高跨项目软件缺陷预测的效果,本文将MSKsmote算法和CPFrFs算法相结合,提出MSK+CP的跨项目软件缺陷预测模型。先将数据集进行MSKsmote混合采样方法,然后再利用CPFrFs算法筛选最优特征集合。实验结果表明,该算法在F1值上相较于经典的跨项目软件缺陷预测算法能够取得更好的效果。
其他文献
桂平市壮族舞春牛是一项优秀的民俗体育活动,是壮族人民在生产劳作中创造出来的灿烂文化,但面临着失传的风险。查询与舞春牛有关的文献记载,可谓是“凤毛麟角”。通过文献资料法、田野调查法、访谈法、对比分析法等研究方法,从非物质文化遗产视角下解析壮族舞春牛的起源与发展、文化生态环境、文化特性与功能价值等,找出制约舞春牛民俗体育传承与发展的因素,探讨舞春牛的保护与传承创新,为壮族舞春牛的保护与传承尽绵薄之力。
学位
花山壮拳是广西壮族自治区宁明县城中镇代代相传的传统武术,它以岩画的形式被描绘于左江两岸,是壮族文化的活化石。花山壮拳在动态传承过程中,其开展的场域不仅仅是物理上的地域性空间,更是一个具备文化性、时空性的典型文化空间。随着花山岩画成为世界级非物质文化遗产之后,花山壮拳也乘势申报更高级别的非遗名录,但是由于花山壮拳于申遗前后的规划、管理和开发不尽合理等原因,导致花山壮拳文化空间不断被破坏。在解决类似的
学位
英语语法是英语学习的基础也是语言使用的规则,对于英语学习起着至关重要的作用。初中阶段是学生开始系统学习语法和打好语法基础的关键时期。然而目前初中英语语法教学仍然存在“填鸭式”教学以及应试目的较强的问题,初中生普遍对语法学习兴趣不高甚至语法学习焦虑,对语法的应用也存在困难。所以当下提升学生英语语法的学习兴趣、实现高效初中英语语法课堂就成为教学的重中之重。“翻转课堂”是基于信息技术科学推出的现代化教学
学位
近年来国内游戏行业诞生了大量优秀的作品,但与国外游戏制作水平仍有较大差距。国内游戏业的兴起注定需要一股新鲜的血液流入,但国内对游戏专业人才的培养与当前市场存在不小的差距。由于一款比较成熟的游戏作品往往经过创意、策划、美工、程序设计及游戏测试发布等多个环节,所以游戏设计是一个复杂的工程。本文旨在开发一款能够帮助初入游戏专业的设计者尽快熟悉游戏开发流程,尽快在游戏设计的各个环节中获得真实的体验感并能提
学位
随着人工智能技术在物联网中的应用日益增多,物联网因其分布、异构性等特性对其安全、可靠性构成了极大的威胁。随着物联网的发展,针对目前的网络发展趋势,物联网安全的解决方案已成为当前网络安全方向的迫切需求。为了保障物联网网络的安全性,入侵检测技术是一种非常关键的技术。近年来,机器学习和深度学习在计算机视觉,自然语言处理,图像识别,智能翻译,推荐系统等方面,都有了很大的突破。基于此,本文提出了一种深度学习
学位
文莱与马来西亚是山水相连的邻邦,双方的地缘、族缘关系紧密,历史渊源深厚,两国具有相同的王室结构、族群构成、宗教信仰和文化传统。1984年文莱与马来西亚建交以来,双方在政治、经济以及人文等领域全面展开合作,两国关系趋向友好,发展牢固。然而历史上,文莱与马来西亚的政治关系在马来亚独立后、文莱独立前较长的一段时间里起伏不定,关系错综复杂。基于丰富的历史文献材料,本研究从历史的角度、分阶段论述1957-1
学位
近年来,卷积神经网络(Convolutional Neural Networks,CNN)在人工智能领域的多种任务上取得了巨大的进步,例如图像识别、语义分割和文本分类等。在CNN的模型训练中,超参数的设置依赖于参数调整人员的长期经验和主观判断给出,而且超参数的质量决定模型的最终效果,选择质量差的超参数意味着模型的失败,这导致花费的时间将大大提升。因此,卷积神经网络的超参数择优问题是目前急需解决的问
学位
随着时代的发展,通信科技的不断更新和媒介技术的不断进步,深深影响和改变着音乐艺术的创作与传播.更重要的是改变了音乐课堂的受众群体也就是学生对于音乐的审美,思想,以及内涵的理解,这样的改变一定程度上转换了音乐课堂的发展模式,尤其是初中音乐课堂。九年义务教育末期的初中音乐课堂,学生相较小学时代更具独立思想,却无法做到成熟的将思想独立,自媒体音乐的发展无疑是对这种独立思想的开拓,对音乐某种意义上来讲是一
学位
随着数据分析、深度学习和许多其他先进技术的发展,研究人员尝试使用机器人来执行一些如对象识别和实时路径规划等更加复杂的工作。然而由于该领域的某些限制,机器人通常受到尺寸和电池容量的限制,同时在恶劣的环境中它们通常是不可以充电的。因此,它们无法承载强大的硬件,并且往往缺乏计算和存储资源。云计算的出现为云机器人的自身问题提供了解决的方法。云机器人计算任务可以通过无线接入将数据处理任务从资源受限的机器人本
学位
视觉目标跟踪作为计算机视觉的基本任务之一,广泛的应用于智能交通、安防监控、轨迹预测、行人重识别等。在目标跟踪的实际场景中存在很多难点,比如遮挡、低分辨率、跟踪目标较小和跟踪时间较长都会影响跟踪性能。所以,使目标跟踪变得更快更准确是有重大意义的。为了提高目标跟踪的性能,本文在跟踪网络的特征提取部分和跟踪模型的集成选择上对目标跟踪算法进行改进。本文的主要创新如下。(1)在目标跟踪网络提取特征的过程中,
学位