【摘 要】
:
孪生网络是一种建立在度量学习理论基础上的机器学习方法,与其他神经网络相比,能较好地解决小样本等分类问题,成了机器学习领域的研究热点。其作为一种特殊类型的神经网络结构,即使在样本数量较少情况下依然能够取得良好的学习效果,比较适合解决文本分类、缺陷预测等典型小样本学习问题。因此,研究基于孪生网络的软件缺陷预测方法具有较强的理论意义和实用价值。本文以静态软件缺陷预测的关键问题(例如,缺陷数据集样本量少、
论文部分内容阅读
孪生网络是一种建立在度量学习理论基础上的机器学习方法,与其他神经网络相比,能较好地解决小样本等分类问题,成了机器学习领域的研究热点。其作为一种特殊类型的神经网络结构,即使在样本数量较少情况下依然能够取得良好的学习效果,比较适合解决文本分类、缺陷预测等典型小样本学习问题。因此,研究基于孪生网络的软件缺陷预测方法具有较强的理论意义和实用价值。本文以静态软件缺陷预测的关键问题(例如,缺陷数据集样本量少、类不平衡分布影响和历史数据不足等)为研究对象,将孪生网络作为核心理论与方法,分别从度量学习、代价敏感学习、元学习、样本权重再学习等角度,探究适合于面向分类任务的有监督软件缺陷预测方法,旨在进一步提高静态软件缺陷预测性能。本文的研究工作主要包括以下内容:(1)基于孪生网络的特征相似性度量学习方法针对缺陷数据集中样本量不足问题,提出了基于孪生网络的特征相似性度量学习方法。该方法利用孪生网络和全链接网络构建了用于小样本学习的孪生全连接网络模型。同时,在原对比损失函数基础上融入了余弦距离函数,使新的损失函数不仅考虑了输入样本对的类间差异而且还关注着样本对的类内差异。与基准对比方法的实验结果表明,所提方法能有效地提升在小样本不平衡情况下软件缺陷分类准确率,可以有效地对软件缺陷进行预测。(2)基于代价敏感学习的孪生并行网络模型针对缺陷数据集中类不平衡分布问题,提出了基于代价敏感学习的孪生并行网络模型。该模型利用“深”与“浅”的网络融合思想设计了用于小样本学习的孪生并行网络模型。同时,利用代价敏感学习技术将不同的误分类代价融入网络模型中,使对误分类代价不敏感的网络模型转换为代价敏感的神经网络,通过最小化总误分类代价来减小数据集类不平衡分布对模型性能的影响。不同误分类代价下的实验结果表明,相对于基准对比方法,该方法在软件缺陷数据集上的分类效果更好。(3)基于元学习的集成孪生分类器针对早期缺陷预测历史数据不足问题,提出了基于元学习的集成孪生分类器。该方法首先根据元学习技术设计了用于类不平衡分布的元知识学习函数。该函数通过对多类数据的内积变换特征进行划分,使得划分后的正负样本数量大小相当或近似相当。然后,利用孪生并行网络模型作为基分类器,通过集成学习技术将各个基分类器集成,使集成后的强分类器不仅减小了模型方差而且分类性能更好。实验结果表明该方法的多个性能指标值优于基准对比方法。(4)基于孪生网络的样本权重再学习方法针对跨项目缺陷预测不平衡问题,提出了基于孪生网络的样本权重再学习方法。该方法利用孪生网络和卷积神经网络构建了用于小样本学习的孪生卷积神经网络。同时,针对数据集类不平衡分布问题,设计了样本权重再学习算法。该算法将样本权重再学习转化为在线近似学习,并根据训练损失曲面下降方向与验证损失曲面下降方向间的相似度来对不同类别的样本权重重新赋值,从样本权重再学习角度来缓解数据集类不平衡分布对模型分类性能的影响。项目内与跨项目缺陷预测的实验结果表明了该方法的有效性。
其他文献
相较于民法、刑法等传统的部门法,经济法更为强调法律的事先预防以及事中监管而不是事后救济,所以司法在经济法的研究中并没有得到足够的关注,相关的研究也较为薄弱,这是不利于建构整个经济法理论体系的。然而,这一格局的形成并非是经济法学者的有意回避,而是传统的司法研究进路在经济法上的作用空间较为有限。司法作为一种国家权力安排,其势必会对外界产生影响,经济法语境下的“国家干预”或者“政府监管”都是可能被影响的
为了适应现代社会经济发展的新需求,我国高速铁路系统规模逐渐扩大。列车在高速行进过程中与轨道不断触碰产生振动,通过路基和地基土体向周围扩散,影响范围涉及居民生活区、古建筑物、使用精密仪器设备的工厂、实验室等。在城市的有轨交通网线覆盖率日益提升的大环境下,高速列车对环境振动的影响逐渐突显。随着海底环境中隧道和高铁等工程技术的研究与推进,我国海底高速交通网线的实现指日可待,同样的环境振动问题也会发生在海
随着社会经济不断发展,能源需求不断增长,化石能源被大量开采和消耗,由此引发的能源枯竭和环境污染问题日益凸显。为提高多种能源的综合利用效率和促进可再生能源发电的消纳,气电综合能源系统开始得到发展并受到重视。天然气系统与电力系统两种异质供能网络间的深度耦合一方面提高了能源供应的灵活性和利用效率,但另一方面也带来了运行层面的多重不确定性和复杂性,对整个系统的安全可靠性水平产生了重大影响。因此对气电综合能
热化学吸附储热系统作为一种具有广泛应用前景的新兴技术,可以用来解决能源供需在时间、空间和强度上的不匹配,有助于提高可再生能源的综合利用率,推进能源脱碳化的进程。在利用低品位太阳能和工业余热的温度范围内,热化学吸附储热系统的典型工质对主要是无机盐/水和无机盐/氨。考虑到安全和成本因素,应用于建筑物热能储存的研究主要集中于无机盐/水工质对。然而,无机盐/水工质对在实际的热化学吸附储热应用中仍面临反应速
当前我国正处于经济发展模式转型的关键时期,压力与挑战并存,经济增速相对放缓,新业态、新经济快速发展,当务之急是要促进经济高质量发展,尤其是社会诚信体系的建设,在推动我国经济高质量发展中起到了关键性的作用,是经济健康可持续发展的重要因素。尽管目前社会信用体系建设格局正在逐步形成,但在社会和经济领域,失信问题高发、频发的态势并未得到根本的遏制,随着经济转型的加快,在现有监管制度尚未完善的情况下,违法成
自2008年全球次贷危机爆发以来,我国面临国内外经济环境高度不确定。在经历了多年的高速发展后,我国经济增速进行了调档,但由于新动能赋能不足,全要素生产率提升乏力,投资与消费不足等原因,我国经济稳增长也面临较大的不确定性。而国外经济金融也给我国经济带来了较大的不确定性。由于欧美等经济发达国家长期积累的矛盾激化,各类“黑天鹅”、“灰犀牛”等事件频发,如2008年全球次贷危机、欧洲主权债务危机、油价暴跌
随着高新科学技术的快速发展,拓展材料服役条件的需求愈发强烈,对材料服役性能的要求也越来越高。聚合物材料与不锈钢材料在航空航天、自动化、建筑工程等领域发挥着重要的作用,在高温环境下的应用也越来越广泛,这就对关乎应用安全可靠性的关键指标—聚合物材料温度相关性拉伸强度、不锈钢屈服强度的获取及提升提出了迫切需求。研究不同温度下控制聚合物材料拉伸强度及不锈钢屈服强度的关键要素及其随温度的演化,建立包含宏细观
单纯的基底表面具有性质单一、实用性不够强、应用范围较窄等各个方面的不足,因此,近年来,具有超润湿性、低流体流动阻力等特殊特性的结构化复杂表面引起了研究人员的兴趣。在自然界中,荷叶、蝴蝶翅膀、蝉翅、玫瑰花瓣和蚊子眼等由于其表面的复杂微纳米结构或者表面能物质而具有各类特殊性质,这对人工制造相关的复杂基底具有重要的启发意义。在过去的几十年里,随着科学技术的快速发展,研究人员已经运用各种技术制备出各类复杂
马××,女,71岁,家庭妇女。1985年8月21日初诊。便秘十余年,临圊则腹痛不堪,前医屡以攻下或润下等法治之,便秘有增无减。刻诊:大便秘结,五、六日未行,胸闷不舒,口腻纳呆,舌苔白厚腻,脉濡。证系湿盛困脾,阻碍运化,脾为所约。治宜化湿运牌。处方:炒苍术10克,川厚朴10克,炒枳壳6克,陈皮6克,茯苓10克,姜半夏10克,苏藿梗各10克,焦苡仁24克,炒决明子10克(打)。三剂,水
光电催化(PEC)分解水技术可直接将太阳能转化为氢能,具有经济、环保等优点,是解决能源危机与环境污染的最有效途径之一。因具有带隙适当(~2.1 e V)、带边位置好、物化特性稳定、地球上储量丰富等优点,α-Fe2O3是一种极具潜力的PEC光电阳极材料。但与许多半导体材料一样,其光吸收较差、光生空穴扩散长度短(2-4 nm)、光生电子-空穴对易复合、光电流的实际效率远低于理论值,如何提升α-Fe2O