【摘 要】
:
跨项目软件缺陷预测(cross project defect prediction,CPDP)旨在实际的软件开发场景中,需要进行缺陷预测的目标项目可能是一个新启动项目,或这个项目已有的训练数据较为稀缺,需要利用其他项目已经搜集的训练数据来构建缺陷预测模型,其已经成为软件质量保证的一种手段,吸引了国内外研究人员的关注.然而,面对不同的目标项目,训练数据的选择将直接影响预测模型的性能.为了解决这个问题,本文描述了一种基于JS散度(Jensen-Shannon divergence)和相对密度的跨项目软件缺陷预
【机 构】
:
江苏科技大学计算机学院,江苏 镇江212100
论文部分内容阅读
跨项目软件缺陷预测(cross project defect prediction,CPDP)旨在实际的软件开发场景中,需要进行缺陷预测的目标项目可能是一个新启动项目,或这个项目已有的训练数据较为稀缺,需要利用其他项目已经搜集的训练数据来构建缺陷预测模型,其已经成为软件质量保证的一种手段,吸引了国内外研究人员的关注.然而,面对不同的目标项目,训练数据的选择将直接影响预测模型的性能.为了解决这个问题,本文描述了一种基于JS散度(Jensen-Shannon divergence)和相对密度的跨项目软件缺陷预测方法.该方法首先通过将源项目和目标项目分别拟合高斯混合模型(Gaussian mixture model,GMM),再通过蒙特卡洛方法计算出目标项目和所有候选项目之间的JS散度.其次,根据获得的JS散度选取与目标项目最接近的源项目;再次,提出相对密度概念,对选取的源项目训练数据进行有效选择.最后,利用CPDP中常用分类器构建预测模型.通过实验对比表明,本文方法不仅能够提高跨项目缺陷预测模型的性能,同时对不同分类器表现出较高的适应性.
其他文献
研究了与两个概率测度μ 和v之间的最优计划 γ 有关的传输密度 σγ 的绝对连续性和Lp,q可和性.更确切地说,如果μ∈Lp,q,其中1≤p<+∞,1≤q<+∞以及v的支撑集合为有限点集,则有σγ∈Lp,q.本文的证明主要利用经由位移内插μt给出了σγ 的等价定义公式,σγ 与μt的关系不等式,以及对位移内插μt进行的Lp,q估计.
本文以我校国家级一流本科课程结构力学为例,对线上线下混合式一流课程建设过程进行了总结,介绍了将传统课堂、线上课堂、线下翻转课堂及慕课堂相结合的线上线下混合式教学实践过程;并基于整体学习人数、课程考核结果及课程评价等,对混合式教学效果进行了统计分析,以望对相关课程的建设工作提供些许借鉴.
基于长江经济带1998—2018年各省(市)的面板数据,运用“自下而上”法测度其旅游交通碳排放量,探究其时序演变特征与空间格局,并建立旅游交通碳排放的Kaya恒等式,运用LMDI分解法揭示不同驱动因素对旅游交通碳排放变化的贡献程度.研究表明:(1)关于时序变化趋势,长江经济带旅游交通碳排放整体呈上升态势,大体可以划分为3个阶段:1998—2003年,碳排放量以10%左右的速率小幅增长;2004—2009年,碳排放增长率整体较高,峰值出现在2004年(32.12%);2010年以后,碳排放增长率回落至10%
为了探究过冷水温度对T型微细通道内蒸汽直接接触间歇凝结过程的影响,开展了可视化实验研究.采用高速摄像机(帧率为5000 fps)捕捉到了蒸汽温度100℃、蒸汽体积流量550μL/min及过冷水体积流量14758μL/min等参数恒定且过冷水温度分别为30℃、40℃和50℃工况下,1000 ms内汽液界面瞬时演变行为.研究发现,微细通道条件下蒸汽泡在间歇凝结过程中会相继发生多次“颈缩”和“内爆”现象,且随过冷水温度升高“内爆”后的汽液两相区面积逐渐增加;此外,随过冷水温度的升高凝结频率总体减低,而1000
本文对求解线性振动系统任意激励响应的Duhamel积分法作进一步讨论.基于将任意外激励分解成无穷多个脉冲激励的基本思想,以串行累计与并行叠加两种方式对各脉冲激励的作用过程作进一步地分析和阐释,给出了各自的理论依据,揭示出Duhamel积分的并行叠加计算本质.另外,基于微积分运算给出了Duhamel积分的严格数学验证,加深了对Duhamel积分的理论认知.
2017年10月调查了辽宁沈阳市郊锡伯族中学学生6项不对称行为特征(利眼、扣手、交叉臂、交叉腿、利足、起步类型).研究结果显示:(1)辽宁锡伯族男性的利眼、扣手、交叉臂、交叉腿L型率均略低于女性的L型率;男性的起步类型、利足L型率均略高于女性的L型率,但总体其6项不对称行为特征的出现率均无性别间差异(P>0.05).(2)辽宁锡伯族与国内其他15个少数民族其6项不对称行为特征出现率分别依次比较结果显示,有显著性差异(P<0.05)或极显著性差异(P<0.01).(3)辽宁锡伯族其6项不对称分布特征指标间的
为了改善3D打印水泥基材料(3D-printed cement-based materials,3DPC)可打印状态,本文通过研究流变性能的相关参数,建立了静态屈服应力时变速率模型,得到了3D打印(3D-printed,3DP)的最大可操作时间点(maximal operating time,MOT).再结合水泥水化动力学过程,通过非接触式电阻率仪测试得到水泥水化诱导期的开始时间,拟合得到诱导期与MOT之间的关系,试验结果表明,MOT出现在诱导期开始前的某一时刻.且随着纳米粘土(Nc)掺量的增加,掺聚羧酸
简介了超级计算(大规模并行计算)的基本概念及软硬件体系,结合笔者经历回顾了近20余年我国超级计算的发展.简要介绍了异构并行计算的基本概念以及并行计算的基本编程方式.
围海造地是解决土地矛盾的重要途径.大型围填海工程不仅对海洋生境造成深远影响,围垦区内景观生态格局变化更是直接影响着区域的生态变化.本文选取江苏条子泥垦区为研究对象,采用2010、2015、2018和2020年4期遥感影像和环境生态调查等数据,研究垦区内景观格局演变,结合景观指数变化,采用面积转移矩阵模型分析驱动因素,进而提出生态保护措施.研究结果表明:建设初期各类景观面积变化快速,破碎化增大,修复期景观破碎化趋势降低.开发与生态保护修复是围垦区景观格局演变的主导驱动力,协调好围垦区开发与生态保护,可以优化
目前,由于存在肿瘤特异性新抗原难鉴定以及无法将广谱肿瘤抗原通过激活性内吞受体途径递送给抗原提呈细胞等制约因素,使得肿瘤疫苗的临床疗效不佳,同时,肿瘤细胞表面抗原的高度唾液酸化修饰会导致免疫耐受.所以,本研究尝试利用糖代谢掺入,使肿瘤抗原的唾液酸位点标记上正交基团-叠氮(-N3),同时将特定的激活性吞噬受体的配体标记上另一正交基团-炔烃,通过生物正交反应,制备肿瘤疫苗.首先,利用分子生物学手段构建了重组质粒,再利用真核系统表达能靶向树突状细胞(dendritic cells,DCs)的重组蛋白mlgG1Fc