基于最大信息系数的软件缺陷预测模型

来源 :应用概率统计 | 被引量 : 0次 | 上传用户:wc836952
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件缺陷预测的回归建模中,由静态代码提取的类层面度量元(特征)以及由方法聚合(sum、avg、max、min)到类的特征往往较多,使用传统的特征选择方法(如AIC、BIC)通常先要确定了模型,不同的模型选出的特征集差异较大,且模型的可解释性差.最大信息系数MIC(maximal information coefficient)是Reshef等[4]提出的度量两个连续变量之间相互依赖程度的一个指标,且有基于观测数据的计算办法.本文基于软件缺陷个数与各特征的MIC度量先选择特征,再对所选特征进行了适当的幂次
其他文献
在实际应用中需要拟合正的偏态数据时,对数正态分布是通常的选择.当通过多重比较确定了多个对数正态分布总体的均值相同时,如何能够利用更多的信息,同时使用这些对数正态分布
一、江苏实施教师资格制度取得的成绩(一)教师资格制度实施已经走上了法制化.规范化、程序化道路自1993年10月全国人大颁布《中华人民共和国教师法》(以下简称《教师法》),1995年12
本文研究了 ~φ混合随机变量序列加权和的矩完全收敛性,利用 ~φ混合随机变量序列的Rosenthal型不等式,得到了 ~φ混合随机变量序列加权和的矩完全收敛性定理,这些结果推广和改
作品中“天如水色”,湖水与天色浑然一体,人在其中居住恍若仙境一般,透过树木与山石的空隙,几间屋宇错落有致地分布在画面中,有一高士独坐在屋内,
翻开一年级语文课本,有许多生动有趣、色彩鲜艳的插图,画面是对课文情境的直观显示,是帮助学生进行形象思维的阶梯,是启发、引导学生展开丰富想象的直接凭借。
3D打印应用领域相对较广,且发展前进非常可观。本设计对3D打印机在国内外的发展现状进行了充分对比、对3D打印产业的未来发展趋势做了详细分析、对3D打印机的原理及特点做了重
心中纵有干丘万壑,终也只能是众鸟归林后的寂静。那份淡薄的明亮,也只是刹那的感触。飞鸟过尽,还有什么能让时光里的气候变得更轻盈一些?
哥本哈根会议已经落下帷幕.节能环保、拯救地球已成为人类共同的责任。2009年11月3目,首都科技界大会上,国务院总理温家宝也将节能环保列为中国战略性新兴产业。能源部正酝酿在2
提出中医"证的构成"与"证的表现形式",阐述临床上证候表现之所以错纵复杂、变化多端的关键所在,意为临床辨证的灵活性提供理论依据.
乡镇政府公共产品供给是一个重大的理论与实践课题。近几年来,不少学者对乡镇政府公共产品供给制度进行了许多有益的探索,但从乡镇职能角度出发立论者较少,这在一定程度上影响了