数据挖掘中基于核的多重填补的一种新算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:huoshengxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘预处理中,数据缺失是最为常见的数据预处理问题之一。通常对所要挖掘的数据分布形式没有任何先验知识。在这种情况下,非参回归分析方法可以为数据缺失的处理提供一种效果很好的解决途径。据此,在缺失机制是随机缺失(Missing at Random,MAR)和完全随机缺失(Missing Completely at Random,MCAR)的条件下,提出了一种处理数据缺失的新方法,即基于核函数的非参多重填补算法。模拟实验结果表明,算法的置信区间的覆盖率,区间长度,以及相对效率都比常用的NORM算法要好。
其他文献
<正> 任何艺术都非常强调形式与内容的统一,形式与风格的统一.花样滑冰既是体育运动项目,又是综合了音乐、舞蹈等特点的一门高级艺术.当然,它的艺术价值是建立在冰上技巧之上
赵炎秋教授主编的《中国古代叙事思想研究》,是用叙事学理论来研治中国传统文学的优秀之作,此书建构了中国的本土叙事理论体系,做了许多基础性的工作,使西方的叙事理论与中国
体育教育是科学的更是人文的,主要是为生命教育服务.但是,由于高等职业院校的体育教育倚重竞技体育,过于程式化,与学生的生活世界脱离,逐渐偏离了体育的主要育人目标.因此,应从教育观
介绍了施斗姆定理的一种证明方法,通过这种证明使我们更易理解施斗姆定理的含义,掌握施斗姆定理,从而达到运用施斗姆定理讨论多项式实数根的目的.
在计算光流场的基础上,提出了snake算法中一种新的外部能量函数,并利用光流场的运动矢量来预测下帧图像中snake的初始值,不仅与无预测的算法相比能提高收敛的速度,而且收敛结果更贴近于目标的本身。实验证明了该文算法的优越性。
长春市应急管理机制在指挥系统、资源整合、处置原则、常态管理等方面有着自己的特点;在管理重心、决策机制、信息传递、社会参与和法制建设等方面还有待于进一步的完善.
发展伦理将发展看作目的价值与工具价值、伦理与经济的统一,对功利主义的单一经济发展见解进行了批评,主张综合发展,突破GNP(GDP)指标,强调人类发展指数(HDI),最终追求价值的
19世纪末20世纪初对美国艺术而言是一个充满巨变的时期,受欧洲现代主义艺术的影响,以及艺术家对本土文化经验探寻的自觉,美国艺术在此时期开始从传统迈进现代,期间爆发了各种
<正> 当前田径训练中最主要的任务之一,就是如何对所有运动员,尤其是青少年中长跑运动员进行耐力训练的问题。苏联研究人员对发展耐力及与其他身体素质间的相互关系问题曾进
对基于求和自回归滑动平均模型(ARIMA模型)的软件可靠性预测方法进行了研究,提出了将软件可靠性失效数据看作时间序列,通过建立相应的ARIMA(p,d,q)模型来进行预测的方法。对该方法的