基于信息增益的数据库缺失值填充算法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:shmilygang8751
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘以及机器学习等领域,都需要涉及一个数据预处理过程。其中,缺失值的填充是一个非常具有挑战性的任务,因为填充效果的好坏会极大的影响学习算法及挖掘算法的后续处理过程.目前已有的一些填充算法在一定程度上能够处理缺失值问题.与已有的方法不同,提出了一种扩展的基于信息增益的缺失值填充算法,它充分利用数据集中各属性之间隐含的关系对缺失的数据进行填充。大量的实验表明,提出的扩展的基于信息增益的缺失值填充算法是有效的.
其他文献
<正> 在棉花放开经营和我国加入WTO后,供销合作社的生存与发展面临着严峻的考验。供销合作社迫切需要在参与和推动农业产业化经营中寻找新的出路。为此,有必要就供销合作社参
企业财务管理目标(又称企业理财目标),是财务管理的一个基本理论问题,也是评价企业理财活动是否合理有效的标准。目前,我国企业理财的目标有很多种,其中利润最大化、股东财富最大化
肺腺癌包括支气管粘液腺上皮癌和细支气管肺泡细胞癌,常伴有胸膜侵犯和癌性胸腔积液。自1992~1997年我们对25例伴有癌性胸腔积液的肺腺癌患者进行了全身化疗加局部治疗,现分析
为尽快适应大学体育教学改革的新要求,本人与本校同行以《体育与健康》新教材为蓝本,在本校进行了为期一年的“一定四主”课堂教学模式探索,即:既定目标;学生自主选项,自主练习、自
统计2002年全年我院收治的10个主要病种,腰椎间盘突出症位居第二,仅次于施行腹腔镜手术的胆囊切除术,该病种的住院手术率自2002年以来一直居高不下,在医疗市场的竞争中,频露
1986年以来,我院共收治烧伤面积占体表面积50%以上者134例,治愈95例、死亡26例、未愈13例,治愈率70.90%、死亡率19.40%。现就救治体会报告如下:1临床资料本组伤员中男114例、
开发新产品,侥幸成功率在 5%,饮料行业侥幸成功率在 30%,除此之外,大都是失败者."元田风"是一个小型企业,又是一个不知名的新品牌,自身的优势不足,如何能保证在 5%和 30%中占
对不能手术切除的中晚期肝癌患者,选择性肝动脉栓塞化疗成为首选治疗方法.然而,在术中常出现一些不良反应,影响了介入治疗的顺利进行,我们在术中对患者进行了全程护理,取得了
第三方物流业正处于起步阶段,对其审计活动进行研究,探讨其审计原则等,不仅可以丰富审计的内涵,而且有利于第三方物流公司的发展。
利用2009—2016年我国沪深两市A股上市公司的数据,从外部融资环境压力和内部管理层权力两个方面研究了债务契约与企业过度投资的关系。研究发现:债务契约与企业过度投资正相