APT-KNN:一种面向分类问题的高效缺失值填充算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:lsssyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是一种常见的数据挖掘方法,而属性值缺失是分类过程中常见的一类数据质量问题,缺失值填充可以减少属性值缺失造成的分类错误。缺失值填充首先要求准确率高,在许多实际应用当中,缺失值填充还必须保证较高的计算效率。提出了一种填充缺失属性值算法APT-KNN,APT-KNN算法利用属性与属性之间的相互关系,根据与目标最相似的几个实例属性值来估计缺失值,以保证填充结果具有更高的准确性,同时设计了一种优化的AntiPole树索引结构,提高了缺失属性值的填充效率。实验表明,APT-KNN方法与现有的几种缺失属性填充方法相比,具有更高的准确率和填充效率。
其他文献
从单项目经营到多项目经营是项目型企业发展的必然趋势。随着企业规模越来越大,项目的数量越来越多,覆盖的地域越来越广,传统的直线-职能型项目组织逐渐暴露出了结构臃肿、效
随着社会需求多元化、异质化发展,仅仅由政府提供单一性、同质性的公共服务已经不能满足社会发展需求,政府需要社会组织的合作,作为其职能转移的“接盘手”,提供优质化的公共
运用我国各省份2004~2008年的面板数据,实证检验了税式支出、财政补贴对我国大中型工业企业研发投入的影响,研究发现:(1)税式支出、财政补贴对我国企业的自筹R&D经费尚未产生
教务信息系统是高校进行教学活动管理的核心系统之一。当前大部分教务系统是基于Web的应用,学生可以通过PC机登录教务系统,获取学习信息和进行选课等。但随着移动互联网的飞
作为典型的导体/聚合物复合材料之一,碳纳米管(CNT)/聚合物复合材料在CNT的含量接近渗流阈值(cf)时发生绝缘体-导体的转变,从而获得高介电常数,但是导电通路的形成也往往导致
<正>教学内容:人教版《义务教育课程标准实验教科书·数学》一年级下册第69页例1及相关练习。教学目标:1.结合具体情境在理解算理的基础上掌握两位数减一位数(不退位)和整十
区域地球物理学旨在应用先进的地球物理场观测技术,按规定网格密度观测区域地球物理场,取得关于区域地壳上地幔组成结构的信息,并最终揭示区域地壳三维结构与构造形态,为资源
目的探讨F10基因即凝血因子X(FX)rs3093261、rs563964多态性与缺血性脑卒中(IS)痰瘀证和冠心病(CAD)痰瘀证及其凝血标志物的关联性。方法纳入IS痰瘀证、CAD痰瘀证、对照组各5
对于现代汉语中的词缀、类词缀学者们已经进行了多方面的研究,但大多数是从语法的角度进行的,为了对汉语中的词缀、类词缀有更加细致的探究,本文选取词缀、类词缀中占有较重
团头鲂(Megalobrama amblycephala)又称武昌鱼,是一种优良的淡水经济鱼类。近年来,随着自然环境的不断恶化以及人类活动的干预等使得其生存环境中时常出现低氧情形,制约了团