不一致数据上精确决策树生成算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:zhangfei0960
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着现实生活中数据量的不断增大,不一致数据的出现也越发频繁,这使得人工修正不一致数据变得更加耗时.而且,人工修正数据方法本身也存在着不可避免的人为操作错误,因此,这种修正方法不再可行.如何不提前修复不一致数据,直接在不一致数据上进行分类,是该文的核心研究内容.对决策树生成算法的目标函数进行改进,使其能够直接对不一致数据进行分类,并得到较好的分类结果.对约束条件中的特征对分类结果的影响进行了多方面衡量,从而调整该特征的影响因子,使得决策树的节点分割更加精确,分类效果更优.
其他文献
<正>网络舆论生态,是在网络化平台上舆论存在和发展的一种系统性状态。这个生态系统由网络、事件、网民、情感、传播、影响等不同要素构成,每个要素既相对独立又互为依存,各
<正>在现实生活中,许多人往往对头皮屑不以为然,不太在意,认为头皮屑是皮屑的自然脱落,尽管会影响形象和气质,却无碍健康。其实,头皮屑过多也是病,2002年世界卫生组织(WHO)定
期刊
教书育人是教师的宗旨,中专校专业课青年教师由于受年龄、经验和教学水平的影响,难免不能很好地胜任培养实用技能型人才的教育教学目标的需要,只有坚持以生为本,以就业为导向
水库大坝白蚁防治是日常管理的重要组成部分,结合深圳市盐田区水库大坝白蚁防治情况.介绍“杀”、“灌”、“防”三个环节的“找(引)、标、杀”、“找、标、灌”、“找(引)、杀(防)”
提出了球形颗粒沉降曳力系数新的拟合关联式,其精度优于常用的Brauer和Clift&Gauvin关联式。
所谓豪宅应该是指比高档住宅在质量、档次、规模和售价等方面都更高的住宅。其豪华程度主要表现在其对资源的占有率方面。而不同类型的住宅所占有的资源类型可能完全不同,所
<正>我本人于2012年12月到2014年1月在美国洛杉矶Cedars-Sinai Medical Center作访问学者,主要从事小动物肿瘤模型的分子影像研究。该医学中心的综合排名2012年位居全美第十,
<正> 在我国两广广泛养殖的鲮鱼主要有我国土生土长的鲮鱼(土鲮)和从国外引进的麦瑞加拉鲮(墨鲮、加拉鲮)、露斯塔野鲮(野鲮)这三种。它们性相近而习略有别。钓时应注意以下
探讨三氯氢硅合成尾气回收方法,降低三氯氢硅生产成本,利于环境保护。
<正> 粉煤灰掺量,目前多以重量计。拌和物的用水量,粗细骨料都随粉煤灰掺量变化而变动,因而影响试验结果的可比性;掺量以实体积计,拌和物的用水量和粗细骨料比不变,能较准确