数据挖掘中的数据清理技术概述

来源 :河南科技 | 被引量 : 0次 | 上传用户:lp51443712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,每天都会产生海量数据,我们正处于一个知识爆炸的大数据时代。大数据受到企业界、科技界、政府等各行各业的高度重视。面对庞大的数据集群,需要用数据挖掘的方法来从众多数据中找到隐藏信息。无论在数据分析还是数据挖掘过程中,数据预处理都处于重要地位,占据数据挖掘过程思工作量的60%-80%,数据预处理过程决定着数据挖掘结果的准确性和有效性,而数据清理在数据挖掘中具有重要作用。本文针对各数据挖掘中数据格式不统一、数据清理过程不完善、冗余数据繁多及数据挖掘任务对数据类型的要求不同等问题,探讨了数据清理
其他文献
西南地区广泛分布黑色岩系,主要分布于上震旦统—下寒武统、志留系、二叠系和三叠系,其中以上震旦统—下寒武统为主,次为志留系。西南地区黑色岩系中分布有众多的铀矿床、铀
环境的刑法保护是一种重要的环境保护方法,但环境刑法的架构极富变化,传统的刑法保护客体理论存在着明显的不足,我国刑法保护的客体应为公民环境权与自然权利的综合体,兼顾对人类
"学困生"是校园里独特的群体,学困生的存在不利于教学活动的正常开展,也不利于学生全面健康地发展,因此,必须认真完成学困生的转化。教师在学困生的转化过程中扮演着重要角色
旨在研究昆明犬运动前后心率变异性(HRV)的特点,为评估昆明犬在运动状态下的工作表现及效果提供理论依据。选取8 头搜索类专业训成昆明犬,在跑步机上以6 km/h的时速运动10 mi
白桦的树皮临床治疗老年慢性气管炎有显著疗效,从其外皮中分离出6个单体成分,经理化性质和光谱分析鉴定为羽豆醇,3-乙酰齐墩果酸,白桦脂醇,白桦本脂酸,齐墩果酸和β-谷甾醇。结晶Ⅰ,Ⅲ的
尽管金融机构与金融消费者属于服务与被服务的关系,但在实践中二者处于不平等地位,并且利益冲突也不断增多,金融消费者权益侵害事件屡发,保护金融消费者权益已经成为社会亟待
本实验利用SYBR GreenⅠ荧光定量技术建立一种相对定量检测猪谷氧还蛋白1(GLRX1)的方法。针对猪GLRX1设计对特异性引物,将PCR扩增的片段分别连接到T-easy载体上构建重组质粒,
【正】 《醒世姻缘传》是明末清初世情小说中一部比较重要的作品。现存的十几种版本都题为“西周生辑著”。“西周生”是谁?历来说法不一,主要说法有三种: 一种说法认为是蒲
土壤中稀有放线菌的分离及培养的研究在新型抗生素以及其它具有生物活性的微生物代谢产物的获得是非常重要的。近几年研究者通过不断地研究得出了各种各样用于分离自然界中有
近几年来,语言使用中的模糊现象引起了语言学家的广泛关注.对模糊语言和将模糊理论运用于各种文体的分析是近些年来中西方语言学家所致力于研究的课题,本文分析外交语言中模