基于置信区间的偏离群数据检测方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:chenminer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常数据检测与处理是数据仓库系统中数据清洗领域的研究热点。该文提出一种基于置信区间的偏离群数据检测方法,从总体中筛选出有效样本,利用遗传算法从中找到可信样本,利用可信样本确定置信区间,基于置信区间对总体进行检测及处理。该方法所处理的数据不需要与时间相关,且可以快速地识别、检测出大数据量中的“脏数据”。实验结果表明,该方法能有效地解决无规则状态下的偏离群数据的检测,并在实际应用中取得了良好效果。
其他文献
文章尝试探讨少数民族青年政治认同与民族地区政治稳定的关系作用机制。藉由结构方程模型的方法,建立一个以政治参与为中介变量的单因子中介模型,并利用Amos23.0进行数据分析
在可扩展固件接口(EFI)平台的应用开发中,本地文件系统难以支持多种文件系统。该文分析了EFI文件系统的结构和组成,根据其特点,提出3层结构模型的EFI NTFS文件系统设计方案,阐述如
宁玛派密咒师既是媒介神圣与世俗的宗教神职人员,又是娶妻成家、扶老养儿的普通百姓。他们平时在家从事农牧业生产劳动,在特定的日子内到密修殿举行宗教法事活动。密咒师的历
目的探究糖尿病患者在注射胰岛素中存在的问题,并制定针对性的护理措施,以保证血糖控制在理想范围。方法选择自2015年12月-2017年12月在兴安县界首中西医结合医院门诊及病房
随着医院基础设施更新改造速度的不断加快,在硬件条件得到改善的同时,各项能耗指标也随之不断增加,加强节能网络建设是控制医院能耗过快增长的有效手段之一,它为绿色医院的构建提
微创外科手术具有独特的解剖学路径和操作技术体系,但目前仍缺乏针对性的解剖学课程和研究。面向微创外科的应用解剖学,作为一门医学创新交叉课程,对于提高临床微创外科技术水平
问责制作为中国当代社会主义政治体制改革和制度创新的重要组成部分,不仅是我国行政改革的题中之意,也是我国迈向责任政府的重要一步.回顾改革开放以来我国行政改革
期刊
提出一种基于树型计算网格的自适应调度算法,实现对小粒度独立任务和用户大作业的自适应最优调度。通过对网格环境的实时检测,给出了基于节点负载状况、节点任务执行时间、任务
本文结合文献资料研究和现状调查,梳理介绍了蒙古国西部卫拉特部族藏传佛教寺院及从教人员历史与现状,探讨了跨境部族相同的宗教信仰对中蒙两国人文交流的积极意义。
透析的剂量和频度的选择一直是。肾脏病学者所关注的热点话题,近年来,一种更加生理性的透析模式一每日透析即短时高效每日透析和长时低效夜间透析逐渐引起人们的兴趣。本文就每