基于插值的高维稀疏数据离群点检测方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:aaronlonghao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点检测问题中的数据可被看作是正常点与异常点在空间中的高度混合,在减少正常点损失的前提下,离群点通常包含在离聚类中心最远的样本集中。受这种思想启发,提出一种针对高维稀疏数据的基于插值的离群点检测方法,该方法在K-means基础上应用遗传算法对原始数据进行插值处理,解决了K-means聚类中稀疏数据容易被合并的问题。实验结果表明,对比基于传统K-means聚类的离群点检测方法以及几种典型的基于改进K-means的检测方法,本文方法损失的正常点更少,提高了检测的准确率和精确率。
其他文献
目的:观察辰巳时辰温针治疗脾胃虚弱型IBS-D的疗效。方法:选择2011年2月至2011年10月期间在厦门市中医院针灸科、消化内科就诊的60例患者为研究对象,按就诊先后顺序随机分为治
路基路面施工质量成为了路政工程重点关注内容,要提高道路桥粱工程施工质量,则要控制好路基路面施工质量,这对道路桥梁工程整体质量发挥了关键性作用。然而在实际作业环节,仍
大量的人类行为发生在互联网上,互联网已成为与真实空间相对应的最重要的虚拟空间。传统虚拟空间中的社会分层研究基于网络信息资源占有的机会和能力等客观指标,并未涉及用户
羽衣是文学作品中常见的服饰意象之一,它常常出现在诗歌、志怪小说和民间文学中,极具传奇色彩。考察中国服饰史,“羽衣”之名对应的服装款式呈现出多样性,这便造成了“羽衣”
【正】京教体美[2008]16号各区县教委:为全面贯彻党的教育方针,落实《中共中央国务院关于加强青少年体育增强青少年体质的意见》(中发[2007]7号)和《中共北京市委北京市人民
【正】京商秩字[2009]4号各区(县)商务局,各有关行业协会、商业服务业企业:为深入贯彻科学发展观,落实节约资源基本国策,以建立节能降耗长效机制为目标,以技术创新和制度创新
为建立系统的超前区域水害探查治理技术体系,分析概括我国石炭–二叠纪煤田煤层赋存及水文地质条件,从水害治理工程的系统性出发,围绕我国煤层底板水害超前区域治理工程施工
【正】 各区县人民政府,各区县教委、政府教育督导室,各中小学校、幼儿园:党的十七大提出"优先发展教育,建设人力资源强国",为全面贯彻党和国家的教育方针,全面推进素质教育,
随着经济全球化的日益加深,企业之间的竞争愈来愈激烈,竞争的主导因素从价格竞争到质量竞争再到人才竞争,一步一步变化着。现今,知识经济的到来,使企业文化竞争成为时代的主流,企业
随着云计算技术的不断发展,云计算资源负载变化呈现出越来越复杂的特征。针对云计算资源的负载预测问题,综合考虑云计算环境中资源负载时间序列的线性与非线性特性,提出了一