一种基于改进KNN的大数据离群点检测算法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:xmy870129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对KNN算法在大数据离群点检测领域中难以处理高维数据和时间复杂度过高的这2个缺点,提出一种基于AOR(属性重叠率)的分类方法,并对KNN算法进行改进。首先对数据进行基于AOR的降维处理,使得数据可处理维度大大增加,然后对传统的KNN算法进行剪枝改进,减少了大量的无效计算。实验结果表明,本文算法对维度高、容量大的大数据样本在运行效率、准确度等方面有较大的提升。
其他文献
【目的】研究双季稻种植制度下,连续3年施肥与不施肥对不同肥力土壤基础地力产量、基础地力贡献率、土壤氮磷钾表观平衡和土壤养分变化的影响,为不同肥力土壤基础地力培育及
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目前,农信社信贷规模以前所未有的速度快速增长,严控信贷风险,提高信贷资产质量成为当务之急。$$ 加强服务“三农”的意识。农信社要牢固树立服务“三农”的意识,坚持“四个面
报纸
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
报纸
运用热性质分析、诱导氧化分析和流变分析,对牛脂肪部分替代猪脂肪后复合脂肪的物化性质及加工产品感官性质的变化进行研究。结果表明:替代添加牛脂肪后,猪牛混合脂肪的物化
本文对小学数学知识的特点及教学现状进行了分析,并据此提出优化几何直观教学的方法策略,力求提升我国小学数学教学的效果。
以2003—2016年我国30个省级数据为样本,测度制造业与生产性服务业协同集聚水平,并引入ESDA分析方法和空间计量模型,探讨两产业协同集聚对区域技术创新的空间效应。结果显示:
DWI不仅对脑卒中的诊断有帮助,而且在颅脑肿瘤的鉴别诊断中也有一定的应用价值。在Eur J Radiol(2005;55:393—400)的论文中讨论了最小弥散系数的数值,这个值对于颅脑肿瘤的鉴别诊
21世纪的慕课颠覆了传统的教学模式,越来越多的学者开始思考该背景下的大学英语教学的改革,大学英语后续课程是大学英语综合英语教学的补充完善,也是很容易被学校忽视的环节
生产要素在市场中有效合理的配置是市场经济改革的前提和标志。然而,由于政区分割,阻碍了生产要素的自由流动,也影响了其配置的效率。本文结合案例,就政区边界地区土地要素的