一种基于聚类的离群点检测方法

来源 :华北水利水电大学 | 被引量 : 0次 | 上传用户:oo789458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点挖掘是数据处理的重要组成部分,它包括离群点检测以及分析两个方面。检测并分析离群点,挖掘离群背后的内涵知识具有重要研究意义。离群点检测方法目前大致分为基于统计、基于距离、基于密度以及基于聚类的方法,其中对基于聚类的方法研究较少。聚类方法的核心是将数据集中的数据赋予标签,很多聚类算法在聚类过程中会产生小簇,这种小簇可以称为离群簇,换句话说,执行聚类算法的过程就是在进行离群点检测。离群点是聚类的副产品,所以基于聚类的离群点检测方法相比于其他方法更加简便高效,对其进行研究很有意义。另外,在数据集中发现离群点是离群检测的中间过程,对检测出的离群点进行分析,得到其背后的内涵知识,从而为决策提供支撑,才是离群检测的最终目的。本文所做主要贡献如下:1、由于传统的基于密度的局部离群点检测算法LOF对原始数据集没有预处理,导致该算法在面对未知数据集时检测效果不理想,又由于其需要计算每一个数据点的离群因子,在数据量过多时,计算量会大大增加。通过对LOF检测算法的分析,在检测方面,本文提出了一种基于目标函数的局部离群点检测方法FOLOF(FCM Objective funct ion based LOF)。首先通过肘部法则确定能使数据集达到最好聚类效果的聚类个数,然后通过FCM的目标函数对数据集进行剪枝,得到离群点候选集,最后利用加权局部离群因子检测算法计算候选集中每个点的离群程度。这种方法提高了检测精度,减少了运行时间,改善了聚类效果。2、在分析方面,根据FOLOF检测过程中得到的离群因子大小按照黄金分割法将离群点进行等级划分,通过每一维属性的离群因子,挖掘得到各离群数据的离群属性,揭示造成其离群的原因,给予离群数据有用的指导思想,将提出的方法在人工数据集和U CI数据集以及NBA球员数据集中均进行了实验,证明其有效性。此方法可以准确挖掘离群背后的内涵知识。
其他文献
学位
地理核心素养能很好地帮助学生从地理角度认识自然和社会,促进学生发展,帮助学生在生活情境中运用所学地理知识和技能,感悟、分析、理解人地关系状况的能力,构建人地和谐发展的地理价值观。教师在教学中应通过深度备课,思考"怎么教、教到何种程度",认真地上好每一堂地理课,在教学中落实学生地理基本素养。
目前,人口老龄化已经成为世界大部分国家共同面临的社会问题,我国的人口老龄化形势也日趋严峻。为了缓解人口老龄化带来的养老问题,文章从我国的养老现状出发,分析银发产业这一新型养老模式的发展契机和发展困境,并根据我国现阶段的实际情况,提出银发产业的发展路径,以期为缓解养老问题、提升老年人的生活水平提供参考。
目的 探讨老年高血压患者应用医院-社区-家庭一体化护理管理方案对用药依从性的影像。方法 纳入2018年6月至2020年6月时段内120例老年高血压患者,以护理方式差异性予以分组,应用常规护理60例(归入对照组),应用医院-社区-家庭一体化护理管理60例(归入研究组),对比两组血压控制效果、用药依从性、生活质量。结果 较干预前,两组血压值均明显下降,且研究组收缩压、舒张压水平明显低,同时生活质量评分
<正>昆山高新区鹿城幼儿园(以下简称“我园”)在探索“课程游戏化”实践模式的过程中,围绕“儿童发展与游戏精神”,将“课程游戏化”界定为:从幼儿的游戏出发,重新审视和回到最初的幼儿游戏世界,体会游戏的真正内涵和精神——“玩”,让“玩”连接游戏与学习,从把握幼儿学习的“生长点”开始,通过与幼儿一同构建新的游戏学习模式,逐步深入实践,旨在开启一段真实适宜、追随童梦、充满“玩味”的课程游戏化学习之旅。在这
期刊
发表于1919年的毛姆的《月亮与六便士》,历经100多年后仍得到中国读者的关注。这部小说主题丰富,文章主要从两个角度对其主题模式进行了解读,一是灵与肉的主题,一是追寻的主题。斯特里克兰在灵与肉的斗争中最终获得统一,在追寻人生意义的过程中获得自己想要的幸福。这两个主题是人类存在意义的终极话题。
<正>【典型案例】孙某,男,中共党员,系B公司总经理。A公司系某省国有控股公司,国有资本占股70%,B公司是A公司的全资子公司。2020年1月,该省为深入推进混合所有制改革,以B公司为试点,拟将其混改为民营资本占股100%的民营企业。后A公司安排孙某牵头负责B公司混改工作,
期刊
多元评价是基础教育课堂教学的重要组成部分,是立德树人、实现育人功能的重要过程。如何通过对学生的课堂评价来促进学生的全面发展,是值得思考的问题。笔者以多元智能理论为基础,通过具体的教学片段,尝试运用多元评价模块对学生全面发展的过程进行综合评价。
一人公司摆脱了传统公司结构复杂的弊端,结构相对简单,一个自然人股东或一个法人股东就可以成立一人公司,其优势也较为明显,帮助许多想要设立公司的投资者、创业者摆脱传统公司制度下的诸多制约因素,同时一人公司制度也为他们提供了更大的空间,激发了市场活力,使公司制度更具有灵活性,使市场经济适用于更多群体,促进了市场经济的发展。一人公司同时也具有传统公司的特性,属于独立的主体,具有独立的人格,也就表明了股东和