数据挖掘中聚类分析算法的研究与应用

被引量 : 85次 | 上传用户:resume_002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的收集与存储技术的快速发展,使得目前世界上的各个组织机构可以存储海量的数据。正是因为数据量的巨大,也使得传统的靠人工分析技术遇到了发展瓶颈,怎样从海量数据中高效的发现有价值有意义的信息已经成为数据挖掘的主要研究方向以及驱动其快速发展的一个重要因素。作为一个新兴的交叉学科,聚类分析技术以其在数据挖掘过程中的独特地位以其在现实生活中的广阔应用,使其成为目前一个十分活跃的研究方向。从目前的情况来看,所有的聚类算法几乎都是针对特定数据对象所设计的,没有一种算法能够做到“放之四海而皆准”,每一种聚类算法都起自身的优点和局限性。本文在简单介绍了数据挖掘的相关知识之后,重点介绍了数据挖掘的聚类分析方法,并且以聚类分析算法的分类为基础,详细介绍了每种聚类分析算法中的典型聚类算法,并且给出了各种典型算法的优缺点的介绍。在对聚类分析技术有深入了解之后对聚类分析的DBSCAN算法、层次聚类算法模糊聚类分析的传递闭包算法与实际应用相结合做了若干数值试验,得出了一些有价值的实验结果,对传统的K-means算法本文结合了基于密度的思想,给出了一种改进算法,进而提高了K-means算法的聚类稳定性,同时给出了一种改进的子空间聚类算法的思想,以及在选择聚类算法时应考虑的因素给了一点建议。
其他文献
大学生宿舍是学生日常生活学习的重要场所,也是高校进行思想政治教育的重要阵地。如何采用行之有效的管理方式来加强宿舍学生思想政治教育,是思想政治教育必须直面的一个课题
目的:观察推拿配合刺四缝治疗小儿便秘(胃肠燥热型)的临床疗效,以期为小儿便秘的防治提供安全、规范、有效的综合治疗技术。方法:符合诊断标准、纳入标准的胃肠燥热型便秘患儿90例
教材是学习音乐知识的重要载体,统一的教材出现适用性问题,开发校本教材也是新课标提倡的,它能促进学生个性化和多样化发展。教师如何有效开发校本教材?本文从三个方面阐述。
<正>幼儿文学和我们通常意义上的文学有很大不同,所谓幼儿文学,是适应3~6岁幼儿阅读或听赏的,由成人作者创作或改编的,符合幼儿审美需求的幼儿故事、童话、散文、儿歌和幼儿
对于既有建筑的屋面隔热改造一般可采用在屋面增设植被隔热层或增加高分子隔热材料等措施,以提高屋面隔热效果,改善室内热环境。利用多孔材料蒸发隔热的基本机理,通过建立模
我国是金刚石产业大国,但是金刚石合成技术同世界先进水平相比还有一定的差距,所以我国金刚石产业面临着产业升级的严峻形势。目前,我国的金刚石人工合成主要依赖于以金属触
目的:分别从中医学和西医学角度,探讨卒中后癫痫发作的临床特点。方法:选择山东中医药大学第二附属医院2006年1月1日至2010年12月30日期间住院的脑卒中患者1921例,采集患者相关信
第一部分:二叶主动脉瓣类型、主动脉瓣功能不全类型及胸主动脉扩张类型之间关系的研究目的:探究二叶主动脉瓣(Bicuspid Aortic Valve,BAV)类型、主动脉瓣功能不全类型及胸主
防空雷达飞机目标自动分类与识别技术的研究是雷达目标识别中的研究重点,有助于提高现役防空预警系统的性能。由于受低分辨率性能的限制,利用常规防空雷达回波特征识别飞机目
化工机械设备腐蚀是自发的普遍现象,机械设备被腐蚀后,在外形、色泽及机械性能方面都将发生变化,造成设备被破坏以及资源和能源的严重浪费,企业受到巨大损失。本文主要对化工