实用分级聚类算法的研究及其应用

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:sanji621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为社会信息化、数据爆炸式增长的一种产物,数据挖掘具有发现数据中隐含信息的功能,能有效的从混乱无章的数据中提炼有用知识。聚类分析是一种无监督的学习方式,能有效发现数据自身的固有属性,也是数据挖掘的重要组成部分。随着聚类分析算法大量深入的研究,其理论价值和实际应用价值日益凸显,受到科研工作者和技术从业者的广泛关注。聚类分析算法主要包含以下几种:基于划分的聚类、层次聚类、基于密度的聚类、基于模型的聚类等。每一种聚类算法都有其特定的适用领域,没有一种聚类算法能够适应多种数据类型以及应用领域。针对这一现状,本文提出了一种相对能适合多种数据类型及应用领域的实用分级聚类算法,通过理论分析和实例应用验证了算法的有效性。本文所做工作如下:1.研究聚类分析的典型算法,分析了典型聚类算法所存在的优缺点,重点分析了K-means算法以及DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法的聚类原理以及优缺点。最后,从多种角度分析了聚类算法的要求以及算法是否有效的评价指标。2.针对K-means算法以及DBSCAN算法的缺陷,提出了一种实用分级聚类算法。算法引入数据竞争以及联系性权重,将聚类过程分为小簇划分和小簇合并两级。竞争思想和联系性权重的引入保证了小簇合并的合理性。3.针对五种不同类型的二维人工数据集,利用Matlab实验平台从聚类准确度、聚类时间、能否处理凸状和非凸状等复杂数据类型等角度以及评价聚类有效性的外部准则验证了所提实用分级聚类算法的有效性和实用性。最后在高维、公开的鸢尾花数据集上验证了算法对于高维数据的聚类准确性。4.将本文提出的实用分级聚类算法同主元分析(PCA)结合,提出PCA-分级聚类算法。将实用分级聚类算法以及PCA-分级聚类算法运用到冠心病病理数据以及肝炎病理数据中,验证了本文提出的实用分级聚类算法和PCA-分级聚类的有效性,同时实用分级聚类算法和PCA-分级聚类能够发现病理数据中隐含的小簇类型,具有知识发现的功能。
其他文献
12月4日,杭州市人大常委会城建环保工委主任王荣富、副主任吴建华,带领省市人大代表赴我集团公司专题调研公共交通建设工作,并召开座谈会。市交通运输局相关负责人、集团公司
自主水下航行器(Autonomous Underwater Vehicle,简称AUV)是近年来海洋工程领域研究的热点之一。它可搭载各种传感器设备,有效地收集数据,在水下环境观测中得到越来越广泛的
在国家整体经济实力增强的带动下,国内的金融市场投资发生了很大变化,市场空前繁华。金融行业从传统的金融1.0时代过渡到智能金融3.0时代。2015年7月,对拟建珠海市民商互联网金融
党的十九大以来,广州市民政局就加强新时代民政工作、推动民政事业平衡充分发展进行了调研,在广泛了解当前民政工作面临困境的基础上,提出了一系列改进措施。一、面临的形势
在激烈的市场竞争中,不少管理人员已经意识到,酒店战略的核心内容应该是提高顾客满意度。许多酒店将顾客满意度研究作为一项重要工作给与很大的关注。顾客满意,从而顾客忠诚;而顾
与经济发达国家相比,我国土地测绘研究工作起步较晚,尚不具备成熟经验和完善的工作体系,结合我国实际情况和社会主义制度,基于GIS的土地测绘能在一定程度上实现土地测绘现代化管理模式,同时也可为土地规划管理提供数据基础和辅助决策手段。本文主要从GIS系统的技术要求出发,从多个方面阐述了GIS技术在土地测绘工作中的应用,并从空间决策支持系统、数值模拟系统和多维GIS技术等方面,分析了GIS技术在土地测绘应
商业银行内部控制长效机制的构建有利于对其风险进行事前防范、事中控制、事后监督和纠正,保障商业银行业务经营安全稳健运行。本文从二级分行这一层面进行分析,从控制环境、评
期刊
校企合作是在目前的市场经济架构下高校和生产企业二者协作培养人才的一种模式。通过校企合作,能全面提高学生职业能力,让学生在大学所学课本知识与实际的生产活动相结合,通
兵法云:"谋定而后动."中国的产品、保健品20年的时间走过了世界上100多年的营销历史,在品种繁多,日趋发展成熟的产品、保健品市场中,要想让自己的产品脱颖而出,并占据一定的