基于路径的划分聚类算法研究

被引量 : 0次 | 上传用户:winningking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息科学技术的飞速发展,全球的信息量爆炸似的剧增,要从这些复杂的数据中获得我们所需要且有价值的信息是一件非常艰巨和具有挑战性的任务,人们结合数据库、统计学以及机器学习等多种技术,提出了数据挖掘来解决这一难题。聚类分析是数据挖掘领域中的一个重要组成部分,是一种用于数据划分或者分组处理的重要手段。聚类分析在市场分析、图像处理、web文档分类等方面都得到了充分的应用。本文在详细介绍聚类分析相关知识的基础之上,分析了国内外现有的聚类算法,着重研究了基于路径的划分聚类算法,本论文的主要研究内容如下:(1)针对传统的K-均值算法对初始聚类中心和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。该方法可以使在聚类过程中初始聚类中心的选取更加有效;并且对孤立点进行特殊处理,不影响用迭代法计算聚类中心的值,理论和实验均表明基于初始聚类中心优化的K-均值算法优于传统的K-均值算法。(2)针对传统的划分聚类算法对空间分布为任意形状的数据集聚类效果较差的问题,本文提出了一种基于路径的相似性度量,设计了新的目标准则函数,并在此基础上提出了基于路径的划分聚类算法。实验结果表明,该算法能够自动生成聚类的数目,并且能够对空间分布为复杂形状的数据进行有效地聚类,对孤立点不敏感。
其他文献
随着经济全球化的到来,市场竞争日益激烈,企业之间的竞争从很大程度上是人才的竞争,如何对人力资源进行科学管理,已是越来越多的研究者和实践者所共同关心的课题。高级经营管
语音识别是语音信号处理的一个重要方面,是人机交互技术的基础,有着广阔的应用前景。因此,对语音识别进行研究具有重要的理论价值和实际意义。本文首先系统地介绍了语音识别
电能从生产、传输直到消费的整个过程形成了一个相对完整的电力供应链。伴随着改革的进程,中国电力从“厂网分开,竞价上网”,再到“输配分离,自负盈亏”,传统的垂直一体化电
本文以制造企业所面临的生产计划与生产过程控制不能可靠地进行,导致企业不能准时、保证保量地交货的问题为课题背景,利用精益生产和系统可靠性的理论,对制造企业的订单评价
目的探讨生物反馈电刺激联合凯格尔训练治疗58例产后阴道前壁膨出患者的临床疗效。方法将我院2010年12月至2011年12月收治的58例产后阴道前壁膨出的患者,随机分为对照组和观
人力资本是经济时代的核心资本,人力资本的配置和运用情况如何,直接关系到一个国家或地区经济社会发展的速度、质量和潜力,而经济发展的情况又直接关系到一个地区城市化进程
随着改革开放的深入,我国地方立法也在发生着变化:地方立法权,尤其地方经济立法已从浑然一体的国家权力中分离出来,形成了一种全新的立法体制;地方经济立法与中央立法已成为
目的:探讨非龋性牙髓炎的病因以利于其正确诊治及预防。方法:收集急、慢性非龋性牙髓炎病例120例,对患牙及全口进行全面检查分析并确定其主要病因。结果:非龋性牙髓炎各年龄
针对两类基本的单中继模型,通过分析瑞利衰落环境下放大转发和译码转发协作单中继系统的性能,研究了在放大转发和译码转发两种模式下,中继位置对系统容量和性能的影响.仿真表
新疆生产建设兵团是一个特殊的组织。1949年新中国建立以后,在生产建设兵团组建音乐团体是史无前例的一种特殊现象,这一特殊现象的产生与当时历史条件下的社会环境、政治环境