调整学习聚类算法的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:chrron
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是重要的数据挖掘技术,在海量数据统计、网络分析及医学图形图像自动监测等领域具有广泛的应用背景。聚类就是根据数据的内在特性将数据对象划分到不同的组(或簇)中,使得属于同簇的数据对象具有相似性,不同簇的数据对象具有相异性。近几十年来,国内外的研究者们提出了许多聚类算法,这些算法大多从全局或局部的角度观察聚类,力图发现所有聚类方案的最优结果。由于处理数据的规模大、类型复杂,因此目前的聚类算法不能满足人们对聚类质量的要求。同时,经典算法在聚类过程中都有保持问题和数据对象位置不变的特点。本文着眼于提高聚类质量,充分地结合经典聚类算法的特点,力图从运动的角度来分析聚类,提出了基于调整学习的聚类算法,其基本思想是通过调用调整算子,变换数据对象的位置来构造一系列粗细粒度不同的近似问题。首先对细粒度近似问题聚类,再利用细粒度问题的聚类结果来引导粗粒度问题的求解。由于变换能改变问题的拓扑结构,从而使原始问题可以转化为多个简单问题迭代求解,达到降低问题难度和提高聚类质量的目的。本文在调整学习聚类算法的基础上分别对FCM算法和CLARANS算法进行了改进。最后通过多组仿真数据和3个实际数据集比较了改进算法与经典算法的聚类质量。实验结果表明,改进后的算法在时间、空间复杂度不变的情况下聚类质量有了较显著提高。本文提出的新聚类算法以经典聚类算法为其从属算法并对其改进。为人们获得高质量聚类结果提供了新思路和新途径,为准确地挖掘出数据集中隐含的模型和信息提供了保证。因此,本文的研究具有较高的理论和实践意义。
其他文献
随着信息化的发展,应用系统的集成问题越来越受到人们的关注。企业要求针对其业务过程对信息进行整合管理。分布式异构系统的集成问题是企业应用集成要解决的关键问题。面向
近年来,由于研究方法和目的等方面的差异,在Web服务技术研究领域出现了两个不同的发展趋势。一方面,以学术界为主的研究组织致力于研究如何实现基于语义的Web服务技术,提出了
在大数据时代,云存储服务越来越普及,云存储环境的复杂性以及不够完善的数据安全保护使得数据泄露的事件时有发生。因此,探讨云存储系统中高效而安全的数据存储方法和数据删
随着互联网的飞速发展,用户的私有数据越来越难管理。人们对信息的存储和管理的需求已经不是使用传统的本地存储策略就能够满足的,云存储系统可以比较好的解决这一问题。当用
关联规则的研究是数据挖掘中的重要研究内容之一,由于实际的数据是随时间变化而获得的,因而有必要对其时态属性进行分析,这样有助于揭示事物发展的本质规律,使得发现的知识更具有
物体分类,其实质就是以计算机的角度识别出图像或者视频中所包含物体的类别,如台灯、椅子等。近年来,由于智能移动设备的大范围普及和网络技术的快速发展,数字图像的数量每天
由于业务过程的变化,很多以前开发的系统己经越来越不能满足新的需求而成为遗留系统。但这些系统仍然具有相当重要的业务价值,需要对它们进行软件再工程。传统的软件再工程开
目前,市场上商品假冒伪造现象严重,但传统防伪方法不能完全满足防伪要求。短信数字防伪技术,是目前国内最先进的商品防伪技术,是借助先进的移动通信技术和移动信息终端,并采用加密
在社会经济大系统中,证券投资组合已成为金融管理和投资决策的重要组成部分。马柯维茨以证券投资收益率的方差作为组合证券风险的度量,开辟了金融定量分析的时代,并在此基础上建
J2EE作为现今最流行的分布式计算平台,已成为基于Web的企业应用系统的核心。但多层的J2EE体系结构在提高软件重用性和降低问题复杂性的同时,也使得代码庞大,层与层之间的控制