基于粒计算和模拟退火的K-medoids聚类算法

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:gzsoft168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的高速发展带来了数据的爆炸式增长,数据挖掘能在纷杂,海量的数据中提取对人类生产生活有用的信息。聚类分析因其独特的优势,现阶段已变为数据挖掘领域一个重要研究方向。同时由于聚类算法本身存在一些缺点,如对初始化化敏感,中心点搜索更新能力弱和目标函数极易陷入局部极值等,需要进一步完善和改进该算法,使得聚类算法更具有重要的实际价值。本文基本建立在传统的聚类算法理论上,探讨了包括K-medoids聚类算法存在的缺点以及最新研究成果,并对此提出了相应的改进优化方案。本文具体研究工作如下:本文引用了粒计算理论来解决传统K-medoids聚类算法聚类中心初始化敏感的问题,并提出一种基于改进的粒计算对传统K-medoids算法进行初始化处理。该算法在Iris数据集中进行实验检测,实验结果表明:该算法的准确率明显较高,迭代过程显著减少。本文通过利用改进的基于模拟退火的聚类算法全局优化性能优化K-medoids算法易陷入局部最优的缺陷,以便增强K-medoids算法全局搜索能力,同时也避免了其陷入局部最优。通过对样本集各维属性的规范化处理,实验结果表明,该算法不仅能有效抑制局部收敛,而且准确率和稳定性均有较大的提高。
其他文献
在数据挖掘过程中,常常存在与数据模型或数据一般规律不符合的数据对象,这类与其它数据不一致的数据对象就称为异常数据,它们往往容易被人们所忽略。然而,这些数据对象可能是具有
元胞自动机(Cellular Automata,简称CA)是一种时间、空间和变量均离散的数学模型,已被广泛应用于各种物理现象的模拟。粒及粒计算的概念来自Rough集理论,是Rough集理论的扩展
随着计算机技术和互联网技术的快速发展,互联网上的多媒体数据急剧增加。随着数据量的增加,分类问题的规模变得越来越大,其中包括样本数量、特征维度和分类的类别数目的快速
在距北京奥运会开幕只有数周的时候,赢取奖牌的表演已经开始。已于2月和3月在浙江日报报业集团准时投入使用的两台高宝报纸印刷机,在质量和性能方面都超出了人们的预期。这两
一、本届金鹰奖观众投票候选名单包括五项,即长篇电视剧、电视剧男演员、电视剧女演员、电视文艺节目、电视节目主持人。观众可任选其中一项或多项投票。二、观众可通过信函
1997年8月,在人民日报社工作3年后,我调到教科文部体育组。我并不是体育迷,但从此和体育报道结下不解之缘。在忐忑不安中写下第一篇体育评论到体育组正式报到后,我写作的第
铁二局第四工程处是《西部探矿工程》参办单位之一。铁二局第四工程处是建设部审定的铁路综合工程施工一级企业。现有员工3542人,各级各类专业技术人员794人,其中有高、中级技术职称的
特征提取算法和分类识别技术是图像处理技术中的重要组成部分,是模式识别领域的关键技术之一。基于视觉的特征提取包括颜色、纹理、形状三个方面。外轮廓信息是形状特征中的
在XX潜艇作战系统仿真研究中,计算机生成兵力(CGF)模型库是仿真应用的信息支撑。目前模型管理系统中的模型独立存在,不能体现模型之间的相互关系,此外,系统查询能力不能实现
目前,有杆抽油系统广泛应用于采油生产过程中,通过随时了解油井有杆系统各方面参数,就可知道油井的工作状况。这些参数主要包括抽油机油杆的冲程、荷载、位移量和抽油机油杆的示