基于粒子群优化的软子空间聚类算法

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:qy313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
子空间聚类方法作为数据挖掘中的重要内容,在高维数据集的处理过程、数据点之间的相似度以及聚类效果中有着重要的影响。它们在文本分析、机器学习、生物分析等领域都有众多的应用。同时,子空间与较好的优化算法相结合会使得聚类效果更加准确,避免了聚类算法局部收敛的现象,对初值敏感的问题。目标函数和子空间搜索策略决定软子空间聚类算法的性能,而聚类有效性分析是衡量其性能的主要指标。本文针对子空间聚类性能,提出一种基于粒子群优化算法的软子空间聚类算法SC-ωSPO。首先,提出三种K均值聚类算法框架。然后,利用第三种K均值类型框架,结合类间分散度和特征权重,提出新的模糊加权软子空间聚类目标函数。其次,为了跳出局部最优,将带惯性权重的粒子群算法作为子空间的搜索策略。最后,根据提出的新聚类有效性函数,选取最佳聚类数目。通过在数据集上的实验,证实了 SC-ωPSO算法能够提高聚类准确度的同时,自动确定最佳聚类数目。
其他文献
如今互联网的互联互通的网络大量信息爆炸的时代里,数据库海量的数据给我们提供了很多有价值的信息,而我们如何通过现有技术将这些数据利用起来,是我们面临的一个亟待解决的
伴随着我国经济社会发展和事业单位分类改革工作的推进,全国地勘行业迎来了事转企的改革高潮。X省地矿集团作为地勘单位改革的一面旗帜,在地勘单位体制改革中走在了全国前列。但其原有的人力资源管理体制陈旧、效能不高,在体制改革过程中对人力资源管理变革的重视程度不够,绩效管理问题重重,已经不能适应转企后单位改革发展的需要。如对绩效管理缺乏认知、考核指标设置不合理以及员工参与度低等,尤其是在目前地勘行业进入衰退
随着云存储和大数据等技术的迅猛发展,各行各业越来越多的数据都存储在云端。而存储在云端的海量数据中,有大量的数据是重复数据,这就造成了宝贵的存储空间的浪费。为了减少
NFSR(非奇异反馈移位寄存器)是一类广泛应用于通信和密码算法中的寄存器。圈结构是用来刻画NFSR状态图的一种常用的表述方式,即该NFSR可以生成多少个圈以及每个圈的圈长是多
研发费用加计扣除政策普遍被认为是一项能引导企业加大研发投入的税收激励政策,然而各项研究表明政策的实施效果有待继续提高。企业执行政策所发生的成本被认为是政策失效的
钦州白话是广西粤语方言的代表之一,含有丰富的量词。而量词研究作为词汇研究的一个热点,不仅能帮助观察词类的语义功能,还有助于从中探索句法功能及量词本身的演变与发展。从笔者收集到的文献来看,钦州白话方言的量词研究甚少,缺乏系统的描写和研究。因此,对钦州白话的量词展开系统性的研究具有重要的学术参考价值。有鉴于此,论文拟通过田野调查来记录钦州白话的量词及相关语料,运用语义学、句法学和类型学等相关理论和方法
当前,随着全球一体化进程的不断加深,市场竞争环境日益激烈,金融产品及服务同质化严重,加上第三方移动支付快速普及以及互联网金融的创新冲击,我国商业银行均积极谋求变革转
随着个人消费需求的智能化,位置信息日益彰显其重要性,安全的位置验证必不可少。目前,针对位置密码学的研究已经取得了大量的成果,但是,如何以区域为凭证信息,设计基于区域的
校企合作,对高职院校来说有着重大的现实意义,影响着高职院校办学的质量和前途。高校的管理工作也属于公共管理的范畴。无论发达国家还是发展中国家,都将校企合作摆在了职业
目前专家检索的方式无法分析文本中的语义结构信息。通过作者主题模型挖掘文档中的作者与词项的关系,建立了文档、作者、主题和词项的关系,打破了文档模型专家与查询独立的假