基于K密度和变维粒子群的聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kangxi2xjp30
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“物以类聚,人以群分”,在自然科学和社会科学中存在着大量的聚类问题。聚类分析通过无监督的机器学习过程来发现大量不同数据之间隐藏的复杂知识模式,源于数据挖掘、机器学习、模式识别和统计学等多个学科。在过去几十年里,聚类广泛地应用于计算机科学、生物学以及经济学等多个领域。随着信息技术的迅速发展,传统的聚类方法已经很难处理大规模、复杂结构的数据,故一些现代智能化的聚类算法应运而生。其中粒子群优化算法在处理大规模数据的聚类问题上独树一帜,它的分布性和自组织能力使其具有很强的适应性和鲁棒性。然而传统的粒子群算法难以解决簇的数量不确定、初始聚类中心选取随机化、容易陷入早熟陷阱等问题,因此在很大程度上影响了聚类分布的均匀性、分散性以及聚类的效果。为此,本文提出了一种改进的粒子群聚类算法。该算法改进了粒子群的粒子编码模式以实现可变维粒子,从而解决了聚类数量在搜索过程中无法变动的问题;改进了初始种群的构造方法,即采用基于参考点的K密度聚类算法构造初始聚类中心,使初始聚类能够均匀分散地分布在高密度数据区域,解决了初始种群随机化的问题;在粒子群的迭代过程中,设计了基于维度增量变异算子的维度更新策略,使维度较差的粒子在收敛时能够尽早地更新其维度以向最优维度的粒子移动,从而使得数据集可被划分为聚类数量最优的多个簇;并针对维度较差的粒子,提出了基于K密度的分裂合并簇方法进行粒子变异,以使聚类中心仍然位于数据空间的高密度区域,从而解决了传统粒子群聚类算法的聚类分布不均匀,难以得到最优聚类数量的簇,聚类效果不够好等问题。实验结果表明,改进后的聚类算法的聚类均匀性更好,解的精度更高,稳健性更强,效率更高,更适合于处理高维空间、数据分布不均匀的聚类问题,且具有对“噪声”数据不敏感的特点。在后续的研究工作中,将在处理“噪声”数据的问题上继续改进聚类优化算法,并进一步加快算法在高维数据空间的搜索速度,提高聚类划分的质量。并在此基础上,利用改进的算法解决实际应用中的聚类问题。
其他文献
“依法治国,建设社会主义法治国家”是我国的基本目标和全民的共识与要求。法理学教学既有助于培养学生的法治意识和尊重人权的特有思维方式,又可以为实践提供理论指导,为学
旨在讨论游乐设施的特征,以及检测中的发现问题,结合实际,提出了解决问题、发展游乐事业的对策。
<正>中国改革开放走过了30多年,令世界关注,也有很多部分发展中国家在学习中国改革开放的经验。我今天这个主题除了讲世界贸易,还要讲到"走出去"的战略机遇。我认为这个机遇
地下水作为人类自然资源的一部分,为我国70%以上人口提供主要饮用水源。由于受到由城市化、工业化、农业和矿业活动导致的污染对地下水构成了威胁,导致部分城镇地下水的水源和水
<正> 国家税收制度是国家各种税收法规和征税办法的总称,是国家向纳税单位和个人征税与纳税单位和个人向国家纳税的法律依据和征纳规程,是一个国家运用法律形式取得财政收入
汽车转向系是由前轮到方向盘的机构,对汽车的操纵稳定性具有很大的影响,本文试从转向系的性能、方向盘的输入等方面进行了论述。
文章选择矿山区域作为地形图测绘更新的目标区域,对比了无人机与有人机航空摄影测量系统的优缺点,详细设计了基于无人机的矿山地形图测绘技术方案,为推广无人机技术在矿山测
家用电器软件评估的对象是家用电器保护电子电路中所使用的软件,软件评估是家用电器安全标准中的新要求,涉及微机控制、自动控制、家用电器安全检测等相关领域。由于标准中没
高校毕业生就业问题一直是备受国民关注的焦点之一,随着社会经济的发展,这一问题日益凸显。造成这一问题出现的原因包括社会供需的失衡,教育结构的不合理,就业观念的陈旧等。笔者