基于群智能的K-medoids聚类优化算法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:angella_dj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和信息技术的迅速发展,如何从海量数据中提炼出有效的信息,成为众多学者研究的热点之一,数据挖掘就在这一背景下应运而生。聚类分析作为数据挖掘中非常重要的组成部分,对不同类型的海量数据集进行归类划分,因此被广泛地应用于多个领域。本文通过分析研究传统聚类算法,针对其存在的一些不足,结合群智能算法的优化优势,分别提出了采用群智能中的人工萤火虫(glowworm swarm optimization,GSO)的聚类算法和细菌觅食(bacterial foraging optimization algorithm,BFO)优化聚类算法,重点研究工作如下:(1)针对传统的K-medoids聚类算法受随机设定的初始值影响明显、算法稳定性和准确度欠佳、易收敛于非全局最优值等缺陷和不足。本文采用流形距离代替欧式距离作为聚类算法的度量方法,并利用GSO优化初始聚类中心,提出了一种基于GSO的K-medoids 算法(K-medoids clustering algorithm based on glowworm swarm optimization,GSO-medoids)。本优化算法GSO-medoids充分利用群智能GSO的稳定性和灵活性较好等优点,克服了传统算法只能够分析球形数据、聚类效果不佳等缺陷。实验表明,GSO-medoids算法有较高的准确率和较好的鲁棒性。(2)针对传统的K-medoids聚类算法受随机初始值影响明显、处理高维数据时聚类效果欠佳等缺陷,本文基于粒子和BFO提出了一种融合BFO的K-medoids算法(K-medoids clustering algorithm based on bacterial foraging optimization algorithm,,BFO-medoids)。改进后的BFO-medoids算法充分利用了群智能BFO的搜索能力强且具有全局寻优能力更强等优点,在发挥传统K-medoids算法优势的基础上,明显的提高了算法的聚类性能。试验表明,BFO-medoids算法具有较高的准确率和稳定性,而且适用于维数较高、数目较多的数据集。
其他文献
布尔函数广泛应用于密码学和纠错码中.用于密码系统的布尔函数需满足多种密码学性质,非线性度是布尔函数重要性质之一.具有最大非线性度的布尔函数称为bent函数,bent函数具有
随着当代社会经济的快速发展,人类在近海水域及海岸周围的活动日益频繁。海岸、近岸海洋工程施工数量及投资规模在不断加大,我们对位于近海岸、河流入海口等近海海域的建筑物
柑橘罐头的生产过程中会产生大量工业废水,若不作处理直接排放对环境存在较强程度的污染,其中,柑橘囊衣果胶是从柑橘罐头生产工业废水中提取的一种分子量约为792 kDa的果胶多
吉林油田低渗透裂缝发育油藏,由于储层非均质及裂缝发育的特点,导致调整区含水上升速度加快,开发特点是低采出程度、高含水,层内和平面矛盾十分突出,无效水循环严重。扶余油
随机微分方程广泛出现在物理学、化学、生物学等自然科学与工程的许多领域.然而很多随机微分方程无法得到其解析解,因此数值解法就成为了一个不可替代的途径.本文研究两类典
极端微生物为了适应极端的温度、pH、盐度、压力等环境条件而形成了一系列的特殊机制,正受到越来越多的关注。大兴安岭地区是典型的低温环境,大量的低温微生物存在于这样的高寒地区,是值得研究和开发的宝贵资源。低温酶具备独特的冷适应性和催化活性,已成为酶学研究的热点。本实验以黑龙江省漠河县兴安落叶松林为主的林下土壤为研究对象,通过传统平板培养法分离、纯化土壤中的微生物,筛选产低温脂肪酶的高活性菌株。利用单因
针对区块开采中存在的矛盾,如何控制区块自然递减大,含水上升速度快的实际,如何更好地挖掘剩余油潜力,进而延长区块的持续稳产,提高综合开发效益,寻找有效的调整方法是一个亟
镍及其合金由于自身过渡金属的特性,在电化学催化领域受到了研究人员的广泛关注。然而,目前块状镍基非贵金属及其合金在电催化反应中的析氢析氧性能尚不理想,且反应机制有待
近些年,二维无机层状纳米材料(纳米片)由于尺寸、形状、结构的优势以及在其它领域的潜在应用,引起广泛关注。由于纳米片有足够大的比表面,因此以纳米片为衬底的荧光粉的发光激
近年来,为改善液晶光电性能,人们试尝在液晶材料中添加微量纳米粒子,研究其对液晶电学、光学、热学等性能的改善和影响作用。国内外相关碳纳米管掺杂液晶性质研究的报道较多,