基于SOM算法改进K-medoids算法及其研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:fjsgxxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的飞速发展,引起信息的急剧膨胀,给计算机存储和行业数据库带来巨大挑战。随着数据指数级的增大,维度不断加大,数据类型的复杂度也在不断提升。对于这些超高维数据,需要通过数据挖掘技术来探索隐藏于数据内的信息并利用获取的信息辅助我们做出科学合理的预测与决策。常见处理高维数据方法有:数据降维、聚类分析、回归分析等。  本文介绍了传统的自组织映射(SOM)神经网络和K-medoids算法。传统的SOM算法在使用时,存在部分样本点和对应的权向量之间差距较大,造成聚类的准确性较低;K-medoids算法在聚类前需要人为确定聚类个数和初始中心点,而不同的聚类个数和初始中心点的选择会造成不同的聚类结果。为弥补以上两种方法的不足,本文提出一种自组织映射(SOM)神经网络与K-medoids算法结合的算法—改进的SOM-K算法。  文中,第一章详细描述了大数据背景下,聚类和降维算法的研究意义;第二章主要讲述了基于聚类算法距离的定义;第三章主要阐述传统的K-medoids算法和SOM算法;第四章主要说明了本文提出的基于SOM算法与K-medoids算法的改进聚类算法并比较了传统的K-medoids算法、SOM算法和SOM-K算法对鸢尾花数据集的聚类结果,证实了SOM-K算法是优于传统的K-medoids算法和SOM算法的一种算法;第五章用SOM-K算法对于全国水资源分布进行聚类分析并结合分析结果给出详细的结论阐述;第六章进行总结与展望,阐明改进算法的优势与不足,以便后续继续学习与探究。
其他文献
本文报告2例先天性再生低下性贫血(11月男婴及12月女婴)经考地松治疗获得效果。该2例之诊断均依据下列各点:出生不久后表现之进行性贫血,伴有食欲不振,软弱乏力但不件有黄疸
质量是决定企业核心竞争力的关键因素,因此,应重视对产品质量的管理,并提高管理质量,以期生产出质量更好的产品.
1 引 言订单问题可描述如下 :n个工件来自 m份订单 ,这 n个工件又分属 B个不同的类 ,sf为不同类工件进行加工转换时所需的机器调整时间 ,来自第 i份订单又属于第 j类的工件
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
期刊
期刊
紧张的教学工作之作,沏一杯香茗,捧一卷在手,可以尽享书之韵、书之美。读书,让我体会“红藕香残玉簟秋,轻解罗裳,独上兰舟”的惬意,让我领略“青箬笠,绿蓑衣,斜风细雨不须归
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
1 引 言线性连续和离散系统的鲁棒分析包括稳定鲁棒性与性能鲁棒性 ,主要方法有特征值分析、Lyapunov理论和矩阵测度方法 ,现已取得较大进展 .但现有结果未能建立连续和离