【摘 要】
:
信息社会对海量数据的处理能力提出了更高的要求。数据挖掘技术伴随着这种需求应运而生,已成为信息技术研究的热点之一。而聚类挖掘是数据挖掘技术中被广泛采用的技术之一。
论文部分内容阅读
信息社会对海量数据的处理能力提出了更高的要求。数据挖掘技术伴随着这种需求应运而生,已成为信息技术研究的热点之一。而聚类挖掘是数据挖掘技术中被广泛采用的技术之一。本文主要对模糊聚类算法FCM进行了改进:结合竞争聚类算法CA、健壮性算法NC和关系型聚类算法FRC,提出了新的目标函数,并借鉴以上几种算法的推导方法,推导出隶属度的迭代公式。该算法具有以下特点:第一,通过竞争因子,使大量的初始聚类逐渐退化到最佳数目的聚类,可以解决传统算法由于缺乏先验知识而产生的聚类数目不合理的问题;第二,通过引入噪声类项,使得算法对孤立点有良好的适应性,从而更加健壮;第三,在目标函数中直接引入相异度函数,使得算法可以直接适用于非欧几里德距离的关系数据。此外,本文在研究基于划分的聚类算法的基础上,对k-均值算法进行改进,提出PKM算法,通过计算机仿真验证了算法的优越性。结合隧道病害检测数据的特点,本文提出了从预处理到评价的有效方法。首先,对数据进行清洗,采用离散化和归一化方法对数据进行转换,并给出数据的集成方法;随后,针对预处理后的数据,应用病害数据相似(异)度的度量方法求解隧道之间的相异度;最后,采用改进的模糊聚类算法以及病害等级评价方法,对758条隧道的病害检测数据进行聚类分析,得出聚类结果,并将结果按照严重程度划分为四个等级,对应病害的四种健康状况。通过对病害状况的初步分析,本文提出若干意见和建议,为隧道病害整治和防治提供有用参考。
其他文献
为了探讨晚侏罗世漠河盆地的构造类型,笔者等对其物源特征进行了系统分析。通过古水流分析、母岩成分分析和源区构造背景分析认为:①晚侏罗世漠河盆地的物源来自南北两个方向
随着老龄化问题在我国的不断凸现,如何提高养老保险制度的效率刻不容缓。目前,我国的养老保险体系主要是以现收现付制的社会养老保险制度为主,然而社会保险不但不足以满足养
地方行政区划和府际关系的重构是20世纪以来中国现代国家制度建设工程的重要内容,关系到国家的政治稳定和地方社会经济的可持续发展。建国60年来,中国地方行政区划和府际关系
在现代图形设计中,运用不同的创意,采用不同的表现手法设计的平面作品越来越多,表现出来的视觉感受也各有不同。本文对平面设计名家的作品创意和表现形式进行了简要的分析与
<正>最近,一组关于文成县府大院的照片在朋友圈内被频频转发。照片中,陈旧的楼面、木质的地板、手扯的开关……让不少网友直呼很温暖,"没想到现在还有这么‘寒碜’的县府大院
<正>随着国家对农户购置农业机械给予补贴和对深松整地作业发放作业补助,全国许多地方出现了抢购大型拖拉机及深松整地农具的热潮。但是众多购机户却因缺乏农业机械知识,不知
<正>说话讲话,既是一种思想观点和态度立场的表达,也是一种文化涵养和价值旨趣的反映。党的十八大以来,习近平总书记在各种不同场合发表的系列讲话,包括大量的批示、演讲、访
该研究以广州市为例,以旅游动机为变量,对居民进行分类,并在此基础上,研究居民的出游行为特征.采用因子分析法提取五个公因子:社交(关系)、放松、分享、求知、欣赏,其中放松
目的:观察前瞻性护理模式在急诊外科中的应用效果。方法:选取急诊外科收治的急救患者120例作为研究对象,根据随机数字表法将其分为对照组和观察组各60例。对照组给予常规护理