基于重叠度的层次聚类算法研究及其应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:a9s5c112j6b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息产业的快速发展,人们迫切需要将大规模数据转换成有用的信息和知识,获得数据之间的内在关系和隐含的信息,于是人们结合统计学、数据库、人工智能、机器学习等技术,提出数据挖掘(Data Mining)解决这一难题,并且逐渐成为研究的热点。聚类分析(Clustering Analysis)是数据挖掘中的一个重要研究领域。它是一种无监督的学习方法,它通过一定的规则将数据按照定义的相似性划分为若干个类或簇,这些类或簇是由许多在性质上相似的数据点构成的。同一个类中的数据彼此相似,与其它类中的数据相异。层次聚类算法是聚类分析的一个重要研究方向。层次聚类算法的困难在于合并或分裂点的选择,所以定义一种尺度来衡量相似度就显得非常重要了。本文研究高斯混合模型和模糊集定义重叠相似度作为相似度的度量。选择合适的聚类数和准确划分簇间重叠的数据是聚类分析领域两个被广泛研究的问题。本文研究了基于重叠度的层次聚类算法,能够很好地解决以上两个问题。算法根据簇与簇之间数据的重叠情况运行或停止,从而准确划分簇间重叠的数据,并自适应地确定合适的聚类数。通过实验分析验证算法的有效性。本文较为系统地分析和研究了基于重叠相似度的层次聚类算法及其应用,主要包括以下内容:1)通过研究基于高斯混合模型的重叠相似度定义,给出两个二维高斯组成成分的高斯混合模型的参数评估公式和重叠度计算的参数评估方法,再利用直方统计图的特征,提高了初始划分子簇的速度,简化了重叠相似度的计算过程,应用于快速的自适应多阈值分割方法(MTSGMM)。2)通过对COLRM算法进行研究和分析,提出改进的基于高斯混合模型的层次聚类算法(HCGMM)。3)给出基于模糊集的重叠相似度定义,提出一个基于模糊集的层次聚类算法(HCOSM)。还把该方法应用于无监督的图像分割领域,并且对算法参数做了详细的分析。4)基于以上聚类算法的分析,提出基于重叠度层次聚类算法的无监督SAR图像船舶检测模型和高分辨率彩色遥感影像船舶检测模型。
其他文献
<正>近年来,深圳市建设工程交易服务中心秉承"阳光交易"理念,以"创新发展"为动力,围绕深圳城市建设发展,不断探索"互联网+"招标投标路径,深化大数据和BIM技术应用,努力打造规
期刊
随着人们环保意识的增强,绿色生态旅游是:来来旅游行业的发展趋势,这对于拥有突出生态资源的温泉企业来说,无疑是获取更多利润的良好机遇。然而近几年来,温泉企业的利润却呈现出下
早在澳大利亚第一次妇女运动之际,妇女自由、平等的权利意识就开始觉醒,通过这次妇女运动,白人妇女取得了受教育权、就业权、议会选举权和被选举权等,家庭地位逐渐提高,相应
随着中国经济对外日益开放,全球经济一体化进程的加快,世界各金融集团相拥进入国内金融市场。国内市场的对外开放,使得国内的金融机构受到外国的挑战。激烈的竞争使得原本在
起诉保留并附带处分是审前转处的重要途径,附带处分使检察官的起诉裁量权发展到更高阶段。台湾地区的实践经验表明,缓起诉制度以特别预防为主的综合预防、填补被害人的损失以
随着汽车工业的飞速发展,汽车在给人们日常生活带来方便的同时也带来了严重的环境污染。据统计,当前汽车排放污染物已成为大气污染的主要来源。由于国家的汽车排放法规越来越
胆管瘢痕狭窄是胆道外科复杂而棘手的难题。对胆管瘢痕狭窄形成机理和防治方法的深入研究,具有非常重要的意义。本研究采用临床与基础相结合的方法,较系统地研究良性胆管瘢痕的
普惠金融是小额信贷和微型金融的深入发展,一些弱势群体(例如:小微企业、农民、城镇低收入人群等)是其重点服务对象。而农村金融依然是我国金融体系的薄弱环节,所以农村是普
本文系统阐述了胜任素质模型的建立原则及建立过程,以A公司为例通过行为事件访谈和360度调查问卷法构建了主管人员胜任素质模型,并总结出了模型构建的意义及影响。