基于混合特征的模糊聚类技术研究

来源 :山西大学 | 被引量 : 5次 | 上传用户:cs80085829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和数据库技术的迅猛发展,人们可以非常方便地获取和存储大量的数据。如何从大量的数据中快速提取有用的和感兴趣的信息,成为海量信息处理面临的瓶颈。聚类分析技术作为一种重要的数据挖掘技术,经过近十年快速发展,已被广泛应用到人工智能、信息控制、医疗诊断、天气预报、图像分析等领域。在传统的研究中,人们一般总把样本看作特征空间中的点,认为模式的特征由数值刻画,因此主要的研究兴趣放在分析数据集中蕴含的信息和揭示点集内在的自然结构上,很少关心数据集的来源、表征形式及其他性质。实际上,在数据挖掘中我们经常会遇到这样一个问题:随着样本集的扩大,聚类分析的计算量越来越大,那么,如何对样本集有效的进行压缩、表征,以加快聚类分析的速度成为一个值得研究的问题.针对这个问题,本文开展了积极的研究,致力于寻找一种有效的针对混合特征的聚类分析方法,主要取得了以下研究成果:(1)提出了一种基于混合特征的模糊聚类方法。传统聚类方法很少对数据特征之间的关系以及数据特征与聚类结果质量进行分析度量,为此,我们深入研究了聚类一致性和聚类完全性的实现方法,并实现了一种有效的迭代计算方法。在此基础,我们发展了一种基于混合特征的模糊聚类算法,该算法首先利用特征分析对大样本集进行压缩,然后通过基于混合特征的聚类一致性和聚类完全性迭代计算,对特征样本展开有效的聚类分析,最后将有效的特征聚合在一起,形成了一种高效的基于混合特征的模糊聚类方法。(2)开发了一个基于混合特征的模糊聚类可重用软件模块:图像处理函数库、特征提取函数库、图像数据管理模块和基于混合特征的模糊聚类分析模块。该软件模块能够很方便的增加各类数据特征的提取操作,并构建聚类一致性和聚类完全性的混合特征集合,可以应用到各种复杂大规模的数据聚类分析应用当中。通过大量的数值仿真例子和实际遥感图像处理例子,我们验证了本文提出的基于混合特征的模糊聚类方法与传统聚类方法相比是一种高效的方法;将该方法应用到遥感图像处理中,可以从多个特征中筛选合适的特征,高效地进行遥感图像的聚类分析。
其他文献
随着互联网应用和用户的飞速增加,猛增的域名查询量对根服务器和CN顶级域名(TLD)服务器造成了越来越大的负载压力。从降低根服务器和CN TLD服务器的负载、提高域名解析的性能
面向对象分析与设计系统在当今软件企业中有着非常广泛的应用,它有目的地把系统分解为模块策略,并将设计决策与客观世界的认识相匹配,为复杂度越来越高、规模越来越大的软件系统
随着计算机应用的日益普及和深入,软件系统的规模和复杂性不断增大,研制可信软件技术以提高软件系统的质量已经成为十分重要和迫切的需求。   软件开发生命周期可以分为需求
支持向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的
随着网络带宽越来越大,网络应用越来越复杂,网络安全问题也日益严重。在骨干网进行安全内容检测,作为国家信息安全的重要一环变得越来越重要。骨干网的主要功能需求是及时高效的
学位
P2P是Peer-to-Peer的缩写,简单地来说,P2P就是计算机系统之间通过直接交换的方式共享资源和服务。这些资源和服务可以包括交换信息、处理器计算资源、磁盘文件存储等。在P2P的
Deep Web是指网络上众多可以在线访问的数据库,其中的数据对传统搜索引擎大部分是不可见的,它们可以通过网站提供的查询接口访问,数据量巨大。但HTML的无结构化、异质性、动
学位
在知识社会的今天,知识的建构性、社会性、情境性、复杂性和默会性得到重视,为学习提供了新的见解、方法和手段。整个社会的学习活动在资源、群体、观念、内容和环境上正在发生
学位
随着用户对审批系统动态性以及适应性要求的提高,传统的审批系统在需求变化时,调整需要付出高昂的代价,很难适应当前审批的需求。当前审批流程越来越复杂并且流程具有不确定
地理信息系统发展到现在,提出了位置智能的概念。它是从传统的GIS应用发展衍生而来的,不过其已经不仅仅局限在GIS应用上。   文章首先介绍了与位置智能相关的技术和理论,对其