异步采样数据的模糊聚类算法

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:wzsyxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为数据挖掘中的一项重要技术,聚类分析具有广泛的应用领域。数据对象的聚类过程是一种无监督自学习的数据分类过程,聚类分析算法的研究是一个极具挑战性的研究课题。传统的聚类算法,比如K均值算法、模糊C均值算法、GK模糊聚类算法,都需要每一个观测对象包含相同的采样特征(相同数目的采样点、相同的采样时间等),但这样的限制条件太苛刻(在医疗诊断、人口普查等情况下就很难满足),导致这些算法不能直接应用于采样特征不同的采样对象。传统的近似方法首先对异步采样数据进行插补处理,然后重新进行同步采样,最后对同步数据应用标准的聚类算法。但是这种传统的方法在插补过程中增加了额外的信息,严重影响了聚类效果。为了解决这一问题,论文介绍了模糊近旁的概念,分别给出了单采样点到异步观测对象和观测对象间的模糊距离范式,有效解决了异步采样数据间距离的度量问题。并应用上述两个概念,改进了标准的模糊C均值聚类(FCM)算法,将之直接应用于异步采样数据。这种算法被称为基于模糊距离范式的模糊C均值算法,简称为F2CM聚类算法。论文在聚类分析基本概念的基础上,对模糊聚类分析进行了归纳总结,并回顾了理解F2CM算法需要的前序知识。在分析讨论F2CM算法后,将其应用于异步采样实例,获得满意的聚类效果,证明了F2CM算法的有效性和正确性。通过ACTG320艾滋病数据实例证明了该算法可以有效的解决实际问题。实验证明F2CM算法在处理异步数据时的聚类效果远优于传统的近似方法。
其他文献
该文针对基于移动互联网的多媒体通信系统进行研究,为目前和将来在移动互联网上进行多媒体通信应用提出详细的分析和研究.作者考虑了移动互联网的主要特点、要解决的主要问题
该论文以大型乙烯生产装置的龙头和关键设备--裂解炉的动态模型为基础,对裂解炉的控制进行了深入研究.1.提出了一种集散系统与流程模拟开发平台之间的数据通讯方法.2.分析了
该课题研究新型的智能变频空调控制器,它以模糊控制和PWM脉宽调制技术为理论基础,以专用SPWM波微处理器80C196MC、IPM智能功率模块和新型的数字化温度传感器为物理核心,并拥
该文在分析了基于跳汰工艺选煤的生产系统及其过程控制系统的基础上,利用面向Agent计算原理和方法,提出一个面向Agent的跳汰选煤MAS总体框架结构;研究了与工艺系统中各环节相
该文研究了不确定系统的鲁棒控制问题,主要包括线性不确定系统的保成本控制,线性不确定时滞系统的鲁棒稳定性分析、变结构控制和广义系统的H、H控制.具体成果如下:一.保成本
该论文共分五章,主要内容如下:1、阐述了MFIAS系统的产生背景.简单介绍了现场总线技术,Internet技术和OPC技术,然后说明MFIAS系统的总体框架及RTDP在MFIAS中的核心地位,最后
随着远程学习应用的不断深入,要求建立一个开放式的远程学习系统框架和标准的学习资源模型.该文针对现有的不同远程学习系统可扩展性差和彼此集成困难的问题,提出一个具有高
该课题以"长春市公安局案件管理信息系统"和"威远集团电子商务系统"的设计和开发为典型应用背景,对基于Web的信息系统进行了较为深入的研究和分析. 该论文在分析了传统信息系
统一建模语言UML(UnifiedModelingLanguage)的出现很大程度上解决了系统分析和设计过程语言表述的问题,但实用性问题依然没有得到解决.该论文的目的是寻求一种基于统一建模语
该文首先介绍了信息管理系统的整体设计方案和信息系统的集成技术,接着详细地描述了该系统的操作系统的安全(Winodws NT)、数据库的安全及用户资源的安全.该文阐述了基于Window