时间序列动态模糊聚类的研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:lihua1114110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球信息技术的迅速发展,大规模数据呈现于各个应用领域中。如何从这些海量数据中发现潜在知识,已经成为当前计算机领域研究的热点问题之一,数据挖掘技术的出现为解决这一问题提供了有力的工具。数据挖掘亦称为数据库知识发现,即从大规模数据中找到有潜在使用价值的隐含信息。作为一个蓬勃发展的交叉领域,其运用了许多其他学科的技术和方法,其中包括统计学理论、数据库技术、机器学习、模式识别、人工智能等。数据挖掘研究的主要内容包括关联规则、分类、预测、聚类、序列发现、异常检测等。时间序列由于其数据具有明显的时间特性,且存在于诸多应用领域中,如金融,商业,气象等,而备受研究者青睐。同时由于其具有高维数、大量噪音、幅度上存在拉伸和平移、时间轴上易伸缩,并且有线性漂移和不连续点等特征,为挖掘工作带来了很大挑战。目前已有的时间序列聚类方法,是将时间序列作为静态数据处理,没有考虑序列随时间演变的特征,因此进行时间序列的动态聚类研究具有重要意义。本文针对模糊聚类有效性及时间序列的动态聚类进行了部分研究,具体研究内容如下。1.基于模糊c均值算法,通过隶属度矩阵计算类内紧密性和类间重叠性,本文提出了一种新的模糊聚类有效性指标。对于类间有重叠的数据集,利用该指标可以有效地发现优化的聚类数。一般来说,理想的聚类结果是类内紧密性大,类间重叠性小。该指标可以克服FCM算法中,类数需要预先设定的缺点。通过多组数据集测试表明,该指标能够准确地对模糊聚类结果的有效性做出判断,并且对于模糊子m取三个不同的常用值,均能发现最优聚类数。2.为了弥补时间序列静态聚类算法的缺点,本文提出了一种时间序列的动态聚类方法。该方法首先使用关键点集合表示时间序列,进行降维计算;再根据基于兰氏距离的FCM算法,对时间序列进行聚类,从而得到具有明显时间动态性的时间序列;最后利用提出的动态聚类算法对跳转序列进行演化聚类。该方法揭示了时间序列类别随时间演化的本质,反映了对时间序列的聚类区别于静态数据聚类的特点。基于兰氏距离的FCM算法对奇异值不敏感。通过多组数据集测试表明,该方法具有良好的可行性和有效性。
其他文献
学位
机器人环境建模与避障导航是机器人技术领域非常重要的研究内容,已引起很多研究者的关注,并取得了大量研究成果。其中,大部分方法仅限于理论分析或者仿真,没有结合真实机器人
阻变随机存储器具有低压、高速、低功耗、结构简单、与CMOS传统工艺兼容、低成本、高密度等优势而越来越受到广泛的关注,被认为是下一代可能取代闪存而成为主流存储产品的一种
随着互联网技术不断的发展,网络安全问题已成为业界的研究热点,尤其是军队和政府部门对网络安全提出了更高的要求,需要系统能够在极高程度上保证其保密性、可认证、可控性、完整
为了提高机器人在全局静态环境下路径规划的速度,本文提出了一种基于改进蛙跳算法的机器人路径规划算法。算法中,青蛙以随机方式和启发方式两种策略从可选栅格集中选择栅格。
在互联网时代,微博作为一种全新的社会化媒体,对人们日常生活的影响越来越大。然而随着微博爆炸式的增长,商业级的微博系统通常都具有大量的用户和多样化的信息。如何从海量
智能变电站是智能电网的重要组成部分,代表了未来变电站技术发展的新方向。为了提高变电站内部数据的集成化和标准化,变电站系统应采用开放和标准化的技术。本文分析了智能变电
电力系统是现代化技术水平较高的行业,它要求有安全、可靠的高新技术来保证其发展。电力系统的用户信息、用电量信息,营销数据等信息都具有很重大的意义,应该加以保护,防止被非法用户获取或篡改。随着电力系统的不断快速发展,信息泄露或被篡改等安全问题频出,并呈逐年上升趋势,给电力系统的正常生产和运营造成了巨大的影响。所以,对一些敏感信息进行重要保护就显得尤为重要。本文以电力系统信息发布系统为背景,主要实现了电
为了克服基于身份公钥密码体制中的密钥托管问题,同时又要避免像在公钥基础设施中那样使用证书,Al-Riyami和Paterson在2003年的亚密会上给出了无证书公钥密码体制的概念。自
随着工作流技术的不断发展,开源工作流产品功能日趋完善,越来越多的软件企业和客户已经意识到,自己去研发一个工作流引擎或平台,已经毫无竞争优势和价值优势,甚至有可能是成