时间序列的聚类和关联规则挖掘研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:shaochao0926
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的高速发展导致了海量数据的产生。如何在这些海量数据中发现有用的知识,是我们目前面临的最主要问题。数据挖掘技术的出现,为解决这一问题提供了有力的工具。在这些海量数据中,有一类很重要的数据对象----时间序列。所谓时间序列就是按照时间先后顺序排列各个观测记录的数据集,众多领域中的数据集都具有这个特点。由于时间序列可以准确反映事件随时间变化的过程,近几年来已经成为了数据挖掘领域研究的热点之一。动态性、高维度、高特征相关性和大量噪音是时间序列的独特结构,这种特征使许多经典的处理静态数据的算法难以发挥作用,极大地增加了挖掘算法的研究难度。因此,开展时间序列的数据挖掘研究,是一个具有挑战性的、且有理论价值和实际意义的研究课题。现实中的大量系统可以用复杂网络来刻画。一个典型的网络是由许多节点与连接两个节点之间的边组成,其中节点用来代表真实系统中不同的个体,而边则用来表示个体之间的关系。近年来,复杂网络的研究受到了越来越多的关注,并渗透到从自然科学到工程科学甚至社会科学的多个领域。复杂网络具有的特征之一是社团结构,诸多学者从不同角度对如何发现网络中的社团结构问题进行了研究。事实上,发现网络中社团的过程就是聚类的过程。如何利用复杂网络解决时间序列的聚类问题,是一个值得研究的课题。聚类和关联规则挖掘是数据挖掘领域研究的基本问题。本文通过对序列中的时间进行加权和结合复杂网络理论,开展了如下的研究工作。提出了一种基于Normal矩阵谱平分法的时间序列聚类算法。该算法首先对时间序列数据进行向量形式转化,计算出各个时间序列间的相似度并构建复杂网络,然后利用基于Normal矩阵的谱平分法进行社团划分,相似的时间序列被划分到一个社团,即实现对时间序列数据的聚类。为了验证该方法的有效性和可行性,将其应用于实际的股票时间序列数据聚类分析中,取得了较好的实验结果。在时间越近越重要原则指导下,对记录进行时间加权,通过给出加权的公式,提出了一种基于背景的加权关联规则挖掘方法。该算法可以针对用户感兴趣的时间-地点背景进行关联规则挖掘。相比传统挖掘方法,该方法通过从低层次到高层次概念的序列映射,可以分析出不同粒度层次的相关信息,有利于决策者做出更准确的决策分析,制定更优的策略。
其他文献
进入21世纪知识经济时代,数字化校园的概念逐步被广泛关注、认同:数字化校园以计算机技术和网络系统为依托,从环境(设备教室等)、资源(图书等)到活动(包括教学、办公、服务等)
近年来,电力企业在信息化建设方面迈出了可喜的步伐,大部分应用系统采用了大集中的服务器部署模式(服务器集中在省级公司)。毫无疑问,业务种类及并发用户数量的不断增长导致
无线传感器网络是新兴的下一代传感器网络,它有望建立起一种无处不在的网络,渗透到社会生活的方方面面,必将极大地影响或改变人们的工作生活方式。这种新的数据采集与处理技
信息系统的广泛使用及大量医疗数据的存储,使得数据的交换和整合越来越频繁,由于大量异构逻辑数据源的存在,数据挖掘和数据整合技术成为多应用系统整合的关键。本文对美国美中互
学位
问题解决是人类思维最常见的一种形式,是人类重要的高级智能活动之一。认知的信息加工理论认为,问题解决的过程,主要是对问题空间进行搜索的过程。然而,毫无目的盲目的搜索效率很
学位
伴随互联网的迅速发展,网络安全已成为人们普遍关注的课题,网络安全技术越来越受到重视。作为网络安全的第一道防线,防火墙技术已经成为网络安全体系中一个最重要的环节。IPv6协
学位
在社会快速发展,人们对新产品的服务和需求日益强烈的背景下,嵌入式技术需要不断的更新和发展。随着理论研究的进一步深入,建立嵌入式平台的Linux操作系统内核和根文件系统制
在传统的应用程序开发过程中,随着国家政府部门的法律法规的改变、企业的市场竞争策略以及内部管理方式的改变、不同客户的个性化需求的不同,使得信息系统的需求经常性的发生
云计算是随着大规模计算机、个人计算机、互联网的发展而产生的第四次IT产业革命,谷歌首先定义并发展了云计算。而云计算的开源模型Hadoop是一种基于Java的通过运行可分布式
公共对象请求代理体系结构CORBA是为了解决分布式异构环境下对象之间的互操作性问题而提出的基于中间件的分布式对象技术,其核心是一套标准的语言、接口和协议,以支持异构分
学位