多维数据中基于周期模式的时间序列分析子系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:magic1136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据仓库中多维数据的联机分析处理和数据挖掘一直是国内外的研究热点,它在企业决策支持中具有广阔的应用前景和巨大的应用价值。联机分析处理虽提供了多角度多粒度展现数据的功能,但它实质上是用户驱动的探查,当面对海量数据时,用户易迷失,忽略重要信息;而目前大部分数据挖掘技术并非基于多维数据模型设计,不能很好的完成对多维数据的挖掘。如何为用户自动发现,或引导用户更快发现多维数据中隐藏的信息成为研究者们面临的新挑战。 “时变性”是数据仓库的重要特征,存储于数据仓库中的多维数据隐式或显式地带有时间信息。数据随时间的变化常伴随着规律,因此以时间维为切入点,利用丰富的时间序列分析方法对多维数据进行分析挖掘无疑能够帮助用户发现大量有用知识。 本文从时间序列的周期模式挖掘入手,定义了密集部分周期模式及其活跃期的概念,提出了一种高效的密集部分周期模式发现算法,并将该算法与多维数据相结合,设计并实现了一系列基于密集部分周期模式信息的数据立方体智能导航与知识发现操作,帮助用户从多角度发现多维数据中存在的周期变化特征。 具体来说,本文的主要研究包括: ◇密集部分周期模式的挖掘密集部分周期模式指时间序列数据中曾经密集出现的部分周期模式,它不要求该模式在整个序列上都成立,也不要求周期内所有位置都参与周期循环。本文设计的算法能够以较小的时空代价挖掘时间序列中所有密集部分周期模式。 ◇基于密集部分周期模式的异常发现基于密集部分周期模式的异常发现方法针对时序数据中的周期模式,找出不符合模式规律的异常,并通过计算异常程度,为用户指出更值得关注的信息。 ◇基于密集部分周期模式的多维数据知识发现与自动导航将密集部分周期模式和异常的挖掘技术与多维数据模型结合,帮助用户发现数据立方体中多层次时间序列的周期模式与异常信息,并提供针对周期模式和异常的上卷和下钻操作,帮助用户分析聚集层周期模式与细节层周期模式的关系,以及周期异常的产生原因和影响范围。 这些研究成果在我们的原型系统中得到了使用和验证,构成基于密集部分周期模式的时间序列分析子系统。实验结果和性能分析表明,本文提出的方法是实用且高效的。
其他文献
大型旋转机械如风机、压缩机和汽轮机等设备,是石油、化工、冶金和电力等现代企业中的关键生产工具,对这些设备开展状态监测与故障诊断工作,保障设备安全可靠的运行,可以取得巨大
本文通过对荣华二采区10
期刊
本文围绕监控场景下视频序列中的运动目标区域进行研究,内容包括研究运动目标区域的灰度直方图,并以直方图为基础建立度量运动目标区域图像可视性的数学模型;以运动目标区域相邻
为了寻求旱地农田耗水结构特征及其影响因素,探明旱地作物产量和水分利用效率提高的机制,本研究采用田间试验的方法,以玉米为研究对象,2013-2014年在山西寿阳开展了旱地农田
本文基于JSP技术和TOMCAT服务器,采用MYSQL数据库建立了环境监测应急系统,并将人工智能中专家系统和知识学习的思想引入到了系统中。希望通过本文环境监测系统的研究与应用,在应
摘要:本文主要分析了藏族班学生汉语文自学能力欠缺的现状,并有针对性的提出了提高汉语文自学能力的对策及建议,旨在通过提高藏族班学生的汉语文自学能力,进而提高他们的学习积极性和学习成绩,提高他们的语文综合素养。  关键词:培养;自学;能力  自学能力,是指较少依赖别人的帮助,自己进行独立而有效学习知识的能力。自学是学生思维能力提高、智能发展的重要途径。[1]随着现代社会的发展,我们越来越明显地感到,自
由于利用迭代译码,LDPC码、Turbo码、TPC码等在信道编码领域扮演着越来越重要的角色,迭代译码算法不仅作为译码算法具有良好的效果,其更是作为一种思想被广泛应用于信道均衡
随着网络规模不断扩大、用户需求不断膨胀和新服务的不断增加,分布式系统得到了广泛的应用。分布式系统的特点是系统资源分布化、用户分布化、计算分布化和管理分布化,这给系统
学位
有源噪声控制(ANC)就是根据声波干涉原理,利用有源器件,人为地制造出一个与初级噪声频率相同、幅度相等、相位相反的次级声波,与原噪声相互抵消达到降低噪声的目的,它是实现
铁在生物体内具有重要的生理功能。但世界范围内约30%的可利用土地为碱性土壤,导致植物缺铁失绿。植物缺铁不仅严重影响了植物的正常生长发育,导致作物减产,还是造成人类缺铁的一