时间序列数据流中相关性分析技术的研究

被引量 : 0次 | 上传用户:ciximdt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库理论研究的广泛深入,许多新的技术应运而生。近年来在传感器网络监控、网络监测、金融数据分析、科学数据处理等多个领域,关于数据流的研究已经成为具有广泛应用前景的新兴课题。由于数据流的特殊性:短时间内有大量数据连续到达,这些数据随时间动态变化。怎样对这些流式数据使用有限存储空间进行快速处理以获取有用信息,为数据挖掘及其应用研究带来了新的机遇和挑战。相似性查询是数据挖掘的一项重要任务,同时也是聚类、分类、频繁模式挖掘和异常检测等其它任务的基础。如何对数据流进行相似性查询已经引起数据库研究领域的广泛关注。本文采用相关性分析作为相似性查询的度量标准,提出了在多个时间序列数据流中进行快速相关性分析的一系列算法。主要工作包括以下几点:(1)提出一种基于布尔表示的数据约减技术。通过简单的转换将原始数据流序列转换为布尔序列,利用布尔序列间的位运算快速获取结果。该方法将原始的数值数据转化为比特位,占用的内存空间极小。(2)在用户提前定义滑动窗口大小的前提下,提出一种分层布尔表示算法HBR,实现多个时间序列数据流的同步相关性分析。该方法将原始数据流序列分别转换为宏布尔序列和微布尔序列,通过布尔序列间的比较即可快速定位候选相关性集合。(3)在同步相关性分析基础上,提出一种高效的滞后相关性分析算法BLC,利用布尔滞后相关技术分析序列之间的滞后相关性,并快速探测滞后时间。(4)在用户没有定义滑动窗口大小的前提下,提出一种窗口大小可调整的自适应性相关性分析算法SACA。利用布尔自相关系数获取原始数据流序列的周期特性,根据周期对多个序列进行分组,然后在每一个分组中完成窗口大小的自适应调整。通过理论分析和实验验证,上述算法在多个时间序列数据流的相关性分析中具有较高的效率。
其他文献
鸡蛋溶菌酶是一种天然存在的具有杀菌抑菌作用的碱性蛋白酶,在食品行业中得到了广泛的应用,然而作为鸡蛋中的一种主要过敏原,约有35%的鸡蛋过敏患者对溶菌酶过敏。另外,食物
船舶气象仪是一套船载的自动化海洋气象观测系统,该系统广泛的布置在各种船只上,可以获得船只经过的海域内的风、湿、温、气压、降雨等气象参数。通过对海洋气象环境实时的掌
<正>编辑同志:最近单位组织了体检,做胸透时医生说我"肺纹理增多"。请问:肺纹理增多是什么意思?对身体有什么影响吗?48506部队张俊峰张俊峰同志:肺纹理是指胸部影像检查时看
本文对一台用于净化氧化铝烟气的布袋除尘器进行了气固两相三维流场数值模拟。分析结果表明,其流场分布不够理想。为了改进除尘区流场分布,需了解除尘器流场分布规律。本文在
中西早期外交研究是国际政治研究的新领域,具有空间意义上的特殊性与时间意义上的当代影响力。作为早期人类共同体的后继形态——现代民族国家,不可避免地接受了许多早期人类
目前,西方国家的很多企业将房地产作为一项新型投资工具,投资房地产的经济现象十分普遍。而这种投资行为也渐渐流入我国,成为我国企业新的经济增长点。但随着投资性房地产出
从1995年起,我校由中共浙江省委宣传部、省委教育工委、省教委联合组成的浙江省高校“两课”建设领导小组批准,成为浙江省高校马克思主义理论课和思想品德课教学改革与建设试点单位
随着国民经济的发展,高速公路作为经济运输大动脉,其作用越来越凸显出来。在一定程度上,高速公路的利用率与我国经济的增长成正比。与一般公路相比,高速公路具有设计标准高、
提高微处理器的整体性能是广大计算机研究者们不断追求的目标。目前半导体工艺水平的飞速发展,为芯片的有效设计提供了极为广阔的空间。如何有效利用这些不断增长的片上资源,
文章结合工作实际,阐述了变电站的直流系统在变电站中的作用,它是为控制装置、保护装置、信号和自动装置提供电源,一旦发生接地,将对变电站,甚至对电网的正常运行都将会产生