大数据流滞后相关性挖掘方法

被引量 : 0次 | 上传用户:Chinaxfhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据流挖掘作为数据挖掘的一个重要分支,越来越成为人们关注的热点之一,尤其是随着网格计算,云计算,特别是大数据的出现,人们对大数据流的处理需求的迫切程度越来越高。本文主要介绍了大数据流挖掘中滞后相关性的概念和方法,介绍了传统数据流挖掘的相关知识与存在的问题,针对大数据流挖掘中滞后相关性研究工作包括以下两个方面:第一、本文提出了一种基于级数分层滑动窗口的数据流序列滞后相关性挖掘方法。该方法首先对序列按级数递增进行分层,在每层上计算滑动窗口的覆盖度g,之后再对每层的滑动窗口计算序列的参数值;最后根据各层滑动窗口的参数值,计算序列的滞后相关系数,以此来确定序列的滞后相关性,实验结果表明本文方法是有效的。第二、本文提出了一种基于布尔约减级数分层的数据流滞后相关性挖掘方法。该方法根据原数据流两段序列的序列均值x、y,设立flag变量对原数据流序列元素进行标记,对大数据流序列进行宏布尔变换,根据阈值?剔除元素,并由flag对剩余元素进行还原;其次,根据采样周期T及得到的宏布尔序列值进行微布尔变换,剔除序列元素后还原。对还原后的微布尔序列按级数递增进行分层,在每层上根据滑动窗口的宽度g和每次滑动窗口数目c,计算每层序列的参数值;最后根据参数值,计算滞后相关系数,以此来确定序列的滞后相关性。实验结果表明,本文方法可以大幅度的减少运算时间,在保证精度的情况下提高运算效率。数据流的增长从某种意义上来说是无限量的,不同的阶段会有不同的挑战,在未来的工作中,着重关注算法的适用性及稳定性,并会对算法在数据约减方面的误差做进一步的研究。
其他文献
从“Andragogy”(成人教育学)到“Self-Directed Learning”(自我导向学习)渗透着有关成人学习问题的重要思考。本文主要试图基于美国著名成人教育理论家梅里安对于“Andrago
本文对美国当代音乐教育的历史沿革、理论基础、发展状况和基本体系进行了概略论述,旨在客观认识和评价其特征和成就,从中借鉴和吸取其成功经验,以有益于改进我国音乐教育,可
知识产权法定主义要求我国知识产权法学界树立以民法为核心的整体性知识产权法观念。以民法为核心的整体性知识产权法观念,要求对知识性权利和知识性利益进行区分,主张民法才
涠12-1油田涠四段油藏注采井网不完善,并且在钻完井过程中由于储层受到严重污染,注水较晚,最终导致涠四段油藏地层压力下降,开发效果不好。为改善该油藏开发效果,试图进行注
赫胥黎作为张爱玲最喜爱的作家之一,两者的创作无疑具有一定的关联。赫胥黎的怀疑主义不仅加深了张爱玲对历史、社会、文明的不确定认知,也同时加深了她对个体生命的思索,但二者
本文从探寻教师培训活动的价值导向入手,从教师专业发展、终身学习能力培养、文化基因学等维度明晰了在线学习活动的价值分析框架,并依照此框架梳理了各类学习活动的教育价值
目的探讨磁敏感加权成像(susceptibility weighted imaging,SWI)技术诊断膝关节半月板撕裂的可行性。方法对40名临床怀疑半月板损伤患者,行MRI T1WI和T2WI-FS、SWI序列扫描,
实验在氯醛糖加氨基甲酸乙酯麻醉的新西兰兔上进行。记录血压、心率、心电图并对心电R-R间期(RRI)作功率谱密度(PSD)分析。以单调性电刺激和低频率的波动性电刺激分别刺激减压神经
意识形态工作是新形势下党和国家一项极端重要的工作。可采用文献资料法、问卷调查法、实地调查访谈法、数据统计法、逻辑分析等方法对目前浙江省各高职院校党支部开展意识形
以双筒减震器为研究对象,建立了其在压缩和复原两个行程中所产生的阻尼力的参数化模型,用虚拟仪器技术LabVIEW对其在正弦激励作用下的外特性和阻尼特性曲线仿真,通过改变模型