时间序列的相似性分析问题研究

被引量 : 0次 | 上传用户:zj280078064
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济、科技和社会的发展,信息技术也在飞速发展,人们对于信息和数据的研究和关注也在不断增加。时间序列从广义上讲是随着时间、空间变化的序列数据,主要采用相同时间或相同空间进行间隔度量;其作为大量数据中的一类数据,具体遍布在在现实生活中的各个领域,例如:股票涨跌走势数据序列、商场购物记录数据序列、产品销售数据序列、病患疾病特征数据序列、语音信息处理数据序列等等。如何在大量时间序列数据信息中快速、高效的查找并分析出与已知序列数据相似的隐含信息和知识,成为现在研究者们关注的热点问题。由于时间序列的高噪声、高维度、波动性大的特点,对时间序列数据进行快速高效的分析,挖掘潜在的信息及相互间的联系,将是一个具有重要意义的课题。时间序列的挖掘分为两个阶段,第一个阶段是时间序列的模式表示;第二个阶段是时间序列的数据挖掘。模式表示主要是根据原始时间序列数据中的主要特征进行提取、拟合原始的序列曲线,对时间序列数据进行重新拟合表示。时间序列挖掘主要是对模式表示后的序列做进一步、深一层的分析研究。本文主要是以时间序列的相似性分析研究为主线,从时间序列的模式表示和时间序列的相似性度量分析方法这两个方面进行研究。本文的主要创新点和贡献如下:(1)基于信息熵的时间序列模式表示本文提出一种基于信息熵的时间序列分段线性表示方法,它对时间序列主要是去除噪声,并且提高拟合误差,有效的解决了由于数据间剧烈变化的干扰造成的分析不准确问题。传统的序列分段线性表示方法,大多通过直接利用数据间的差值来进行模式表示,这些方法不能有效的去除噪声。实验表明,与以往方法相比,基于信息熵的时间序列分段线性表示方法在消除噪声和拟合误差方面有明显的优势。(2)带转向标记的相似性度量分析方法在时间序列相似性研究中,本文提出一种带重要转向标记的最长公共子序列度量方法,可以有效提高时间序列的相似性分析的速度和效率。该方法利用重要点序列,将向量间夹角余弦的概念和指针矩阵引入相似性度量比较方法中。利用模式表示后的重要点序列,基于转向角,结合分段平均划分的思想、最长公共子序列相似性度量方法原理和标记矩阵,利用转向角之间向量余弦值序列和指针矩阵快速度量分析出两序列的相似性。实验表明,该方法保证了相似性度量分析的快速、高效和有效性。
其他文献
首先分析了农产品电子商务冷链物流的特点,接着分析了发展农产品电子商务冷链物流的必要性,剖析了农产品电子商务冷链物流发展过程中存在的问题,最后提出应从基础设施建设、
为了减少环境污染,制定商业车辆排放标准已经在全球形成共识,并开始建立强制排放法规。为此,需要通过有效的冷却管理系统使发动机处于适宜的燃烧温度。本文讨论了一种全新的
分析了我国冷链物流的现状与存在的问题,提出了相应的发展对策与建议,包括培育冷链物流品牌、规范冷链市场、建设配套冷链设施、严格冷链标准、加强新技术应用、强化质量监管
对B2B和C2C两种模式下的电子商务物流服务流程分别进行了概述,按照全面性、区分性、定量和定性相结合、结果评价和过程评价相结合、可操作性等原则,建立了B2B和C2C两种模式下
在我国电视剧文化品质不断提升、产量迅猛增长的背景下,电视剧编剧在幕后发挥的巨大作用,引起人们越来越多的重视,并逐渐成为理论界和艺术界关注的焦点。在我国当代大陆众多的电
<正> 明万历十二年(1584),我国乐律家朱载堉创建了十二平均律。他把八度分成十二个相等的半音,使任意相邻的二个音的音程为21/12。他的具体方法是,先求出半音的音程1.05946,即2
近年来,我国区域发展不平衡问题依然突出,贫困地区尤其是集中连片特困地区发展尤为滞后,而产业发展不足是导致地区贫困的根本性因素。开发区是区域产业在空间上的集聚,是调整
21世纪全球进入知识经济的时代,成为学习型人才成为这一时代的必然要求。教育工作者开始思索:如何培养学生学习能力,切实关注每个学生的成长与发展?传统的教学往往是接受性的,
丰富多彩的社会必有多彩的艺术,生活造出艺术,艺术便丰富人类生活。随着社会各方面发展,艺术同时也要改变自身的。本文通过对写意重彩画形成的历史、文化背景、美学观念、表