时间序列相似性度量方法综述

来源 :数字化用户 | 被引量 : 0次 | 上传用户:wekey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】时间序列的相似性度量是时间序列数据挖掘的基础问题,针对时间序列相似性度量问题,综述了现有的时间序列相似性度量方法,重点介绍了各种度量方法的基本原理、优缺点,从而便于研究者对已有算法进行改进和研究新的时间序列相似性度量方法。
  【关键词】时间序列 数据挖掘 相似性 度量
  时间序列的相似性度量是时间序列数据挖掘的基础问题。两条完全相同的时间序列几乎不存在,因此采用相似性(距离)度量来衡量时间序列之间的相似性。由于时间序列数据的复杂性,经常发生振幅平移和伸缩、线性漂移、不连续性、时间轴伸缩和弯曲等形变,为了最大程度地支持上述形变,并尽量提高相似性度量的时间效率,有一系列时间序列距离度量方法被提出和引入。
  一、明科夫斯基距离
  明科夫斯基(Minkowski)距离的优点在于简单直观,易于计算。设两长度相等的序列和,把它们看成n维空间中的两个坐标点,则两者之间的明科夫斯基距离[2]定义为:
  当q=1时为曼哈顿(Manhattan)距离,
  当q=2时为欧几里德(Euclidean)距离,
  其中欧几里德距离是最常用也是应用最广泛的一种距离,其计算复杂度不高,与序列长度成线性关系,因而具有很好的伸缩性,序列长度的增加不会造成计算复杂度的迅速提高。并且欧氏距离满足距离三角不等式,在基于索引的查询时,可以利用距离三角不等式快速过滤一些不符合条件的索引节点。
  二、动态时间弯曲距离
  动态时间弯曲(DTW)距离在语音处理领域得到广泛的研究,Berndt和Clifford首次将DTW引入到数据挖掘领域[3]。与欧几里德距离相比,动态时间弯曲距离不要求两条时间序列点与点之间一一对应,允许序列点自我复制在进行对齐匹配。
  动态时间弯曲(DTW)距离:设时间序列和,则X和Y的DTW距离定义为:
  式中:表示序列点和之间的距离,可以根据情况选择不同的距离度量,通常使用明科夫斯基距离。
  动态时间弯曲(DTW)距离的缺点是时间复杂度太高(),在子序列匹配时如不进行优化甚至为(,L为子序列的长度),不适用于海量时间序列的数据挖掘,需要专门采用某种技巧来减少其计算复杂度。
  三、最长公共子串距离
  当两条时间序列在大部分时间段具有相似的形态,而只在很短的时间范围内发生剧烈突变或间断时(即时间序列形变中的不连续性),欧氏距离和动态时间弯曲距离都忠实地记录了该形变的影响,这对于那些忽略时间序列不连续性的相似性度量问题而言是不适用的。
  设时间序列和,它们满足以下条件的最长公共子序列分别为和:1)对任意,都满足;2)对任意,都有。那么时间序列和之间的相似度定义为:
  最长公共字串(LCS)距离能克服时间序列的短期突变或间断带来的相似性问题,但无法处理振幅平移、时间轴伸缩和弯曲等形变。
  四、结束语
  本文对现有常用的时间序列相似性度量方法进行综述,介绍了各种度量方法的基本原理、优缺点,从而便于研究者对已有算法进行改进和研究新的时间序列相似性度量方法。
  参考文献:
  [1]. 毛红保等, 面向相似性查询的时间序列距离度量方法述评. 计算机工程与设计, 2010(19): 第4221-4224页.
  [2]. 孙即祥, 现代模式识别. 2002: 国防科技大学出版社.
  [3]. Berndt, D.J. and J. Clifford, Using dynamic time warping to find patterns in time series. 1994.
  [4]. Keogh, E. Fast similarity search in the presence of longitudinal scaling in
  time series databases. in Tools with Artificial Intelligence, 1997. Proceedings., Ninth IEEE International Conference on. 1997.
  [5]. 江诗锋与何振峰, 一种基于权重的時间序列相似性度量. 计算机应用与软件, 2010(9): 第116-118页.
  [6]. 邵校莎莎等, 不同粒度时间序列相似性度量. 计算机应用, 2011(12): 第3285-3287页.
  [7]. 孙达辰, 孙迎燕与周广群, 不等长子时间序列的相似性度量方法. 计算机时代, 2011(5): 第17-20页.
  [8]. 丁永伟等, 基于弧度距离的时间序列相似度量. 电子与信息学报, 2011(1): 第122-128页.
  [9]. 冯玉才等, 高效时序相似搜索技术. 计算机学报, 2009(11): 第2107-2122页.
  作者简介:孙建乐(1989-),男,河南,硕士研究生,主要研究方向:智能信息处理;廖清科(1990-),男,重庆,硕士研究生,主要研究方向:智能信息处理
其他文献
【摘 要】近年来,随着电力体制改革的不断深化,市场竞争日趋激烈,供电所的经营难度也随之不断加大,利润空间变得越来越小。而线损率作为供电所一项较为重要经济技术指标,其直接反映了供电所的经营管理水平。因此,加强线损管理已经成为供电所提高经营收入的重要手段。  【关键词】供电所营销 线损 线损率  一、供电企业营销过程中线损管理特征  (一)具有新的经营模式。随着农电体制改革的落实,供电企业的基层实施了
目的 分析老年股骨颈骨折病人的临床护理和康复指导.方法 实施心理、生理护理,满足病人的需要,指导病人进行患肢功能锻炼,采取相应的护理措施,预防并发症的发生.结果 病人情
【摘 要】本文设计制作了一种由PZT驱动的无阀微型泵,和由微沟道组成的微流量控制系统。其中无阀单向阀是由等腰梯形扩散/收缩管组成,泵腔采用圆形设计,直接切除成圆形驱动腔弥补了利用腐蚀工艺制作圆形难以实现的不足。通过计算机软件IntelliSuite对制作工艺的模拟,确定了无阀型微泵、扩散/收缩管微阀和微沟道的制作方案。采用MEMS工艺制作出所设计的部件并组装完成微流量系统。同时引用多方文献分析了扩
【摘要】 历时四年,新医改方案最终在翘首期盼中问世。医药生产企业的现状、前景与我国医疗卫生体制改革息息相关,其中医药合资企业的发展,对中国市场的影响力已不可小觑。通过观察合资医药企业在华医药领域现状、政府对新一轮医疗改革的指导思想和目前已经公布实施的一些具体措施,着重分析新医改将对合资医药企业本身产生影响,探析新医改背景下合资医药企业的发展趋势。  【关键词】 新医改;合资医药企业;策略    2
目的:了解昆山市医疗机构污水消毒处理情况,为有关部门监督管理提供科学依据。方法:随机抽取昆山市81家医疗机构,检测消毒灭菌后污水的粪大肠菌群、肠道致病菌、总余氯。结果
目的 测定抑制喉罩通气道LMA-Fastrach、LMA-Proseal置管和气管插管心血管反应的瑞芬太尼半数有效浓度以及比较置管期间相应脑电双频谱指数(BIS)的变化.方法 择期全麻下行胆囊切除术患者63例,美国麻醉医师协会(ASA)I~II级,按置管类型的不同随机均分为T、F、P 3组,每组21例.4 mg/L启动并调整丙泊酚靶控,使得BIS稳定于45~55,之后按Minto药代模式设置并启动
细胞色素P450酶系参与生物体内许多内源性及外源性物质的生物转化。其中CYP3A广泛存在于肝内外,参与了多种前致癌物和致突变物的活化代谢过程,并与多种肿瘤的发生密切相关。
【摘 要】对于基于B/S模式的信息管理系统,系统安全是系统设计的重点。本文阐述了进行系统安全性设计时,安全保障体系架构。以及从系统层、应用层和数据层,对系统安全所采取的措施与方法。  【关键词】B/S模式 信息管理系统 安全性设计  一、前言  目前,基于B/S模式的信息管理系统设计已占据软件项目的半壁江山。对于B/S模式的信息管理系统,由于是基于浏览器进行的访问,用户分布地域广,层次多元化,后台
【摘 要】通过对现有应急照明系统的全面分析,提出了先进消防照明的一系列概念及光源、电源及系统的分类、适用场所、节能评价和设计要求。  【关键词】消防照明 变光强蓝光LED消防照明疏散系统 消防疏散导流标志 消防持续照明 光源选择指数 光效密度值 消防照明集中电源 消防照明控制系统 中央能源中心  建筑物消防状态下的照明系统是消防系统的重要组成部分,长久以来一直归类为应急照明领域,而关于应急照明的分
【摘 要】本文阐述了巡检机器人系统是由机器人移动本体、自动控制系统和检测系统组成,研究了其基于不同传感器技术的各种引导方式,并对其优缺点进行比较,设计了一套支持AGV技术的从路径规划、流程设计、系统仿真到项目实施全过程的解决方案。  【关键词】AGV技术 巡检机器人本体 导引方式  AGV是自动导引运输车(Automated Guided Vehicle)的英文缩写。在国内电力领域已经开始研制变电