基于人体运动捕捉数据的高维时间序列模式挖掘算法的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ZZ2077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是包含一系列随时间变化的数据的序列,它反映了某种属性值随时间变化的特征。在金融、经济、自然科学、信息工程等重要领域,每天都会产生大量的时间序列,因此如何有效地处理这些数据并挖掘其背后隐含的规律和知识,成为人们日益关注的问题,随着研究的深入,许多经典的问题得到了有效地解决。而近年来,随着技术的发展,出现了许多复杂庞大的高维时间序列数据库,然而其带来的计算复杂度的激增,使得大部分能够成功地应用于一维时间序列的挖掘技术,都无法应用在高维时间序列的挖掘上。针对该问题,本文首先对时间序列数据挖掘领域的研究进行了系统的文献总结,分析了时间序列及高维时间序列的分类、特点和研究现状。之后,阐述了该领域研究的几个主要问题,即相似性度量、快速检索、主旨模式挖掘,并针对每个问题,对主流方法的特点、适用范围及优缺点进行了详细的分析与说明。在此基础上,本文针对当前该领域的两个热点问题,即序列的快速检索和主旨模式挖掘,以人体运动捕捉数据作为具体分析对象,进行了深入的研究,分别提出了有效的解决方法,并通过相关实验验证了算法的有效性。(1)在序列的快速检索方面,通过充分挖掘人体运动的特征,本文提出了两个新的模型:借助于运动中产生的能量对运动进行描述的能量模型和利用相关系数描述人体运动中关节间协作状态的运动协调性模型。利用这两个模型,可以从人体运动中提取出能够有效地体现出其运动特征的低维度索引序列。之后,利用支持向量机对该低维索引序列进行粗分类,从而最大程度地避免了与查询序列不相似的序列参与到时间复杂度较高的精确比较中。最后,在经过粗分类的候选序列集合上,利用基于DTW距离进行度量和Keogh索引下界进行剪枝的线性检索算法精确地度量输入运动和候选动作之间的相似性。(2)在主旨模式挖掘方面,针对现有算法易受噪声干扰的问题,本文提出了一种基于最长公共子序列距离的主旨模式挖掘算法。但该度量方法具有复杂度较高的问题,因此,在搜索过程中,该算法采用了基于子序列距离判别的策略进行了剪枝。之后,采用了层次化聚类的方法将相邻重叠并高度相似的候选模式进行合并,仅保留下能够充分体现序列各部分特征的序列。最后,对于提取出来的非等长候选模式,使用了最小描述长度原则求得其相关权重,并据此选择出现频率最高、最能体现原时间序列特征的主旨模式。
其他文献
多文档自动摘要是自然语言理解领域的一个重要的研究方向。近年来,随着计算机和互联网技术的迅速发展和普及,信息增长的速度比以前各个时期都更快,人们越来越陷入到信息的海洋之
随着计算机网络时代的到来,人们开始通过网络的途径享受各种娱乐服务和学习各种知识,并对家庭数字媒体服务提出了更高的要求。人们需要一种方便可靠的途径,能在家庭环境下获
随着个人电脑市场的增长和存储设备数据存储能力的不断提高,个人数据量变得越来越大。文件系统作为管理用户数据的基础,其名字空间变得越来越复杂,这导致文件系统元数据访问
随着硬件工艺技术的进步,处理器芯片集成了越来越多的晶体管,处理器速度的飞速提高导致其与内存的速度鸿沟不断拉大。现代主流的体系结构都采用分层缓存架构来缓和处理器和内
农业虫害是常对作物造成严重危害的农业生产重要限制因素之一,也是我国农业经济惨遭严重损失的主要原因,而绝大部分的农业生产者对虫害的认识不清,盲目防治,造成农药的浪费,
选址问题是组合优化领域中的一类重要问题,它是对于一些网络服务器、核电站或者物流中心等有限且重要的资源进行选址决策,在生产管理与调度,网络通信,理论计算机科学等方面有
网络上信息的共享是人们关注的一大热点。目前资源组织管理以C/S方式为主,即资源集中存放在服务器端,资源的交换、用户之间的交流通过服务器完成,用户和服务器之间的交流是系
面向服务的体系架构(Service oriented Architecture,SOA)作为一种新的分布式软件系统架构,为互联网环境中服务共享、服务重用、业务集成提供了新的解决方案,它能实现系统之
无线传感器网络是近年来世界各国科学研究的热点之一,作为二十一世纪十大新兴技术之一,它将对人类生活的许多方面产生深远的影响。然而,目前无线传感器网络在安全方面面临着
近30年来,伴随着并行计算机的出现,并行计算迅速发展。SMP(对称共享存储多处理机)是一类被广泛使用的并行计算机系统。OpenMP则是其上最流行的并行程序开发模型。OpenMP具有