面向时间序列的子序列相似性检索技术研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:wef123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列中的相似性检索是大规模数据驱动应用程序中的常见操作。它也是时间序列数据挖掘算法的主要子程序。时间序列的表示和复杂的相似性度量是时间序列相似性研究的基础,对完成时间序列相似性搜索的任务起着至关重要的作用。时间序列子序列的相似性检索处于数据挖掘技术的核心地位,它在不同应用领域(包括神经科学、金融学、气象学、人体健康检测、数据检索等)的研究也越来越广泛。然而,由于数据序列的海量以及高维性,使得数据挖掘的难度明显提高。所以,在我们获取到时间序列之后,领域专家就面临着对数据分析处理的难题。常用的方法是对数据序列进行特征表示,通过特征表示从而达到有效降低数据的维度,然后再使用距离度量进行相似性判别。因此,我们通过采用时间序列表示和相似性度量相结合的方法实现时间序列子序列的相似性检索。在本文中,针对海量数据库序列的维度大、计算复杂的问题,提出了两种新的索引技术进行时间序列子序列相似性检索。具体内容如下:(1)提出一种类似于B+树的索引构建方法,首先将输入的时间序列进行正则化,对正则化之后的序列进行分段聚集近似(PAA)的降维处理,然后将PAA降维后的结果进行离散化。然后,根据离散化的序列进行索引树的构建。最后在构建的索引树上进行变长子序列的相似性查询。(2)提出了一种新型的哈希映射函数,这是一种基于数据独立散列的哈希算法,其核心思想是对数据集中的点进行哈希运算,使得距离近的点冲突的概率远大于距离远的点冲突的概率。在查询时,将查询点按照相同的哈希函数散列到桶中,然后取出桶中的所有点作为候选近似最近邻点,最后计算查询点与每个候选近似最近邻点的距离,通过该距离判断是否符合查询条件。通过大量实验表明,我们的索引算法可以使得可变长子序列的相似性检索更加简洁高效。
其他文献
经颅磁刺激(transcranial magnetic stimulation,TMS)是一种非侵入式的神经疾病治疗技术,其通过TMS线圈产生的刺激磁场来影响人脑细胞的代谢等活动以达到治疗疾病的目的。由于人脑细胞比较精密和脆弱,所以在TMS设备应用前需要对刺激磁场的精度进行检测。在检测刺激磁场精度的过程中,代表磁场分布情况的多通道TMS信号易受到各种噪声的干扰。传统的滤波算法每次只能处理单通道的信
学位
农业害虫的自动检测对于害虫的监控、预警和及时防治有重要意义。以人工智能为基础的目标检测方法可以为农业害虫的自动检测提供技术支撑。由于害虫目标在图像中常以小目标形式存在且伴随着特征分辨率低、携带特征信息弱的特点,导致图像中害虫特征信息提取较困难,害虫检测准确性不高。因此,研究一种高效的害虫目标检测方法对实现农业害虫监测有重要价值。本文针对小害虫图像携带特征信息弱、分辨率低导致网络对小目标特征信息提取
学位
气体流场的二维(2D)高空间分辨率测量对于燃烧诊断和泄漏定位非常重要。本文提出了一种激光吸收成像技术,将可调谐半导体激光吸收光谱(TDLAS)技术与带电子滚动快门(ERS)的小型化互补金属氧化物半导体(CMOS)相机成像技术相结合,实现流场2D高空间分辨率测量,主要研究内容和成果如下:(1)提出了一种用于实现气体流场2D高空间分辨测量的方法。全面总结梳理了激光吸收光谱技术在2D检测的研究现状,针对
学位
正当防卫向来是刑事领域经久不衰的研究主题,尤其是在当代,越来越多的涉正当防卫认定案件见诸报端,引起社会上的广泛讨论。影响司法实践中正当防卫认定的主要问题在于:实践中强烈的唯结果论的倾向,同时也是结果无价值论对于司法实践的影响;一体化理论和二分说各有其理论支撑,但就指导司法实践而言,二分说更具操作性。就实践而言,进入司法视野的正当防卫案件一般都造成了重大损害结果,而重大损害结果也是激活正当防卫的钥匙
期刊
混沌系统的同步控制往往会受到外部扰动或系统不确定性的干扰,因此,鲁棒性较强的滑模控制方法适宜应用于混沌同步控制中。为了提高混沌系统的同步控制性能,本文结合积分滑模、终端滑模以及全局滑模等相关理论,开展了滑模控制方法的改进研究。积分滑模面具有能够消除稳态误差,提高控制精度的优点而在滑模控制中得到广泛应用,但当初始误差较大时,传统的积分滑模面会出现暂态性能恶化,甚至破坏系统稳定性的问题。为此,对积分滑
学位
区块链技术作为一种典型的去中心化技术,被广泛的用来解决权限集中、数据篡改和个人隐私泄露等问题,目前广泛的应用在数字货币、资产管理和选举投票等场景。联盟链作为企业级应用的优先选择而备受关注,针对联盟链中拜占庭容错类的共识机制存在通信复杂度高、视图切换复杂、主节点压力大以及系统规模难以拓展的问题,本文提出了基于Hotstuff和二叉交流树的HSP共识机制。具体内容如下:1.针对Hotstuff共识机制
学位
永磁无刷直流电机具有功率密度大、结构简单等优点,被广泛应用于电动汽车、航空航天等领域,而转矩波动会影响电机的运行性能。针对永磁无刷直流电机因非理想反电动势和换相过程产生的转矩波动,本文从产生原因和抑制方法上进行深入研究。本文介绍了永磁无刷直流电机的数学模型,分析了不同调制方式下电机转矩波动的成因,以及相应的抑制方法。为同时抑制非理想反电动势在正常导通和换相阶段产生的转矩波动,本文利用平均转矩控制策
学位
气液两相流是一种复杂的流动现象,分析和掌握气液两相流中气泡的运动特性和流动原理对于提高生产效率和保护机器零部件具有重大的意义。尽管国内外诸多学者在两相流领域进行了大量的研究,但是目前对气液两相流的流动特性掌握的还不全面,针对流场三维速度场检测方法的研究尚不完善。视觉检测技术作为一种全场景、无接触的测试手段,在多相流研究中得到一定的应用,尤其是粒子图像测速(Particle Image Veloci
学位
呼气中内源性气体与生理状态密切相关,其中很多可作为生物标志物用于疾病的无创诊断,如:呼气中的CO2和NO气体的检测与分析能够实现肺部疾病的初步诊断。可调谐半导体激光吸收光谱(TDLAS)作为一种常见的痕量气体检测技术,具有灵敏度高、选择性好、响应速度快等优点。本文基于TDLAS技术对呼气的CO2和NO气体进行了检测分析,主要工作及成果如下:第一,设计和搭建了呼气检测的通用平台。根据呼气动态过程的高
学位
污水处理过程是一个高度复杂的非线性过程,出水水质参数检测难以达到实时性,并且实际生产过程存在严重的能耗损失。针对上述问题,论文在完成赣州某污水处理厂控制系统开发的同时,引入智能算法优化策略以预测关键水质参数、降低运行能耗、保障出水水质。针对水质检测滞后问题,论文将进水水质中的重要参数作为特征变量,利用支持向量回归机(SVR)对出水总氮和出水化学需氧量预测。通过改进萤火虫算法(GNFA)对SVR的惩
学位