基于变化特征离散化的多维时间序列关联分析

来源 :东华大学 | 被引量 : 0次 | 上传用户:GOG12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工程机械上不同类型传感器如温度传感器、压力传感器、湿度传感器等的大规模部署,这些传感器产生了大量的多维度时间序列数据。通过对这些传感器采集的时间序列数据关联分析,可用于发现工程机械各部件工作状况的潜在关联关系。这种潜在关系将为工程机械系统的故障预警和分析提供支持。但是,由于工程机械时间序列具有维度高和数据量大的特点,使得传统的Apriori关联算法无法直接运用。因此,本文从实际的工程机械时间序列数据出发,针对工程机械时间序列具体特点,提出一种适用于工程机械领域多维时间序列的关联分析方法。首先,本文设计了多维时间序列关联分析系统的整体框架,该框架分为预处理模块,离散化模块和关联规则提取模块。预处理模块负责数据清洗和规范化,实现每个时间序列的取值范围的规范化,并使每个时间序列符合高斯分布。另外,离散化模块对规范化的时间序列进行表示和离散化,也就是将数值型数据转化成字符型数据。此外,关联规则提取模块利用改进的时间特性关联方法从离散化的时间序列中提取有效的关联规则。接着,本文详细说明了离散化模块所用到的技术。本文先对流行的PAA+SAX离散化方法进行评估,发现PAA+SAX离散化方法有不足之处。PAA表示方法会改变时间序列规范化的结果。并且PAA表示方法会忽略原始时间序列的关键信息。另外,SAX离散化方法只能表示时间序列的大小特性,并且SAX的前提是时间序列符合高斯分布。然而,本文的数据集大部分不是高斯分布。所以本文对SAX离散化方法进行改进,使其也可以处理非高斯分布的时间序列。针对SAX不能保留原始时间序列关键信息的不足,本文推荐了变化特征离散化方法,它可以处理非高斯分布的时间序列并保留原始时间序列的关键信息。最后,本文详细阐述了关联规则提取模块所用到的时间特性关联方法。该方法改进了传统的Apriori算法。因为传统的Apriori算法不考虑项的时间特性,所以需要改进候选项的生成算法,支持度的计算方法和关联规则生成算法。使得改进的时间特性关联方法不仅可以处理单重时间序列,还可以处理多重时间序列。不仅如此,本文使用频率阈值和支持度阈值来获得异常模式。针对本文数据集的周期性特点,本文推荐了可以减少关联算法运行时间的关键时间片段关联方法。
其他文献
苏州话的俚词俗语,很多记录的都是苏州人的生活,很大程度上反映了苏州一这个具有两千五百多年历史的古老城市的民俗、社会面貌和风土人情;人们口耳相传的俚词俗语也是方言词
背景:骨代谢过程中,成骨细胞的数量和功能的变化影响骨的生物学特性,外泌体能够通过细胞间的传递进行信号传递,具有促进细胞增殖、分化的潜能。目的:探讨骨质疏松大鼠血清中
赛络纺精梳棉纱与韩国晓星氨纶通过不同纱线组合及弹力布在不同经纬向的弹性拉伸和弹性回复对比,使全衬弹力布具有良好的弹性拉伸和回复性。从原料组合选择、织造工艺参数设
不平衡数据的出现给传统关联分类算法带来了巨大的挑战.为了提高关联分类方法对不平衡数据集的分类精度,本文分别从数据和规则层次着手,提出了关键值抽样法(key value sampli
2016年,中国美术学院以“天地云间”为主题,第七次以毕业季的方式向公众进行毕业创作的展示,在学院、媒体、师生、大众等多方参与之下形成了艺术主题嘉年华的特质。而本届中国美
目的探索护工基本生存状况。方法采用分层随机抽样法,用自制调查表对汕头市几家综合性医院229名护工进行调查。结果(1)护工市场已渐成规模。从事护工之前职业分布,务农最高(48.5%),企
目的:用DTI研究正常儿童脑白质发育特点。方法:收集50例1~12岁健康儿童脑DTI图像,分析第1组(1~3岁)、第2组(4~6岁)、第3组(7~9岁)及第4组(10~12岁)4个年龄组与脑白质内囊前肢、内囊后肢、胼胝
基于ArcGIS的空间分析与SPSS的Pearson相关系数法,探究安徽省县域范围内农用地及建设用地经济密度的时空演化及驱动力状况。研究表明:(1)随着时间推移,安徽省农用地及建设用
<正>开骨散为王庆任《医床改错》中的古方,由当归、川芎、龟板、血余炭、黄芪组成。以补气止血为主功效。是以宋代龟甲汤加川芎而成,明代又名加味芎归汤。此方重用当归、川芎
[目的]明确不同罗非鱼杂交品种的肌肉品质与营养成分差异,为今后罗非鱼的杂交选育及产品深加工等提供科学依据。[方法]根据国家的相关检测标准,对杂交繁育出的6种不同罗非鱼