【摘 要】
:
时间序列数据是一组具有顺序关系的实值型数据的集合,广泛存在于日常生活中的各个领域。这类数据通常存在数据规模大、局部形状特征丰富和数据维度高等特点。随着传感器设备的发展,越来越多的时间序列数据可以被用于科学研究和深入的数据挖掘。在过去几十年间,大量的研究人员也针对时间序列数据挖掘进行了广泛而深入的研究。时间序列分类问题是时间序列数据挖掘的重要任务之一。尽管在时间序列分类问题的研究上已经取得很多有效的
论文部分内容阅读
时间序列数据是一组具有顺序关系的实值型数据的集合,广泛存在于日常生活中的各个领域。这类数据通常存在数据规模大、局部形状特征丰富和数据维度高等特点。随着传感器设备的发展,越来越多的时间序列数据可以被用于科学研究和深入的数据挖掘。在过去几十年间,大量的研究人员也针对时间序列数据挖掘进行了广泛而深入的研究。时间序列分类问题是时间序列数据挖掘的重要任务之一。尽管在时间序列分类问题的研究上已经取得很多有效的成果,但依旧存在着一些待解决的问题。首先,时间序列中存在丰富的形状特征,我们如何克服噪声的影响对序列的形状特征进行有效表示;其次,在时间序列相似性度量中,我们如何有效的度量序列的局部形状相似性;最后,在对高维时间序列进行模式挖掘时,如何快速有效的挖掘模式用于分类。本文将针对上述三个问题对如何建立具有可解释性的基于序列形状特征的时间序列分类算法展开研究,主要工作如下:(1)针对现有的时间序列相似性度量方法仅仅考虑点对之间的距离函数,不具有可解释性的问题,提出了一种具有可解释性的基于动态时间规整(Dynamic Time Warpping,DTW)的时间序列相似性度量方法。该方法将时间序列的局部形状相似性度量与距离度量相结合,能够同时考虑序列的数值相似性和局部形状相似性。此外,本文的滤波策略和离散化策略还能够有效克服噪声对局部形状特征表示的影响。(2)针对现有的时间序列表示方法通常是提取子序列的均值、方差等统计特征,而忽略了时间序列的局部形状特征的问题,提出了一种基于趋势与统计特征袋模型的时间序列表示方法。该算法利用离散化的斜率来表示序列的局部趋势特征,并且使用加权直方图对趋势特征进行特征编码,能够在克服噪声的基础上有效表示序列局部形状特征。此外,该方法还融入子序列的均值和方差等统计特征,能够更加完整的表示原始序列。(3)针对现有的模式挖掘方法不能很好的权衡时间复杂度和分类准确率的问题,提出一种基于字典的多尺度多领域的时间序列模式挖掘方法。该方法能够在保留原始序列信息的基础上,大幅度减少候选模式数量。此外,本文使用单因素方差分析的方法对候选模式进行评价,利用F统计量来选择模式,能够保证模式的有效性。实验结果表明,本文提出的方法能够有效提升时间序列数据的分类准确率。具体的实例分析也体现了本文算法的可解释性。
其他文献
目的:探讨福建地区男性不育患者的勃起功能及其相关影响因素。方法:选取来福建医科大学附属第一医院男科就诊的男性不育患者136例,采用国际勃起功能问卷5(IIEF-5)评估患者的
阪崎克罗诺杆菌(Cronobactersakazakii)属肠杆菌科,克罗诺杆菌属,为革兰氏阴性菌,周生鞭毛,能运动,无芽孢,兼性厌氧,是一类能够在人和动物肠道内生存的机会性致病菌。阪崎克罗诺杆菌广泛存在于环境和食物中,通过环境接触和摄食等途径进入动物和人体。感染阪崎克罗诺杆菌可能危及新生儿、婴幼儿的生命,对老年人和免疫功能低下的成年人同样具有较强的致病性,该菌对人类危害性较大,已广泛引起人们的关
后基因组时代,生物分子网络建模成为探索复杂生命活动的有力工具,而其中构建基因共表达网络并进行分析是预测目标物种未知基因功能的有效方法。功能相关的基因通常在转录水平上表现出一定的协同表达,因而基因共表达网络可以直观的展示出相互连接的有相似调控机制的基因,利用已知功能的基因在基因共表达网络中进行关联推断,可以有效地预测出未知基因的功能。基因共表达网络的构建需要大量高质量的转录组测序数据,新一代测序技术
整合子是一类真核细胞所特有的蛋白因子。多个整合子形成异源多聚体,并与DNA转录酶结合形成复合体,共同参与sn RNA的转录及剪切成熟。目前发现并报道了的与植物拟南芥sn RNA
随着我国高速公路和城市道路的不断修建,越来越多的沥青路面需要面临夏季持续高温带来的车辙病害问题。因此,研究基于管网降温系统的沥青路面车辙预防技术具有预防车辙病害和减缓城市热岛效应的工程应用意义。然而,很少有国内外学者去研究采用管网降温系统给沥青路面降温的车辙预防技术。因此,本文采用文献查阅、数值模拟、理论分析和参数分析的方法,研究了基于管网降温系统的沥青路面车辙预防技术,得出了以下主要结论:(1)
(-)-vibo-栎醇是一种脱氧肌醇(1L-1,2,4/3,5-环己五醇),天然存在于橡树、蜜露蜂蜜、陈酿葡萄酒的橡木桶和匙羹藤植物中。由于其与葡萄糖结构类似,已被用作合成控制糖尿病药物的生物活性化合物的替代手性元件。本研究利用体外合成生物学平台,构建了主要由五种酶参与组成的体外酶促合成系统,其避免了 ATP参与,可一锅法将麦芽糊精转化为(-)-vibo-栎醇。这个系统中主要参与的酶有淀粉磷酸化酶
生命体离不开蛋白质,它是生命特征的物质基础,具有催化、运输和储存、免疫保护等功能,生命体的存在方式是这些蛋白质化学组份的不断自我更新,而自我更新过程就需要蛋白酶工具
压电陶瓷是一类重要的功能材料,广泛应用于电子工业领域。长期以来,铅基陶瓷(如Pb(Zr,Ti)O3,PZT)一直占据着工业应用的主要市场,然而,由于铅的毒性在生产和使用过程中会对环境造
近年来,随着环境污染和能源匮乏等问题的出现,半导体材料在光催化降解污染物、光催化制氢等方面表现出的巨大应用潜力受到了越来越多的关注。TiO2具有无毒、成本低、催化活性
聚丙交酯因其具有良好的生物相容性和生物可降解性而成为广受关注的高分子材料。但是,聚丙交酯本身固有的一些不足之处限制了其工业应用。例如,它的热稳定性较差、药物渗透性