基于U-shapelets的时间序列聚类方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:gaoyangwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是数据挖掘领域中的热点研究对象,其研究重点是如何从时间序列数据中发现有价值的信息以指导实际工作,其中时间序列聚类方法是时间序列数据挖掘领域中的重要研究内容。由shapelets衍生的u-shapelets(unsupervised shapelets)能够在无标记的情况下完成时间序列的准确划分。基于u-shapelets的时间序列聚类方法利用不同时间序列间局部特征的差异性进行聚类,其聚类结果具有极强的解释性,且很大程度上避免了噪声的影响。但是该方法仍然存在亟需解决的问题,本文围绕这些问题进行了深入研究。首先,针对现有基于u-shapelets的时间序列聚类方法中子序列质量评估方法以及u-shapelets集合选取方式不当的问题,本文对多种子序列质量评估方法展开了研究,证明了I index是一种合适的子序列质量评估方法,并在此基础上结合多样化top-k查询技术提出了一种基于最佳u-shapelets的时间序列聚类方法(Div Ushap Cluster)。实验表明:与传统聚类方法相比,Div Ushap Cluster方法的整体效果最佳;与现有的Brute Force方法和SUSh方法相比,该方法能够保证在多数数据集上运行时间基本保持不变,并且在多个数据集上的准确度较前两者均提升了30%。其次,针对现有基于u-shapelets的时间序列聚类方法在规模较大的数据集上运行时间大幅增长的问题,本文在Div Ushap Cluster方法的基础上提出了基于最佳u-shapelets的快速时间序列聚类方法(Fast Ushap Cluster)。该方法通过使用转折点和R-tree索引结构来降低u-shapelets子序列候选集的量级,并以此达到降低时间复杂度的目的。实验表明:在平均运行时间上,Fast Ushap Cluster方法与Div Ushap Cluster方法和SUSh方法相比分别提速了21倍和71倍;在平均聚类准确度上,Fast Ushap Cluster方法的平均聚类准确度为0.74201略小于Div Ushap Cluster方法的0.75477,远大于SUSh方法的0.58875。最后,在理论研究的基础上设计并实现了基于u-shapelets的时间序列聚类原型系统,通过可视化的手段验证了本文提出的研究方法的有效性。基于u-shapelets的时间序列聚类原型系统使用模块化开发方式提高系统的可拓展性,并提供查看时间序列、u-shapelets集合以及Fast Ushap Cluster方法与SUSh方法的聚类效果对比的功能,以更直观的了解基于u-shapelets的时间序列聚类过程。
其他文献
我国刑法第二十条第一款规定:“为了保护国家、公共利益、自身或他人的资产、人身等权利不受正进行的非法侵害而采取措施来防止、停止非法侵害,这是合法的正当防卫,即使损害不法侵害人,也没有刑事责任。”该条第三款规定:“那些犯有杀人、强奸、绑架、抢劫和其他暴力罪行,对人身安全构成严重威胁,此时防卫人进行正当防卫,即使造成不法侵害人受伤或死亡,也不承担刑事责任,不属于防卫过当。”这两款规定载明了正当防卫的法定
随着经济一体化进程不断深入,全球范围内贸易发展速度持续性加快,形成了对国际贸易融资业务强劲的需求。各大商业银行因此也将国际贸易融资业务作为大力发展的业务之一。国际贸易融资业务给商业银行带来了巨大的利润,但是受近些年经济下行以及业务不良率逐渐攀升的影响,多家银行国际贸易融资业务发展陷入困境。同时在经济复苏阶段中,国际经济市场上大宗商品的价格波动性较大,国际贸易融资业务信用风险和市场风险也随之加大,风
大体积混凝土结构作为现代桥梁建设中一种重要的结构型式,其开裂问题一直是工程技术人员最为关注的问题之一。为指导大体积混凝土施工,减少温度裂缝的产生,可对其进行仿真计算,制定各施工阶段的具体温控措施。但是,在对大体积混凝土温度场和应力场进行有限元分析时,所采用的热学参数主要通过经验公式或试验得到,由于经验公式难免有误差,试验因其花费高、耗时长而较少使用,并且这些参数在施工期受气象条件、时空、荷载、施工
在知识经济高速发展的今天,高校作为知识生产、传播、应用的重要组织,与相关产业、市场的联系日趋紧密,成为“双创”背景下一股不可忽视的力量。高校教师作为创新创业的主体,拥有天然的技术优势,是提高科研成果转化率的一个重要因素,在推动科技创新、提高产业竞争力、发展区域经济等方面发挥重要作用。然而,长期以来我国一直存在着高校科研成果与社会经济发展脱节的问题,许多有着良好应用前景的科研成果并没有形成生产力的有
2018年以来,全世界的智能手机出货量都呈现出下降或者停止增长的状态,智能手机市场正迎来寒冬,在这种情况下,全球各大主要手机厂商之间为了争夺市场,他们在追求设计与创新的同时,还必须兼顾成本控制,因此企业就有动机将部分成本转嫁给上游的供应商。此外,一些传统的手机企业开始寻求转型,比如苹果、华为和小米等公司都在积极扩张自己的业务范围,力图以智能手机为突破口,延伸出更多的相关业务,来提高自身的盈利能力,
随着互联网技术的迅速发展,越来越多的用户热衷于将个人数据存储在网络中以便快捷地访问和处理。然而,近些年云服务器频繁被攻击而引发了各种隐私数据泄露事件,使得人们意识
古诗文在高中语文教材选篇中占有将近一半的分量,而学生要理解并达到课程标准要求的能力水平,就必须掌握一定的古代文化常识,另外,学生了解一些古代文化常识也是传承中华优秀传统文化的一个途径。积累古代文化常识的必要性和重要性为所有老师公认,但现有研究和教学现状表明,大多教师对于高中生究竟要掌握哪些古代文化常识、如何教才能更好地帮助学生掌握这些必要的古代文化常识,还存在种种模糊的认识和做法。因此,有必要对古
近年来,我国高速铁路的建设方兴未艾,为广大国民的出行带来极大便利,也为加快城乡一体化进程、带动沿线区域的经济增长提供新的机遇。但与此同时,高速铁路的运营需要高额成本,对于铁路运输企业而言,只有深入分析高速铁路的客流特点,才能以需求为导向、以收益为追求,更好地为社会服务。因此,明确旅客在高速铁路大力推广这一形势下的出行行为就显得至关重要,这不仅是运输企业理应承担的基本业务,同样也是后续制定列车开行方
随着计算机技术的快速发展,中学地理逐步引入信息技术作为其有效的教学辅助手段。GIS作为地理科学中具有较强实用性的新兴技术,对地理教育的发展具有独特意义。《普通高中地理课程标准(2017年版)》中着重强调了地理信息技术的应用,这使得GIS成为了充实地理教育理论、增加地理教育科学性的重要工具。随着GIS的更新与普及,中学硬件和软件设施的配备也随之不断完善。将GIS作为学生学习的工具引入地理课堂能否成为
目的:本课题是通过对抑亢方联合甲巯咪唑治疗初发或复发初诊Graves病患者的临床观察,进一步探讨抑亢方在治疗Graves病患者的疗效及安全性。方法:筛选广东省中西医结合医院内分泌科门诊就诊的76例Graves病患者,按随机数字表法分为两组,治疗组给予抑亢方联合甲巯咪唑口服治疗,对照组给予单纯甲巯咪唑口服治疗,所有入组患者在起始治疗及之后第4、8、12周进行观察,观察两组患者治疗的心率、体重、中医证