基于动态时间弯曲的金融时间序列聚类研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:liongliong523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类进入大数据时代,通过数据挖掘技术将时间序列数据库中隐藏的、有价值的知识挖掘出来得到了愈多的关注,其相关技术己被成功地运用到各个领域。时间序列相似性度量可以衡量时间序列之间相似程度的方法,其度量结果可用于分类、聚类、相似性搜索等数据挖掘任务中。时间序列聚类是时间序列数据挖掘领域中重要的挖掘任务之一,不同的时间序列聚类方法,可以挖掘出不同的隐含信息。本文以时间序列为研究对象,探讨时间序列的相似性度量方法和聚类方法,促使方法可以充分与灵活地应用到时间序列数据挖掘中,然后撷取潜在珍贵的信息和知识。本文的主要研究内容如下:(1)以数值分布特性和趋势波动特征为出发点,提出基于数值符号和形态特征的相似性度量方法。新方法能够充分反映时间序列数值分布和形态特征,有效地提高了时间序列相似性的度量效果。(2)针对传统聚类方法通常需要确定具体聚类数目,及未能充分反映时间序列整体空间结构和相互影响关系的问题,提出一种基于中心度的标签传播时间序列聚类方法。该方法无需指定具体聚类数目即可实现自动聚类,并且根据不同参数构建不同的网络空间结构,聚类数目能够对此进行相应地调整,提高其在时间序列聚类的性能。(3)动态时间弯曲和时间序列聚类在金融领域的应用。一方面,以动态时间弯曲和经典时间序列聚类方法为基础,在金融领域进行进一步探索。针对股票联动性的研究,挖掘股票的隐含信息,对监管部门和投资者决策起着一定帮助作用。另一方面,以沪深300指数为标的指数,利用新的相似性度量方法和聚类方法对现货股票进行聚类分析,选定追踪成分股,并建立优化模型来获得成分股在投资组合中的优化权重,并使得新方法确定的成分股更能准确地模拟标的指数,且能够满足不同投资喜好的投资者投资要求。研究内容通过数值实验分析,并且通过比较研究领域的相关方法,检验了新方法的性能,进一步完善时间序列相似性度量和聚类的研究,同时在一定程度上扩展了时间序列数据挖掘相关理论和提升了方法在金融时间序列数据领域中的应用性能。
其他文献
运用是外语教学的最终目的,但不能看作是教学过程中最终阶段的任务。运用语言应该贯穿于课文整体教学的始终,尽管在最终阶段要集中进行一些口头练习和综合性练习。
国家中长期教育改革和发展规划纲要(2010—2020年)明确规定,加强体育,牢固树立健康第一的思想,确保学生体育课程和课余活动时间,提高体育教学质量,本文采用了文献资料、调查访问、实
徐迎宾,男,湖南益阳人,1959年10月出生,现为广州科苑新型材料有限公司及广州海天塑胶有限公司董事长、总经理,中国塑料加工工业协会专家,中国工程塑料协会理事,中国工程塑料协会专家
本文以互联网普及率和移动电话普及率作为互联网经济的发展指标,研究了互联网经济对农村居民消费结构的影响效应。结果发现:整体上,互联网经济对农村居民的八类消费支出均有
本文从社会网络分析角度揭示群体性突发事件的演化机理,建立了维权型群体性突发事件社会网络结构与策略的协同演化模型。首先,考虑变化的参与者心智模型和博弈环境,建立了五
最初由美国FAA提出的广域增强系统(WAAS)的概念,主要用来满足航空领域对GPS导的要求,广域增强系统包括由分布在广大区域上的参考站组成的网络,中心站,上行站以及地球同步轨道卫星等
由于GLONASS卫星采用频分多址技术,致使GLONASS的相位数据处理与GPS有显著差别。为了克服常规方法的不足,本文提出了一种计算GLONASS浮点解的方法。并用数学的方法和实测数据的
考察无意识活动的特性,提出无意识活动的数学公式,包括脑内不同内容的无意识活动项目之间关系的公式,无意识活动的心脑关系的公式,无意识活动的心身关系的公式,无意识活动的
随着我国各所高校的大规模扩大招生,高等教育工作已经逐步向大众化教育方向发展,大学生就业率较低和信息技术的飞速发展给高校学生管理工作带来了一些挑战。本文主要论述了目