论文部分内容阅读
随着中国金融市场的飞速增长,股票市场经过三十年的发展,已经达到拥有超过四千个上市公司的规模。面对如此大规模且瞬息万变的股票市场,投资者们需要构建合理的投资组合,使得规避风险的同时获得高额收益,其中如何通过利用“股票联动效应”构建合理投资组合是股票投资策略的重要方法。目前,业界对于“股票联动效应”并没有清晰的定义和衡量标准,而对于“股票联动效应”的判断也主要参考基于人工分类和经验方法,学术界的研究也多关注于宏观层面或特例个案的分析研究。近年来,人工智能技术的兴起使得越来越多机器学习算法运用在不同行业,如何根据股票时序数据特点结合机器学习算法研究股票联动也成为了研究热点。本文基于股票时序数据,从股票个体间和股票群体内的联动出发进行研究,本文的主要研究内容包含以下方面:股票时序数据集构建和数据可视化服务实现。本文设计并实现了一套获取互联网上多源数据并进行数据整合从而构建高质量的股票时序数据集的自动化方法,同时为辅助股票联动关系等相关课题的研究设计实现了多角度的股票走势对比可视化服务。用于股票个体联动分析的相似性指标设计。本文从不同角度设计了三类股票相似性指标,包括基于统计学角度的股票时序数据相关系数指标、基于时序形态角度的时间加权的软DTW(tw-s DTW)距离指标和基于表示学习的角度通过构建股票序列学习到的股票向量的向量相似度指标,实验表明这些相似性指标能在个体联动分析中挖掘到股票联动关系。用于股票群体联动分析的聚类方法设计。本文基于此前所设计的相似性指标进一步设计适用于股票群体联动分析的聚类方法,包括基于相似性指标构建关系矩阵的谱聚类、基于序列相似度的时间加权的软DTW的改进KMeans聚类和结合全局对齐核函数的K-Means聚类、基于股票向量的自组织映射神经网络聚类算法。除了使用传统聚类评价指标,本文还设计了具备描述股票群体联动性的股票聚类评价指标,并通过对比实验验证了这些聚类方法相对于人工分类方法和传统聚类方法具有更好的性能,同时也探究这些聚类方法的在股票群体联动分析中的适用性。