论文部分内容阅读
符号数据分析于20世纪80年代由Diday教授提出,是一种新的数据分析方法,这种数据分析方法主要处理的数据对象是符号数据。所谓的符号数据,是建立在传统数据的基础上,通过对传统数据的“打包”处理,从而形成的更高层次的数据。随着数据量的不断膨胀,符号数据分析得到了更多的重视。在符号数据分析的三个类型之中,区间型符号数据分析的较为常见。符号数据分析经过20多年的不懈努力,其理论及分析方法都得到了较为长远的发展,但其在实际中的应用仍然较少。正是看到这个现状,本文将以区间型符号数据分析的应用为研究的核心,以股票分析为应用背景,重点研究区间型符号数据分析在股票分析中的应用,从而为股票投资者研究分析股票市场,制定投资策略提供一种新的途径。本文首先将对对区间型符号数据分析的一些基础概念进行研究。其中着重研究区间型符号数据的定义、基本运算法则、统计量等内容,以及区间型符号数据分析的典型和本文所使用的数据分析工具SODAS2的工作原理及功能。在这之后,文章将对区间型符号数据分析在股票分析中的实际应用展开研究。首先研究区间型符号数据主成分分析在股票分析中的应用。研究目的是将上市公司的众多财务指标归入几个主成分之中,通过分析不同规模的上市公司的主成分数据,分析一定时期内上市公司规模与风险性和收益性的关系,同时分析各财务指标之间的相关性。其次研究区间型符号数据回归分析在股票分析中的应用。研究目的是通过对沪深300指数数据与一系列分类指数,如工业股票指数、地产股票指数数据等进行回归分析,分析各分类指数与沪深300指数的拟合程度和相关性,进而确定各分类股票或金融工具价格趋势与整个A股市场价格趋势之间的相关关系,并据此进行分散投资,降低股票投资风险,提高投资收益。最后研究区间型符号数据聚类分析在股票分析中的应用。本章的研究目的是通过聚类方法,以股票的涨跌幅为观察变量,根据股票具体的表现将一段时间内的众多股票样本划分为若干不同特征的类别,从而为预测股票的未来趋势提供一定的历史依据,帮助投资者进行分散投资,降低风险,并提高收益。