论文部分内容阅读
摘 要:在数学方法百出的今天,选择合适的模型对经济問题进行分析,往往可以通过剖析已有数据,在已有数据的基础上,得出最优方案解。在本文中我们通过主成分分析法讨论股票,在网络爬取的数据下,将数据分为几种因素,每个因素从某一方面反映了股票的变化情况,要综合多个影响因素评价指标进行分析。使用主成分分析法对股票数据进行分析,进而得出最优方案。
关键词:主成分分析法;MATLAB;最优选择
0引言
目前,中国市场交易制度、信息披露制度和证券法规等配套制度体系已经建立起来,投资者日趋理性和成熟,机构投资者迅速发展已具规模,政府对证券市场交易和上市公司主体行为的监管已见成效[1]。近年来我国资本市场的发展和证券交易规模不断扩大,越来越多的资金投资于证券市场,与此同时市场价格的波动也十分剧烈,而波动作为证券市场中最本质的属性和特征,市场的波动对于人们风险收益的分析、股东权益最大化和监管层的有效监管都有着至关重要的作用,因此研究证券市场波动的规律性,分析引起市场波动的成因,是证券市场理论研究和实证分析的重要内容,也可以为投资者、监管者和上市公司等提供有迹可循的依据。所以本文对引起市场波动的几个成因进行分析,得出最优方案。
1 数据选择
本文数据我们从网上随机爬取,测试模型的可行性。
选取对股票波动的几个影响因子:开盘价格、最高价格、最低价格、收盘价格、成交量。选好数据后,要对原始数据进行标准化变换。下文有提到。
2 主成分分析模型的建立与求解
2.1主成分分析法的基本思想
主成分分析是将原来许多个有一定相关性的指标重新组合成一组新的互相无关的综合指标。在分析过程中,我们应从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息。
2.2主成分分析模型的建立
(1)确定分析变量,搜集数据资料。
(2)对原始数据进行标准化变换。
原始数据标准化是为了消除由于量纲的不同可能带来一些不合理的影响。
标准化后的自变量为
式中:X’ij为原始矩阵X0中变量Xij经标准化后的第i个样本的第j个变量的数据;Mj和Sj分别为第j个变量的算术平均值和标准差。
(3)计算原始观测样本数据矩阵X经标准化变换后的协方差矩阵R,计算式为
(4)计算协方差矩阵R的特征值矩阵L和特征向量A,计算式为
(5)根据特征值矩阵L和特征向量矩阵A分别计算变量的主成分贡献率及累计贡献率。由累计贡献率的大小来判定主成分的个数。贡献率和累计贡献率的计算式分别为
(6)根据确定主成分替代原始数据[2]。
(7)对m个主成分进行综合评价
对m个主成分进行加权求和,记得最终评价值。权数为每个主成分的方差贡献率[3]。
2.3主成分分析模型的求解
由于各股票的开盘收盘最高最低价格中不存在夸张的极值,所以用平均值来代表样本比较合理。
(1)计算出样本相关系数矩阵
(2)计算相关系数矩阵R的特征值和相应的特征向量[4]。
(3)最终结果
3 总结
根据上表情况,可知在主成分分析法之后,总得分前三的是第九支股票、第十支股票和第三支股票。当然数据的选择也对结果有很大的影响,因此要考虑好对方案的几个最佳影响因子,得出最佳方案解。
参考文献:
[1]赵纯.我国政策市的制度性成因探讨[J].商业时代,2010,(27):49-50,82. DOI:10.3969/j.issn.1002-5863.2010.27.027.
[2]卓鹏宇.基于时间序列分析的股票趋势预测模型研究[D].浙江:浙江工业大学,2016.
[3]郑意,宋述刚.我国主要地区(城市)水质污染情况的主成分分析[J].科学与财富,2010,(11):27-28.
[4] 李亚慧,高仲芳,姚文静, 等.基于主成分分析法的上海原油期货价格波动研究[J].统计学与应用,2020,9(03):377-385. DOI:10.12677/SA.2020.93040.
作者简介:
黎涵予(2000-),男,汉,四川省内江市,本科,研究方向:飞行器适航技术
邵振东(2001-),男,汉,河北省邯郸市,本科,研究方向:飞行器适航技术
张子涵(2000-),女,汉,山东省泰安市,本科,研究方向:工程造价
袁玉(2001-),女,汉,四川省宜宾市,本科,研究方向:食品质量与安全
(西华大学 四川 成都 610039)
关键词:主成分分析法;MATLAB;最优选择
0引言
目前,中国市场交易制度、信息披露制度和证券法规等配套制度体系已经建立起来,投资者日趋理性和成熟,机构投资者迅速发展已具规模,政府对证券市场交易和上市公司主体行为的监管已见成效[1]。近年来我国资本市场的发展和证券交易规模不断扩大,越来越多的资金投资于证券市场,与此同时市场价格的波动也十分剧烈,而波动作为证券市场中最本质的属性和特征,市场的波动对于人们风险收益的分析、股东权益最大化和监管层的有效监管都有着至关重要的作用,因此研究证券市场波动的规律性,分析引起市场波动的成因,是证券市场理论研究和实证分析的重要内容,也可以为投资者、监管者和上市公司等提供有迹可循的依据。所以本文对引起市场波动的几个成因进行分析,得出最优方案。
1 数据选择
本文数据我们从网上随机爬取,测试模型的可行性。
选取对股票波动的几个影响因子:开盘价格、最高价格、最低价格、收盘价格、成交量。选好数据后,要对原始数据进行标准化变换。下文有提到。
2 主成分分析模型的建立与求解
2.1主成分分析法的基本思想
主成分分析是将原来许多个有一定相关性的指标重新组合成一组新的互相无关的综合指标。在分析过程中,我们应从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息。
2.2主成分分析模型的建立
(1)确定分析变量,搜集数据资料。
(2)对原始数据进行标准化变换。
原始数据标准化是为了消除由于量纲的不同可能带来一些不合理的影响。
标准化后的自变量为
式中:X’ij为原始矩阵X0中变量Xij经标准化后的第i个样本的第j个变量的数据;Mj和Sj分别为第j个变量的算术平均值和标准差。
(3)计算原始观测样本数据矩阵X经标准化变换后的协方差矩阵R,计算式为
(4)计算协方差矩阵R的特征值矩阵L和特征向量A,计算式为
(5)根据特征值矩阵L和特征向量矩阵A分别计算变量的主成分贡献率及累计贡献率。由累计贡献率的大小来判定主成分的个数。贡献率和累计贡献率的计算式分别为
(6)根据确定主成分替代原始数据[2]。
(7)对m个主成分进行综合评价
对m个主成分进行加权求和,记得最终评价值。权数为每个主成分的方差贡献率[3]。
2.3主成分分析模型的求解
由于各股票的开盘收盘最高最低价格中不存在夸张的极值,所以用平均值来代表样本比较合理。
(1)计算出样本相关系数矩阵
(2)计算相关系数矩阵R的特征值和相应的特征向量[4]。
(3)最终结果
3 总结
根据上表情况,可知在主成分分析法之后,总得分前三的是第九支股票、第十支股票和第三支股票。当然数据的选择也对结果有很大的影响,因此要考虑好对方案的几个最佳影响因子,得出最佳方案解。
参考文献:
[1]赵纯.我国政策市的制度性成因探讨[J].商业时代,2010,(27):49-50,82. DOI:10.3969/j.issn.1002-5863.2010.27.027.
[2]卓鹏宇.基于时间序列分析的股票趋势预测模型研究[D].浙江:浙江工业大学,2016.
[3]郑意,宋述刚.我国主要地区(城市)水质污染情况的主成分分析[J].科学与财富,2010,(11):27-28.
[4] 李亚慧,高仲芳,姚文静, 等.基于主成分分析法的上海原油期货价格波动研究[J].统计学与应用,2020,9(03):377-385. DOI:10.12677/SA.2020.93040.
作者简介:
黎涵予(2000-),男,汉,四川省内江市,本科,研究方向:飞行器适航技术
邵振东(2001-),男,汉,河北省邯郸市,本科,研究方向:飞行器适航技术
张子涵(2000-),女,汉,山东省泰安市,本科,研究方向:工程造价
袁玉(2001-),女,汉,四川省宜宾市,本科,研究方向:食品质量与安全
(西华大学 四川 成都 610039)