基于主成分分析和支持向量机的股价涨幅分类预测研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xieshanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票价格的趋势预测一直以来都是金融领域和学术界广泛研究的课题,股价的涨跌直接体现了投资者资产的变化,若能较好地预测股价的涨幅,就可以为投资者提供一定程度上的辅助决策。支持向量机主要用于分类问题和回归分析,具有良好的统计理论基础,主成分分析法可以提取主要原始信息,甚至可以实现样本的最优压缩,PCA-SVM模型不改变样本分布特性,还可以提高运算速度。银行业的发展与国家经济状况密不可分,在证券市场比较有代表性,论文选择银行板块的股票进行股价涨幅分类预测分析。在西南证券电脑客户端,同花顺电脑客户端和优矿证券数据库下载2019年8月20日到2020年2月21日共121期股票数据。进行聚类分析时以公司相关财务指标为主,便于反映公司经营状况;进行预测时以交易指标数据为主,便于掌握股价动向。以R软件为平台采用自编程序结合相关包的调用进行数据分析,研究主要工作有:第一在指标的选择中加入开盘、尾盘、超大单、主力净资金情况,紧跟主力动向,抓住股票动态变化;第二用加权主成分聚类方法对银行板块股票进行聚类分析,便于探索和认识各股票之间的关联;第三根据各股票价格的涨幅分布情况对股价涨幅进行分类,在分类标签中添加振荡类别作为上涨和下跌的缓冲区间;第四从聚合得到的四个类别中各选取一只股票,运用主成分支持向量机方法构造分类模型,利用网格搜索法结合交叉验证法寻找最优参数,得到分类模型。根据模型预测结果显示,招商银行和建设银行的投资成功率为85.37%和87.8%,经过组合模型预测后郑州银行和江阴银行的投资成功率为76.92%和80.77%,PCA-SVM模型与神经网络和费歇尔判别方法相比效果更佳,平均投资成功率超过了80%,说明此类预测模型和方法的预测效果较好,也体现了模型在银行板块股价涨幅分类预测的优越性能。
其他文献
在企业的经营管理中,汇率风险已经成为其面对的主要风险之一。“811汇改”拉开了新一轮人民币汇率形成机制改革的帷幕,人民币兑美元汇率从持续升值转为阶段性贬值。人民币汇率波动对中国企业究竟有何影响?企业汇率风险对冲策略有哪些?其效果如何?这些问题对于深入理解人民币汇率波动的影响机制,分析汇率波动对我国进出口和经济发展的影响,完善我国跨国公司的汇率风险管理具有重要意义。在此背景下,本文考察了海尔智家的人
随着大数据时代的到来,通过数据挖掘获取信息已经成为常态,然而我们获取的数据大多数情况下都是含有缺失值的,也就是说数据是不完整的。然而很多统计方法在做数据分析时,都需要完整数据才能研究。数据缺失普遍发生在各个研究领域中,对缺失数据的处理已经不能局限于忽略或者直接删除,数据插补法逐渐活跃起来。本文主要探讨的是多种插补方法对于分类型缺失变量和连续型缺失变量的插补效果。在探究分类缺失变量的插补方法时,首先
AR教学资源呈现的知识立体化、多样化,其交互性也让学习者可以从中理解、探索知识,被越来越多的教师应用于日常教学中。初中地理知识涵盖面广,抽象的知识是学生理解的难点。本研究结合AR教学资源与初中地理教材内容进行教学设计,并在教学中实践,探究AR教学资源和初中地理教学的整合方式与效果。本论文通过文献研究法梳理了AR资源在教育中的研究现状。以建构主义学习理论等为指导,对课程目标、课程内容和学习者的特征进
数学解题在高中生数学学习中发挥着重要作用,通过对学生数学解题的深入观察了解,发现高中生在数学解题中有如下问题:解题时没有计划、没有方向、解题思路单一、容易犯相同的错误等。而这些都和学生的元认知相关,发展学生的数学学科自我监控能力是数学教学的一个核心问题。因此,本研究将自我监控能力与数学解题相结合,以调查问卷为基础分析高中生数学解题自我监控能力的现状、影响因素以及优化建议。首先,对国内外有关元认知、
随着我国经济的快速发展,生态环境问题也日益突出,尤其是在农业领域。由于农业领域的长时间粗放管理,环保意识不足等原因,农业领域之中产生了诸多生态环境问题,逐渐成为我国农业进一步发展的瓶颈。在农业生态环境治理方面,我国政府也在不断加大政策力度,尝试新的政策工具与方法。中共十六届五中全会,我国政府首次提出“按照谁开发谁保护、谁受益谁补偿的原则,加快建立生态补偿机制”,自此我国生态补偿政策作为强有力的生态
样本量的确定是实施抽样调查或者医学临床试验等统计实践的基础工作,合理的样本量既能保证调查或者试验结果的可靠性与准确度,同时能控制调查或试验的费用和成本,在确保试验可信性以及资源节约等方面起着尤为重要的作用。Logistic回归模型在临床医学和药物研发等领域应用广泛。本文针对该模型的样本量计算问题,结合多种不同的信息,给出相应的样本量计算理论,并推导对应的公式。在简要介绍经验法的基础上,详细讨论了公
2019年4月4日,教育部启动实施一流本科专业“双万计划”,旨在通过加增“一流学院”“一流专业”建设,促进我国高等教育从“跟跑着”向“引领者”转变,亦使我国一流本科教育的改革与发展进入实质性阶段。在此背景下,以研究性学习理念为导向的突出学生为中心、学生能力发展为要点、突破了原有的以有组织的定量评价以及刚性逻辑为主的主题框架,重视具有多维度、多层次的过程导向的改革成为高等教育内涵式发展的关键与重点。
随着银保监会陆续公布批准设立的地方资产管理公司名单,以及中美双方签署第一阶段经贸协议,中国将允许美国金融服务供应商申请资产管理公司许可证,除四大国有金融资产管理公司之外的地方资产管理公司、民间投资者、外资机构纷纷向传统不良资产进军,逐鹿万亿不良资产市场。资金的涌入,造就了一个个高价格的资产包,提高了银行出包的底价。作为承接银行一级市场包的资产管理公司等投资者,科学地进行不良资产商业化收购定价,是持
供应链金融以真实交易信息为依据,以核心企业信用为背书,对破解中小企业融资难融资贵问题具有重要意义。2017年10月国务院办公厅发布《关于积极推进供应链创新与应用的指导意见》明确指出“积极稳妥发展供应链金融,推动供应链金融服务实体经济。”“研究利用区块链、人工智能等新兴技术,建立基于供应链的信用评价机制”。平安银行作为我国首个开展供应链金融业务的银行,在“科技引领”的转型背景下,积极响应国家政策,通
随着网络越来越发达,以及信息技术越来越完善,人们实现了“在家不出门,便知天下事”的信息自由。接踵而来的不再是信息稀缺的问题,而是如何处理超出人们可以人为方便处理的数据量的问题。对于电影行业来说也面临着同样的问题,自从Netflix利用其3000万付费用户的数据制作《纸牌屋》(House of Cards)以来,大数据一直在发挥着重要作用。推荐系统就是解决这一问题的有效方法,可以帮助片方便捷地找到目