结合财务指标和技术指标的股票预测实证研究

来源 :科技风 | 被引量 : 0次 | 上传用户:xumeg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  关键词:股价涨跌;机器学习;实证研究;XGBoost
  一、文献综述
  与传统时间序列模型相比,机器学习模型对数据没有严格的假设条件,受到研究者的喜爱。王燕基于參数寻优后的XGBoost模型对中国平安等股票收盘价的短期预测在多个评价指标上较SVM模型和GBDT模型有更好的效果。王禹利用boosting级联多棵决策树算法预测仪器仪表领域的股票涨跌走势,结合股票的行情指标和技术指标,预测结果对比单一决策树的预测准确率有明显的提升。王亚红利用随机森林算法基于12个财务指标对随机选取的股票价格预测的准确率超过70%。何铮认为任何单一因素都难以完全解释股票价格水平和波动,通过结合基本面因素和技术面因素作为输入特征构建股价模型,可以获得较好的预测能力。
  二、模型分析
  (一)数据处理和指标选择
  量化投资特征选取一般分成基本面指标和技术指标两大类。基本面指标主要由盈利因子、成长因子、流动性因子、估值因子和品质因子等组成。盈利因子技术指标主要有趋势因子、均线因子和交易因子。通过查阅相关文献最终在基本面指标和技术指标两大类指标中选取了12个基本面指标、25个技术指标。部分指标如表1所示。
  将去除缺失值后的股票数据的所有特征进行标准化处理,以消除不同量纲带来的影响。
  (二)模型理论概述
  本文是对股票价格涨跌标签进行预测,所以选择监督学习里面的二分类学习算法。接下来对逻辑回归、决策树和XGBoost算法模型设置为二分类有关的内容。
  1.机器学习算法理论
  (1)逻辑回归。逻辑回归是一种主要用于分类的统计分析方法。通过引入sigmoid函数得到逻辑回归表达式:
  将上式对数变换后,通过极大似然估计得到其损失函数:
  (2)决策树。决策树通常只有一个根节点,是所有训练数据集合。测试实例中的某一属性,依据不同的测试结果进
  (3)XGBoost。XGBoost是一种基于树模型的Boosting集成算法。其特点是逐一构建弱评估器,经过多次迭代逐渐累积多个弱评估器。XGBoost的目标函数构成如下所示:
  2.模型评价标准
  模型的评价标准是检验模型有效性的重要指标。混淆矩阵如表2所示:
  准确率指所有的预测正确(包括正例负例)的所占比重。精准度指所有被预测为正例中实际为正例的概率。召回率指实际为正例且被预测为正例的概率。
  (三)模型的预测与评价
  实验一:使用个股2015年1月5日至2019年6月28日作为训练期,2019年7月1日至2019年12月10日为测试期。将未来第15天的收盘价减去当天的收盘价,若大于0,标签记为1;若小于0,标签记为0。A组以12个财务指标和25个技术指标作为输入特征,以股票收盘价的涨跌作为预测对象分别建立逻辑回归、决策树和XGBoost模型。以准确率、精准度和召回率作为模型的评价指标。为了形成对比,B组除了将输入特征改为25个纯技术指标,其他与A组类似。评价指标结果如表3所示。
  实验二:c组以12个财务指标和25个技术指标作为输入特征,分别对另外四只A股收盘价的涨跌作为预测对象建立模型。D组除了将输入特征改为25个纯技术指标,其他与c组类似。评价指标结果如表4所示:
  (四)模型结果分析
  实验一中除逻辑回归模型以外,A组中决策树和XGBoost模型分别比B组中对应的模型的准确率降低了近3%。B组决策树模型的精准度比A组降低了近4%。A组中XGBoost模型召回率比B组提高了26%,通过分析实验一的结果说明了加入财务指标后模型的优良性。
  为了验证输入特征以财务指标和技术指标相结合的有效性设计实验二,对比实验二中的c组和D组结果,四只股票的各个预测模型在D组中的准确率较c组都有一定的降低,除了股票1在决策树模型上有不明显的提高,但在逻辑回归和XGBoost模型上预测的准确率分别降低了约30%和20%。其他三只股票,在模型上的预测准确率均出现一定程度降低。进一步说明加入财务指标后的股票预测模型的有效性。
  三、结论与建议
  本文结合财务指标和技术指标,对股票价格涨跌建立一种短中期预测模型。从以上实验得出:第一,以财务指标和技术指标作为输入特征,模型的预测准确率均超过50%,体现了模型的可靠性和股票市场的可预测性;第二,剔除财务指标的模型的预测精度会发生明显的降低,进一步验证同时选取两类指标作为模型输入特征的有效性,为广大投资爱好者提高更有价值的参考。
其他文献
关键词:馈线分段;配网转供;转供策略  配电网在电力系统中起到了至关重要的作用,其连接了电力系统与用户两部分,并且负责向用户供应与分配电能,关系着用户供电质量。在供电事故中,其中由配电网故障导致的停电可以占到所有停电故障的80%左右,由此可见,想要提高用户供电质量,就必须要对配网供电方式进行调整优化。配网转供的作用是在配电网故障且隔离完成后,通过开关操作和部分负荷切除等方式,在安全约束的条件范围内
衰老相关分泌表型(SASP)是细胞衰老后分泌的一系列炎症细胞因子、趋化因子、生长因子和蛋白酶,与多种生理过程和衰老相关疾病密切相关,是细胞衰老的特征.SASP与干细胞、成纤
高职院校的环境与校园文化建设是高职学生培养健康心理、良好人格的重要保障,因此高职院校的环境与校园文化关系到高职院校的软实力以及知名度.面对大部分的高职院校只是简单
关键词:毕业设计;产品化;创新创业教育;融合  一、绪论  近年来,我国高职院校创新创业教育取得了明显成效,但并未真正将创新创业教育融入整个人才培养体系,创新创业课程体系中以普及创新创业基础知识的课程为主,与学生所学的专业结合不紧密,学生基于专业的创业成功率不高,出现了创新创业教育与专业教育“两张皮”的状况。  毕业设计是高职创新创业教育与专业教育融合的重要载体和平台之一,却也是当前高职教育教学薄
通过对榆林职业技术学院化学工程系、机电工程系、管理工程系、师范教育系、矿业工程系共5个系部部分学生的专升本意愿调查研究,发现目前在专升本学生群体中仍然存在一系列问
关键词:高职院校;会计专业;职业能力;高职学生  职业教育背景下,要求高职院校充分发挥供给侧作用,基于会计专业学生实际,制订完善的人才培养计划,优化人才培养环节,将提升会计专业学生应用能力、创业就业能力作为职业能力提升的核心。因此,相关高职院校要提高对会计专业学生职业能力培养的重视程度,基于课程体系改革、核心素养、实践操作能力等方面,促使会计专业学生全面发展,更好满足社会实际岗位需求。  一、高职
关键词:双万计划;双一流;中西部高校;发展机遇  在全国教育大会上,习近平总书记明确阐述了教育对于国家繁荣昌盛、民族伟大复兴、社会快速发展、百姓安居乐业的意义、重要性以及必要性,积极肯定了教育的全局性作用与先导性地位,将教育在国家建设中的地位与作用提升到一个历史新高度。  为实现“两个一百年”的战略目标,实现教育现代化。在2015年,中共中央联合国务院颁发了《统筹推进世界一流大学和一流学科建设总体
关键词:余热余压余气;冷却;回收;发电  在我国社会经济水平不断提升、飞速发展的进程中,各类能源资源的消耗量也不断递增,存在愈发凸显的能源供需矛盾问题,节能降耗作为了钢铁企业在未来生产发展中的侧重方向。钢铁企业作为我国传统流程制造业,更作为我国国民经济基础型企业,同时也作为耗能大户,能源消耗占比达我国工业领域所有消耗总量的15%,但是仅仅有30%~50%能源得以利用。随着钢铁节能技术的不断发展,也
关键词:港口;电气设备;卸船机;PLC;教学模型  一、控制系统硬件部分  为贴合卸船机本身电控系统结构,模型采用与卸船机电控系统相同的主控PLC型号及配套输入输出模块、通信功能。使用ABB公司AC800M系列主控PLC,利用以太网端口进行编程操作。通过Profibus通信方式实现与各分站模块C1801以及输入输出模块D1801、D0802等功能硬件的通信功能。动力部分采用24VDC电机,配合直流
当前全国各地的科技馆展品中很少有真正具备创意性的展品出现,大多是更换包装或操作流程就直接展出,因此大众很难对科技馆的展品产生兴趣,为解决这个问题对国内科技馆展品设