基于机器学习分类算法的新股开板当日再封板预测及策略应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:s362613932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究在系统性地综述了国内外量化投资发展状况与机器学习分类算法在量化投资应用研究成果的基础上,着重阐述了BP神经网络、随机森林、支持向量机三种监督性分类算法的概念与原理,结合2014年年初以来我国A股市场新股上市之后所呈现的连续一字涨停板现象,首创性地将各分类算法应用于预测新股开板后当日能否再次封住涨停板的应用场景中;在界定了具有“IPO后打开一字涨停板当天能够重新封住涨停板”特征的新股样本作为分类预测对象的同时,较为深入地结合了股市基本面分析框架,选择了上市公司的规模、估值、盈利等自身的特质变量以及市场或行业热度及风格转换等不同维度与类型的外部市场变量构建了七个样本输入特征对各分类模型进行了监督性训练及参数优化,筛选出了三种算法在本研究情境下的最优参数模型,构建了一套完整的基于这三个分类预测模型的新股开板后博求再封板的短期交易策略,并对不同参数维度下的新股交易策略进行了样本内回溯测试与样本外模拟交易测试,主要得出了以下几点结论与新股短期交易建议:1.从交易策略的标的选择上看,若不对打开一字涨停板的新股进行一定的过滤而直接对所有新股在打开涨停板后均进行短期追多投机交易,从长期来看是一个大概率会造成净值亏损的交易策略,而若能够有效地筛选出本研究所界定的“在打开涨停板当日能够再次封住涨停板”特征的新股且仅对这部分新股进行短期追多交易,则能够获得较高的收益风险比。2.对于任意新股,买入后不宜持有过长时间,在1-3个交易日内选择股价高点进行择机卖出该新股是较为合理的操作方案。3.三个模型预测表现方面,最优参数下的随机森林对样本内与样本外的预测准确度皆为三者中最高,具有良好的抗过拟合特性。在犯错误预测类型方面,最优参数下的随机森林犯“弃真”错误的概率显著低于支持向量机与BP神经网络,而最优参数下的支持向量机犯“取伪”错误的概率则显著低于随机森林与BP神经网络。4.在本研究构建的7个特征变量中,“开板前所属行业热度”、“开板前所属指数板块热度”以及“招股说明书中的业绩预告”等变量对分类预测的方差贡献度较高,其余变量则相对较低。
其他文献
引言rn便携式消费类电子产品小型化的趋势继续在业界发展,随之而来的便是电池及其相应容量可用空间不断下降.同时,开发商业上可行的、能量密度更高从而补偿电池空间降低的电
当你的目光投射到它身上,视线会不由自主地随着它的曲线移动;当你抚摸在它身上,似乎能感受到工匠们的手留下的温度;而当你真正驾驶它飞奔在阳光下的海岸线上,你才会懂得光阴
戴姆勒·克莱斯勒东北亚地区2007年第一季度轿车销量增长13%梅赛德斯-奔驰2007年第一季度在中国市场(包括香港)的销量为6800辆,同比增长16%;第一季度S级轿车在中国市场以3000
期刊
采用水热法合成Bi_2Te_3粉体,将炭黑(CB)与其掺杂制备不同比例的碲化铋/炭黑(Bi_2Te_3/CB)复合材料,研究复合材料的热电性能。同时采用TGA、SEM、XRD等分析方法表征Bi_2Te_3/
奔驰AMG的4款新车在中国发布之前,我的邮箱里先收到了来自公关部门这样的邮件:“请您务必留意,奔驰的AMG产品不是奔驰的专业改装品牌,是奔驰产品的高性能版本。”不过如此郑
闼读是人类认知世界的最基本方法,更是语文教学的重要内容之一.通过阅读教学,可以培养学生的阅读能力,使之掌握阅读的策略.文章吸收了相关的先进理念,对小学语文阅读展开研究
林西县地处巴林右旗左邻,西拉沐沦河北部,该地区林西组地层出露广且厚度大.本文主要以林西组第四段为研究对象,通过野外的路线实测和地质调查相结合,对该段的沉积特征和古生
小额贷款公司自2008年在全国范围内开展试点工作以来,无论是公司数量、从业人员数,还是实收资本都得到了迅速发展。近年来,受经济结构调整和金融市场发展的影响,小额贷款公司行业
该校是以现代信息技术为支撑、以体系办学为特色、以终身教育为目标的开放式大学,为国防科技工业职业技术教育开辟了一条新路云南国防工业职业技术学院是一所由云南国防工业
本期封面所用肖像画的作者是西班牙画家格列柯(El Greco,1541-1614),他的原名长而绕口,“格列柯”是其艺名,意为“希腊人”;有时他还喜欢在此艺名前加上个克里斯(Kres),表明