论文部分内容阅读
摘要:本文采用支持向量机与F—F3因子模型结合的方法构建投资组合,并获得了较为显著的收益。在构建投资组合时,首先用支持向量机预测出中国股市所有股票下一天的涨跌情况,然后利用三因子模型对预测上涨的股票进行排序,选取前排名靠前的股票进行持有构建投资组合。从结果来看,全年的累计收益超过了50%,最高时达到120%。远远超过了同一时期上证300的收益。说明支持向量机的方法在股票预测,选股策略构建时是有效的。
关键词:支持向量机;三因子模型
一、引言
中国股票市场从建立至今已经经历了二十多年的发展历程,市场的成熟程度不断提高。越来越多的人们参与到股市的投资中。在参与过程中如何利用既有信息对股票买卖的决策是非常重要的。
虽然在传统金融学的框架下,我们假设市场是有效的,即我们不能从历史价格信息中获得关于股票未来价格趋势的信息,但是从国内外的研究来看,很少有市场是完全符合有效市场的特点的,而且,由于各种金融异象的存在,使得有效市场理论面临许多的挑战。比如动量效应,反转效应,日历效应的存在,都对弱有效市场产生了挑战。这就说明投资者可以利用现有信息在股票市场上获得超额利润。
在本文中,我们利用的支持向量机与传统三因子模型结合的方法来构建投资策略,从结构来单获得的显著的超额收益,说明中国股票市场并不符合弱有效市场的特点。具体文章安排如下:第二部分为理论部分,第三部分为实证部分,第四部分为结论。
二、理论
1、支持向量机的原理
对于给定训练样本集 ,分类学习最基本的思想就是基于训练样本集D在样本空间中找到一个划分超平面,将不同类别的样本分开。但是一般来看,可以把样本分成不同类别的超平面可能不止一个,应该如何进行选择。我们选择分类结果最稳健的那个超平面,即对泛化能力最强的那一个。所以该分类问题就转化为了如下的优化问题:
这就是支持向量机的基本型。 为划分超平的线性方程, 为法向量,b为位移项即决定与原点之间的距离。我们可以通过求解上述规划问题,获得超平面。
在实际工作中,原始样本空间并不总是存在可以正确划分两类样本的超平面。对于这种情况我们的解决办法是,将其映射到一个更高维度的特征空间,使得样本在这个空间线性可分。而且,如果原始靠肩是有限维,即属性有限,那么一定存在一个高维的特征空间使得样本在新的空间内线性可分。为了简化计算过程我们引入了核函数,每一个核函数都隐式的定义了一个特征空间。这就使得核函数的选择变的非常重要,这也成为了支持向量机最大的变数。一般情况下常用的核函数有线性核,多项式核,高斯核,拉普拉斯核等,在本文中我们选取经常用到的高斯核进行计算。并且选取了股票的日收盘价与换手率作为分类特征。
2、三因子模型选股原理
三因子模型是Fama和French提出的,他们在capm模型的基础上加入了市值因子与账市比因子来解释股票市场的超额收益,获得了较为显著的结果。如下:
其中 为市场超额收益率,SMB为市值因子,即小市值相对大市值公司的超额收益率,HML为账市比因子。一般来说我们所获得的超额收益都可以由上面这三个因子来解释,那么在这种情况下,α的长期均值就应该为0,所以如果该值在这段时间中回归结果为负值,那么我们认为该只股票的收益在这段时间内偏低,而根据有效市场的假设,股票市场是一定会回到他的正常状态的,所以其价格在未来必然会上涨。基于这种原理,我们把经过支持向量机算法筛选后的股票全部按照三因子模型进行性回归,然后按照回归结果中的截距项进行有小到大的排序,取前二十只股票做为我们的投资组合。
三、数据选择及结果
1、数据选择
本文的数据全部来自于锐思金融数据库,事件跨度为2010年到2015年六年数据,为了保持数据的完整性,我们提出掉了2010年以后上市的公司的股票,并且出于数据稳定性的考虑我们也剔除了ST开头的公司股票。共得到1503只股票数据。
2、策略构建
在构建策略组合时我们首先将每只股票的數据分成两个部分,2015年1月1日以前的为第一部分是我们的训练集,以后的部分即为测试集。对于每只股票首先用训练集来训练我们的支持向量机模型,然后用训练后的模型,对测试集中的数据进行预测。即用前一天的收盘价与换手率预测下一天的涨跌,对于每天的股票只保留预测为涨的,然后用三因子模型对每只股票的数据进行回归,将每天预测为涨的股票利用回归后的阿尔法截距项按照从小到大的顺序进行排序,保留前二十只股票作为每日的股票池进行持仓,每天按照此种方法进行调仓。每日组合的收益即为策略的收益。
3、结果
如上图所示,为策略组合收益与沪深300指数的对比图,从图中可以看出策略组合的收益远远超过了沪深300指数的收益。
表一为策略组合每日收益的统计数据,根据表中数据可以看出策略组合的每日平均收益为0.26%,并且p值为0.0005,说明均值显著大于零。从此可以看出,策略组合的收益是显著的。
表二为策略组合的累计收益的统计数据,从表中可以看出,策略组合的累计收益最高时可以达到126.9%,并且年终的累计收益也达到了56.6%。
2、结果分析
从以上的结果可以看出本次构建的投资组合可以获得显著的收益,说明支持向量机在股票预测方面是有效的,另一方面也间接的说明了,中国股票市场并不符合弱有效市场的特征,投资者可以通过挖掘历史价格信息而预测未来股票的价格。
四、结论
通过以上的分析,我们找到了一种通过支持向量机进行选股的策略并获得了显著的收益,并且显著高于沪深300股票指数。所以我们可以看到将支持向量机运用于股票收益的预测可以获得显著的结果。
参考文献:
[1]陈蓉,陈焕华,郑振龙.动量效应的行为金融学解释[J].系统工程理论与实践,2014,(3):613~622.
[2]陈卓思,宋逢明.图形技术分析的信息含量[J].数量经济技术经济研究,2005,(9):73~82.
作者简介:任正红(1991—),男,山西忻州人,山西财经大学2016(金融工程)学术硕士研究生,研究方向:金融资产定价.
关键词:支持向量机;三因子模型
一、引言
中国股票市场从建立至今已经经历了二十多年的发展历程,市场的成熟程度不断提高。越来越多的人们参与到股市的投资中。在参与过程中如何利用既有信息对股票买卖的决策是非常重要的。
虽然在传统金融学的框架下,我们假设市场是有效的,即我们不能从历史价格信息中获得关于股票未来价格趋势的信息,但是从国内外的研究来看,很少有市场是完全符合有效市场的特点的,而且,由于各种金融异象的存在,使得有效市场理论面临许多的挑战。比如动量效应,反转效应,日历效应的存在,都对弱有效市场产生了挑战。这就说明投资者可以利用现有信息在股票市场上获得超额利润。
在本文中,我们利用的支持向量机与传统三因子模型结合的方法来构建投资策略,从结构来单获得的显著的超额收益,说明中国股票市场并不符合弱有效市场的特点。具体文章安排如下:第二部分为理论部分,第三部分为实证部分,第四部分为结论。
二、理论
1、支持向量机的原理
对于给定训练样本集 ,分类学习最基本的思想就是基于训练样本集D在样本空间中找到一个划分超平面,将不同类别的样本分开。但是一般来看,可以把样本分成不同类别的超平面可能不止一个,应该如何进行选择。我们选择分类结果最稳健的那个超平面,即对泛化能力最强的那一个。所以该分类问题就转化为了如下的优化问题:
这就是支持向量机的基本型。 为划分超平的线性方程, 为法向量,b为位移项即决定与原点之间的距离。我们可以通过求解上述规划问题,获得超平面。
在实际工作中,原始样本空间并不总是存在可以正确划分两类样本的超平面。对于这种情况我们的解决办法是,将其映射到一个更高维度的特征空间,使得样本在这个空间线性可分。而且,如果原始靠肩是有限维,即属性有限,那么一定存在一个高维的特征空间使得样本在新的空间内线性可分。为了简化计算过程我们引入了核函数,每一个核函数都隐式的定义了一个特征空间。这就使得核函数的选择变的非常重要,这也成为了支持向量机最大的变数。一般情况下常用的核函数有线性核,多项式核,高斯核,拉普拉斯核等,在本文中我们选取经常用到的高斯核进行计算。并且选取了股票的日收盘价与换手率作为分类特征。
2、三因子模型选股原理
三因子模型是Fama和French提出的,他们在capm模型的基础上加入了市值因子与账市比因子来解释股票市场的超额收益,获得了较为显著的结果。如下:
其中 为市场超额收益率,SMB为市值因子,即小市值相对大市值公司的超额收益率,HML为账市比因子。一般来说我们所获得的超额收益都可以由上面这三个因子来解释,那么在这种情况下,α的长期均值就应该为0,所以如果该值在这段时间中回归结果为负值,那么我们认为该只股票的收益在这段时间内偏低,而根据有效市场的假设,股票市场是一定会回到他的正常状态的,所以其价格在未来必然会上涨。基于这种原理,我们把经过支持向量机算法筛选后的股票全部按照三因子模型进行性回归,然后按照回归结果中的截距项进行有小到大的排序,取前二十只股票做为我们的投资组合。
三、数据选择及结果
1、数据选择
本文的数据全部来自于锐思金融数据库,事件跨度为2010年到2015年六年数据,为了保持数据的完整性,我们提出掉了2010年以后上市的公司的股票,并且出于数据稳定性的考虑我们也剔除了ST开头的公司股票。共得到1503只股票数据。
2、策略构建
在构建策略组合时我们首先将每只股票的數据分成两个部分,2015年1月1日以前的为第一部分是我们的训练集,以后的部分即为测试集。对于每只股票首先用训练集来训练我们的支持向量机模型,然后用训练后的模型,对测试集中的数据进行预测。即用前一天的收盘价与换手率预测下一天的涨跌,对于每天的股票只保留预测为涨的,然后用三因子模型对每只股票的数据进行回归,将每天预测为涨的股票利用回归后的阿尔法截距项按照从小到大的顺序进行排序,保留前二十只股票作为每日的股票池进行持仓,每天按照此种方法进行调仓。每日组合的收益即为策略的收益。
3、结果
如上图所示,为策略组合收益与沪深300指数的对比图,从图中可以看出策略组合的收益远远超过了沪深300指数的收益。
表一为策略组合每日收益的统计数据,根据表中数据可以看出策略组合的每日平均收益为0.26%,并且p值为0.0005,说明均值显著大于零。从此可以看出,策略组合的收益是显著的。
表二为策略组合的累计收益的统计数据,从表中可以看出,策略组合的累计收益最高时可以达到126.9%,并且年终的累计收益也达到了56.6%。
2、结果分析
从以上的结果可以看出本次构建的投资组合可以获得显著的收益,说明支持向量机在股票预测方面是有效的,另一方面也间接的说明了,中国股票市场并不符合弱有效市场的特征,投资者可以通过挖掘历史价格信息而预测未来股票的价格。
四、结论
通过以上的分析,我们找到了一种通过支持向量机进行选股的策略并获得了显著的收益,并且显著高于沪深300股票指数。所以我们可以看到将支持向量机运用于股票收益的预测可以获得显著的结果。
参考文献:
[1]陈蓉,陈焕华,郑振龙.动量效应的行为金融学解释[J].系统工程理论与实践,2014,(3):613~622.
[2]陈卓思,宋逢明.图形技术分析的信息含量[J].数量经济技术经济研究,2005,(9):73~82.
作者简介:任正红(1991—),男,山西忻州人,山西财经大学2016(金融工程)学术硕士研究生,研究方向:金融资产定价.