基于量化投资角度的多因素模型投资综合策略

来源 :中国集体经济 | 被引量 : 0次 | 上传用户:luck_chiachang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文章运用量化投资策略思想,通过数学、计算机软件、统计学等学科的综合运用,量化出股票价格走势的大致曲线,对股票的未来价格走势做出大致的预测,使人们的投资思想得以实现,并取得超越市场平均水平的收益率,即战胜市场。在当前中国的无效市场,或弱有效市场的背景下,文章通过数量化的方式,结合各个学科的知识,从一定程度上是可以取得超额收益的。文章基于这样的一个理念展开了相关的逻辑推理,并使用各种科学方法,通过计算机软件实现我们的投资策略。
  关键词:量化投资;多因素模型;投资策略
  一、研究方法
  本报告的量化投资策略所采用的方法有以下几种:线性回归;多因素模型;资本资产定价模型;假设检验与置信区间估计;蒙特卡洛模拟;风险价值方法;Matlab技术。主体内容主要分为四大部分。
  第一、模型建立阶段,选择股票收益率的相关因素。然而,并不是所有的因素都需要被考虑,因为影响股票收益率的主要因素在各個上市公司之间有所不同,本文通过量化的方法选出合适的、符合每个公司自身特点的收益率的因素,并建立多因素模型,得出影响个股收益率的方程,对个股的未来收益做出预期判断。
  第二、主要是挑选出收益率靠前的股票,并运用CAPM模型组合搭配,来剔除非系统性风险,使股票收益达到最大化。
  第三、采用统计学的知识,对上述建立的模型的相关参数进行范围上与概率上的估计,对股票的风险与收益做出客观的评判。
  第四、模型评价阶段,即对该模型做出全面的解释,包括如何进行实际的投资以及模型的不足之处,并力求改正。
  二、策略步骤
  (一)模型建立阶段
  1. 影响收益率的因子初选。
  本文采用以下收益率因子。
  估值因子:账面市值比、盈利收益率、PEG、股息率、现金收益率
  成长因子:ROE、ROA、EPS增长、主营收入增长率、收入净利率、再投资率
  资本结构因子:资产负债率、固定资产比例、流通市值
  技术面因子:12个月动量、1个月反转、换手率、换手率变动、震动指标
  以上影响收益率的四大类因子,较好地包括了影响收益率的主要因素。虽然从宏观层面上我们挑选出了一些影响收益率的主要因子,然而,在现实过程中,影响某个具体公司收益率的因素很可能只是其中某几个。比如,一家交易农产品的公司可能会对天气、环境比较敏感,而一家钢铁生产公司则对天气的敏感程度要低。因此,基于这样的一个理念,应当试图找出影响每个股票的收益率的个别关键因素,这里采用matlab技术以及线性回归的方法,以融捷股份(002192)与暴风科技(300431)为例进行说明。
  将深圳证券交易所统计的数据导入到matlab中,以市盈率为横轴、收益率为纵轴,建立图形关系后,进而在matlab得到两组数据的相关系数。运行的结果如下:
  Cor =1.0000 0.3056
  0.3056 1.0000
  R2 =1.0000 0.0934
  0.0934 1.0000
  从上述运行结果可知,市盈率与股票收益率之间的R2只有0.0934,远小于1,因此市盈率这一项指标在融捷股份里并不能对收益率的变动起到决定性作用。真实点与估计的曲线的偏离程度较大,线性关系并不十分明显。
  类似地,我们建立暴风科技公司的股票市盈率与收益率的图像, 通过matlab作图,可得相关系数为:
  Cor =1.0000 0.2947
  0.2947 1.0000
  R2 =1.0000 0.0869
  0.0869 1.0000
  可以看出,虽然暴风科技公司股票的收益率与市盈率之间的相关性也很弱,其收益率与市盈率出现了两极分化。因此我们分别对其低市盈率与高市盈率进行线性拟合,上述曲线的R2均较高,因此,可以得出如下结论:暴风科技公司在近期股票收益率与其市盈率之间存在着一定的相关关系,根据拟合出的曲线,我们可以对未来一段时间的收益率进行估计。
  类似的,可对所有的因子进行相同的操作方法。
  2. 多因素模型体系的建立。
  在进行完影响收益率的因子选择之后,便是最为重要的建立综合评分体系,用来解释股票收益率与因子之间的具体变化。挑选出的影响收益率的关键因子为:累计收益、年化复合收益、年化超额收益、信息比率、月最大超额收益、月最小超额收益、跑赢基准月份占比、上升市场跑赢基准月份占比、下跌市场跑赢基准月份占比、正收益月份占比。
  通过matlab实现多因素模型可得到以下结果。
  特征值/贡献率/累积贡献率:
  DS =7.8821 0.7882 0.7882
  1.2637 0.1264 0.9146
  0.6038 0.0604 0.9750
  0.2504 0.0250 1.0000
  0.0000 0.0000 1.0000
  -0.000 -0.0000 1.0000
  -0.000 -0.0000 1.0000
  -0.000 -0.0000 1.0000
  -0.000 -0.0000 1.0000
  -0.000 -0.0000 1.0000
  信息保留率T对应的主成分与特征向量:
  Com_num =2
  Pv=0.3468 -0.1311
  0.3501 -0.0600
  0.3517 -0.0858
  0.3533 0.1051
  0.2713 -0.570   0.3402 -0.0566
  0.3294 -0.2054
  0.3170 0.2590
  0.3318 0.2818
  得分及排序:
  Result =
  -2.4817 -0.8026 -3.2842 5.0000
  -2.9612 0.5523 -2.4089 4.0000
  -0.2807 0.0989 -0.1818 3.0000
  2.5953 1.5047 4.1000 2.0000
  3.1283 -1.3533 1.7750 1.0000
  通过对上述运行结果的分析可以看出,月最大超额收益的影响最大,而累计收益的影响最小。这样,便量化出了影响该股票收益率的方程式。
  (二)交易标的股票的选取
  1. 选取收益率前20%的股票
  为了使收益最大化,优中选优,选取了每个版块的20支股票,尽可能使收益保持最大化。
  2. 利用CAPM模型進行资产组合
  资本资产定价模型的核心即为以下等式:
  E(Rn)=Rf+β(E(Rm)-Rf)
  通过该理论,可以建立多个资产的不同搭配情况。下面以两种股票为例进行说明,在股票A与股票G之间,我们可以根据投资者自身不同的风险偏好程度,决定资产的配置比例。其中C点为全球最小方差组合点,反映了在引入无风险资产组合之前的风险最小点。通过加入国债等无风险资产,可以进一步降低组合的风险,而此时的有效前沿变成了一条直线,在市场组合点与无风险收益之间的这部分曲线为加入国债等资产的组合的可能点,而在市场组合点之外,则为进行杠杠融资的结果。
  三、风险控制
  (一)对各项参数进行区间估计和假设检验
  前两章重点阐述组合的收益状况,要求在弱势有效市场的情况下,使收益达到最大化。收益与风险是投资组合的最基本的衡量指标。因此对风险的估计和度量仍然非常重要,要将二者进行联合评估。下面将介绍怎样利用统计学知识,对风险与收益的取值范围做出估计。
  假设由第一部分模拟出的收益率方程满足如下等式:
  Yi=-4.451+2.057*X1i+2.008*X2i
  可以看到,等式中出现了三个参数,分别是截距项、X1i、X2i。然而,模拟有会一定误差,此时需要对误差进行度量。特别是对于X1i与X2i的参数的估计,其改变直接决定了Yi的变化的方向以及程度。在这里,我们运用假设检验与置信区间估计的方式,判断究竟有多大的概率,该参数是可以满足我们的要求。
  用统计软件得出相关统计学分析,可以知道R2(R-squared)为0.934,并且调整后的R2(Adj R-squared)为0.890,说明该式的所有系数,作为一个整体,对Yi具有较好的解释力度。其中ESS(Explained Sum of Squared)为模型模拟出的曲线与平均值的差的平方和,而SSR(Squared Sum of Residual)为真实点与估计点的差的平方和。2.057所处的95%置信区间范围为0.984-3.130。可以通过查对应的t分布图来找到对应值。比如说,要判断Experience的参数在95%的概率条件下的合理性,计算出其t统计量2.66,观察对应的置信区间范围是否包括了这个数值,答案是包括的。因此可以得出如下的结论:Experience的系数2.008在95%的置信水平下是无法拒绝的。
  (二)基于蒙特卡洛模拟的风险控制
  蒙特卡洛模拟,是对资产的所有可能的取值来进行一次随机数模拟,方便计算产品价格和产品风险度量的大小。在此将详细来说明如何进行基于蒙特卡洛模拟的风险的度量。
  利用matlab模拟四次,得出不同收益率的图形,每次模拟都可以得到一条收益率的曲线,当我们从股票收益率的总体曲线中随机抽出N个样本的收益率曲线,对其进行算术平均,可以得到最终模拟出的收益率曲线。
  四、模型的评价与总结
  (一)模型评价
  以上是笔者所构建的量化投资策略的总体框架,若读者按照上述量化投资策略进行投资,定会获得超额的投资收益率。量化分析比传统的基本面分析、技术分析有更加标准化、科学化的特点,有更加合理之处。
  当然,该模型仍有一定的缺陷性。模型本身采用的是线性回归的方法,即最高次幂为1次幂。而现实过程中,大多金融产品的收益曲线并不是一条严格的直线,而更多的是具有二阶导的曲线。
  二阶导的曲线中是包含了期权时间价值在内的利润图,在引进期权的时间价值以后,其图形不再是直线,而是带有弧度的。因此,针对本模型的局限性,可以引入二阶导来进行估计。这一点可以通过matlab不断拟合收益率的曲线来进一步精确估计收益率未来的变化趋势。
  (二)总结
  通过上述的分析,可以构建出一整套较为合理的量化投资策略,来模拟股票的收益率的涨跌。笔者首先找影响收益率的四大类因子,再经过科学筛选,挑选出最关键的因子。具体是通过matlab方法来实现对关键因素的选取。其次之后,要对选取的因子之间的相关性进行分析,进行线性检验。本文使用matlab找出因子间关系,并消除相关关系后,建立出了多因素回归模型。之后,运用假设检验与置信区间估计的方法,对多因素回归模型的相关参数的合理性做出判断和解释。再者,使用蒙特卡洛模拟方法,对资产组合的风险大小进行描述。尤其是在市场发生剧烈波动的时候,可以避免传统线性VaR方法带来的低估风险的错误。最后,本文采用一系列评估指标,来衡量对应一定风险的收益水平的大小。
  参考文献:
  [1]汪军,林美艳.CAPM模型在项目风险管理中的应用[J].辽宁工程技术大学学报(社会科学版),2008(01).
  [2]张庆海,张琼.Matlab在数学建模中的应用[J].中国集体经济,2008(06).
  [3]庞阳.资产证券化产品的量化投资策略分析[J].金卡工程,2016(10).
  [4]叶飞阳.2017年量化投资策略研究[J].现代商贸工业,2017(31).
  [5]张厚先,施柏楠.基于蒙特卡洛方法的网络计划资源优化[J].数学的实践与认识,2015(06).
  (作者单位:安徽财经大学金融学院)
其他文献
龙岗镇滨临东海,1984年经过浙江省政府批准建镇。建镇30年来,龙岗镇依靠户籍制度改革、土地有权出让、发展民营企业,建设中国第一个农民城。经过30年的发展,龙岗镇历经三次调
2009年底至2010年初,笔者结合人大代表视察和有关社科研究团体组织的相关调研活动,根据西部灾区城镇住房重建的推进工作普遍滞后于灾区农村住房重建的推进工作这一实际问题,再次
估算了谷子的最大生产潜力,探讨了实现最大生产潜力的可能性和主要限制因素,为进一步提高谷子生产力水平提供了科学依据和技术方案。
6月中旬,住房和城乡建设部标准定额研究所和中国建筑工业出版社向四川地震灾区免费赠送500册抗震规范图书。经两家单位研究决定,向四川省建设厅捐赠300册,向陕西省建设厅捐赠100
部分获奖方案将在四川汶川地震灾区付诸建设2008年6月25日,由国际太阳能学会、中国可再生能源学会主办,国家住宅与居住环境工程技术研究中心、中国可再生能源学会太阳能建筑专
十八大以来,全面推进依法治国和从严治党的思想不断深入人心,反腐败取得压倒性势态,高等学校作为培养人才的摇篮,因其身份的特殊性,必须成为法治思想思考者和法治行动的领跑
<正> 1985年以来,在全县范围内开展了配方施肥的试验、示范和推广工作。三年来,配肥作物由单一到多种,配肥方法由地力分级法到养分平衡法(即养分差减法)。先后化验土样2.74万
为了适应新蚕区不愿培育单一桑园的习惯,提高土壤肥力,合理利用耕地,我们结合发展新蚕区,建立蚕桑队的同时,在盩厔城关公社二曲管区设置了一块百余亩的农桑综合经营的桑园,预
期刊
上里镇位于四川雅安雨城区北部,距雅安市区27公里,是四川北线的旅游重镇。全镇辖9个村,62个组,3,078户11,379人,其中农业人口11,242人。镇域面积76.98平方公里,其中林地面积62.68平方公
南京市近日向社会各界通报了2007年城建实施情况:累计完成投资185.25亿元,实施经济适用房建设、郊区三城九镇建设、郊野公园等十大工程。在老城整治、快速路等城区工程告一段落