基于最小二乘小波支持向量机的股指波动率预测

来源 :中国管理信息化 | 被引量 : 0次 | 上传用户:chuanjie_zheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 为提高金融波动率的预测精度,用极差估算股指波动率,建立了基于最小二乘小波支持向量机(LS-WSVM)的波动率预测模型,以上证综指和深证成指的日数据、周数据和月数据为数据样本,通过LL、NMSE、NMAE指标验证了LS-WSVM在波动率预测方面的有效性。结果表明,LS-WSVM用于波动率预测是有效的,对不同频率波动率的预测精度优于高斯核LS-SVM,在预测较低频率波动率中表现更好,不同小波核之间的预测精度相差不大。
  [关键词] 波动率;预测;最小二乘小波支持向量机
  doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 01. 042
  [中图分类号] F830.9;TP183 [文献标识码] A [文章编号] 1673 - 0194(2018)01- 0104- 04
  1 前 言
  金融衍生品定价、资产组合配置、金融风险测度及管理都离不开对波动率的准确预测。对波动率的准确预测,一方面有助于研究者进行资产定价、套利定价和期权定价的理論研究,另一方面有助于市场监管者对金融市场运行质量进行准确评估,同时又有助于投资者对投资组合进行合理配置,有效规避投资风险。为此,国内外学者不断提出各种方法提高波动率的预测准确性。Engle和Bollerslev提出的自回归条件异方差类模型[1-2]及其扩展形式以资产收益的条件方差估计波动率,能够较好地刻画波动率的各种特征,在波动率预测中占有重要地位。
  为进一步提高波动率的预测精度,Donaldson等[3]将神经网络(NN)与GARCH模型相结合预测股指波动率,Taylor[4]、Tae[5]分别利用NN预测股指波动率。这些研究证实,NN可以在一定程度上改善波动率的预测效果。但神经网络以经验风险最小化作为计算准则,在理论上存在三个问题:网络结构难以确定、存在局部极小值、收敛速度慢。由Vapnik提出的支持向量机(SVM)[6]是当前重要的机器学习算法之一,有效解决了神经网络遇到的问题。SVM的本质是求解一个带约束条件的凸二次规划问题,通过结构风险最小化准则,兼顾了学习算法的经验风险和泛化能力,在非线性回归和预测中表现优越。Perez-Cruz[7]利用SVM估计GARCH模型,进而提高了波动率的预测精度;Gavrishchaka[8]证实SVM的波动率预测效果优于“主流”波动率模型;陈诗一等[9]、王保华等[10]分别将SVM应用于波动率预测研究,证明了SVM的有效性。汤凌冰[11]利用小波核提高SVM非线性逼近能力,实证研究表明,基于小波核的SVM较基于RBF核的SVM具有更高的波动率预测精度。SVM算法的复杂性取决于数据样本的个数,样本越多,相应二次规划问题求解越复杂,计算效率越低。
  最小二乘支持向量机(LS-SVM)是SVM的一种扩展形式[12],将最小二乘算法引入到SVM中,取代了SVM的二次优化算法,通过定义拉格朗日函数,并结合最优条件,将SVM中的二次规划优化变换为线性方程求解,从而降低了算法的复杂性,提高了计算效率。Geng[13]成功地将LS-SVM应用于波动率预测研究。
  核函数是LS-SVM模型的关键,LS-SVM的预测性能取决于核函数的选择。以高斯核函数为代表的常见核函数,在回归分析表现出较好的映射性能。但研究发现,这些已有核函数不能使LS-SVM逼近平方可积空间L2(R2)上的任意函数,致使LS-SVM 无法逼近任意的目标函数[14]。
  最小二乘小波支持向量机(LS-WSVM)以小波核为核函数,利用小波函数的多分辨率提高LS-SVM的非线性处理能力[15],在模式识别和非线性函数逼近等方面获得应用。目前LS-WSVM在波动率预测领域的应用很少,本文将LS-WSVM应用于波动率预测研究,通过对上证综指和深证成指不同频率波动率的实证分析,检验LS-WSVM的有效性。
  2 波动率的最小二乘小波支持向量机
  金融经济学研究中通常以方差估计资产收益的波动率。Parkinson证实极差能够捕捉到更多金融市场的变化信息,以极差估计波动率要比传统的样本方差估计更有效[16]。极差Rt定义为:
  Rt=100×(log Pt,high-log Pt,low)(1)
  其中,Pt,high与Pt,low分别为t时刻资产的最高交易价与最低交易价。为了获得更多数据变化信息,本文以当期和前4期极差的算术平均值估算波动率λt:
  lt=Rt-k(2)
  采用LS-WSVM算法建立波动率预测模型时,为减少预测误差的累积,利用当期波动率预测下一期波动率,即LS-WSVM的输入为当期波动率,输出为下一期波动率。设波动率时间序列为∧={λ1,λ2,…,λn},λt≥0,t=1,2,…,n,n为样本个数,LS-WSVM通过非线性映射函数φ( ),在高维特征空间中建立线性回归模型为:
  λt 1=ωTφ(λt) b,t=1,2,…,n-1(3)
  其中λt,λt 1∈R分别表示输入和输出变量,T表示“转置”运算,ω,b分别表示权向量和阈值。根据结构风险最小化原理,LS-WSVM预测可表述为最优化问题:
  J(ω,b,e)=||ω||2 et2(4)
  式(4)中目标函数的第1项表示正则化项,第2项表示经验误差项,正则化参数γ用来调整正则化项和经验误差项之间的平衡,et∈R表示误差。为求解以上优化问题,引入Lagrange乘子αt∈R,t=1,2,…,n-1,构建Lagrange函数:
  L(ω,b,e,α)=J(ω,b,e)-αt(ωTφ(λt) b et-λt 1(5)
  由Karush-Kuhn-Tucker条件,Lagrange函数分别对ω,b,e,α求偏导数并等于零,得到:   ω=-αtφ(λt)αt=0λt 1=ωTφ(λt) b etγet=αt,t=1,2,…,n-1(6)
  消去式(6)中的ω和e,可得到一组线性方程组:
  0 HTH Ω I/γba=01(7)
  其中:H=[x2,x3,…,xn]T,Ωj=HtHjK(λt,λj),t,j=1,2,…,n-1。I为n-1阶单位矩阵,α=[α1,…,αn-1]T,1=[1,1,…,1]。求解线性方程组获得a和b值,LS-WSVM回归模型为:
  λt 1=αjK(λt,λj) b(8)
  其中,K(λt,λj)为核函数,K(λt,λj)=φ(λt)Tφ(λj),其形式决定了非线性映射函数和特征空间的结构,选择合适的核函数成为提高LS-SVM性能的关键。由于波动率序列复杂多变,高斯核等常用核函数难以刻画波动率的复杂变化特征。
  核函数构建定理指出,满足Mercer定理的平移不变小波核函数是允许的支持向量核函数[17]。现已证实,Mexican母小波、DOG母小波、Morlet母小波等都可构造出平移不变小波核函数。本文选取Mexican小波核作为核函数,具体形式如下:
  K(xt,xj)=1-exp-(9)
  其中,d为平移尺度因子,为伸缩因子。则Mexican小波核LS-SVM预测模型为:
  t 1=αj1-exp- b(10)
  3 实证研究
  3.1 数据的选取
  将上证综指(SHCI)和深证成指(SZCI)的日数据、周数据和月数据作为样本进行实证分析,其中,选取2009年1月5日到2013年3月15日的每日观测值作为日数据样本,共1 019组数据序列;选取2005年1月7日到2013年3月15日的每周观测值作为周数据样本,共411组数据序列;选取1991年4月30日到2013年2月28日的每月观测值作为月数据样本,共263组数据序列。按式(1)和式(2)分别计算出日波动率、周波动率和月波动率,样本总数分别为1 015个、407个和259个。
  3.2 网络学习及预测
  为提高LS-WSVM的收敛速度,先对三组数据样本进行归一化处理,再分别将三组数据样本分为训练样本和测试样本。对日波动率,取前715个数据作为训练样本,后300个数据作为测试样本;对周波动率,取前287个数据作为训练样本,后120个数据作为测试样本;对月波动率,取前163个数据作为训练样本,后96个数据作为测试样本。
  为比较LS-WSVM的有效性,利用以高斯函数为核函数的LS-SVM模型(LS-SVM)预测SHCI和SZCI不同频率的波动率,将预测结果与LS-WSVM的预测结果进行比较。
  3.3 预测性能评价指标
  选取对数误差统计量(LL)、正则均方误差(NMSE)和正则均值绝对误差(NMAE)评价模型的预测性能,分别定义如下:
  LL=N-1ln(t)-ln(Rt)2(11)
  NMSE=(12)
  NMAE=(13)
  其中,N为预测样本个数,t为预测的波动率,Rt为实际波动率。以上指标值越小,表明模型预测性能越好。
  3.4 結果分析
  LS-WSVM和LS-SVM分别对SHCI和SZCI的日波动率、周波动率和月波动率预测结果见表1、表2和表3。SHCI中,LS-WSVM对不同频率波动率的LL、NMSE和NMAE均小于LS-SVM的对应值; SZCI中,除周波动率的NMAE外,LS-WSVM的LL、NMSE和NMAE均小于LS-SVM的对应值,表明整体上LS-WSVM对三种不同频率波动率的预测精度优于LS-SVM。计算LS-WSVM和LS-SVM对应的预测性能评价指标差值,通过差值比较不同频率波动率的预测效果。在三种不同频率波动率中,LS-WSVM对月波动的预测效果最好,差值在0.000 3~0.001 7之间;对周波动的预测效果次之,差值在0.000 1~0.001 5之间;对日波动率的预测效果最差,差值在0~0.000 3之间。
  图1、图2给出了LS-WSVM和LS-SVM分别对SHCI和SZCI不同频率波动率的预测结果曲线图。由两图可看出,LS-WSVM和LS-SVM都较好地预测了SHCI和SZCI不同频率波动率的变化趋势,LS-WSVM较LS-SVM更准确地预测出了较低频率波动率的某些极值。
  另选取DOG小波核、Morlet小波核作为LS-SVM核函数,分别对SHCI和SZCI的不同频率波动率进行预测,形式如下:三种不同小波核LS-SVM的波动率预测结果如表4、5、6所示。由三表可知,小波核LS-SVM在不同频率波动率预测精度方面优于高斯核LS-SVM,不同小波核之间的预测精度相差不大。
  4 结 语
  本文建立了基于小波核的最小二乘支持向量机波动率预测模型(LS-WSVM),利用上证综指和深证成指不同频率的实际交易数据样本,以LL、NMSE、NMAE检验其有效性。实证研究结果表明,从提高波动率预测精度角度,采用小波核LS-SVM比高斯核LS-SVM更有效,LS-WSVM对较低频率波动率具有更好的预测效果。
  主要参考文献
  [1]Engle R F. Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of UK Inflation[J]. Econometrica, 1982, 50: 987-1008.
  [2]Bollerslev T. Generalized Autoregressive Conditional Heteroskedasticity[J]. Journal of Econometrics, 1986, 31: 307-327.   [3]Donaldson R G, Kamstra M. An Artificial Neural Network-GARCH Model for International Stock Return Volatility[J]. Journal of Empirical Finance, 1997, 4: 17-46.
  [4]Taylor J W. A Quantile Regression Neural Network Approach to Estimating the Conditional Density of Multiperiod Returns[J]. Journal of Forecasting, 2000, 19: 299-311.
  [5]Tae H R. Forecasting the Volatility of Stock Price Index[J]. Expert Systems with Applications, 2007, 33: 916-922.
  [6]Vapnik V N. An Overview of Statistical Learning Theory[J]. IEEE Transactions on Neural Networks, 1999, l0(5): 988-999.
  [7]Perez-Cruz F, Afonso-Rodriguez J A, Giner J. Estimating GARCH Models Using Support Vector Machines[J]. Quantitative Finance, 2003, 3: 1-10.
  [8]Gavrishchaka V V,Supriya Banerjee. Support Vector Machine as an Efficient Framework for Stock Market Volatility Forecasting[J].Computational Management Science, 2006, 3:147-160.
  [9]Chen S Y, H?覿rdle W K, Jeong K. Forecasting Volatility with Support Vector Machine-based GARCH Model[J]. Journal of Forecasting, 2010, 29(4):406-433.
  [10]Wang B H, Huang H J, Wang X L. A Support Vector Machine Based MSM Model for Financial Short-term Volatility Forecasting[J]. Neural Computing
其他文献
<正> 目前低压电力排灌站或工厂配电装置中,通常选用DW10型低压断路器作多台电动机总保护。为满足电动机的起动要求,其瞬时脱扣动作电流整定值都比较大,一般为:最大一台电动
为了促进讲解员业务工作水平的提高,展现讲解员的风采,2002年9月,河北省爱国主义教育基地领导小组和省委宣传部共同举办了"河北省爱国主义教育基地讲解员风采大赛".
<金缕玉衣的故乡--满城汉墓>是河北省博物馆新近推出的一个大型文物专题陈列,展示面积1300平方米,展出文物300余件.陈列于1999年10月正式对外展出后,以其丰富精美的文物、高
娄亭村位于河北省易县城西北20公里处,隶属梁各庄镇,东距清西陵的崇陵约2.5公里,南距泰陵4公里;西可通紫荆关的官道岭;北倚太行山脉云蒙山段,北易水的上游.娄亭村属于半山区,
<正> 容量大的变流设备往往需要把几个晶闸管串联或并联使用。由于各个晶闸管的阻断特性、正向压降等在规格范围内都是不相同的,所以在工作中,就会形成串联或并联后电压、电
<正> 密闭式铅酸蓄电池(Sealedlead acid battery,以下简称为SLA)由于具有免维护、可任意取向安装及不排出有害气体等优点,正在以较快的速度扩大使用范围。 SLA含电解液量较
<正> 两台70年代自东欧进口的同型号的200kW晶闸管无刷励磁发电机组在并车工作时,环流达200A多,致使功率继电器动作,无法带负荷运行,经调节励磁,也无法消除环流。该机组励磁
<正> 单相插座接线是电气安装工程中占比例大、又很容易出错的一项工作。以单相三孔插座为例:一只插座有三根线,可能出现的各种接线方式如表1所示。两位数中,个位数表示三根
<正> 农村配电变压器高压侧保护装置采用跌落式熔断器是较经济、简便、有效的方法。这种熔断器既能在变压器内部故障时断开电源,使其脱离系统,又便于投、切变压器的操作。但