论文部分内容阅读
股票价格时间序列本身的复杂性、多样性和善变性,影响其变化的因素众多,有些因素是可以度量的,而有些因素却难以量化,很难科学的计算和评价,因而研究难度较大。本文运用马尔科夫链对的股票价格做实证分析.并对2016年1月份的价格作出了预测,证明了马尔科夫链对于短期的时间序列预测具有预测精度,是一种可行的数据分析和预测的方法.同时采用隐马尔可夫模型(HMM)给出了关于股票市场行为的趋势分析的想法.确定了股票市场的行为一天股票差分值和其相应的稳态概率分布值,然后基于这些概率值,我们的目标是找出隐藏状态序列给定的观察序列,分析趋势可以用稳态概率分布(TC)值,得到了一个优化的隐状态序列.
马尔可夫链 隐马尔可夫模型
转移概率矩阵 发射概率矩阵 稳态概率分布
股票市场是证券市场中重要的组成部分,也是最活跃、最受关注的市场.证券市场是股票、债券、投资基金等各种有价证券发行和买卖的场所.证券市场通过证券信用的方式融通资金,通过证券的买卖活动引导资金流动,有效合理地配置社会资源,支持和推动经济发展,因而是资本市场的核心和基础,是金融市场中最重要的组成部分.金融时间序列变化的分析对于制定精确的定价和预测决策是至关重要的,随着中国股票市场的发展以及更多数据的取得,利用技术分析的范围将会扩大,进行合理分析我国股市的波动特性以及正确预测股市,对于我国政府对证券市场加强宏观调控和管理,引导股民进行正确的投资,使股票市场真正成为经济发展的晴雨表,保障我国证券市场的健康持续发展都具有重要的意义。
文献综述
(1)国内外研究现状
马尔可夫链理论预测的对象是一个随机变化的动态系统,其预测是根据状态之间的转移概率来推测系统未来的发展,转移概率反映了各种随机因素的影响程度,因而马尔可夫链比较适合随机波动性较大的预测问题,但是马尔可夫链要求状态无后效性,且要具有平稳过程等特点.如果灰色GM(1,1)模型对数据进行拟合,找出其变化趋势,则可以弥补马尔可夫预测的局限性,在灰色预测基础上进行马尔可夫预测,同时可弥补灰色预测对随机波动性较大的数据序列准确度低的不足,因此将二者结合起来将大大提高预测精度。
国内外学者对统计学方法在股票预测上的应用进行了大量研究。如 Nelder JA等人通过放松经典线性模型的假设,提出了广义线性模型,Aaron,Li 和 Duan 对假设条件进一步放松,提出了一般回归模型,他们的研究极大地丰富了回归分析的理论,对该领域的发展产生了深远的影响.基于统计学的预测模型主要包括移动平均与分解模型、指数平滑模型、自回归移动平均模型、随机波动模型等,详见文献。YOON等建立了一种 csHMM,可以看作是对隐马尔科夫模型的一种推广,它所包含的发生概率和过渡概率可随“上下文”而改变,这对研究某些具有相关特性的模型非常有效,例如对 RNA 二级结构的分析和预测.在文献中YOON 又提出了基于 csHMM 的快速搜索算法. 实验表明,改进的算法具有较高的效率.罗泽举等提出一种基于隐马尔科夫模型的快速训练算法进行基因识别. 实验表明,其性能优于支持向量机方法. 朱红梅等提出一种延时隐马尔科夫模型. 实验表明,该模型优于标准隐马尔科夫模型. 通常,用于基因预测的隐马尔科夫模型一般需先对参数进行优化后再进行预测,且优化算法需要大量的运算。
股票市场是一个国家的经济晴雨表,反映着一个国家的经济运行情况,股票价格反映了市场上的资产价格,其联动效益正日益在世界各市场中表现出来.股票价格的时间序列变化一直对预测者有着巨大的吸引力,也是各种预测方法应用的热门领域.本文旨在应用马尔科夫链对股票价格进行预测,并运用隐马尔科夫模型进行股票价格分析,得到一条最佳隐序列,以期为相关的利益人提供更加科学有效的决策支持系统.
理论基础
(1)马尔科夫链分析方法基本原理
第一,马尔科夫链。假设马尔科夫过程﹛Xn,n∈T﹜的参数集是T是离散的时间集合,即T=﹛0,1,2,…,n﹜其相应 可能取值的全体组成的状态空间是离散的状态集I=﹛i1,i2,i3,…﹜。
定义:设随机过程﹛Xn,n∈T﹜,若对于任意的整数n∈T和任意的i0,i1,i2,…in,条件概率满足
P﹛Xn+1= in+1︱X0= i0,X1= i1,…Xn= in﹜
=P﹛Xn+1= in+1︱Xn= in﹜(1)
则称﹛Xn,n∈T﹜为马氏链.上式是马尔科夫链无后效性的数学表达式.
第二,状态转移概率。状态转移概率是指事物在变化过程中,从某状态出发,下一时刻转移到其他状态的可能性.根据条件概率的定义由状态Ei到状态Ej的状态转移概率P﹛Ei→Ej﹜就是条件概率。
即: P(Ei→Ej)= P(Ei︱Ej﹜=Pij(2)
3.1.3 状态转移概率矩阵
假设某一被预测的时间有n个可能状态,即Ei·(i=1,2,…,n).Pij为状态Ei到状态Ej的状态转移概率,则矩阵
P= (3)
一般的Pij满足下列条件:
(4)
只要满足上式的概率矩阵都是概率矩阵.
(2)马尔科夫链预测方法
首先介绍状态概率πj(k),它表示事件在初始(k=0)状态为已知的条件下,经过k次转移后,第k个时刻处于Ej的概率.根据概率的性质显然有:
(5)
从初始状态开始,经过k次转移后达到Ej的这一状态转移过程,可以看做是首先经過(k-1)次转移后达到Ej(i=1,2,…,n),然后再由 经过一次状态转移达到状态Ei.由马尔科夫过程的无后效性及条件概率公式有:
(6)
若行向量 π(k)=[π1(k),π2(k),…,πn(k)],由(5)式可得到下面公式:
(7)
式中,π(k)=[π1(0),π2(0),…,πn(0)]
為初始状态概率向量.
下面介绍在第k个时刻的状态概率预测方法:
(1)将事件划分状态;
(2)根据划分的状态求出该事件的转移概率矩阵pij;
(3)确定时间在第0个时刻的初始状态π(0);
(4)利用公式(7)求出经过k次状态转移后,在第k个时刻处于各种可能的状态的概率π(k)。
这样就得到了第k个时刻的状态概率。
实证分析
(1)股票价格的马尔科夫链预测
xt是代表股票价格高低的随机事件序列,对xt所能取到的最小值mo和最大值mn所限定的区间划分成若干小区间:
(m0,m1],(m1,m2],…(mn-1,mn]
,其中mi≥mi-1。记Ek=(mk-1,mk],则可视xt(t=1,2,…,N)为一个以E=Ek(k=1,2,…,N)为状态空间的随机时间序列(或称随机过程).下面根据A股指数(1A0002)这支股票收盘价的实际情况划分,将2013年8月1日到2013年12月31日的日收盘价划分为5个区域,使每一天的收盘价仅落入一个区域内,每一区域可作为一个状态.需要注意的是,由一个标准划分的各个状态之间相互独立,是预测对象在某一时间值处于一种状态.
(8)
那么,xt是一个以E= Ek(k=1,2,3,4,5)味状态空间的随机序列.分为5个价格区间。
第一,检验马尔科夫性。用nij表示x1,x2,…xn从状态 经过一步转移到Ej的频数,建立频数矩阵
(9)
并将频数矩阵(nij)n×n的第j列之和除以各行各列的总和所得到的值记为pij,即
(10)
再记: (11)
则统计量(当n较大时)
(12)
可以根据统计量x2检验xt是否是马尔科夫链,如果检验了xt为马尔科夫链,则当前股票的收盘价符合随机游走的特性,股票收盘价的走势包含和反应了历史信息,市场为弱有效,可构建马氏链模型分析股票收盘价未来的变化情况.
状态转移如下:
由上表可知:股票收盘价变化的转移有13次从E1从发的,从E1到E1的有9次,从E1到E2的有4个,可以得到:
,
同理可以计算得到收盘价变化的状态矩阵如下
由表2知,第102个交易日的收盘价是2214.49,落于第二状态区间,所以用马尔科夫链进行预测时,初始概率向量π(0)=[011,0,0,0],然后根据公式π(k)=π(k-1)P=…=π(0)P k可得到103至106个交易日的收盘价绝对概率向量分别为:
由π(1)可以看出,第103个交易日的收盘价落于第2区间的概率最大;由π(2)可以第103个交易日的收盘价落于第2区间的概率最大,结合实测数据,统计如下:
第二,股票价格的马尔科夫链分析。在这4个交易日中,2014年1月7日的预测值和实测值相差1,其他交易日的误差为0,预测准确率为75%.
预测值与实测值之间的误差主要取决于收盘价变化区间的划分.本文的收盘价变化区间是均匀划分的,可以根据正态分布的状况把区间划分得更细,误差就可以极大的减小.另外应用马尔科夫链对股价分析预测时,时假定未知的概率与已知的概率分布差别不大,即市场外界环境比较傲稳定,但这点在实际中式很难满足的,这也是导致误差的重要原因。
(2)股票价格的隐马尔科夫模型分析
本文考虑了A股指数(1A0002) 2015年8月1日到2015年12月31日的收盘价.两个观察符号:“I”表示收盘价上涨,D表示收盘价下降。
如果今天的收盘价与昨天的收盘价之差大于零,观察符号是I;
如果今天的收盘价与昨天的收盘价之差小于零,观察符号是D。
设五个隐状态分别表示为:
这些状态不能直接观察,模拟股票市场时考虑为隐状态.考虑股票收盘的1天差分,得到每天收盘价差分的转移概率矩阵、发射概率矩阵、稳态概率分布。
转移概率矩阵:
发射概率矩阵:
稳态概率分布:
使用MATLAB软件中的“Hmmgenerate”函数得到一个最佳序列:
序列:
状态:S3 S2 S4 S6 S5 S6 S6
结论
由于马氏链具有“无后效性”,所以在市场有效的条件下,预测股价的变化规律比较准确.但是应该注意到使用该模型的条件,即假定对初始向量的认定和转移矩阵概率的不变,应该根据实际情况对初始向量和转移矩阵做出调整,以符合实际情况,调高预测准确度.总之,在确定了股价成交量的马氏链特性后,应用马氏链分析股价的变化.同时基于隐马尔科夫模型得到了一条收盘价时间序列的最佳隐序列.马尔科夫模型是应用马尔科夫链的基木原理与方法分析事物的变化规律,并预测其未来变化趋势的一种技术.它实际上是在条件概率下求期望值的问题,利用这种技术的关键是获得事物的初始向量和转移概率矩阵.隐马尔科夫模型在股票价格预测方面有一定的利用价值.
刘卿君(1976.5-)女,汉族,湖南衡阳人,讲师,硕士,主要从事国际投资与融资研究。
[1]表二苏.股票价格预测方法研究 [J].天津大学学报,20007,8(5):74-119
[2]薛勋国,刘宝新,李百川.灰色马尔可夫链在道路交通事故预测中的应用[J].人类工效学,2006,12 (3):
16,26-28.
[3]唐娜,桂预风,李宝.灰色马尔可夫模型应用于股指分析.刘彦奎,彭锦.第五届中国不确定系统年会论文集.[M].香港:Global-Link,2007,195—198.
[4]Yoon B J,Vaidyan Nathanp P . Computational identification and analysis of noncoding RNAsunearthing the buried treasur es in the genome [J] . IEEE Signal Processing Magazine,2007,24( 1) :64—74.
[5]Yoon B J,Vaidyan Nathanp P.Fast search of sequences with complex symbol correlations using profile contex-tsensitive HMMS and pre-screening filters[M] .PPICASSP 2007,Hawaii,USA : I EEE Press,2007,1: 345—348.
[6]Luo Ze-ju,Li Yan- hui,Song Li-hong,Recognition of DNA sequences based on hidden Markov models[J].Journal of South China University of Technology : Natural Science Edition,2007,35( 8) : 123-126.
[15]Zhu Hong-mei,Wang Jia-xin,Zhao Yan-nan,.Application of time-delay HMM in gene splice donor sitespr ediction[J].Computer Engineering,2007,27( 5):1-3.
马尔可夫链 隐马尔可夫模型
转移概率矩阵 发射概率矩阵 稳态概率分布
股票市场是证券市场中重要的组成部分,也是最活跃、最受关注的市场.证券市场是股票、债券、投资基金等各种有价证券发行和买卖的场所.证券市场通过证券信用的方式融通资金,通过证券的买卖活动引导资金流动,有效合理地配置社会资源,支持和推动经济发展,因而是资本市场的核心和基础,是金融市场中最重要的组成部分.金融时间序列变化的分析对于制定精确的定价和预测决策是至关重要的,随着中国股票市场的发展以及更多数据的取得,利用技术分析的范围将会扩大,进行合理分析我国股市的波动特性以及正确预测股市,对于我国政府对证券市场加强宏观调控和管理,引导股民进行正确的投资,使股票市场真正成为经济发展的晴雨表,保障我国证券市场的健康持续发展都具有重要的意义。
文献综述
(1)国内外研究现状
马尔可夫链理论预测的对象是一个随机变化的动态系统,其预测是根据状态之间的转移概率来推测系统未来的发展,转移概率反映了各种随机因素的影响程度,因而马尔可夫链比较适合随机波动性较大的预测问题,但是马尔可夫链要求状态无后效性,且要具有平稳过程等特点.如果灰色GM(1,1)模型对数据进行拟合,找出其变化趋势,则可以弥补马尔可夫预测的局限性,在灰色预测基础上进行马尔可夫预测,同时可弥补灰色预测对随机波动性较大的数据序列准确度低的不足,因此将二者结合起来将大大提高预测精度。
国内外学者对统计学方法在股票预测上的应用进行了大量研究。如 Nelder JA等人通过放松经典线性模型的假设,提出了广义线性模型,Aaron,Li 和 Duan 对假设条件进一步放松,提出了一般回归模型,他们的研究极大地丰富了回归分析的理论,对该领域的发展产生了深远的影响.基于统计学的预测模型主要包括移动平均与分解模型、指数平滑模型、自回归移动平均模型、随机波动模型等,详见文献。YOON等建立了一种 csHMM,可以看作是对隐马尔科夫模型的一种推广,它所包含的发生概率和过渡概率可随“上下文”而改变,这对研究某些具有相关特性的模型非常有效,例如对 RNA 二级结构的分析和预测.在文献中YOON 又提出了基于 csHMM 的快速搜索算法. 实验表明,改进的算法具有较高的效率.罗泽举等提出一种基于隐马尔科夫模型的快速训练算法进行基因识别. 实验表明,其性能优于支持向量机方法. 朱红梅等提出一种延时隐马尔科夫模型. 实验表明,该模型优于标准隐马尔科夫模型. 通常,用于基因预测的隐马尔科夫模型一般需先对参数进行优化后再进行预测,且优化算法需要大量的运算。
股票市场是一个国家的经济晴雨表,反映着一个国家的经济运行情况,股票价格反映了市场上的资产价格,其联动效益正日益在世界各市场中表现出来.股票价格的时间序列变化一直对预测者有着巨大的吸引力,也是各种预测方法应用的热门领域.本文旨在应用马尔科夫链对股票价格进行预测,并运用隐马尔科夫模型进行股票价格分析,得到一条最佳隐序列,以期为相关的利益人提供更加科学有效的决策支持系统.
理论基础
(1)马尔科夫链分析方法基本原理
第一,马尔科夫链。假设马尔科夫过程﹛Xn,n∈T﹜的参数集是T是离散的时间集合,即T=﹛0,1,2,…,n﹜其相应 可能取值的全体组成的状态空间是离散的状态集I=﹛i1,i2,i3,…﹜。
定义:设随机过程﹛Xn,n∈T﹜,若对于任意的整数n∈T和任意的i0,i1,i2,…in,条件概率满足
P﹛Xn+1= in+1︱X0= i0,X1= i1,…Xn= in﹜
=P﹛Xn+1= in+1︱Xn= in﹜(1)
则称﹛Xn,n∈T﹜为马氏链.上式是马尔科夫链无后效性的数学表达式.
第二,状态转移概率。状态转移概率是指事物在变化过程中,从某状态出发,下一时刻转移到其他状态的可能性.根据条件概率的定义由状态Ei到状态Ej的状态转移概率P﹛Ei→Ej﹜就是条件概率。
即: P(Ei→Ej)= P(Ei︱Ej﹜=Pij(2)
3.1.3 状态转移概率矩阵
假设某一被预测的时间有n个可能状态,即Ei·(i=1,2,…,n).Pij为状态Ei到状态Ej的状态转移概率,则矩阵
P= (3)
一般的Pij满足下列条件:
(4)
只要满足上式的概率矩阵都是概率矩阵.
(2)马尔科夫链预测方法
首先介绍状态概率πj(k),它表示事件在初始(k=0)状态为已知的条件下,经过k次转移后,第k个时刻处于Ej的概率.根据概率的性质显然有:
(5)
从初始状态开始,经过k次转移后达到Ej的这一状态转移过程,可以看做是首先经過(k-1)次转移后达到Ej(i=1,2,…,n),然后再由 经过一次状态转移达到状态Ei.由马尔科夫过程的无后效性及条件概率公式有:
(6)
若行向量 π(k)=[π1(k),π2(k),…,πn(k)],由(5)式可得到下面公式:
(7)
式中,π(k)=[π1(0),π2(0),…,πn(0)]
為初始状态概率向量.
下面介绍在第k个时刻的状态概率预测方法:
(1)将事件划分状态;
(2)根据划分的状态求出该事件的转移概率矩阵pij;
(3)确定时间在第0个时刻的初始状态π(0);
(4)利用公式(7)求出经过k次状态转移后,在第k个时刻处于各种可能的状态的概率π(k)。
这样就得到了第k个时刻的状态概率。
实证分析
(1)股票价格的马尔科夫链预测
xt是代表股票价格高低的随机事件序列,对xt所能取到的最小值mo和最大值mn所限定的区间划分成若干小区间:
(m0,m1],(m1,m2],…(mn-1,mn]
,其中mi≥mi-1。记Ek=(mk-1,mk],则可视xt(t=1,2,…,N)为一个以E=Ek(k=1,2,…,N)为状态空间的随机时间序列(或称随机过程).下面根据A股指数(1A0002)这支股票收盘价的实际情况划分,将2013年8月1日到2013年12月31日的日收盘价划分为5个区域,使每一天的收盘价仅落入一个区域内,每一区域可作为一个状态.需要注意的是,由一个标准划分的各个状态之间相互独立,是预测对象在某一时间值处于一种状态.
(8)
那么,xt是一个以E= Ek(k=1,2,3,4,5)味状态空间的随机序列.分为5个价格区间。
第一,检验马尔科夫性。用nij表示x1,x2,…xn从状态 经过一步转移到Ej的频数,建立频数矩阵
(9)
并将频数矩阵(nij)n×n的第j列之和除以各行各列的总和所得到的值记为pij,即
(10)
再记: (11)
则统计量(当n较大时)
(12)
可以根据统计量x2检验xt是否是马尔科夫链,如果检验了xt为马尔科夫链,则当前股票的收盘价符合随机游走的特性,股票收盘价的走势包含和反应了历史信息,市场为弱有效,可构建马氏链模型分析股票收盘价未来的变化情况.
状态转移如下:
由上表可知:股票收盘价变化的转移有13次从E1从发的,从E1到E1的有9次,从E1到E2的有4个,可以得到:
,
同理可以计算得到收盘价变化的状态矩阵如下
由表2知,第102个交易日的收盘价是2214.49,落于第二状态区间,所以用马尔科夫链进行预测时,初始概率向量π(0)=[011,0,0,0],然后根据公式π(k)=π(k-1)P=…=π(0)P k可得到103至106个交易日的收盘价绝对概率向量分别为:
由π(1)可以看出,第103个交易日的收盘价落于第2区间的概率最大;由π(2)可以第103个交易日的收盘价落于第2区间的概率最大,结合实测数据,统计如下:
第二,股票价格的马尔科夫链分析。在这4个交易日中,2014年1月7日的预测值和实测值相差1,其他交易日的误差为0,预测准确率为75%.
预测值与实测值之间的误差主要取决于收盘价变化区间的划分.本文的收盘价变化区间是均匀划分的,可以根据正态分布的状况把区间划分得更细,误差就可以极大的减小.另外应用马尔科夫链对股价分析预测时,时假定未知的概率与已知的概率分布差别不大,即市场外界环境比较傲稳定,但这点在实际中式很难满足的,这也是导致误差的重要原因。
(2)股票价格的隐马尔科夫模型分析
本文考虑了A股指数(1A0002) 2015年8月1日到2015年12月31日的收盘价.两个观察符号:“I”表示收盘价上涨,D表示收盘价下降。
如果今天的收盘价与昨天的收盘价之差大于零,观察符号是I;
如果今天的收盘价与昨天的收盘价之差小于零,观察符号是D。
设五个隐状态分别表示为:
这些状态不能直接观察,模拟股票市场时考虑为隐状态.考虑股票收盘的1天差分,得到每天收盘价差分的转移概率矩阵、发射概率矩阵、稳态概率分布。
转移概率矩阵:
发射概率矩阵:
稳态概率分布:
使用MATLAB软件中的“Hmmgenerate”函数得到一个最佳序列:
序列:
状态:S3 S2 S4 S6 S5 S6 S6
结论
由于马氏链具有“无后效性”,所以在市场有效的条件下,预测股价的变化规律比较准确.但是应该注意到使用该模型的条件,即假定对初始向量的认定和转移矩阵概率的不变,应该根据实际情况对初始向量和转移矩阵做出调整,以符合实际情况,调高预测准确度.总之,在确定了股价成交量的马氏链特性后,应用马氏链分析股价的变化.同时基于隐马尔科夫模型得到了一条收盘价时间序列的最佳隐序列.马尔科夫模型是应用马尔科夫链的基木原理与方法分析事物的变化规律,并预测其未来变化趋势的一种技术.它实际上是在条件概率下求期望值的问题,利用这种技术的关键是获得事物的初始向量和转移概率矩阵.隐马尔科夫模型在股票价格预测方面有一定的利用价值.
刘卿君(1976.5-)女,汉族,湖南衡阳人,讲师,硕士,主要从事国际投资与融资研究。
[1]表二苏.股票价格预测方法研究 [J].天津大学学报,20007,8(5):74-119
[2]薛勋国,刘宝新,李百川.灰色马尔可夫链在道路交通事故预测中的应用[J].人类工效学,2006,12 (3):
16,26-28.
[3]唐娜,桂预风,李宝.灰色马尔可夫模型应用于股指分析.刘彦奎,彭锦.第五届中国不确定系统年会论文集.[M].香港:Global-Link,2007,195—198.
[4]Yoon B J,Vaidyan Nathanp P . Computational identification and analysis of noncoding RNAsunearthing the buried treasur es in the genome [J] . IEEE Signal Processing Magazine,2007,24( 1) :64—74.
[5]Yoon B J,Vaidyan Nathanp P.Fast search of sequences with complex symbol correlations using profile contex-tsensitive HMMS and pre-screening filters[M] .PPICASSP 2007,Hawaii,USA : I EEE Press,2007,1: 345—348.
[6]Luo Ze-ju,Li Yan- hui,Song Li-hong,Recognition of DNA sequences based on hidden Markov models[J].Journal of South China University of Technology : Natural Science Edition,2007,35( 8) : 123-126.
[15]Zhu Hong-mei,Wang Jia-xin,Zhao Yan-nan,.Application of time-delay HMM in gene splice donor sitespr ediction[J].Computer Engineering,2007,27( 5):1-3.