长短时记忆神经网络模型改进

来源 :时代金融 | 被引量 : 0次 | 上传用户：wangxiaofengkobe

【摘要】

：

【作者】

：

唐寅

【出处】

：

时代金融

【发表日期】

：

2016年24期

【关键词】

：

LSTM RNN 神经网络股指预测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　【摘要】由于神经网络自身的高度自学习性，稳定性以及抽象模拟能力，相比于统计学以及计量经济学中的数学模型，神经网络用于预测金融时间序列更具优势。本文在深入分析LSTM神经网络对股指进行短期时间序列预测的可行性。
　　【关键词】LSTM RNN 神经网络股指预测
　　一、LSTM神经网络分析
　　LSTM（长短时记忆）神经网络是建立在RNN上的一种新型深度机器学习神经网络。在这个模型中LSTM单元包含一个尝试将信息储存较久的存储单元。这个记忆单元的入口被一些特殊的门控制，被控制的功能包括保存、写入和读取操作。这些门都是逻辑单元，它们负责在神经网络的其它部分与记忆单元连接的边缘处设定权值。这个记忆单元是一个线型的神经元，有自体内部连接。具体来说就是其在每一个神经元内部加入了三个门，分别是输入门、输出门和忘记门。用来选择性记忆反馈的误差函数随梯度下降的修正参数。当忘记门被打开时，自己连接权值为1，记忆单元将内容写入自身。当忘记门输出为0时，记忆单元会清除之前的内容。输出门允许在输出值为1的时候，神经网络的其它部分将内容记入记忆单元，而输入门则允许在输出值为1的时候，神经网络的其它部分读取记忆单元。模型结构如下：
　　Cell，就是神经元状态的记忆，有个叫做state的参数来记录状态的。Forget Gate：将上一次神经元的状态选择性遗忘修正参数。对于每个存储单元，三套权重从输入训练而得，包括先前时间步中完整的隐藏状态。一个带入到输入节点，在上图的底部。一个带入到忘记门，在最右侧显示。另一个带入到输出门，在顶部最左侧的显示。每个黑色节点与一个激活函数相关联，典型的激活函数为S型函数。单元中最中央的节点即内部状态，并且以数量1为权重来跨越时间步，再反馈到本身。内部状态的自连接边，被称为恒定误差传送带或CEC。
　　以前传递为例，输入门来决定何时让激活状态传入存储单元cell，而输出门决定何时让激活传出存储单元，这些都是通过训练学习而确定的。最后忘记门用来学习是否记忆上一个神经元状态的全部或部分或完全遗忘。后传递也是同样的道理，输出门是在学习什么时候让误差流入存储单元，而输入门则学习什么时候让它流出存储单元，并传到神经网络的其它部分。忘记门也是一样。以下按照一般算法的计算顺序来给出每个部分的公式：
　　带下标L的是跟Input Gate相关的，连向Input Gate包括：外面的输入，来自Cell的那个虚线（虚线叫做peephole连接），带H的是一个泛指，因为LSTM的一个重要特点就是其灵活性，cell之间可以互联，hidden units之间可以互联，所以这个H就是泛指这些连进来的东西，可以看成是从外面连进了的三条边的一部分。
　　FORGET GATE：
　　后向传播中的偏微分求导由于非常复杂，在这里就不赘述了，只要明白对每个门中经过的参数求偏导是为了按梯度的方向进行收敛并修正权值。
　　二、LSTM神经网络模型的优势及问题
　　LSTM的出现的原因其实是因为RNN转换成超级长的传统神经网络后，利用BP反向传播的时候，误差会逐级减小，但由于展开的太长了，误差需要归因到每一层每一个神经元，这会导致整个训练过程无法逃离局部最优解。LSTM正是解决了这个问题，他将每一层的神经元设计成具有多个“门”的结构，这使得误差在传播过程中，有些可以直接通过“门”，不用归因于当前神经元，误差就完好无损的直接通过到下一层了，因此收敛性很好。
　　三、LSTM神经网络模型的算法改进
　　α学习速率是与误差函数的一阶导数相乘，来控制随梯度下降的步长的，虽然α是变化的但是每一次归因对于每个自变量来说是相同的。可以将α设为误差函数的二阶导数，这样以每一自变量下降的不同速度来随梯度下降。这种改变的理论依据源于著名的数学理论拟牛顿法。
　　具体公式为：wn∈w=wold+H-1wold
　　这里的w为权值的向量矩阵，H-1为hessian矩阵，这里就是将学习速率α设为误差函数的二阶导数，从而使每一个自变量（权值）下降的速度随各自梯度下降，使模型收敛的更加准确。
　　四、实证分析
　　研究对象：选取日成交量最大的标普500指数作为基础研究对象来验证模型的准确性，运用LUA语言进行编程，并以TORCH作为深度学习框架。进行训练预测拟合图形并计算误差。
　　LSTM模型预测误差均值为0.783%股指。模型收敛的更小，误差更小，模型预测准确。
　　参考文献
　　[1]Andrej Karpathy.The Unreasonable Effectiveness of Recurrent Neural Networks[R].，2015.3.
　　[2]胡新辰.于LSTM的语义关系分类研究[M].哈尔滨工业大学.2015.6.
　　[3]李小燕.灰色神经网络预测模型的优化研究[D].武汉理工大学.2009.
　　作者简介：唐寅（1991-），男，汉族，贵州金沙人，现就读于首都经济贸易大学，硕士学位，研究方向：电子商务。

其他文献

低分子右旋糖苷治疗联合颈总动脉压迫试验在经颅多普勒检查中的应用分析

目的:探讨在经颅多普勒超声(TCD)检查中,低分子右旋糖苷治疗联合颈总动脉压迫试验在经颅多普勒检查中的应用价值.方法:对双侧颞窗、眼窗均透声良好的322例健康体检者进行TCD

期刊

颈总动脉压迫试验误诊率眼窗低分子右旋糖酐

完善省以下转移支付制度的思考——以广西为例

当前各省对下转移支付制度大多参考中央对地方的转移支付制度建立的,从实践经验来看,仍存在诸多需要完善的地方。本文将以广西壮族自治区以下转移支付制度为例,分析省以下转

期刊

转移支付均等化绩效评价

完善风险预警监管体系，促进我国贸易顺利开展

【摘要】多年来，我国在检验监管工作中尝试对进出口产品、企业实施多维的分类管理。但是，这些风险管理工作，各自为营，独立作战，风险预警监管体系存在不少问题，本文作者根据这些问题提出首先要思想上必须高度重视风险预警体系的作用，其次要加强风险预警人才的培养等措施以完善风险预警监管体系。　　【关键词】风险预警贸易　　自从国家质检总局成立以来，陆续出台了《出入境检验检疫风险预警及快速反应管理规定》等涉及风险

期刊

风险预警贸易

北京侨福芳草地商业空间中的公共艺术研究

商业空间在承载大众消费活动的同时,也是社会生活的重要载体.今天商业空间发展的整体趋势是从商店、商业街再到商业综合体的过程.将公共艺术引入商业地产进行文化运营已成为

期刊

公共艺术商业空间

管理专业“学·思·行”人才培养模式实践探索——以川北医学院管理学院为例

人才培养模式创新是提高人才培养质量的有效保障,川北医学院管理学院基于学生全面发展和关注学生发展潜力的角度提出了“学·思·行”人才培养模式,将学生学习力、思维力和实

期刊

管理专业人才培养模式学·思·行

浅谈企业党的建设与思想政治工作

企业党的建设与思想政治工作在改革开发后的建设中发挥着极其重要的作用.随着我国社会主义市场经济的确立和发展,企业的生产组织形式,经营形式和行政管理体制等发生了一系列

期刊

企业党的建设思想政治工作社会主义市场经济基层党组织建设行政管理体制企业党建工作组织形式重大问题企业发展经营形式关键时期改革开发新形势新

活跃课堂气氛提高教学质量

课堂教学是学校教育的主阵地，追求课堂教学的高效率，是每一个老师不断追求的目标，它是教学过程的最优化，教育效果的最大化。　　一、精心设计导语　　导入新课是一门艺术，“转轴拨弦三两声，未成曲调先有情。” 著名特级教师于漪老师说过：课的开始，其导入语就好比提琴家上弦，歌唱家定调。第一个音定准了，就为演奏或者歌唱奠定了良好的基础。因此语文课堂的导入也应该精心构思，巧妙设计，引人入胜，扣人心弦，一开课就能把

期刊

课堂气氛课堂教学学生语文课堂学校教育学习兴趣特级教师巧妙设计快乐学习教育效果教学过程歌唱家导入新课最优化注意力主阵地导入语转轴

老年鼻息肉治疗体会

尽管鼻息肉切除对全身的直接创伤较小 ,但多数老年人为复发性息肉 ,且伴有某些基础病 ,因此对老年鼻息肉的处理应特别谨慎。我科自 1988年 1月至 1998年 1月对 12 3例老年鼻

期刊

老年鼻息肉

国际化视野下的远程教育基本理论框架——德斯蒙德·基更《远程教育基础》中文第二版阐释

本文是为2008年出版的中文第二版写的书评.文章介绍了这部经典著作研究、出版以及与时俱进、多次修订的背景情况,对全书内容做了简介、评价和导读,指出了本书的特点和创新之

期刊

德斯蒙德·基更远程教育经典著述理论创新

健康教育在老年心血管疾病患者临床护理中的作用

目的:对健康教育在老年心血管疾病患者临床护理中的应用价值进行分析探讨.方法:选取我科2016年6月至2017年2月收治的120例老年心血管疾病患者,将其随机分为两组,分别实施健康

期刊

健康教育老年心血管疾病临床护理应用效果

长短时记忆神经网络模型改进

与本文相关的学术论文