基于文本及价量数据的股票及股指期货超短线预测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:camelwin2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2015年A股市场的股灾、近几年的中美贸易摩擦和2019-2020年的新冠疫情深刻地改变了我国股票和股指期货市场。量化投资拥有强大的数据分析能力,越来越受到机构投资者的重视,各大公募基金、券商资管纷纷组建量化投资部门。在学术界,量化投资也成为继基本面分析和技术面分析后的第三种重要的投资研究方法。超短线交易指交易频率较高、持仓时间较短的交易行为。与股票的T+1和股指期货的T+0制度相对应,股票的超短线交易的持股时间为一个交易日,股指期货的超短线交易的持仓时间为分钟级别。在超短线环境下,交易机会更多,利润的积累效应强,因此许多机构投资者和研究人员青睐于股票和股指期货的短线和超短线交易。超短线预测中最重要的两个元素是预测模型及其所基于的信息。在模型方面,超短线环境下的股票及股指期货价格呈现很强的非线性和复杂特征,所有股票及股指期货形成了一个整体性的复杂系统。因此,将单个股票或股指期货价格视为孤立的单个时间序列的传统模型将逐渐被淘汰。本文所提出的所有模型都重视挖掘多个股票和股指期货之间的交叉影响效应。深度学习模型拥有复杂的内部结构和大规模计算框架,能很好地拟合和适应超短线环境下数据的非线性特征。传统模型也可以与文本挖掘算法结合,依靠文本信息这一强有力的信息增量获得更好的性能。在信息方面,股票和股指期货的超短线预测依赖的数据主要为价量信息和文本信息。价量信息是市场内部信息,它反映了市场内的综合信息,是全市场的交易者综合博弈的结果。文本信息是市场的外部信息,是对价量信息的有效补充,在股票及股指期货的超短线预测中起着重要作用。其中,股吧文本是投资者情绪的直接反映,蕴含着重要的有效信息;新闻文本信息中则蕴含着巨大的价格推动力量,新冠疫情、中美关系和利率政策等多方面的重要新闻常常导致股票和股指期货价格的巨大波动。此外,股票的超短线交易还与题材概念息息相关,题材概念是股票之间情绪传染的重要路径。本文将融合前沿的深度学习、文本挖掘模型及传统金融模型,利用股吧文本数据、新闻文本数据、价量数据和题材概念数据,对现有文献的预测模型进行改进并提出新的预测模型,从而预测股票及股指期货的超短线价格方向、套利方向和收益率,进而构建股票和股指期货的超短线交易和超短线套利策略。本文的研究内容及贡献如下:(1)基于价格数据和随机占优的股指期货超短线预测。理论方面,本文根据超短线环境下股指期货及股票指数的尖峰和有偏的特点,改进了已有文献的近似随机占优模型,提出了两个新的随机占优模型,并设计了一个1分钟数据下的基于随机占优的股指期货超短线套利策略。实证方面,本文基于8年多的股指期货超短线数据检验了本文提出的随机占优模型,发现其比现有文献的模型更具优势;基于5年多的股指期货1分钟数据的实证研究结果显示,本文提出的基于随机占优的套利方向预测效果很好,超短线套利策略取得了很好的收益。实证研究还分析了2015年股灾及中国金融期货交易所的股指期货严格监管措施对股指期货及股票的市场有效性的影响,发现严格监管措施对市场有效性的损伤比股灾还严重。(2)基于价量题材数据和深度学习的股票及股指期货超短线预测。理论方面,本文基于交易日分段编码改进了现有文献的分层神经网络架构,解决了隔夜跳空数据不连续的问题,进一步加强了处理长时间序列的能力;基于股票题材概念信息提出了一个股票间交叉影响的编码系统,能在分钟级别挖掘几千个股票之间的交叉影响关系;基于指数构造方法提出了一个股指期货预测模型,利用股票价格方向的预测值来预测股指期货价格方向。实证方面,本文基于9年的A股全部股票和近6年的股指期货的1分钟价量及题材数据进行实证分析,实证结果验证了所提出模型的有效性,且在牛市和熊市中都取得了比已有文献的模型更好的表现。(3)基于股吧文本和时间序列模型的股票及股指期货超短线预测。理论方面,本文通过平衡被预测资产和其他资产的权重,改进现有的多元时间序列模型,并基于矩阵偏导数和极大似然估计法求解参数矩阵;然后利用情感词典法从东方财富股吧文本中构建情绪指数,作为外生变量引入本文提出的多元时间序列模型。实证方面,本文基于5年的股指期货及疫情前后一年半的股票超短线数据、东方财富股吧文本数据进行实证分析,实证结果显示本文提出的模型取得了很好的表现。实证研究还分析了新冠疫情对我国股票市场的影响,结果显示新冠疫情在降低情绪指数的同时提升了股吧活跃度,从而使基于文本挖掘的超短线预测模型具有更强的竞争优势。(4)基于新闻文本和深度学习的股票及股指期货超短线预测。理论方面,引入计算机领域的前沿文本分类模型,通过参数迁移和分类器优化精调降低了模型的计算资源开销,并基于新闻的冲击效应下股指期货价格的异常波动来标注新闻极性,然后构建超短线预测模型,进而提出相应的交易策略;构建了一个基于题材的新闻个股映射系统,以题材为媒介将新闻映射到个股,比传统的基于股票名称的映射方法更具优势。实证方面,本文基于5年半的四大证券报和新华社的新闻文本、股票及股指期货1分钟价量数据、题材概念数据进行实证分析,实证结果验证了本文所提出的基于文本挖掘的超短线预测模型以及新闻个股映射系统的有效性。
其他文献
飞机梁肋结构件通常服役于恶劣的腐蚀环境下,在长时间的腐蚀环境作用下易发生腐蚀损伤,严重威胁飞机适航性和安全性。轻微腐蚀受损件可通过打磨后采用激光喷丸等表面强化方法进行修复后再次投入使用。受损件经过打磨除腐后,表面将形成由平面、凸圆弧面、斜面、凹圆弧面等组成的复杂几何形状。这些形状以及边缘效应的存在可能会对激光喷丸修复质量(残余应力、疲劳寿命、表面完整性等)产生不良影响。因此在飞机受损件激光喷丸修复
齿轮传动系统在汽车、船舶、航空等众多领域中应用广泛,故障齿轮的振动信号总会表现出幅值调制和频率调制的特征,利用振动信号调制边带的变化规律来进行齿轮故障诊断具有重要的研究意义和工程实用价值。基于单级定轴轮系的动力学模型,考虑系统存在谐波形式的转速波动,理论上分析了齿轮在平稳型、冲击型故障时振动响应信号的频谱特征,并提出了新的平稳型故障振动信号调幅调频数学模型。所提模型在调幅部分和啮合频率载波部分中都
无人机、无人车等自主系统在复杂环境中安全运行和做出运动路径的规划,需要有强大的环境感知能力,使系统能够获取机身周围的三维数据。双目立体视觉是获取真实场景三维数据的常用方法,但是立体匹配算法复杂,一般难以同时满足实时性和精度要求。全景图像可以突破相机视场大小的限制,全方位的展示出水平视野范围内的所有事物,结合头戴显示器可以得到临场感和沉浸感强烈的视觉体验。FPGA因其丰富的逻辑资源和特殊的硬件结构,
“三农”问题是关系国计民生的根本性问题,实施乡村振兴战略,是解决新时代我国社会主要矛盾的迫切要求。然而,目前我国农业的弱质性、高风险性以及分散生产等特性,使农户难以通过传统融资途经获得充足的金融资源,农业产业化发展受到严重的制约。订单农业与供应链金融日益发展,为解决农业“融资难”的问题指明了方向。此外,由于在订单农业中“小农户”在供应链中处于绝对的劣势地位,使其很难在完全自由市场中获得收入保障。因
氢气是一种理想的能源载体,其燃烧值高、产物无污染、来源广泛。电解水制氢是生态友好、可持续的氢气生产方式中最有前途和吸引力的方法之一。但该技术目前存在着制氢效率较低、成本较高的问题,制约其商业化。因此,通过开发高效、廉价、稳定的催化剂来降低电解水制氢的成本,对实现大规模电解水制氢具有重要的意义。鉴于此,本论文研究工作致力于开发高效、廉价、稳定的水分解电催化剂、揭示所制催化剂表面电催化机理、构筑规模化
聚合物基正温度系数(Positive Temperature Coefficient,PTC)材料是近年来发展起来的一种新型温控材料,具有自适应强,安全可靠,易加工等优点,已成为发展最快的智能温控材料。但目前研制的聚合物基PTC材料居里温度点普遍较高,不能满足大部分元器件的温控需求,且材料在长期使用过程中易出现稳定性和机械性能下降等问题。本文主要从降低材料的室温电阻率和渗流阈值,提高材料PTC强度
热塑性塑料因其具有快速成型,可反复加工等优点在工业生产中用途广泛。超声焊在热塑性塑料的装配领域有着重要意义。传统的超声焊接工艺一般由操作者目测判断工件焊孔位置,并手工引导固定有焊头的机械手移动直到记录下所有工件焊孔的位置信息,之后对焊接路径进行编程完成焊接,这一过程不但耗时耗力,而且其精确程度依赖于工人的经验,还易于出错,因此有必要提出一种可以自动完成焊接工艺的焊点寻址导航系统。汽车作为近年来重要
不完备视觉数据指的是视觉样本类别信息不完备或其本身信息不完备的数据。随着科技的进步,越来越多的视觉数据被收集储存起来。但是与专业完备的数据集相比较,大多数场景下收集到的数据是不够理想的,也就阻碍了这些视觉数据进一步的理解与应用。本文旨在解决存在于不完备视觉数据的样本类别不完备和自身不完备两个问题,主要从两个方面进行展开,即不完备视觉数据的识别与生成。针对视觉数据类别不完备的问题,我们希望借助于类别
随着互联网金融的迅速发展,银行业务受到冲击,线下银行网点数量出现负增长,部分用户被互联网金融平台分流。基于此背景,银行网点决定利用推荐技术展开精准营销,提升用户在银行网点的服务体验及用户粘性。在利用主流推荐技术为新用户提供银行相关产品或活动的推荐时,由于缺少新用户的偏好数据,造成新用户冷启动问题,无法准确为新用户提供有效推荐。本论文研究的就是在特定银行网点场景下,如何在新用户偏好数据缺失的冷启动阶
我国有大量的近海区域、河道、湖泊、沼泽、水库等水域需要进行水底地形、水深、水质、库容等水信息的采集,目前多通过人工作业或单独使用无人机、无人船作业来实现。在一些人力不易到达的水域,将无人机与无人船结合起来代替人力进行灵活、安全、高效的作业对水信息采集领域而言具有一定的探索意义。为此,本文研制了一种可垂直起降的水空两用多旋翼水面无人飞船水信息采集系统,并重点研究了多旋翼水面无人飞船的控制方法。通常情