基于机器学习的期货市场趋势研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zhuoluo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融市场与量化交易的不断发展,高频交易已经成为量化交易发展的核心。越来越多的投资者加大了对高频交易研发的投入,并逐渐转向依靠高频交易获取稳定的盈利模式。高频交易的核心是对高频交易数据进行分析。机器学习技术是现代统计学习理论中最重要的发展技术之一,通过对样本数据的建模分析,从而刻画出样本数据背后蕴含的模式。在量化投资与高频交易领域,机器学习也有着非常广泛的应用。本文主要研究机器学习算法在期货市场高频交易领域价格趋势的研究。本文首先研究了机器学习算法中应用较为广泛的随机森林和支持向量机模型。针对金融市场中对数据时效性要求的特征,考虑近端数据的信息量高于远端数据,构建了加权支持向量机模型,通过对样本数据进行时间加权,提升模型拟合准确性和时效性。针对价格趋势研究,需要将其转化为分类问题,定义价格趋势分为上涨、下跌和稳定三类,并将其量化进行分类。然后构建了高频交易数据指标体系结构作为样本数据的特征集。由于境内黄金期货主力合约日内交易量较大,市场流动性高,所以采用黄金期货数据实证分析。文章首先研究了黄金期货日内数据的分布,利用随机森林模型进行指标特征重要性排序和参数训练,研究发现指标特征存在较强的规律型和分层结构。通过重抽样方法对支持向量机模型进行参数寻优。最后对本文构建的加权支持向量机模型进行训练。研究发现高频交易价格趋势与市场报单量具有极高的相关性,与市场价格等相关指标几乎没有相关性。通过对三类模型训练结果的对比,证明加权支持向量机在一定程度上提升了模型拟合准确率,也相应降低了模型的训练时间。加权支持向量机模型综合了随机森林无需进行样本重抽样以及训练时间短的优势和支持向量机预测准确率高的优势,在实际应用领域具有更高的应用价值。
其他文献
目的 :探讨正常人月经周期子宫内膜细胞凋亡及其与Fas基因家族的关系。方法 :应用TUNEL法检测细胞凋亡的时空分布 ,用原位杂交和免疫组化法检测Fas、FasL的表达。结果 :( 1)
采用亨斯迈公司的尼龙专用活性染料艳丽牢,对尼龙66/涤纶交织物进行活性/分散染料一浴法染色。与传统酸性/分散染料一浴染色法相比,该工艺具有更好的匀染性、重现性和色牢度
2003年初,我国广东省发生了"非典"疫情,其来势凶猛,人类陷入了一场灾难,社会上曾一度出现谈"非"色变的恐慌,部分省区还出现抢购食醋、食盐等生活物资和抗病毒药品的现象.人民
随着现代社会生活节奏的不断加快,个体承受的压力不断增加,表现为焦虑、紧张、失眠、抑郁甚至是疾病,这些因素都使机体处于一种慢性应激状态。慢性应激与神经内分泌免疫网络
在设计模糊逻辑系统时,如何实现其对输入噪声的鲁棒性是一个首要的问题,相应地如何很好地分析其对输入噪声的鲁棒性(也称敏感性分析)也就成了一个重要问题.使用统计的方法,对常见的
古树茶眼下是普洱茶市场上备受追捧的对象,在茶叶市场上,“古树茶”“古树纯料”“古树头春”等等打着古树茶招牌的各种普洱茶数不胜数,从几十到几千块的古树茶鱼龙混杂、时常令
报纸
校园戏剧通识教育是实现素质教育的重要途径和方法,作为一种必要的教育手段,能够有效培育学生的健康心智、涵养和审美人格;增强表达和沟通能力,培育协作精神;增强角色定位,感
目的研究胃癌组织中富含脯氨酸蛋白11(PRR11)表达与胃癌临床病理参数之间的关系以及PRR11表达对胃癌患者预后的影响。方法通过患者胃癌组织标本的免疫组化染色,评估了132位胃癌
黄庭坚一生漂泊,行程际遇丰富,创作了大量的纪行诗。文章从黄庭坚的纪行诗艺术特点于早中期的奇崛峭拔和晚年的平淡质朴两方面来分析.具体从草蛇灰线的章法结构、拗峭平和的句法
本文基于作者自身的实际工作经验与学习认识,首先简单分析了新媒体环境下企业危机公关的重要性,然后主要就新媒体环境下企业的危机公关策略提出了部分探讨性建议,以期能为相