大数据分析与价差套利

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:packey80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要:很多人都知道股市的赚钱比例是很低的,近70%的人在亏损,真正可以赚钱的只有10%。面对金融市场中的巨大风险,人们通过各种技术手段分析金融数据,发掘其中隐含的规律,大数据技术就是一种重要的技术手段。针对如何利用大数据技术分析数据在股市中获得利润的问题,文章将利用R语言对金融数据进行大数据分析,给投资者提出建议。
  关键词:大数据;价差套利;R语言;金融
  中图分类号:TP311.1      文献标识码:A 文章编号:2096-4706(2020)06-0013-03
  Abstract:Many people know that the percentage of people who make money in the stock market is very low. Nearly 70% of people are losing money,and only 10% can make money. In the face of huge risks in the financial market,people analyze financial data through various technical means to discover the hidden laws. Big data technology is an important technical means. Aiming at how to use big data technology to analyze data to obtain profits in the stock market,this paper will use R language to conduct big data analysis on financial data and give suggestions to investors.
  Keywords:big data;spread arbitrage;R language;financial
  0  引  言
  在金融市场上,对于投资者来说,抓住合适的投资机会进行盈利是很困难的,因为市场中金融产品众多而且难以把握交易的时机,大数据技术可以给投资者提供合理的建议。大数据是一个专门用于分析、处理和存储大量数据的领域,这些数据通常来自不同的数据源。通过大数据技术对金融数据的分析处理,将会帮助投资者对交易时机的把握和对金融产品的选择,因此,本文基于河南大学大数据课程,对金融数据进行了大数据分析。
  1  股市的风险
  以一个经典的故事为例:一个女人和一个男人抛硬币,如果都是正面男人赢3块,都是反面男人赢1块钱,一正一反女人赢两块,这从表面上的看是非常公平的,但结果是男人一直输。我们可以通过数学分析的方法来看看其中的原因,女人想要自己一直赢,保证男人赢的数学期望始终小于零就可以了,我们不难解出,只要女人出正面的概率在1/3和2/5之间,无论男人怎么出硬币,都会一直输钱。女人就像股市里的庄家一样,可以拉升股价也可以打压股价,男人就像散户一样,可以买多,也可以买空。当庄家拉升股价时,我们做多赢了,做空的话就输了;如庄家打压股价,我们做多输了,做空就赢了,表面是公平的,实际上庄家有一定的策略让散户一直输钱。由此表明,股市有风险,投资需谨慎。
  在市场上,随着新的信息被披露,企业的股价必然会受其影响而出现价格波动,例如,2019年苹果公司的新产品iPhone 11的热卖造成了其股价的上升。当然反应和调整是需要时间的,一般来说市场越有效,反应和调整所需要的时间就越短,对于投资者来说,要想获利,就要想尽一切办法在市场作出反应之前确定投资计划。
  2  价差套利
  下面介绍一种利用价差来获利的投资方式,这种方式相对来说风险较低。
  (1)该方式的典型是在期货市场。期货价格的基础是现货价格,但是期货价格和现货价格的变化趋势并不一样。可以用基差来描述现货价格与期货价格之间的关系,利用“基差=现货价格-期货价格”的公式就可以求出基差。在到期之前,基差应该为正(此时称为反向市场),也就是期货>现货价格,因为期货合理价格=现货价格*(1+利率)。如果出现了现货价格高于期货价格(此时称为正向市场),且幅度扩大,就可以买进期货、卖出现货,等着日结算获利。
  (2)时间价差也叫作日历价差或水平价差。一般情况是卖出一个期权,并同时买入一个远期期权,如果两个期权的实际价值相同的话,远期期权更具有时间价值,因为离到期日越近,期权的价值会减少。这一买一卖就可以赚取其中的价差,时间价差最多的就是商品,如Crude Oil Calendar Spreads。
  (3)各产业内不同个股,股价时常会一起涨或一起跌,且保持一定的價格差距(Price Gap)。当两只股票之间的价差扩大缩小时,就可以进行价差交易。例如,股票A高于股票B约20元。参考技术、筹码情况之后,如果价差缩小到20元以内,可以买进股票A,卖出股票B。反之,价差高于20元可以买进股票B,卖出股票A。
  (4)寻找走势相近的两档权重股,一买一卖进行价差交易。可分为买进价差、卖出价差。若价差=股票A-股票B,买进价差的意思是:做多股票A,做空股票B。两只股票的统计相关,出现正负交替时,就是套利机会出现的时候。表1计算了在香港上市的两只股票:中国银行和中国农业银行的价差表(中国农业银行-中国银行)。
  从2019年6月4日到2019年7月3日一个月内,一股未计算手续费的利润是0.88元,以一张期权1 000股计算,此1:1的价差部分,一套价差获利880元。如果配合套期保值比率(hedge ratio),获利可能更惊人。   3  大数据技术
  对于大数据的定义,可以认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[1]。大数据具有数据量巨大、数据真实性、数据类型多样、流动速度快和价值密度低的特点,即大数据的“5V”。
  3.1  数据量巨大
  大数据处理的数据量是巨大的,而且还在不断增长。世界上有很多股票交易所,这些股票交易所拥有数万家上市公司,每家上市公司每个财年都会公布财务报告,还有大量的期货信息和其他的金融衍生品。由此可見金融市场的数据之多。
  3.2  数据的真实性
  数据的真实性是指数据的质量或真实可信度。股票的开盘价、收盘价、最高价、最低价和成交量的数据是真实的。
  3.3  数据类型多样
  大数据支持处理多种格式和类型的数据。金融市场上有很多产品、股票、期权、期货、外汇以及各种各样的衍生品,当然,还有与它们紧密联系的时间数据。由此可见市场上种类丰富的数据。
  3.4  流动速度快
  在大数据环境中,大量的数据可以在很短的时间内积累。毫不夸张地说,在市场上,一分钟可能积累几百GB或者几TB的数据,投资者所做决策的价值会随时间的推移慢慢下降。
  3.5  价值密度低
  价值是指数据对企业或个人的有用性。一般来说在大数据背景下,处理庞大的数据量才可以提供一个投资建议,进行获利。
  基于大数据的“5V”特点,其存储技术和处理技术可以有效处理金融领域的数据。数据分为结构化数据、半结构化数据和非结构化数据,对于这些数量庞大而且种类多样的数据,提出了集群、分片、NoSQL数据库、CAP理论、ACID数据库设计原则、BASE数据库设计原则,这些理论和对应的技术将有效地对数据进行存储。无论是SCV理论,Hadoop和MapReduce的处理模型,相关性分析,机器学习,自然语言处理,大数据使用这些理论方法的目的就是发掘数据背后隐藏的秘密,要将这些结论以图表或者其他易懂的方式和模型清晰地展示在使用者的面前[2]。由此可见大数据技术在金融领域应用价值。
  4  利用R语言进行数据分析
  下面通过分析联合利华公司和保洁公司的收盘价来发现价差套利机会,因为这两个公司的主要经营业务相似,所以数据相关性够高。
  以保洁公司2015年11月到2019年11月的收盘价减去联合利华公司2015年11月到2019年11月的收盘价(数据来源于雅虎金融),利用R语言汇总分析得到如图1所示的价差的时间序列图。从图中观察可知,两家公司的价差波动比较大,有套利的机会。对此进行进一步的分析,得到如图2所示的价差概率分布图,图中的虚线是波动的平均值,通过图2我们可以进一步发现,两家公司的价差有明显的波动,这就意味着有价差套利的可能。
  我们有个价差交易策略——价差大于上界,我们做空价差,反之做多。按照上述所列举的中国银行和中国农业银行进行价差套利的例子所代表的思想,利用R语言进行分析,结果如图3所示,点1证明我们要做多,点2证明我们要做空。
  5  结  论
  利用R语言对保洁公司和联合利华公司的股票收盘价进行分析,可以找出合适的套利时机,指导投资者做出正确的决策。由此可见,使用大数据分析对利用价差进行投资有巨大的意义。现在国内的大数据技术发展已经成熟,且中国市场是一个弱式有效市场,善用大数据技术对历史金融数据处理分析,将会给投资这带来巨大的利益。
  参考文献:
  [1] 本刊编辑部.什么是大数据 [J].黑龙江档案,2016(6):98.
  [2] 维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革 [M].盛杨燕,周涛,译.杭州:浙江人民出版社,2012.
  作者简介:谢玉成(1998.11-),男,汉族,河北石家庄人,本科,研究方向:大数据分析;王嘉琳(1998.11-),女,汉族,河南郑州人,本科,研究方向:数据分析。
其他文献
摘 要:由于技工院校学生普遍受知识水平、经验阅历、感受体验等多方面的限制,创新意识和创造能力的不足成了当今技工院校学生的短板。为了解决创新创造能力薄弱的问题,以及实现专业教学与企业需求的有效对接,现以广州市轻工技师学院多媒体制作专业高技层次核心课程“高级影视特效制作”的教学作为研究基础,尝试在教学过程中引入成功企业的创意构思工作方法。通过教学的实践证明,概念塑造和创意思考法能有效引导学生激发内在潜
期刊
摘 要:文章对于一种基于Linux系统和树莓派开发的智能监控摄像头进行了研究。面对人员情况复杂,布置环境多种多样的应用条件,这种摄像头具有无线化、小型化、智能化的特点,减少了对布置环境的要求以及对相关人员的需求;结合视觉信息处理、云台舵机控制,可以自动进行人脸识别、人脸验证、识别颜色等;并且在识别特征的基础上持续跟拍目标,适合紧急布置,识别特定目标并跟拍的任务。  关键词:监控;人脸识别;特征检测
期刊
摘 要:为解决“中医骨伤科学”实训课难以为学生提供真实病例反复训练的现状,提出基于虚拟仿真技术的虚拟仿真教学法,将122名中医专业学生随机分成虚拟仿真教学组及传统教学组,前者接受虚拟仿真教学,后者接受传统实训课教学。授课完毕后对两组学生完进行考核。结果显示:虚拟仿真教学组学生操作考核平均分及学生满意度均明显优于传统教学组。研究表明,虚拟仿真教学法是一种行之有效的教学方法创新,可为其他学科实训课教学
期刊
摘 要:智慧城市指综合利用各类信息技术,通过对城市人与物的感知和互通,大幅优化并提升城市运行效率的过程。文章针对广州市南沙区的区域经济运行展开结构化、动态化、指数化的定量研究,建立区域经济运行指标体系模型,并借助该模型提升南沙区政府决策的“智慧度”。首先运用计量经济学的相关方法构建区域经济运行指标,然后通过德尔菲法对指标进行权重赋值,并应用AHP层次分析法确定最终的指标权重,最后通过基准对比分析每
期刊
摘 要:课程导学是导学教师为学生提供的学习支持服务手段之一,即由导学教师配合授课教师在课程教学前后为学生提供的学习支持服务,既可以对学习内容进行辅导,也可以对学习方法进行指导。针对成人高校计算机公共基础课程教学现状,以西安广播电视大学为例,围绕“计算机应用基础”课程,分析计算机基础课程体系构建的基础和目标,在对不同专业需求和学习要求进行调研的基础上,从专业角度出发,对计算机类公共或基础课程构建“F
期刊
摘 要:新冠肺炎引起的急性呼吸道传染病,存在“人传人”的现象。体温异常为判断疑似和确诊新冠肺炎的重要指标之一,人工测体温不仅耗时、费力,最主要的是增加传染概率。基于ZigBee无线传感网络对新冠肺炎疫情预警系统进行设计,节省人力,对新冠肺炎的预防能在第一时间获得数据,防止校园大规模爆发,并且能够降低新冠肺炎在人工测量时带来的风险,有效控制新冠肺炎。  关键词:ZigBee;无线传感网络;新冠肺炎;
期刊
摘 要:为了提升学生的实践动手能力,现在越来越多的高职教师都选择采用项目化教学,随着项目化教学的不断深入,项目化教学实施的问题也逐渐显现出来,基于此,以高职高专汽车检测与维修专业学生学习“汽车电器构造与检修”课程为教改对象提出了信息化教学改革的新思路,通过教学改革表明,采用信息化教学模式,可以有效地提升学生的学习兴趣,拓展学生的学习时间和学习空间,既提升学生的创新能力,使学生的综合职业素养也得到了
期刊
摘 要:近年来,立足于不同学科或研究点的名师工作室建设在全国多地展开,对于教育教学团队的建设起到了积极作用。信息化教学是当前教育界普遍关注的现代教学手段之一,并得到了众多教师的实践与运用。将信息化教学与名师工作室相结合并借助于网络平台是大面积提升教师信息化水平的有效途径。“泛PPT”则是以当前教师群体使用的主流信息手段PPT为基础,添加若干插件而深化其内涵、丰富其功能。信息化教学教研的聚焦点在于基
期刊
摘 要:在信息化高速发展的时代,上海市中职计算机类课程开设与时俱进,各中职校计算机类教学资源日新月异,但由于缺乏统一资源库,每个学校的教学资源包括教学案例、音视频等数据不能共享,只能单独存放在独立数据库里。研究旨在分析Hadoop+GPU的大数据平台架构可行性应用,即集中存储和挖掘上海市中职计算机课程资源。此构架旨在汇总并挖掘中职计算机类课程资源,做到资源共享、教学资源充分利用,可以多层次多维度建
期刊
摘 要:随着雾霾天气的逐渐增多,对空气造成了污染,给人们的生活产生了较大影响,人工神经网络是人们预测雾霾的重要工具。因此,为了更好地反映雾霾在时间及空间的分布状况,为预防工作提供充足的时间准备以雾霾预测研究为例,对人工神经网络的现状、发展与应用进行了简要描述,并结合人工智能、大数据等方面对人工神经网络的未来发展趋势进行了综述。  关键词:雾霾预测;人工神经网络;水质预测  中图分类号:TP183
期刊