大规模机器学习在算法交易中的应用与研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:feifeiml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机技术不断发展的条件下,越来越多的数据被加以采集和储存,从这些大规模数据中发现的统计规律,可以对投资决策进行指导。算法交易是通过数学和计算机模型从大规模数据中发现投资机会,自动完成证券买卖的投资方式,相比于通行的基本面分析和技术分析具有客观性、纪律性和精确性等优势。算法交易在国外已经存在多年,并在证券市场中扮演着重要角色。随着最近几年我国证券市场的发展,算法交易逐渐被各投资机构重视并加以尝试。算法交易系统的建设需求十分迫切,这从今年夏天因交易系统问题导致的“光大事件”中可见一斑。在对算法交易系统需求进行分析的基础上,本文为算法交易系统做出了较为详细的系统设计,将算法交易系统划分为数据抓取及存储、量化模型运行时、程序下单三大模块。数据抓取及存储模块负责从不同的数据源获取数据并进行持久化存储,机器学习模型运行在量化模型运行时模块中,尝试从大规模的数据中发现投资机会,并通过程序下单模块自动完成证券的买卖。国内现有的算法交易系统被设计为主要用于处理从稳定数据源获取的结构化数据,比如交易所提供的交易记录。在面对内容庞杂的大规模互联网数据时,因存在数据抓取和存储上的困难而较少地使用。主题爬虫技术在垂直搜索中被较为广泛的研究,大规模数据存储的问题作为大数据技术的重要部分也被广泛的讨论。本文将主题爬虫和大规模数据存储技术运用到算法交易系统中,通过使用SVM技术的主题爬虫提高了系统抓取数据的效率,以关系型数据库分库分表技术在保证存储系统事务性的同时能够支撑大规模数据的存储。同时,以分布式数据库为核心,使得交易系统能够快速适配各种不同的数据源。除了实现数据抓取与存储模块外,本文还搭建了量化模型运行时模块,将SVM应用于金融时间序列的处理,结合交易经验,构建出日内交易模型,实验显示该模型的预测准确率略高于现有的研究。以此更好的展示算法交易系统的全貌。
其他文献
目的:探讨经超声引导的小剂量凝血酶注射治疗经常规压迫法治疗无效的医源性股动脉假性动脉瘤(iatrogenic femoral artery pseudoaneurysms,IFAP)的有效性和安全性。方法:28例
目前,中国各级政府多层次的政务督查网络已初步形成,督查工作机构逐步完善,构建了具有中国特色的政务督查工作体系,但从中国的实际情况来看,我们国家在政府督查工作中还是存
上扬子下寒武统筇竹寺组具有良好的生烃条件和勘探前景。本文基于野外剖面观测、室内薄片鉴定,以及扫描电镜等系统的研究测试,从沉积相、矿物成分特征等方面,对下寒武筇竹寺组黑
官腔镜技术的发展与普及使子宫内膜息肉的诊治可谓“锦上添花”,宫腔镜不但可以对子宫内膜息肉进行直观、准确的形态学诊断,还是子宫内膜息肉理想的治疗方法。因宫腔镜检查对子
陈旧性宫外孕42例临床分析附属医院妇产科黄燕南陈旧性宫外孕患者症状和体征不典型,就诊较晚,病程较长,易被延误诊治。我院自1984年1月至1992年12月共收治陈旧性宫外孕55例,除10例首次就诊确诊为陈
通过文献回顾的方法,阐述了关注中国医疗保险支付体系的原因,并分三个阶段对其研究历程进行了回顾和总结,最后指出未来的医保支付体系研究应该"更微观、更宏观"。
在违约责任中 ,损害赔偿各国合同法皆采完全赔偿原则。完全赔偿原则作为损害赔偿的一般原则 ,是民法公平原则与等价有偿原则的必然要求。但基于违约行为的复杂性 ,在司法实践
政治协商制度是中国特色社会主义制度的组成部分。“政协是我国政治体制中贯彻社会主义民主,实行互相监督的重要形式,它的主要任务应当是实行政治协商和民主监督。”“民主监
中国摔跤历史悠久源远流长,特别是它的称谓在各个时代都有不同。先秦时摔跤称为角力、相搏、手搏,主要用于军事训练。秦时正式定名为"角抵",开始成为娱乐表演项目。汉代摔跤
文章结合实践,对首诊负责、查房、病历质量、病例讨论、会诊、值班和查对等7项核心制度落实中存在的主要问题及其表现形式进行了阐述,从医务人员责任心、有效工作时间、质量