【摘 要】
:
交易策略在金融资产交易中具有十分重要的作用,如何在复杂动态金融市场中自动化选择交易策略是现代金融重要研究方向.强化学习算法通过与实际环境交互作用,寻找最优动态交易策略,最大化获取收益.提出了一个融合了CNN与LSTM的端到端深度强化学习自动化交易算法,CNN模块感知股票动态市场条件以及抽取动态特征,LSTM模块循环学习动态时间序列规律,最后通过强化学习方法累积最终收益并做出交易策略.在真实股票数据上的实验结果表明,该方法显著优于基准方法,可扩展性更强,鲁棒性更好.
【机 构】
:
清华大学 五道口金融学院,北京 100084;清华大学 北京信息科学与技术国家研究中心,北京 100084
论文部分内容阅读
交易策略在金融资产交易中具有十分重要的作用,如何在复杂动态金融市场中自动化选择交易策略是现代金融重要研究方向.强化学习算法通过与实际环境交互作用,寻找最优动态交易策略,最大化获取收益.提出了一个融合了CNN与LSTM的端到端深度强化学习自动化交易算法,CNN模块感知股票动态市场条件以及抽取动态特征,LSTM模块循环学习动态时间序列规律,最后通过强化学习方法累积最终收益并做出交易策略.在真实股票数据上的实验结果表明,该方法显著优于基准方法,可扩展性更强,鲁棒性更好.
其他文献
通过对新中国成立以来广东省甘蔗收购政策的改革发展历程进行梳理,回溯70年来我国甘蔗收购管理政策经历了从最初的政府限制市场,到市场放开,再到以市场调节为主、政府监管为辅的变迁过程.既反映了政府、蔗农和糖厂及市场之间的角色和定位的转变,也表明了我国对糖料生产管理的探索和创新.最后指出:未来的糖业管理需要放在监管理念的共识,综合协调的定位,激励机制的调整上,以保护多方的合法权利,并促进市场的有序竞争.
食糖消费是推动世界糖业发展的主要力量.通过全球食糖消费现状、时空变化特点分析后,探究了食糖消费的影响因素-人口、GDP增速、消费偏好、糖税政策、糖价和替代品,得出几个主要结论:第一,全球食糖消费量大体增长,2018/19年榨季和2019/20年榨季受疫情冲击消费下滑,消费增速波动较大,全球人均食糖消费呈先增后减态势;第二,食糖消费量区域分布由高到低排序依次为亚洲、欧洲、非洲、北美和中美洲、南美洲、大洋洲;第三,各地食糖消费偏好差异显著,人均消费量由高到低排序依次为南美洲、欧洲、大洋洲、北美和中美洲、亚洲、
目的 为满足高速列车关键部件的轻量化需求,开发高性能铸造铝合金.方法 熔炼铸造了低锌、低镁且含微量钪的Al-5.78Zn-1.63Mg-1.75Cu-0.17Zr-0.22Sc(质量分数)合金,对合金实施了双级均匀化处理及“固溶+时效”(T6)工艺,结合光镜(OM)、X射线衍射仪(XRD)、扫描电镜(SEM)、能谱仪(EDS)及透射电镜(TEM)多种分析测试手段,对比研究合金在铸态、均匀化态及T6处理态下的微观组织特征,重点关注了析出相的演变,并通过室温拉伸性能实验测试合金的力学性能.结果 铸态合金中的析
对典型金属材料H62、GCr15、316L在酸性盐雾环境中的腐蚀进行研究.镀金厚度影响H62的耐酸性盐雾腐蚀能力,铜基1.26μm镀金层表面存在微孔,使中间镍镀层暴露在酸性盐雾环境中,吸附在微孔处的酸性液膜对中间镍镀层进行腐蚀,随着腐蚀的发展,最终对基材造成腐蚀;铜基3.17μm镀金层杜绝了中间镍镀层和基材与外界的接触,从而避免了材料腐蚀.铬Cr含量影响合金钢的耐腐蚀能力,GCr15中Cr含量较低,形成的氧化铬钝化膜无法完全覆盖基材表面,使Fe与酸性液膜中的O2反应,造成材料腐蚀;316L中Cr含量较高,
针对原普通导爆雷管使用中爆破振动与后冲影响大、大块产出率高等问题,在河钢矿业庙沟铁矿露天采场进行了数码电子雷管爆破工业试验.结果表明:爆破方案设计合理,数码电子雷管爆破产生的振动波小,后冲减小了1~2 cm,大块产出率明显减少,炸药量减少10% ~15%,提高了矿山开采经济效益,具有推广价值.
介绍了宽薄规格320GD酸轧过程中出现的起筋缺陷的宏观形貌,并分析了热轧原料和冷轧参数对轧制的影响.认为酸轧过程中手动增加正弯辊力、轧机自学习参数设定不合理,导致了窜辊值逐步增大,从而引起带钢中部延伸过大,卷取过程中产生起筋缺陷.通过控制原料凸度和楔形,开发轧制力弯辊力跟随程序,降低冷轧生产过程中各机架弯辊力、4#机架压下率和酸轧卷取张力,优化板形自学习参数等措施,避免了宽薄规格高强钢起筋缺陷的产生,提高了产品质量.
为探讨城市轨道交通网络(U RT N)的网络特性及面对突发事件时的鲁棒性,提升运营效率,基于复杂网络理论,采用Space-L方法构建URTN拓扑结构,提出URTN站点重要性综合评价指标.建立URTN级联失效模型,设计级联失效仿真算法,通过网络效率和最大连通子图比例两项鲁棒性评价指标,定量分析不同攻击策略下U RT N级联失效鲁棒性.以上海轨道交通网络为例进行实证分析.研究结果表明:上海轨道交通网络在L空间中具有小世界网络和无标度网络的网络特性;无论是否存在级联失效情况,相比蓄意攻击,上海轨道交通网络在面对
深度Q网络(deep Q network,DQN)模型已被广泛应用于高速公路场景中无人车换道决策,但传统的DQN存在过估计且收敛速度较慢的问题.针对此问题提出了基于改进深度Q网络的无人车换道决策模型.将得到的状态值分别输入到两个结构相同而参数更新频率不同的神经网络中,以此来减少经验样本之间的相关性,然后将隐藏层输出的无人车状态信息同时输入到状态价值函数(state value function)流和动作优势函数(action advantage function)流中,从而更准确地得到模型中每个动作对应的
研究了低碳低硅铝镇静钢表面夹渣缺陷的产生原因,并提出了控制措施.认为表面夹渣缺陷主要是由于连铸过程中结晶器卷渣造成.通过减少结晶器液位波动,提高水口面精度,更改中间包三路氩气管路布局,提高保护渣的熔速、黏度以及表面张力,优化中间包烘烤工艺,降低冬季结晶器水量等措施,河钢唐钢生产的低碳低硅铝镇静钢热轧板夹渣率由3.9%降至1.5%.
中间包快换技术是减少停浇及生产准备次数,提高板坯铸机作业率的重要手段.介绍了首钢股份迁安钢铁公司高液位浸入式中间包快换的要点和技术特点,同时与低液位中包快换技术进行了对比.结果表明:高液位浸入式中间包快换技术在中包快换效率、接痕凝固均匀性、事故快速处理等方面优势明显,在行业中具有推广价值.