基于不平衡数据的数字货币价格趋势预测研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:cxzclong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字货币作为一款新兴的投资产品,由于其良好的技术应用前景和较高的投资回报率,在交易市场受到追捧。与其他投资产品一样,市场迫切需要一种自动化分析工具去分析数字货币的历史数据,并对数字货币的未来做出预测。机器学习方法在各个领域被广泛使用,数字货币市场也不例外,其中集成学习方法相较于传统机器学习方法具有效率高,性能优异,鲁棒性强等优点,越来越多研究者开始关注如何将集成学习更好的应用于数字货币市场上。在数字货币数据集中,大部分样本属于振荡区间,只有较少的样本属于上涨或下跌,而上涨和下跌的样本,正是数字货币趋势预测重要的研究对象,对上涨和下跌样本的错分代价,高于振荡样本。一般机器学习算法的训练目标是整体精确度的最大化,在数据不平衡的数据集中,模型学习会偏向占多数的样本,导致占少数的样本分类性能降低。因此,在使用机器学习方法分析数字货币时,解决数据不平衡是无法忽视的重要部分。本文目的在于提高集成学习模型在数字货币场景下的分类性能。基于这个目标,首先从数据层面提出一种基于聚类和特征分布的上采样算法SC-SMOTE算法来改善数据不平衡现象,然后在Boosting集成学习框架上,结合SC-SMOTE算法和权重均衡因子,提出适用于数字货币的平衡集成学习算法SCSMOTE-Boost算法。该算法将数据集进行聚类,并选择具有代表性的种子样本,基于类簇中的特征数据分布进行上采样,提高对样本在空间位置分布和特征数据分布的重视;同时,添加了一种样本权重均衡因子,提高了集成学习过程中少数类的重要程度。SCSMOTE-Boost从数据层面,集成学习算法和权重调整三个方面进行优化,在多个数字货币种类上进行实验,证明了 SCSMOTE-Boost在数字货币趋势预测场景的有效性和稳定性。
其他文献
随着国家海洋强国战略的提出,海洋环境监测、资源开发以及军事活动等海洋相关应用需求与日俱增。由于水声协作传感网具有良好的通信性能和可扩展性,可以针对不同应用场景进行部署,因此有着广泛的发展前景。然而,由于水下环境以及水声信道的复杂性和不确定性,大量无效通信将导致水下传感器节点的能量被过度消耗;同时,由于水下传感器节点等设备的能量有限,且在水下环境中难以进行补充和更换,使得能量受限问题成为水声协作传感
目的通过研究乳腺X线摄影、乳腺磁共振对非钙化型乳腺癌影像诊断的评价,并且分析两者诊断效能之间的差异,旨在提高非钙化型乳腺癌的准确率,减少非钙化型乳腺癌的误诊率,为临床治疗相应疾病提高可靠依据。资料和方法回顾性收集2016年1月至2019年12月经手术和病理证实的119例乳腺癌的临床资料和影像学资料,其中男2例,女117例,年龄28~77岁,平均年龄51.5岁,中位年龄50岁。所有病灶均接受乳腺X线
红树林是生长在热带、亚热带海岸潮间带的一类木本植物群落,因为地处海陆交界,所以红树具有独特的生态价值。随着全球气候变化和人类活动干扰的加剧,以及互花米草的入侵,红树林生态系统的现状不容乐观。为了更全面地了解全球变化背景下,红树植物与互花米草的根际活动变化,确定根际微生物在其间的作用,我们在漳江口红树林展开实验,通过设置野外水位梯度控制平台,实现同一空间的水位控制,模拟海平面上升的过程,通过对秋茄、
肉毒毒素(Botulinum toxins,BoNT)是由厌氧的肉毒梭状芽孢杆菌(Clostridium botulinum)产生的一种毒性极强的蛋白类神经毒素,是目前自然界中已知生物和化学毒素中毒性最强的物质。BoNT共有7种血清型(A~G),自然情况下A、B、E、F型均可导致人类肉毒中毒。其中,A型肉毒毒素(BoNT/A)毒性强且报道病例多,有关A型毒素单克隆抗体(mAb)的研究也比较多。而对
河口区域是海洋开发的前沿地带,是陆地与海洋物质流和能量流交换的重要平台,也是人类活动密集的区域,因此河口区域的环境问题是目前河口研究的热门方向。河口区域面临的主要环境问题为入海泥沙量锐减、陆源污染物增加、湿地被侵占、水温异常等,对这些环境问题进行评估需要对水域的温流分布以及径流通量进行高精度的实时监测。然而河口区域的温流分布受到径流以及潮汐的双重作用,呈现明显的空间差异性,因此在实时监测上存在一定
交通运输工具的发展是保证国民经济增长的决定性因素之一。当前,代表中国最先进的交通运输工具有:轨道交通领域的中国高铁“复兴号”和民用航空领域的现代干线飞机C919。但在交通运输工具高速发展的同时,因结构导致的交通安全事故时有发生。转向架构架作为高铁等轨道交通车辆的骨架,在行车过程中承受复杂外力作用,故转向架构架,特别是其焊接区域,是轨道交通车辆最常见的失效部件之一。飞机的复合材料结构在飞行中需要承受
沸石是一类具有丰富三维纳米孔道的铝硅酸盐分子筛。MFI型结构是众多沸石分子筛拓扑结构中的一种,该结构具有独特的“之”字型与直线型十元环纳米孔道。ZSM-5铝硅酸盐沸石分子筛和其全硅端元的Silicalite-1沸石分子筛是MFI型沸石分子筛的典型代表。MFI型沸石分子筛因其优异的择形催化性、良好的吸附分离性、较高的热稳定性成为能源与环保领域最为重要和常用的沸石分子筛种类之一。然而,MFI型沸石分子
21世纪以来,海洋在一个国家中的地位,特别是军事的战略地位变得越来越突出。在开发和利用海洋资源的过程中,为了维护这个过程中的安全,无论是民用还是军用,都要正确地对水声目标进行分类识别和跟踪。为了更好地监控特定海域,也需要对该海域中的水声目标进行分类和识别。因此本文在水声识别技术的基础上,以船舶辐射噪声为主要研究对象,研究不同种类船舶的识别问题。虽然水声目标识别技术已经发展了很多年,但是在大多数情况
肝细胞癌(HCC)是原发性肝癌中最常见的病理类型同时也是全球第四大癌症相关死亡原因。它属于高度炎症相关的癌症类型,调节性细胞死亡(RCD)可在HCC的“炎症-致癌”途径中起到肿瘤抑制的作用。铁死亡是一种新型RCD,可规避致癌过程的抗凋亡信号有利于抑制HCC进展。铁死亡性细胞形态表现为线粒体大小、外膜及嵴的改变,肿瘤抑制因子p53的逆行信号是线粒体早期功能障碍的提示信号,参与细胞生存和死亡之间的调节
随着航空发动机性能的日益提高,对其内部压力进行检测和实时监控成为了人们研究的重点。但由于结构和材料的限制,传统的压力传感器无法在发动机内部高温、高压环境下工作。最近一种基于微波谐振腔的压力传感器因其具有无线无源的结构以及高温下信号传输距离远等优点,特别适合在高温高压的环境下进行压力监控,因此受到广泛关注。聚合物先驱体陶瓷(Polymer-derived ceramics,PDCs)具有高的耐高温性