大数据环境下预测模型的自动化构建与优化

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:wangqingj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测是很多行业都需要的一项技术。随着数据的积累,较多行业面临海量数据预测的问题。针对此问题对数据加工及其分析方法进行全面且深入的研究显得尤为重要。各类行业数据的表现形式不同,产生了特定领域的各种预测模型。不同学科不同领域的数据融合与分析应用也将是未来大数据研究运用的一大方向。跨学科、跨领域预测模型的自动化构建预测过程还未有标志性的成果。为适应新的大数据发展趋势,亟待解决预测模型的自动化预测方法。近些年,根据国内外专家的综合分析已经有了一些可观的研究成果,其中应用较多的两种相对稳定的预测模型分别为高斯过程回归模型和人工神经网络模型。高斯过程是一个随机处理过程,对处理小样本、非线性、高维数等复杂问题具有很好的适应性。人工神经网络模型具有高速寻找优化解、并行计算、联想存储等特点,同时还具有良好的自学习能力。但是每种预测模型都存在优缺点,在处理数据或者得到预测的结果总会存在误差。因此,本文通过分析各类模型的优缺点提出了一种新的预测模型:PWGB模型。预测模型实现了自动化的预测,其预测过程首先通过PCA算法进行数据处理,处理后的结果作为改进后高斯过程回归模型的输入数据进行拟合得到基本预测数据与残差序列,通过BP神经网络修正的残差序列与基本预测数据相结合,得到PWGB模型的最终预测结果。PWGB模型与单项模型相比组合预测模型的适用范围更大,经过对比实验进一步证明了该模型具有一定的适用性,提高了预测结果的精度。
其他文献
随着社会的进步,环境和能源的保护越来越受到人们的关注。一直以来,照明在能源消耗中占相当大的比重,因此,具有节能、环保、长寿命等优势的白光LED已经逐渐进入了我们的生活
随着现代气象事业的发展,对数值天气预报模式的分辨率提出了越来越高的要求。数值天气预报模式的运行速度是提高模式分辨率的客观前提,是必要非充分条件。大规模并行计算是目前提高模式运行速度的主要手段。超级计算集群的规模不断扩大,性能不断提升。为充分利用大规模超级计算集群的计算能力,数值模式的可扩展性需要提高。中国气象局的“全球/区域一体化数值预报系统(GRAPES)”由动力框架、可自由组合的物理过程参数化
赛特公司的STE320热环境试验辅助管理系统,是出于保障研发车辆引擎控制器和提升产品可靠性水平的需要,特别是为了改进产品对多种恶劣环境的适应能力,从热环境试验亟需解决的
菌渣作为一种新型有机肥料,其替代传统化肥可在一定程度上改善土壤理化性质、提高土壤质量、增加作物产量,在改善农田土壤环境以及降低氮肥施用引起的环境污染风险等方面有积
随着建筑工业化的发展需要,装配式结构开始兴起。采用活性粉末混凝土(RPC)作为预制梁外壳,后浇普通强度混凝土(NSC)形成的RPC-NSC叠合梁既能发挥RPC的优势,又能发挥装配式结
设v,k,?都是正整数。一个(v,k,?)-循环差集D(28)?d_1,d_2,(43)d_k?是k个不同的模v的剩余组成的集合,对任何一个模v不同余0的数d,同余方程d_i-d_j?d都恰有?组解(d_i,d_j),其中d_i,d_j都属于D.本文根据循环差集的原始定义,首先得出了循环差集存在的等价条件:设G是一个模v的剩余类加群,若D是G的子集,则D是(v,k,?)-差集当且仅当满足|D?(D
高容量储能器件在便携式电子设备和电动汽车等领域有着巨大的市场需求。在锂电池材料体系中,锂金属拥有高的理论比容量(3860 m Ah g-1)和最低还原电势(-3.04 V vs.标准氢电极S
黄河三角洲滨海盐碱地土壤养分少、透气渗水能力差,淡水资源短缺等问题突出。本研究以黄河三角洲盐碱土壤为研究对象,采用野外试验研究微咸水灌溉与木霉对其土壤性状和枸杞光
管具公司生产物资管理系统是黄河钻井管具公司在钻井现场服务过程中对钻井工具的入库、供井、转井、回收、埋井、丢失、检验、维修、报废等各个环节的任务的总称。通过生产物
聚集诱导发光(Aggregation-Induced Emission,AIE)现象,已经成为国内外研究的热点。这类分子具有特殊的光学性质和广阔的发展前景,可以被应用于荧光传感器、光动力治疗、生物成