基于生成对抗网络的时序数据缺失值填充算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:lh305879918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网和传感器技术的发展,现实生活中的大量时序数据,例如股票走势数据、气象观测数据和个人医疗数据等,被监测并记录下来。挖掘时序数据中的隐含信息并对时序数据进行分析具有重大的现实意义,比如股票价格分析和预测、天气预报以及未来健康状况预测等。然而,由于采集设备的不稳定性或者被干扰等原因,采集到的时序数据往往是不完整的,而数据的缺失部分则阻碍了对时序数据的深入分析。因此,缺失值的处理对于后续时序数据的分析变得格外重要。传统的缺失值处理方法包括直接删除法、直接填充统计数据法以及基于机器学习算法的填充法。然而上述缺失值处理方法均没有考虑到时序数据中的时间先后信息,故难以取得准确的填充效果。本文利用时序数据的时间间隔特征,结合生成对抗网络技术,提出了一种基于生成对抗网络的时序数据缺失值填充方法。经过对抗式的训练,该方法能够生成符合原始数据集分布的新时序数据。针对每一条缺失时序数据,本文采用梯度下降算法寻找一个低维特征向量,使得以该低维特征向量为基础的生成样本与原始样本最相似,从而利用生成样本填充时序数据当中的缺失值。为了加快填充时序数据中的缺失值,本文进一步提出了端到端的时序数据缺失值填充方法。该方法充分利用了降噪自编码器的降维能力,自动的为每一条缺失时序数据寻找对应的低维特征向量。结合生成对抗网络技术,能够端到端的自动填充时序数据中的缺失值,具有更高的时间效率。真实数据集下的实验结果表明,本文提出的两种时序数据缺失值填充方法,在填充准确度上显著优于国际主流的填充方法,利用本文方法填充后的数据集也能够显著提高下游分类和回归任务的性能。
其他文献
房地产行业是典型的资本密集型行业,房地产的开发、销售都离不开银行信贷资金的支持,所以房地产市场的发展、房地产价格的波动和国家的宏观经济政策、银行信贷情况有着密切联
随着技术的发展和水务系统应用需求的不断推进,人们对于水务系统的要求也越来越高,传统的水务系统正在向智慧水务系统发展。为实现水务系统的管理智能化,使得水务场景下的工作人员能够更好的融入水务系统中,完善的定位服务是必不可少的。目前水务系统中主要依靠的是GPS定位系统,该系统可基本满足水务系统中室外场景的各种定位需求。但水务系统若想拥有更加全面的定位服务,还需要两个定位场景来完善。第一个是室内场景,精确
随着教育改革的不断深入,数学教材发生了变化,主要目标是培养学生的实践能力和创新思想。二次函数在生活中应用比较广泛,是数学学习的重点内容。因此,在二次函数的教学中,要
混凝土的耐久性对于混凝土在服役期间的可靠性非常重要,尤对于恶劣环境下服役的混凝土。混凝土的抗渗性能是混凝土耐久性重要的影响因素。最近研究表明,纳米改性是提高混凝土
综合客运枢纽地区集成了多种交通方式,各种交通方式设施设备的合理布置直接影响着枢纽集疏运效率。在各种方式中,正确认识行人流和机动车流的相互关系,有效处理交叉干扰,将对提高枢纽集散效率具有重要的理论和实际意义。然而,目前国内外尚缺乏对枢纽地区人车干扰机理的系统理论,缺乏人车交互设施设备配置的相关评估方法和工具。针对这一问题,本文对综合客运枢纽地区人车干扰的交互机理展开研究,并运用微观仿真的方法,评估枢
早期的任务分配模型主要受启发于社会性昆虫和动物的集群行为,其中多数属于探索性模型,旨在揭示某个特定假设条件下群体中个体状态改变的规律和性质。随着演化博弈论的不断发展,其应用可以延伸到任务分配的研究领域,将描述群体策略演化的框架用于对任务分配现象的抽象建模,并且可以借助演化博弈论的思想解释群体中分工合作行为的涌现。群体中的个体通过各自执行特定的任务使得在群体层面达到分工合作的效果,可以被看作是一种特
聚合物分离膜在当代膜分离技术领域中具有非常重要的地位,然而膜污染严重制约了其在水处理、生物医学等领域的应用。探索聚合物分离膜的新型改性方法,对膜表面进行功能化设计
生物材料表界面的构建通常采用共价修饰的方法,虽然这种改性的方法能够赋予材料表面丰富的化学基团和生物功能,但不免也会存在诸多缺点。例如,修饰过程繁琐,涉及复杂化学合成,反应过程不可控,对材料基底具有选择性,因此在一定程度上限制了该方法的应用范围。此外,传统生物材料表界面的构建方法,原料难以全部参与表界面的反应,不环保,成本较高。本文创新地利用聚环糊精(PCD)和单宁酸(TA)的邻苯三酚的主客体作用以
上周本刊报道了《廊坊银行直销银行P2P化》,廊坊银行直销银行外包给互联网金融公司中融金(北京)科技有限公司(以下简称“中融金”)来运营。在进一步调查过程中,北京商报记者注意到,
报纸
流通效率是反映产业竞争力的核心指标,其概念综合反映了企业在经济发展上的节奏和价值实现的速度。鉴于不同企业涉及领域不同,企业类型多、数量规模大,在经济管理方面存在较