缺失值填补相关论文
可靠、准确的区域用电负荷预测对于电力系统的运行和规划至关重要,短期负荷预测有助于经济运行、调度电力.考虑到时间序列数据从采......
随着信息时代的到来,数据呈爆炸式增长,但大多时候数据的产生并没有质量保证。很多真实应用产生的数据通常包含大量的缺失值,甚至......
随着综合立体交通网建设的持续推进和感知技术在交通领域大规模应用,交通数据在快速增长,这些将成为现代化高质量综合立体交通网的......
面对数据爆炸式积累的大数据时代,从海量数据中如何高效的挖掘信息成为了一项有意义的研究课题。分类是数据挖掘中基本且重要的技......
在科技飞速发展的今天,各行各业都离不开数据的采集、记录、分析等操作,因此累积了相当庞大的数据量,而数据缺失是不可避免的问题......
针对用户电量采集过程中数据缺失的问题,提出一种基于正则化矩阵补全的用户电量缺失值填补方法.首先,基于原始用户电量缺失值进行......
现在,大规模生态监测站普遍通过布置传感网来收集传送数据,实现对分布地理区域进行实时、远程监测。然而,由于网络的不稳定性和仪......
P2P网络借贷平台,简称P2P,是互联网金融的一种重要形式。P2P作为一个平台连接了两类群体,一类群体需要筹集资金,另一类群体有闲置......
近年来,随着金融领域逐步放宽民间资本的准入门槛,各类线上线下贷款机构迅速发展,信贷市场规模日益增大,带动了信用服务市场规模稳......
数据缺失是许多实验研究和社会调查领域中经常发生且几乎无法避免的问题。缺失问题的产生不仅会增大数据分析过程的难度,还会导致......
数据的爆炸式增长为人类社会带来巨大的机遇与挑战,如何有效挖掘数据的潜在价值已成为一项重要的研究课题。分类作为一种常见的数......
随着大数据时代的来临,我们可以通过数据挖掘技术从海量的数据中获取隐藏在数据背后的信息,从而为决策提供正确的指导。然而在现实......
古生物进化树的构建是探索早期生命起源和进化发展规律的重要途径。对于古生物进化树的构建而言,采集于化石的表征数据是可以依据......
研究背景: 时间序列模型已经是医学研究领域中重要的分析手段之一。然而,医学时间序列数据收集时常面临各种问题,缺失数据以及不规......
[背景]地面监测站点大气污染物数据越来越多地被应用到环境流行病学个体暴露评估中。鉴于大气监测等实时数据缺失信息无法弥补,利......
为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数......
GNSS监测技术被广泛应用于变形监测工作中,但GNSS监测数据中会有缺失值、噪声等误差的存在,对预测结果造成影响。引入改进的小波神......
当医疗数据存在缺失和冗余信息的情况下如何提高预测准确率一直是一个极具挑战的问题。为解决这一挑战,大多数预测模型要么直接删......
缺失数据的填补是所有数据挖掘任务中非常关键的步骤。由于电力市场的复杂性,且电价的影响因素众多,造成电价数据在采集的过程中极......
为提高燃烧效率及降低污染排放,基于运行数据的建模与优化是一种有效途径,但现场运行数据因传感器故障或传输失败等原因不可避免地存......
基于大样本非标记定量蛋白质组学数据的特征,和蛋白质组学领域相较于转录组学,代谢组学领域数据前处理方法的“滞后性”,并从快速......
缺失数据处理是数据挖掘领域中进行数据预处理的一个重要环节,由于成分数据特殊的几何性质,传统的缺失值填补方法不能直接用于这种类......
真实数据集中含有缺失值,许多数据分析技术不能直接应用到不完整数据上,且缺失值的存在会明显地降低算法的有效性,缺失数据处理是......
PM2.5是指可直接被肺部吸入的直径小于或等于2.5微米的颗粒物,它对环境的污染极大,同时危害人类的身体健康.PM2.5的精确预测对空气......
输变电设备是电网的重要组成部分,其状态量值表征了设备的基本运行状态。由于一些不可控因素,在采集时会有一些“空值”。这些缺失......
为解决具有关联性数据的缺失值问题,提出一种结合相关系数与相似性匹配作用于离散型数据填补缺失值的方法。首先,在非缺失数据源中......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
核函数方法已经被成功的用于各种函数的估计.本文利用核函数的思想,针对缺失数据造成现有的成分数据统计方法失效和k近邻填补法(KNN......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
目的提出数据缺失机制识别及处理的标准化操作流程,并开发相应集成系统,为非统计专业背景的医学工作者处理缺失数据提供恰当、专业......
近年来,随着硬件计算能力的提高,深度学习在计算机视觉、语音识别、自然语言处理、卫生医疗等各个领域取得了举世瞩目的成绩。特征......
本文首先研究两个相关关系矩阵(对称矩阵或非对称矩阵)之间的相关关系,给出预测并解决如下问题:网络间相关性检验以及高维网络中包......
近年来,随着大数据挖掘技术在水利行业中的迅速推广以及水库健康管理理念逐渐兴起,水库健康管理平台积累了海量的水库健康监测数据......
由于生产工艺、技术及设备的日趋复杂化,经典控制理论中依据物理化学机理建立精确数学模型对生产过程进行控制的传统方法已变得越来......
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在......
<正>一、问题的背景在行为学、社会学、教育学、经济学和心理学等领域研究中,人们常常遇到诸如健康状况、个性、智力水平、满意度......
代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据......
为提升PM 2.5浓度预测精度,提出基于时空融合与缺失值填补的预测方法。抓住时空相关性,以历史气象和PM 2.5浓度数据作为输入,利用......
“数据的缺失问题”是科学实验和调查研究中普遍存在的问题。数据的缺失会影响统计数据的质量,增加数据分析过程的复杂性,因此,对......