缺失值填补相关论文
可靠、准确的区域用电负荷预测对于电力系统的运行和规划至关重要,短期负荷预测有助于经济运行、调度电力.考虑到时间序列数据从采......
随着信息时代的到来,数据呈爆炸式增长,但大多时候数据的产生并没有质量保证。很多真实应用产生的数据通常包含大量的缺失值,甚至......
随着综合立体交通网建设的持续推进和感知技术在交通领域大规模应用,交通数据在快速增长,这些将成为现代化高质量综合立体交通网的......
面对数据爆炸式积累的大数据时代,从海量数据中如何高效的挖掘信息成为了一项有意义的研究课题。分类是数据挖掘中基本且重要的技......
在科技飞速发展的今天,各行各业都离不开数据的采集、记录、分析等操作,因此累积了相当庞大的数据量,而数据缺失是不可避免的问题......
针对用户电量采集过程中数据缺失的问题,提出一种基于正则化矩阵补全的用户电量缺失值填补方法.首先,基于原始用户电量缺失值进行......
基于质谱数据的蛋白质定量分析一直是目前高通量蛋白质组学的重要研究手段.但是基于现有质谱技术的限制,大规模蛋白质定量过程中往......
PM2.5是指可直接被肺部吸入的直径小于或等于2.5微米的颗粒物,它对环境的污染极大,同时危害人类的身体健康.PM2.5的精确预测对空气......
无监督特征选择(Unsupervised Feature Selection,UFS)是一种应用广泛的大数据降维技术,然而传统的无监督特征选择算法并不适用于......
现在,大规模生态监测站普遍通过布置传感网来收集传送数据,实现对分布地理区域进行实时、远程监测。然而,由于网络的不稳定性和仪......
P2P网络借贷平台,简称P2P,是互联网金融的一种重要形式。P2P作为一个平台连接了两类群体,一类群体需要筹集资金,另一类群体有闲置......
现实生活中,由于机械和人为等诸多原因,导致收集到的数据中常常包含缺失值,且缺失值的存在还会极大地降低算法的有效性,因此如何处......
近年来,随着金融领域逐步放宽民间资本的准入门槛,各类线上线下贷款机构迅速发展,信贷市场规模日益增大,带动了信用服务市场规模稳......
数据的爆炸式增长为人类社会带来巨大的机遇与挑战,如何有效挖掘数据的潜在价值已成为一项重要的研究课题。分类作为一种常见的数......
随着大数据时代的来临,我们可以通过数据挖掘技术从海量的数据中获取隐藏在数据背后的信息,从而为决策提供正确的指导。然而在现实......
随着基因微阵列技术的发展,人们对于基因表达谱数据的研究逐渐成为了生物信息学的研究热点。这些研究为我们认识和理解生命现象提......
古生物进化树的构建是探索早期生命起源和进化发展规律的重要途径。对于古生物进化树的构建而言,采集于化石的表征数据是可以依据......
教学评价信息的采集中难免出现数据缺失的情况,不适当考虑丢失的数据会导致分析结果的偏差。数据填补技术针对不同数据集的填补性......
目的通过对单核苷酸多态性(SNPs)数据展开缺失值填补影响因素与填补效果的研究,为利用SNPs数据进行基因与疾病的关联研究提供科学......
目的:通过对SNPs数据展开标签SNP位点的筛选以及缺失值填补的影响因素与填补效果的研究,为SNPs模拟数据在科研工作中的应用提供方法......
研究背景: 时间序列模型已经是医学研究领域中重要的分析手段之一。然而,医学时间序列数据收集时常面临各种问题,缺失数据以及不规......
[背景]地面监测站点大气污染物数据越来越多地被应用到环境流行病学个体暴露评估中。鉴于大气监测等实时数据缺失信息无法弥补,利......
为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数......
GNSS监测技术被广泛应用于变形监测工作中,但GNSS监测数据中会有缺失值、噪声等误差的存在,对预测结果造成影响。引入改进的小波神......
当医疗数据存在缺失和冗余信息的情况下如何提高预测准确率一直是一个极具挑战的问题。为解决这一挑战,大多数预测模型要么直接删......
缺失数据的填补是所有数据挖掘任务中非常关键的步骤。由于电力市场的复杂性,且电价的影响因素众多,造成电价数据在采集的过程中极......
为提高燃烧效率及降低污染排放,基于运行数据的建模与优化是一种有效途径,但现场运行数据因传感器故障或传输失败等原因不可避免地存......
随着我国煤矿开采深度的不断增加,冲击地压、煤与瓦斯突出等动力灾害日益加剧,这些动力灾害与深度开采过程中上覆岩变形有密切的关......
缺失数据处理是数据挖掘领域中进行数据预处理的一个重要环节,由于成分数据特殊的几何性质,传统的缺失值填补方法不能直接用于这种类......
真实数据集中含有缺失值,许多数据分析技术不能直接应用到不完整数据上,且缺失值的存在会明显地降低算法的有效性,缺失数据处理是......
PM2.5是指可直接被肺部吸入的直径小于或等于2.5微米的颗粒物,它对环境的污染极大,同时危害人类的身体健康.PM2.5的精确预测对空气......
输变电设备是电网的重要组成部分,其状态量值表征了设备的基本运行状态。由于一些不可控因素,在采集时会有一些“空值”。这些缺失......
我国电力行业自动化、信息化进程高速发展,电站积累了海量的历史运行数据,其中必然蕴含了大量未知的宝贵知识,为应用数据挖掘指导......
为解决具有关联性数据的缺失值问题,提出一种结合相关系数与相似性匹配作用于离散型数据填补缺失值的方法。首先,在非缺失数据源中......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
核函数方法已经被成功的用于各种函数的估计.本文利用核函数的思想,针对缺失数据造成现有的成分数据统计方法失效和k近邻填补法(KNN......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
目的针对混合型缺失数据,使用几种填补方法在缺失填补中的应用并评价填补效果。方法结合实际数据,模拟出不同缺失比例(10%、20%、3......
目的提出数据缺失机制识别及处理的标准化操作流程,并开发相应集成系统,为非统计专业背景的医学工作者处理缺失数据提供恰当、专业......
近年来,随着硬件计算能力的提高,深度学习在计算机视觉、语音识别、自然语言处理、卫生医疗等各个领域取得了举世瞩目的成绩。特征......
本文首先研究两个相关关系矩阵(对称矩阵或非对称矩阵)之间的相关关系,给出预测并解决如下问题:网络间相关性检验以及高维网络中包......
由于生产工艺、技术及设备的日趋复杂化,经典控制理论中依据物理化学机理建立精确数学模型对生产过程进行控制的传统方法已变得越来......
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在......
<正>一、问题的背景在行为学、社会学、教育学、经济学和心理学等领域研究中,人们常常遇到诸如健康状况、个性、智力水平、满意度......
代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据......