缺失值相关论文
目的:评估不同缺失值处理方法在不同缺失模式、缺失机制及缺失比例下双臂优效临床试验中的统计性能,筛选出相应的最优缺失值处理方式......
数据缺失发生在各个研究领域当中,若不加处理直接使用,会对模型选择、研究分析造成一定的困难。因此,对于缺失数据包含的信息进行......
多维时序序列是指一组按照时间发生先后顺序进行排列的数据点序列,广泛存在于天文、医疗、交通等领域.囿于收集技术较差,或是序列......
为准确估计多传感数据流中的缺失值,提出了一种改进循环神经网络模型.所设计的改进循环神经网络由插值模块和插补模块组成,其中插......
在开展长白山生态数据智能分析时,需要爬取大量的网络数据,这些数据大概率会出现缺失、重复、异常、噪声等情况,因此需要对爬取到......
缺失值数据是目前研究数据分析的一个重要领域,随着智能医疗的迅速发展,如何充分利用海量数据挖掘出其中的重要信息,对隐藏的疾病......
在众多不同领域中,数据缺失普遍存在,这可能会影响数据挖掘工作的进展,甚至造成不同的结果。因此,缺失数据的填补是训练数据存在缺......
背景目前,公开发表的一些医学研究的结果不能被重现以及学术论文被撤稿的问题正在成为生物医学研究者关注的焦点。文献的报告质量......
电力变压器是电网中能量转换和传输的核心,是电网中最重要和最关键的变电设备。为准确监控变压器的真实运行状态,大量的状态监测装......
针对北斗MEO卫星辐射剂量探测数据出现连续性缺失的问题,开展缺失值处理方法研究.提出一种叠加正弦波的线性样条回归方法,即引入样......
数据清洗是数据分析与应用的重要保证,是数据分析和挖掘的起点,“脏数据”的存在导致无效数据的输出,最终导致分析结果的错误。本......
基于质谱数据的蛋白质定量分析一直是目前高通量蛋白质组学的重要研究手段.但是基于现有质谱技术的限制,大规模蛋白质定量过程中往......
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整......
1、数据库的建立:通过EpiD ata设计和建立数据库,提高数据录入效率,降低错误率。2、数据清洗:包括原始数据的整理、赋值,异常值的......
应用相关性理论,研究了交通流数据中缺失值与其他数据的相关性,对与缺失值不同相关性的数据给予不同的权重值,提出了基于交通流时......
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整......
实际应用中数据经常出现的缺失值将直接影响到数据挖掘算法的准确性,因此如何处理缺失值已成为数据分析领域必须解决的重要问题。......
实际应用中,数据常常表现出不完备性和动态性的特点。针对动态不完备数据中的特征选择问题,提出了一种基于相容粗糙集模型和信息熵......
摘 要:针对国省干线公路采集的交通数据存在缺失值的情况,文章提出了基于拉格朗日插值法的缺失数据恢复方法。首先,找出缺失数据所在......
电子商务信用风险评估是建设信用体系的重要环节。在企业电子商务数据采集存在缺失值的情况下,本文比较了BP神经网络、支持向量机......
以大数据为背景,通过线上与线下教学的优劣比较,对教师传授知识、学生学习知识、培养学生能力、课程思政等方面的融合策略进行分析......
期刊
目的:本文旨在基于数据科学方法,构建一套可涵盖创伤临床数据、核磁共振氢谱(proton nuclear magnetic resonance,~1H-NMR)代谢组......
数据缺失是统计研究领域中普遍存在的问题。在本文中,我们扩展了Choi和Tibshirani(2013)提出的弹性网回归下的半正定方差方法,引入......
近年来,随着城市化水平持续提高、工业发展速度越来越快、人口激增,导致城市环境污染问题越来越严重。人们对于空气质量问题越来越......
节点的重要性或称“中心性(centrality)”,它作为社会网络分析的一个重要领域,在近年来获得学者的广泛关注和研究。识别出网络中的......
为了了解病人的身体状况,医生会对病人的各项生理指标进行监测,这些监测记录形成了医疗时间序列。我们可以根据这些记录对病人的住......
互联网技术的飞速发展产生了海量的数据,从这些数据中提取出对实际生活有用的信息成了研究的热点问题。聚类作为一种经典的无监督......
针对不完整数据,已经发展出很多预处理方法,如删除法和填补法,删除法会造成信息浪费,填补法会带来不确定,因此不完整数据分类成为......
信息时代的今天,数据的获取越来越容易,在数据挖掘领域,需要面对的数据量也更加庞大.在二分类任务中,我们常常遇到维度高达几百上......
进入21世纪后,互联网技术飞速发展,数据可以快速通过线上方式进行获取和存储,这为数据挖掘工作带来了机遇,但由于各种原因往往会获......
数据挖掘的目的是在复杂的数据集中发现有价值的规律或知识。这需要专业人员建立可靠的算法模型来发掘,而可靠的算法模型依赖于高......
三维重建是计算机视觉的热点之一,它的目的就是从二维图像中恢复出三维结构和运动信息。这些研究成果不仅可以使机器人具有捕捉动......
大于胎龄儿(LGA)是指出生体重在相同胎龄平均体重的第90百分位以上的新生儿。体重过高的新生儿表现出严重的新生儿和产妇并发症。......
目前,建筑能耗监测平台已在商业建筑中普遍使用。作为一种建筑能耗性能评估的手段,建筑能耗监测数据能够对监控建筑运行情况、分析......
概述:在生物医学和社会心理学研究中采用样本几何均值估计、比较人口几何均值的方法十分普遍。然而,由于测量工具的检测局限,有时......
本文提出了一种不完全数据的完全化方法,并进行了Monte-Carlo模拟。结果表明,对不完全数据进行完全化是必要的,完全化的结果优于不完全化,随机完全......
目的 给出一种有效的处理含缺失值时间序列的方法 ,完成缺失值的内插及ARMA模型的参数估计。方法 用状态空间的Markov表达描述时......
[目的]对量表分析中的缺失数据进行估计。[方法]采用了EM算法,该方法经过期望步和极大化步迭代后,获得最大似然估计值,实现缺失值......
基因芯片能为基因组学研究提供海量的基因表达谱数据,这些数据反映了基因在不同组织细胞的不同生长发育阶段或不同生理状态下表达......
目的通过对单核苷酸多态性(SNPs)数据展开缺失值填补影响因素与填补效果的研究,为利用SNPs数据进行基因与疾病的关联研究提供科学......
缺失值大量存在于现实数据库中,这不仅严重影响了信息查询质量,还会扭曲数据挖掘与数据分析结论,进而误导决策.解决这一问题的最佳......
利用k-means算法,在气象台站历史数据基础上进行聚类研究,通过缺失值处理和数据归一化处理,修正属性对聚类算法的权重影响。探讨了......
泉城路是济南的一条重要商业街,它横贯于济南老城东西,与济南老城有着同样悠久的历史。自明清代以来,泉城路就是济南的商业和政治中心......