面向大数据的多维数据缺失特征填补仿真研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:zlk84
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的数据缺失填补方法,通常只考虑数据间某种特征的关联性,且忽略了数据的填补顺序对数据填补准确性的影响。为此,提出一种基于数据多维相似度的数据缺失特征填补方法。通过计算缺失数据与另一已知数据的多维相似度,进一步计算缺失数据的加权值,来检验缺失数据与其对应的临界点的相似度融合情况;利用贝叶斯联合概率计算缺失数据间不同填补顺序的置信度,结合缺失数据与其临界点的相似度融合情况,选择最优置信度确定数据的填补顺序;采用KNN数据填补算法结合多维相似度计算缺失数据值,按顺序依次进行数据填补。仿真证明,所提方法可以更准确的计算缺失数据值,所需计算时间更短,同时对填补顺序进行计算,提高了数据填补的准确率,填补结果更接近原始数据。
其他文献
目的:分析拉玛泽减痛分娩法在初产妇分娩过程中的临床护理效果。方法:回顾性分析我科住院分娩86例孕妇,按照是否接受拉玛泽减痛分娩法,分为:研究组,共45例,予以拉玛泽减痛分
<正>2016年以来,珙县公安局按照"公安推动、政府主导、部门联动,界定范围、细分流程、推送督办,限时催办、电话回访、考核问效"的工作思路,不断完善"群众报警→公安分流→运
目的 分析输尿管软镜在肾结石与输尿管上段结石中的临床应用。方法 选取2016年11月~2019年2月本院收治的肾结石与输尿管上段结石均在≤20 mm的患者208例作为研究对象,以随机
<正>2019年是中华人民共和国成立70周年,在继往开来的历史起点上,"不忘初心、牢记使命"的主题教育恰逢其时。"为中国人民谋幸福,为中华民族谋复兴,是中国共产党人的初心和使
在众多税务人员违法犯罪案件中渎职案件占了相当大的比重,但由于税务行政执法的特殊性,要想消除税务渎职风险在现阶段确是一件很难实现的事,从税务渎职风险形成的原因入手,从
矿山调度监督工作对于矿山生产能否顺利进行以及生产的安全保障有着非常重要的影响。本文对于加强安全知识学习提升安全意识、明确岗位职责提升责任意识、实施奖惩制度以及做
<正>百花蜜采于百花丛中,汇百花之精华,清香甜润,营养滋补,有清热、补中、解毒、润燥、收敛等功效,是传统蜂蜜品种。冬蜜源于中药树种鸭脚木花蜜,是岭南特有冬季蜜种,具有清
期刊
针对清洁压裂液返排液回收利用率低、处理困难的问题,并结合致密油藏渗吸采油机理,以处理后的现场清洁压裂液返排液作为渗吸液,开展清洁压裂液返排液对致密油藏自发渗吸驱油
论文在国家“86”计划和国家科技支撑计划项目的资助下,以制备高强、低电阻、耐渗透型TiB2/C复合阴极材料为目标,对粘结剂煤沥青进行热处理和无机粒子改性研究。考察了热处理
该文报道了广西三种新记录归化植物,即长芒苋(Amaranthus palmeri)、橙红茑萝(Ipomoea hederifolia)和宽叶雀稗(Paspalum wettsteinii)。其中,长芒苋是人为无意引进的外来种,