不完全数据填充算法的研究与应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:czw6243579
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和人工智能的不断发展与深化,数据正以指数级的姿态爆发。但由于各种原因导致这些数据中存在大量的不完全数据,直接影响进一步的数据分析与挖掘,使得数据无法最大化的发挥其价值。因此对不完全数据填充的研究具有极其重要的意义。传统的单次数据填充算法用全部数据集进行填充,这在提高了计算量同时又没有考虑数据间的相关性,并且大部分算法无法直接对缺失数据进行特征提取;而对于迭代式填充算法,大多又存在收敛慢,精度不够高等问题。针对以上问题,文本先提出了一种基于深度信念网络的不完全数据填充算法,用降噪的深度信念网络直接从不完全数据提取出具有一定鲁棒性的特征。再用这些特征进行聚类,在每个类内使用共现矩阵和部分距离策略对数据进行举手表决,最后将得分转换成权重进行加权填充。然后本文又提出了一种基于多核估计的不完全数据填充算法,它是一种迭代式填充算法,针对离散属性构建核函数,并对连续属性构建多个核函数的估计器,进而得到混合属性的多核估计器。同时,为了提高算法收敛速度,使用部分距离策略对缺失值进行预填充。最后使用核估计器对缺失值进行迭代填充。在文章的最后,通过对本文算法进行适配与优化,将其应用到了美国进出口贸易数据的填充与规范当中。通过验证分析,其填充准确率高达85%。从实验结果中可以得出,本文提出的算法在保证准确率的同时提高填充精度,满足学术研究的要求与工业应用的标准。具有一定的理论与应用价值。
其他文献
财务管理是企业管理的关键环节,通过对以财务稽核为手段,促进企业规范管理,从而有效避免经营风险进行了分析,并提出了相关对策建议。
1 病例报告男,15岁.右腰部反复溃破、流脓伴发热12a.患者3岁时无诱因出现发热,即而右腰部出现一核桃大小肿物,质软,红肿,波动感.予以切开,内为稀薄脓液.经引流及抗结核治疗愈
1 病例报告例1 男,27岁.以咽部疼痛时伴低热3个月就诊.3个月前感冒后咽部疼痛,间歇性低热,于外院诊断为慢性扁桃体炎,予静滴林可霉素及甲硝唑,共1周,无明显好转.查体:咽部慢
随着旅游业迅速发展,我国旅行社并购逐渐增多并一度掀起并购热潮,引起许多学者的广泛关注。主要运用有关并购基本理论,结合我国旅行社并购模式选择的现状,对于旅行社并购的动
自从有了能区分出甲、乙、丙、丁和戊型肝炎病毒的血清学和分子生物学方法后,经过广泛的筛选,人们发现仍有10% ~ 20%的慢性肝病原因不清,推断还有新的致病因子.1997年底,日本
角色人生实际远超你在银幕上所见,只有通过庞杂故事背景才能略知其中典故,这种电影很多人都不爱看。更不用说它还刻意致敬系列电影、漫画书以及80年代复苏的以帅气博学者为主
"魔王"这一名词伴随着佛经的翻译而产生,它在佛经中有扰乱、障碍、破坏之义。《度人经》及严东注在汉代"气"论的基础上,以"龙汉"、"赤明"等年号为劫运,以大罗、中罗、小罗为
为了了解目前郑州市青年学生的口腔卫生状况,我们从2000-01~2001-04对河南省郑州市405名在校医科大学学生进行了口腔疾病的调查研究.
目的评价半夏泻心汤加减治疗非糜烂性反流病寒热错杂证的疗效和对患者生活质量的影响。方法将127例非糜烂性反流病寒热错杂证的患者随机分为2组,治疗组64例,对照组63例,治疗
马克斯·奧菲尔斯的完美构想,需要一个对摄影技术娴熟的万金油式摄影师来实现,克里斯蒂安·马特拉斯就是那个最理想的人选。马特拉斯具备一位优秀电影摄影师最不可或