【摘 要】
:
不完全数据填充在数据处理和分析中起着重要的作用,并直接影响到数据挖掘和知识发现的结果.大多数现存的数据填充算法有的不能处理混合属性的数据有的参数确定复杂度高.针对
【机 构】
:
大连理工大学软件学院; 泛在网络与服务软件重点实验室; 华南农业大学信息学院;
【基金项目】
:
国家自然科学基金项目(U1301253)资助;广东省省级科技计划项目(2015B010110006)资助
论文部分内容阅读
不完全数据填充在数据处理和分析中起着重要的作用,并直接影响到数据挖掘和知识发现的结果.大多数现存的数据填充算法有的不能处理混合属性的数据有的参数确定复杂度高.针对这些问题本文提出一种基于多个核函数的混合属性数据填充算法.首先,为了减少干扰和计算量,算法采用带修正线性单元的降噪深度信念网络对缺失数据进行特征提取和聚类.然后,为了减少算法的迭代次数,定义部分距离策略对缺失值进行初始化,这能使算法快速收敛并且提高准确性.最后,对连续和离散变量分别定义核函数,计算它们的概率密度,进而构造一个估计器对缺失值进行填充.实验结果表明,本文提出的算法,可减少参数确定复杂度和迭代次数,同时保证数据填充的精度.
其他文献
兴趣是学习最好的老师,对于化学这种理论、公式较多,内容相对枯燥的自然学科而言,如何激发学生对化学课程学习的兴趣,进而提高课堂教学效果是化学教师需要认真思考和面对的。
互联网时代为新时期高校思想政治教育工作带来了丰富的可能性,如何运用有效手段探索互联网视阈下的德育工作路径,成为新时期我国高校思想政治教育领域亟待讨论的重要课题。基
<正> 心不在焉的教授在门洞里转了六个小时,他记不起来是要进去还是要出来。管家:教授,门口那个收账的不相信您不在家,他说我骗了他。教授:看来,一定要我亲自出去告诉他了。
在当今社会,通信技术和计算机技术正以惊人的速度在发展,影响着社会发展的各个领域,使高职高专档案传统的管理方式面临着严峻的考验,高职高专档案的信息化管理显得尤为重要,
在音乐学术刊物的来稿中,一些论文没有摘要、关键词等著录内容,一些论文在摘要撰写和关键词选用上存在着问题,直接影响到学术期刊规范化的执行,不利于学术信息资源的标准化建
本研究旨在了解当代高校学生网上非正式学习活动的现状以及个人差异影响学生网上非正式学习活动的状况。研究采用问卷收集数据,研究发现,90%以上的学生网龄超过1年,平均每天
封装天线是指将天线与单片射频收发机集成在一起从而成为一个标准的表面贴器件。本文对封装天线中连接天线地与系统地的过孔进行了分析,具体研究了过孔数量与位置对天线性能
<正>我们来到新区搞建设,山多土少,石头是当地可以利用的建筑材料,要发扬延安作风,贯彻大庆精神,就必须因地制宜,就地取材,大搞石头“干打垒”。在这个问题上,开始时有许多不
<正>前言 道岔是煤矿窄轨铁路运输的主要环节之一。道岔质量的好坏和铺设的是否符合标准,对运输效率和安全生产有很大影响。过去由于没有统一的技术标准,其几何参数和技术要
目的:了解江苏省医疗机构制剂的现状。方法:对江苏省2008-2012年医疗机构制剂的现状进行实证研究,分析其存在的问题。结果:自2008年以来,江苏省医疗机构注册制剂品种数呈减少