不完备不一致数据的填补及其属性约简算法的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:goooooooal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,数据呈多态化变化趋势,产生了很多不完备不一致数据,这对数据分类和预测等处理带来了巨大的阻碍。对不完备不一致数据的填补一直以来都是数据挖掘领域里数据预处理研究的一个难点问题,合理地填补数据能为数据的分类处理提供更多的有用信息。高维数据的处理过程也相对较复杂,有效地使用属性约简能把高维数据降到低维数据,从而可以极大地提高处理数据的速度和减少分析不完备不一致数据的难度。目前粗糙集理论和相关的算法能较好地解决数据填补这个问题,但对不完备不一致数据的填补算法和属性约简算法的研究还存在诸多问题。因此,本文主要研究对不完备不一致数据运用信息增益和不一致度结合的填补算法,并提出基于粒化模型的属性约简算法,再对基于粒化模型的属性约简算法进行改进。本文完成的主要工作如下:(1)针对属性约简中计算等价类和容差类的计算耗时问题,运用容差关系和上下近似的性质建立一种快速访问并计算每个对象的等价类和容差类的粒化模型,该模型能够有效地缩短属性约简时间,并在粒化模型的基础上提出一种属性约简算法。对不完备不一致数据建立粒化模型后计算得到每个属性的信息增益值,并由小到大排序形成一个待约简的属性集合。用关于属性的一致度作为属性约简算法的启发函数,计算并比较每个对象关于属性的一致度大小,然后进行属性约简操作,再用实验验证了属性约简算法具有较好的性能,最后还研究了不一致度比例与属性约简个数之间的关系。(2)通过结合信息增益和不一致度的特点,提出一种针对不完备不一致数据的填补算法,它能最大限度地还原初始数据的特征,还可以达到较好的填补效果,并能保持较高的分类准确率。然后对不完备不一致数据提出一种信息增益和不一致度结合的属性约简算法,实验结果表明本文提出的属性约简算法具有较好的属性约简效果和扩展性,对完备一致数据和不完备不一致数据都能进行属性约简。综上所述,本文针对不完备不一致数据提出了粒化模型并在此基础上实现的属性约简算法能够有效缩短属性约简时间,再针对不完备不一致数据提出的信息增益和不一致度结合的填补算法和属性约简算法,可以最大限度地还原初始数据的特征,且进行了有效的属性约简,并用实验结果证明了算法的有效性。
其他文献
目前,电动汽车的驱动系统通常使用PID算法进行控制。电动车的驱动系统是非线性系统,其控制难度较大。采用PID控制算法,其控制效果并不理想。出现的主要问题表现为动态响应慢,
传统的基于位置的服务应用(LBS)仅针对单独位置信息呈现,已经满足不了人们对社交网络日益增长的需求。当与一些朋友外出游玩,在与朋友走散的情况下,想与其他人会合会花费很长
随着知识的爆炸式增加和不同领域知识图谱的推出,面向知识图谱的查询已成为近来搜索引擎领域的研究热点。然而,由于不同领域的知识图谱大多独立存在且所涵盖的知识有限,仅基
小说意味隽永蕴含先进的价值观念和价值取向,是高中语文教学的重要组成部分,对提高学生品德修养有着至关重要的作用。美德发展作为学生语文素养的重要内容,由于没有实际的检
以Facebook为代表的基于位置社交网络受到人们的广泛关注,这种新兴的社交网络在传统的社交网络基础上增加了地理位置,使得传统的在虚拟网络上的世界社交延伸到现实世界。通过
近年来,随着基于位置服务的发展以及智能设备的普及,空间查询技术已经深入到日常生活中。然而当今的查询技术已经不仅仅局限于我们所熟知的近邻查询。为了更贴近实际应用,移
图像分割是图像分析、计算机视觉研究的重要内容,在医学影像、遥感影像、智能交通、生物分子影像处理与分析等多个领域广泛应用。基于变分水平集方法的变分图像分割模型为多
无线射频识别技术(RFID)作为物联网感知识别层重要的技术之一,从当初第二次世界大战的鉴别敌机军事应用变革到现在的身份识别、门禁控制、车辆收费以及无人收货等商业应用,其
随着我国国力的不断提升,党和国家越来越重视我国体育事业的发展,作为体育人才培养及体育事业发展的主要单位—高等体育院校,也越来越受到重视。高等体育院校为了培养出质量
随着医学影像学的快速发展,医学成像技术层出不穷,光学相干层析(optical coherence tomography,OCT)成像的出现推动了眼科学的发展,并得到了广泛的应用。但由于相干成像模式,