基于条件粒度熵的不完备信息系统的动态约简研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:wuzhihot9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于大数据时代的来临,我们正面临着一项艰巨的任务:从海量的、杂乱无章的、有噪声的、不完备的、模糊的数据中找到有用的知识,即数据挖掘。分类是数据挖掘的一个重要分支,在众多分类技术中,粗糙集理论因为它不仅可以处理不确定问题并且还不需要数据集之外的任何先验知识这一突出优点,所以成为了知识发现的有效工具,获得了学者们的广泛关注。属性约简是粗糙集理论的热点研究内容之一。目前,基于粗糙集理论下的属性约简方法已经很多,但是大部分都是在完备并且静态的信息系统条件下的,并不能够满足现实中存在很多缺失数据的不完备信息系统和不断增加数据集的动态信息系统。虽然现在也有许多关于不完备信息系统和动态约简的研究,但是相对来说还是比较薄弱和单一。因此研究在不完备信息系统下的动态属性约简算法是很迫切的并且很有理论价值意义。基于以上,本文的研究工作着重于以下几个方面:(一)从代数论和信息论两个方面分析总结了目前基于粗糙集理论的不完备信息系统的属性约简算法。(二)从信息论的观点出发,根据基于容差关系下的不完备信息系统的粒度函数定义,给出了新的粒度熵函数,从而得到条件粒度熵函数和属性重要度,以属性重要度为启发式信息给出基于条件粒度熵的不完备信息系统下的属性约简算法。(三)对基于条件粒度熵的不完备信息系统下的属性约简算法进一步研究,在得到原信息系统约简的情况下,分析仅有对象增加时、仅有对象减少时、同时存在对象增加和对象减少时,这三种情况下条件粒度熵函数的变化机制,并更新约简算法。最后将所得到的动态约简算法应用到船舶耗油数据分析中,以证明算法的有效性。
其他文献
在这篇报告中我们研究了李群及代数群的表示理论中的几个问题,对准素的与非紧半单李群的isotropy表示相关联的旋表示进行了分类,并对仿射代数群的表示环(ringsofrepresentation
当一种严重的传染病突然出现时,染病者将大量出现。需要到医院接受治疗的病人有可能会超过当地医院的承受能力。 我们建立了一个带有饱和恢复率的传染病模型,以便揭示有限的
设K为复平面C上的三分Sierpinski垫,顶点分别为1,e2πi/3,e4πi/3,K的Hausdorff维数α=1+log2/log3.令μ为K上正规化的α-维Hausdorff测度,i.e.μ(K)=1.本文第一部分考虑了测度μ
随着非线性弹性力学、电流变学及图像恢复等实际问题的发展,具有变指数增长性条件的非线性问题成为一个新兴的研究课题。变指数函数空间的特征刻画及其相关算子与交换子的有界
本文主要讨论了一些二元三角插值算子的一致收敛和强性逼近等问题.本文的第一章是关于逼近论和三角插值方面的预备知识,主要介绍了最佳逼近,连续模,强性逼近等相关概念,并引入了
本文研究了一类特殊的DC规划以及一般DC规划的全局收敛算法。DC规划是一类特殊的非线性规划,人们对此提出了许多好的算法,如Tao所提出的DCA算法([11])数值效果就很好。但是,目前更
本文主要研究强偏差定理。强偏差定理又称小偏差定理(即用不等式表示的强极限定理)是借助于似然比而引进的一种度量,进而建立的一种新型定理。刘文教授于1989年首次采用分析方
函数空间理论,奇异积分算子及其交换子的有界性在现代调和分析中具有十分重要的作用.本文就是在齐型空间上围绕这些问题展开讨论. 函数空间理论的研究一直是倍受人们关注的
丙烯酸及酯工程项目不同于一般建筑施工工程,其主要特点有建设工期长,涉及工序工种多,施工危险性大,生产工艺复杂等。基于此,从决策、施工准备、施工和竣工验收4个阶段对中海油丙
考虑拓扑空间之间的映射,如果一个点在两个映射下的像点相同,则称该点为这两个映射的重合点.在代数拓扑学中,人们不仅对重合点的存在感兴趣,也十分关注重合点的个数估计以及重合