基于粗糙集和粒度计算的不确定信息度量及知识约简研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:mahui0503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粒度计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究,它是词计算理论、粗糙集理论、商空间理论、区间计算等的超集,也是软计算的一个重要分支,它已成为模糊的、不完备的、不精确的及海量的信息处理的重要工具和人工智能领域研究的热点之一。自波兰学者Pawlak于1982年提出了粗糙集理论以来,由于粗糙集理论具有很强的定性分析能力,能够有效地表达不确定的或不精确的知识,善于从数据中获取知识,并能利用不确定、不完整的经验知识进行推理等,因此在知识获取、机器学习、规则生成、决策分析、智能控制等领域获得了广泛应用,特别是在数据挖掘领域获得了巨大成功,业已成为粒度计算研究领域的主要方向之一。 本文跟踪国际学术前沿,在粗糙集和粒度计算理论框架下,对不确定信息处理及其度量理论与知识约简方法进行了深入的研究。为了度量信息系统中属性重要性,本文从知识粗糙性的粒度原理和经典的知识粒度及信息熵理论出发,对经典的知识粒度及信息熵理论进行推广,给出了信息系统中知识的粒度和粒度熵原理,揭示了知识粒度和粒度熵原理的本质和关系,为进一步研究知识的粒度计算提供了理论基础;为了度量信息系统中属性相关性,本文借鉴集合论中对称差的概念,从粒度计算的观点出发,给出了信息系统中知识距离的概念,分析了其相关性质,并指出利用知识距离也可以度量属性的相关性,同时又给出了知识贴近度的概念,并分析了它与知识距离的关系;针对信息系统中的知识约简,本文分别提出了一种基于知识粒度的属性约简算法和一种基于知识距离的属性约简算法,这些算法针对现有知识约简算法[68-70]中存在的不完备性问题做了改进,且这两个算法都不需求核,对无核的这种特殊信息系统计算约简更加有效,同时它们的算法时间复杂度也分别较文献[68]和文献[69,70]中的算法时间复杂度有所降低。
其他文献
随着信息社会的快速的发展,流媒体技术在互联网媒体信息传播方面使用的越来越广泛。然而,随着流媒体的快速发展,流媒体文件的版权保护成为急需考虑的问题,引起各方面的重视,
与传统C/S模式相比,P2P模式致力于高效合理地组织和利用Internet 边缘上大量分布的计算、存储、通信、信息等资源,在充分利用节点资源、提高系统可扩展性等方面具有巨大的潜力
学位
近年来,随着数据存储技术的飞速发展,各行各业均积累了宝贵的海量数据。那么如何高效利用“沉淀数据”辅助决策制定,进而推动经济社会发展业已成为亟需解决的问题。数据挖掘
网络的迅猛发展,网络的开放性以及日益强大的计算机技术的发展,改变了很多行业的工作模式,也改变了人们的生活,娱乐,学习模式。与此同时,各种网络攻击、病毒以及信息窃听等网络安全
随着信息技术的高速发展,基于免疫原理的入侵检测系统的研究已经成为网络安全问题的研究热点。本文首先论述了入侵检测系统的概念、发展现状及发展趋势、入侵检测的模型和分
随着Internet的飞速发展,网络中包含着海量可以被利用的数据。其中由Web数据库返回并根据预定义模板展现在用户响应页面中的数据记录,是一类非常重要的Web数据类型。这类记录
调查显示,在因特网的流量中,有超过50%的流量来自于P2P软件的使用。P2P的广泛使用造成了网络带宽的巨大消耗,甚至会引起网络拥塞,大大降低了网络性能,劣化了网络服务质量。 本文
我们对Web应用程序中(以JSP为例)由于引入内置对象和动作标签后引发的数据流进行了研究,在对数据流研究的基础上建立起函数级、函数群级、对象级,对象群级的测试模型,并分别
社团挖掘作为复杂网络分析中的一个重要方法,近年来越来越多的研究者将其应用到社交网络分析、万维网服务、网络可视化等具体问题中。目前许多社团挖掘算法复杂度高,难以处理