基于粗糙集的知识获取方法研究

被引量 : 0次 | 上传用户:july1126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是1982年由波兰学者Z.Pawlak提出的一个数据分析的有力工具,近年来日益受到各领域的广泛关注,并已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域得到了成功的应用。研究基于粗糙集理论的知识获取方法有着重要的理论意义和应用价值。本文基于粗糙集理论,对信息系统中的一些知识获取方法进行了研究,并取得了以下研究成果:在决策表的属性约简方面,定义了一种通过对论域在条件属性和决策属性上的划分形成的对象集合,对这种集合进行了研究分析,用该集合与信息熵结合起来度量决策表中的属性重要性以及属性之间的相关性,提出了一种基于粗糙集和信息熵的属性约简启发式算法。该属性约简方法,通过信息熵的计算选择最优条件属性,逐渐地去除确定的对象,缩小考察的论域中的对象范围,提高了约简效率。实例表明算法能得到完备或者不完备决策表的相对约简。在信息系统的决策规则获取方面,根据条件属性和决策属性对论域划分形成的对象集合,分析决策属性对条件属性的依赖程度,研究了粗糙集中基于这种对象集合的规则获取方法,区别于经典粗糙集理论中采用的单一等价关系,对同一决策表从多个角度和多个层次来研究。这种对象集合的抽象-特化程度能够刻画条件属性及其组合对决策的有序划分,通过在不同的角度和层次上动态地进行粒度细化,能够挖掘出决策表中的确定、非冗余、前件短的规则。此外将基于粗糙集的决策支持方法和动态决策规则挖掘算法扩展应用在不完备决策表中动态获取决策规则。实例表明提出的算法能够提供良好的决策规则,为数据挖掘的研究提供了新的方法。本文基于粗糙集理论对信息系统中的知识获取方法进行了一些研究,不仅从理论上丰富和发展了粗糙集理论,而且为数据挖掘的研究也提供了新方法,研究成果在大规模数据处理中有着重要应用价值。
其他文献
随着全球经济的高速发展和科技的日新月异,高新技术已经成为推进当今世界经济增长的重要动力,高新技术产业的发展水平也成为衡量一个国家发达程度的主要标志之一。高风险、高
目的拟靶向结核分枝杆菌(M.tb)感染后的分泌期抗原Rv1626,构建其原核表达质粒pPROEX-Rv1626并表达纯化,通过人群和动物实验评价其免疫原性。方法构建重组载体pPROEX-Rv1626,
<正> 英明领袖华主席指出:“为了彻底揭露‘四人帮’修正主义路线的极右实质,必须批判他们那条路线的反动理论基础。”马克思主义政治经济学是无产阶级及其政党——共产党推
<正>有幼儿的地方就有游戏。游戏是幼儿生活、学习不可缺少的一部分。幼儿借助游戏接受现实社会规定的生活方式和行为规范,养成规则意识,内化社会行为。基于此,"如何让一日生
随着社会的不断发展,先进的科学技术也渗入到地籍测绘当中,当前,GPS已经成为重要地籍测绘技术,并以其提供的准确的测量数据,确保了地籍管理工作的有效开展。本文将就GPS在地
食葵是昌吉市的重要经济作物,是昌吉农业经济发展的重要支柱产业。现今,食葵种植水平较低,造成食葵生产成本高,因此,推广食葵机械化生产作业技术,提高单产,降低生产成本,实现
现代汉语人名、地名有全名也有省缩名。人名、地名的省缩具有一定的特点和规律,即省略通名或者缩短专名。但不管如何省缩,都不能省缩为单音节(有些人名由于受外来人名影响在某种
GPS作为新型的卫星定位系统,在我国的地籍测绘中,强化运用GPS技术,可以有效提升我国的地籍测绘水平。地籍测绘的本质是地基调查相关活动的总体称呼。地籍测绘对地籍进行勘测
生态问题是二十一世纪人类在享受物质文明的同时不得不面对的生存悖论。这种现实的严重性迫使我们重新审视人与自然的关系,期望从理论层面上寻找解决生态问题的良策。因此,从生
在当前的宏观经济环境下,研究知识型企业的竞争战略,是企业为谋求生存发展的必然选择和趋势。作为一家由自有知识产权而成立的高新技术企业LK公司来说,成立之初的经营环境和