基于神经网络的分类数据挖掘属性选择和规则抽取研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:sysylh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门从大规模数据中提取有用信息和知识的新兴技术,分类是数据挖掘的一项重要内容 。面对大规模、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘研究的重要方向之一。在分类数据挖掘中,属性选择和规则抽取是两个最重要的工作。神经网络是数据挖掘的一个重要工具,而现有的神经网络属性选择方法必须对全部属性进行训练和裁剪,造成网络规模过大,训练量大,效率低下的缺陷,为了克服这些缺陷,必须提出新的方法。本文以神经网络为主要研究方法,并结合模糊逻辑技术,对分类数据挖掘中的属性选择和规则抽取两个问题提出了一些有效的算法,具体的研究工作如下:提出了一种基于输入输出关联法排序的RBF神经网络属性选择方法。由于属性选择是一个NP-HARD问题,现有的属性选择方法计算过于复杂,效率低下。本文提出一种新的属性选择方法。该方法先用输入输出关联法对所有属性进行重要性排序,然后根据属性重要性次序用RBF神经网络进行属性选择。该方法避免了现有的神经网络降维方法必须对全部属性进行训练和裁剪的弊端,大大提高了属性选择的效率。提出了一种可分性判据排序的RBF神经网络属性选择方法。该方法先用可分性判据计算每个属性的重要度,并对其进行排序,然后根据属性重要性次序用RBF神经网络进行属性选择。提出了一种基于降维的概率神经网络模糊规则抽取方法。该方法先用上面的属性选择方法从原始属性集中选择部分最重要的属性,然后对这部分属性进行模糊化处理,接着用概率神经网络进行模糊规则抽取。该方法通过属性选择减少了神经网络训练规模,避免了对神经网络进行节点裁剪,从而大大提高了规则抽取的效率。并且,用模糊规则来表现知识,规则易于理解,规则精度也有所提高。
其他文献
随着经济的发展和人民生活水平的不断提高,家庭仪表的用途越来越广泛,电表、水表、气表大量地出现在人们的生活中。同时,这些仪表的抄录工作也变得越来越烦琐,工作量变得很大,传统
实现工业控制信息化和高效经济的运行,需要大量的现场设备信息。无线传感器网络随着科学技术的发展更加成熟,将无线传感器网络与传统的有线网络进行有效的结合,实现对工业系
粗糙集理论是由Paw1ak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它
网络家电技术就是使家电与网络能够互联,通过网络终端实现对家电的远程控制。要实现家电与网络之间的互联问题,就需要解决本文介绍的:描述家电或住宅特性的产品模型,使得网络终端与网络家电间的数据交换具有特定含义。在本论文中提出的Web服务器和Web浏览器可以提供很好的服务。如果嵌入式设备支持TCP/IP等Internet有关的协议,成为Web服务器,用户可以使用Web浏览器端远程监测、管理该嵌入式设备I/
数字地图系统,空间数据库技术的发展,极大地促进了地图信息系统(GIS)的形成和发展.GIS技术在城市规划、土地资源管理、交通管理等各行各业都有着越来越广泛的应用,它已经成为
机器人运动控制系统的性能直接影响到机器人的整体性能和工作效率。根据机器人运动控制的高精度及高稳定度的性能要求,本文旨在设计开放性强、人机界面友好的移动机器人运动控
学位
很多情况下控制系统都依靠频域特性分析来设置控制器,以实现控制功能和确保整个控制过程的平稳。对于运载火箭,由于其突出的长细比并且使用液体燃料作为推进剂,使得箭体的弹性运
学位
随着城市建设的迅速发展,集中供热成为我国北方地区城市现代化建设所采取的方案之一。供热系统的不断扩大,如何有效地控制和管理整个热力系统,提高热力系统的经济效益和社会效益