知识发现中粗糙集基本算法的应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:shi_shui_wen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集工具的成熟以及海量存储设备的广泛应用,目前许多大型企业己经积累了大量的数据。为满足管理、经营的需要,这些数据必须得到有效地处理;使用传统的数据分析和检索方法处理这些数据,不仅将耗费大量的计算时间,而且依赖于事先对数据关系的假设和估计,难于得到其中的有效信息。目前面临的要求是如何自动和智能的将待处理的数据转化为有用的信息和知识。二十世纪八十年代初波兰数学家Pawlak.Z提出了粗糙集理论,它是一种处理含糊和不确定性的新型数学工具,可以有效的用于知识约简和提取。为在知识发现中更好地应用粗糙集理论,将主要研究工作集中在粗糙集约简算法以及应用粗糙集理论处理多值系统的查询和检索方面,为多值系统中的知识发现应用提供了方法,并建立了两种算法用于满足知识发现中的不同约简需要。首先,在分析属性分类能力后,给出一个易于理解、方便交互的启发式约简算法,可以有效满足知识发现中领域专家对控制并调整约简过程的需求;其次,为提高约简算法效率,对正区域进行深入的分析和研究后,给出并证明一种新的正区域等价定义,以此推导了高效的正区域基本算法;为满足大数据集上对约简算法效率的要求,通过对不同约简属性集所对应的属性子集、论域子集和正区域间的关系,以及正区域递增算法中约简属性的性质等方面,推导相应的性质和推论后,建立了一个高效的属性约简算法并证明了其完备性。实验数据的分析,表明该算法可以有效地应用于大数据集上的约简计算;最后,建立多值数据属性的检索和查询方法,使得多值系统上的知识发现应用成为可能。
其他文献
网上阅卷系统利用计算机和网络支持阅卷教师完成阅卷工作,解决了传统人工阅卷模式下效率低、容易出错、难以控制阅卷质量等弊端,保证了考试阅卷工作的高效、准确、公平和公正
移动自组网是一种有特殊用途的对等式网络,具有无中心、白组。织、可快速展开及可移动等特点。组播在移动自组网中扮演着重要的角色,目前已成为研究热点之一,本文主要分析和研究
随着传感器技术和无线网络技术的发展,无线自组网也逐步进入了实际应用领域。无线自组网中的传感器节点可以以自组织的方式进行通信,不需要人工操作也能很好的完成预先设定的
随着通信技术的飞速发展,信息的海量存储与实时处理,对设备的性能要求越来越高了。但是,无论多大的磁盘空间,从最初的几K,到几十G,几百T,始终还是不能满足所有的需求。然而,互联网的
IP组播是一种受到广泛重视的网络技术,在一对多和多对多的网络通信中,组播技术可以使只在需要的时候才复制数据包,因此可以有效节省网络带宽。但是目前IP组播技术并没有在Int
由于神经网络具有强大的自学习、自适应、自组织能力,有较好的容错和并行处理能力,对非线性函数有较强的逼近能力,而得到了越来越广泛的研究和应用的推广。组合优化问题的求解是
分类挖掘是数据挖掘的重要技术之一。传统的分类算法主要是基于统计的分类算法,这些算法虽然比较成熟,并成功应用于许多领域,但其自身仍存在着诸多不足,尤其是当分类数据的特征存
函数调用图是编译期对程序中函数调用关系的一种静态描述,在函数调用图中,节点表示函数,边表示函数之间的调用关系。函数调用图在软件工程领域有广泛的应用,例如编译优化,过程间数
无线传感器网络通过采集大量的各种传感数据,经过融合处理,输出一系列有意义的信息。随着科技的发展,应用领域也越来越广泛,包括海洋环境检测、野生动物习性监察、建筑安全、地震
数字电视系统中的数据广播是数字电视领域的重要业务之一,它作为MPEG-2DVB的扩展,使运营商能够在提供音视频业务的基础上,向用户提供各种数据服务。 数字技术为广播电视带来