数据挖掘中数据分类器的设计与实现

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:lahlyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数据库中存在着大量数据,因此从数据库中发现有用的信息显得十分重要。数据挖掘技术就是为解决这个问题而产生的,它引起了科学界、工业界、商业界的广泛关注。数据分类是数据挖掘的一个重要方面,以前大多数的数据分类方法是面向元组的,由于他们要大量的从复扫描元组,导致分类的效率下降。然而,利用给予概念的面向属性归纳方法将大大地减少扫描元组次数,从而提高发现分类规则的效率。本文论述了运用基于概念的面向属性归纳方法来发现分类规则的有关问题以及数据分类器的实现。首先,概述了数据挖掘和数据分类的发展现状。而后,分析了数据分类的一般标准、概念层次的定义和表示方法、评价分类模式的标准等问题,并给出了数据分类器的结构框架。然后,在数据分类器的实现中,论述了数据的概念层次提取和管理,并对数值型数据给出了一个自动提取概念层次算法;同时给出了基于面向属性归纳的分类算法、分类模式的评价算法和分类规则的可视化方法。最后,在数据库上对数据分类器进行测试,结果表明数据分类器具有一定实用性,其性能满足设计要求。
其他文献
该文的目的是研究能够准确模拟不可压流体流动的格子Boltzmann模型以及其他相关的问题,包括热流动模型、非均匀网格模型以及LBM的边界处理方法,从而为流体运动的计算机仿真模
全文共分为五章,第一章简单介绍了VPN的概况,从功能和协议角度对其进行了阐述.第二章主要介绍了IPSec的基本原理.第三、四、五章是该文的重点.第三章提出了对VPN的各种实现方
B.Preneel等人将完全非线性函数(Bent函数)和满足严格雪崩准则的布尔函数(SAC函数)进行了推广,提出了k次扩散准则(PC(k))的布尔函数.由于扩散准则在密码学上,尤其是在分组密
近年来,随着计算机及互联网技术的不断发展,数以百万计千万计的计算机节点组成分布式协作系统网络,它们可以提供计算能力、可以提供资源。在这样一个规模巨大的分布式协作系
计算机集群系统的广泛应用,对作业管理系统产生了迫切的需求。国外一些大型研究机构和公司都将作业管理系统作为提高生产效率和资源利用率的一项技术保证,并面向实际需求开展了
近年来,互联网技术不断发展,网络攻击技术的发展也日新月异,攻击行为已经从零碎的小规模的攻击发展成为大规模的、分布式的攻击.这些大规模分布式攻击严重妨碍了计算机互联网
该文主要对面向对象软件中的类测试和类簇测试进行研究.首先研究类测试,重点在利用扩展的OSD图,产生有效的方法调用序列,来进行类内数据流的测试.接下来,考虑面向对象技术中
分布式实时系统,特别是安全关键应用领域的分布式实时系统,对实时性以及安全性都有严格的要求。随着当前国防科研以及军事应用等安全关键领域的应用对安全性的要求越来越高,安全
随着计算机及网络技术的飞速发展,信息技术带给人类的影响日益扩大,同时也使得计算机系统安全问题日渐突出而且情况也来越复杂。 操作系统安全是计算机系统安全的基础。本论
1987年,Tom Head发表了一篇论文[3],引入拼接系统(splicing system)的概念作为限制酶与DNA(脱氧核糖核酸)作用、进行DNA重组的数学模型.更重要的是,他还证明正则语言中的一类