【摘 要】
:
数据挖掘是一个包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算和数据可视化等多学科领域的新兴技术。信息
论文部分内容阅读
数据挖掘是一个包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算和数据可视化等多学科领域的新兴技术。信息技术的迅猛发展使得各个领域的数据量激增,数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段。关联规则是数据挖掘的一种重要模式,有着广泛的应用。本文在研究关联规则挖掘技术的基础上,提出了基于布尔型数据库关联规则挖掘算法,在此基础开展了基于关联规则的学生成绩研究。
数据挖掘致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘产生了许多新概念和方法。特别是最近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发展。像其它新技术的发展历程一样,数据挖掘技术也经过了概念提出、概念接受、广泛研究和探索、逐步应用和大量应用等阶段。Apriori算法是关联规则挖掘的典型算法,是一种有候选项目集的迭代算法。针对Apriori算法的一些不足,可以采用基于散列、基于数据分割和基于采样等方法提高运行效率。
结合关联规则的性质和布尔向量的关系运算思想,提出了基于布尔型数据库的关联规则挖掘算法(ABBD)。实验结果证明该算法是可靠的,并且有较高的效率。根据本人所从事工作的特点,在充分分析业务需求的基础上,设计了面向中考成绩的关联规则挖掘系统,采用基于布尔型数据库关联规则挖掘引擎,对北京市2006年近13万条中考成绩进行了挖掘,得到一些有用的规则,并将这些规则运用到实际工作中。在数据挖掘过程中,如数据分类,数据离散化,规则解释等方面引入了专家系统,提高了数据挖掘工作的实用性和针对性,是对数据挖掘工作应用方式的一种有效探索。
其他文献
企业为了在日趋激烈的市场竞争中立于不败之地,需要不断优化其生产、经营过程,因而对业务过程的高效组织和管理成为提高企业效益、增强企业竞争力的重要手段。工作流建模作为一
众所周知,UML是半形式化的。Petri网虽然是形式化的工具但本身又有不便于应用的缺点。所以论文的目的是把UML活动图模型转换为PNML,以便能够用Petri网分析工具来分析UML所描
说话人识别以其独特的方便性、经济性和准确性等优势在公安、司法、声控以及军事等领域有着广阔的应用前景。如何从大量的语音数据中提取反映说话人个性特征的语音参数和设计
随着移动通信技术的快速发展,人们对基于位置服务(Location Based Service, LBS)的定位精度要求越来越高。由于GPS,A-GPS等常用定位技术在城市环境中存在各种问题和不足,以及
指纹识别因为其悠久的历史以及较高的识别精确度,成为了目前最成熟的生物特征识别技术之一,并被广泛的应用到各个领域当中。在大型的指纹数据库中,待识别指纹与样本数据库中
与时间相关的数据库应用需求的不断增长,使得时态数据库设计成为非常重要的问题。在数据库的设计中,要充分考虑对数据依赖的处理,数据依赖是指数据之间存在的各种联系,数据冗
词袋(Bag of words,简称Bow)模型最早应用于文本文档的分类领域中,近年来,随着对词袋模型的进一步研究,以及模型本身具有简单有效的特点,使得模型得到了更加广泛的应用,并且
介质访问控制(Medium Access Control,MAC)协议是Ad Hoc网络协议体系结构中的重要组成部分,主要用于协调节点访问共享信道,MAC协议能否高效地利用有限的无线资源对Ad Hoc网络
大规模地形场景实时绘制技术在地理信息系统、虚拟战场以及三维游戏中有非常重要的应用,一直是国内外研究的热点。在GPU出现之前,大规模地形绘制的研究主要集中在对地形的裁减
P2P(peer-to-peer)技术作为Internet的重要技术之一,近些年来受到了计算机业界越来越多的关注。由于P2P具有大规模性、动态性、分布性等特点,在这种环境中如何有效的查询资源