【摘 要】
:
随着信息技术的飞速发展,数据挖掘在许多领域所起的作用越来越重要。在数据挖掘的各个分支中,关联规则挖掘和分类挖掘是两个高度活跃的领域,其应用范围也非常广泛。而关联规
论文部分内容阅读
随着信息技术的飞速发展,数据挖掘在许多领域所起的作用越来越重要。在数据挖掘的各个分支中,关联规则挖掘和分类挖掘是两个高度活跃的领域,其应用范围也非常广泛。而关联规则挖掘和分类挖掘之间具有相似性——挖掘相关性强的项目集。因此,可以利用关联和分类的相似性用关联挖掘算法来完成分类任务,这种分类算法就是关联分类挖掘算法。在此基础上,本文提出了一种新的关联分类算法—基于 CFP-tree(Classification Frequent Pattern tree)的分类算法。 本文首先阐述了各种分类和关联挖掘的相关理论和算法;其次介绍了传统的关联分类算法 CBA 和 CMAR;最后提出并详细论述了新算法—基于CFP-tree(Classification Frequent Pattern tree)的关联分类算法。 新算法把分类信息添加到FP-tree中形成分类频繁模式树CFP-tree。CFP-tree用于存放数据库中的分类频繁信息。构建好CFP-tree以后只需针对类别属性的每个值分别自底向上构建不同的被约束子树,由于频繁模式的挖掘是针对被约束子树的,因此在CFP-tree中不存在指向同名的特征属性的链表;由于被约束子树比原来的CFP-tree树小的多,算法是在被约束子树上发现分类频繁模式并同时输出分类规则,因此减少了算法中指针的数量,提高了算法的效率。本文最后通过大学生智能评估系统给出了算法在教育信息系统中的应用实例。
其他文献
无线互联、物联网等技术的发展促使嵌入式设备的广泛应用,智能手机、家电的出现对嵌入式设备的性能有了更高的要求,而Java的可移植性,安全性和兼容性,给J2ME的产生带来了巨大
传统的染色计算机配色在配色过程中引入大量的假设,并且计算过程复杂,配色误差较大。本文从尽量减少获取样品信息的操作复杂度和误差的角度,提出了基于染色的数字化计算机配
专利文献作为技术信息最有效的载体,囊括了全球90%以上的最新技术成果,对于知识产权的保护起着至关重要的作用。随着目前专利数量的不断增长以及专利侵权诉讼的日益频繁,专利
考试是教学的重要环节,对考试成绩进行分析和评价是教学质量管理的重要方面。随着高校教学改革的深入和计算机应用的普及使学分制成绩管理得到了很大的发展。但由于原有的对成
本文首先分析了影响系统响应时间的主要因素,指出提高性能的切入点;分析了实时系统对实时内核的要求,指出了Linux在实时性方面的不足并给出了一些Linux的实时化方案;最后从应用层
ARM7TDMI是一种高效,低功耗的RISC处理器,以该内核为核心的S3C44BOX是一款基于以太网应用的高性价比16/32位微控制器,非常适合嵌入式产品。本文的研究目标是实现基于S3C44BOX的μ
SoC(Systems-on-a-Chip)系统目前应用得越来越多。一个SoC系统可以包含不同的功能模块,例如数字电路、模拟电路、硬件专用电路、存储器、微处理器、数字信号处理器DSP(Digital
论文首先就PSTN与IP的互联互通在下一代网络发展过程当中扮演的重要角色入手,并结合现有解决方案的缺陷,提出中继服务器的模型。中继服务器首先可以作为信令网关,完成PSTN网络的
随着大数据时代的到来,各行业数据大量累积,目前人们尚未对这些海量数据进行足够深层次的分析应用,数据挖掘技术便在此背景下应运而生。本文在研究了数据挖掘中聚类算法的研究现
随着计算机及网络技术的发展,无纸化考试这种考试形式得到了越来越广泛的应用。无纸化考试所具有的方便、快捷、效率高、防止试题泄露等优点,是传统考试手段所无法比拟的。在网