基于形式概念集的分类规则挖掘算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:liqiusheng2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,利用形式概念分析来进行数据挖掘的研究得到了相关学者的广泛关注。他们提出了相应的概念格构造算法,并利用形式概念分析进行其它方面的研究。在利用形式概念分析进行分类规则挖掘的时候,大多数方法都是先生成形式背景对应的完备概念格,这些完备概念格的构造方法大都基于经典的概念格构造算法,如增量式算法、批处理算法等。当完备概念格构造完之后,再从这种偏序的结构中将那些适于作为分类规则的格节点提取出来,进而得到整个形式背景的分类规则。但是,由于构造完备概念格的复杂性及构造过程中产生的大量冗余,这种方法往往具有较高的时间和空间复杂度,因而影响了效率。针对这些问题,本文提出了一种Fccrm算法,它采用类标号分割的方法来降低形式背景的规模,通过对每一类标号的形式背景按照属性划分,生成单属性形式概念,并由这些形式概念的最大概念以及它们的下覆盖来获取全部的格节点,获得分类规则。该算法避免了构造完备概念格时格之间的复杂关系,只生成全部的概念节点,并且在生成所有形式概念的同时进行预剪枝,缩小了生成概念集的规模。在分类器的构造上,本文将分类规则赋予权值,然后在分类器中采用投票的方式对未分类数据进行分类,并根据规则加入对训练数据的判断结果的反馈机制。这种方法强化了那些具有强分类能力的规则,提高了分类的正确率。本文还对分布式数据挖掘在概念集成时采用的方法进行了研究,并给出了一个模型。最后,实现了本文中提出的算法,并通过实验进行验证。实验结果表明:该算法在性能上有了很大改进,通过形式概念集获取的规则对于样本集是完备的。实验还测试了数据集大小以及稠密程度对算法性能的影响。
其他文献
多Agent系统(MAS)及其相关技术近年来受到越来越多的研究者的关注。它不仅已经被广泛运用到了Internet、办公自动化、冲突协调、决策支持、开放式信息系统等众多领域。并且它
随着现代通信技术和计算机技术的飞速发展,尤其是互联网的迅猛发展,各种网络服务已经渗透到了人们生活的各个领域,一方面给人类生活带来巨大的便利和好处,另一方面也带来了前所未
机器翻译是自然语言处理的一个重要课题,随着互联网的发展,社会越来越需要找到一种快捷的方式沟通不同语言的人群。美国国家标准技术研究院(NIST, National Institute of Sta
随着现代通信技术和计算机技术的迅速发展,数据量每天都在以几何级的速度增长,同时用户对通信质量和数据传输速率的要求也在不断提高。由于通信信道固有的噪声和衰落特性,信
计算机和网络技术的普及,在给人们的生活带来极大便利的同时,也将安全隐患传播到整个网络。正是由于网络的普及率越来越高,一旦发生有目的、大规模的网络入侵行为,造成的影响
图可视化是使用计算机图形技术辅助用户理解图结构的理论和技术。图可视化的基础是图布局算法,是指将图结构嵌入几何布局空间的算法。在图布局算法中,布局空间的选择会影响图可
在过去几十年里,计算机动画一直是人们感兴趣的研究领域。随着虚拟现实和计算机动画技术的发展,加之服装CAD和试衣系统等领域的迫切需要,计算机动画的一个重要组成部分---布
近年来,数据挖掘作为一门正处于蓬勃发展期的学科,其应用已经渗透到了许多领域并且在人工智能与机器学习、数据库、模式识别、生物信息学、神经计算等方向上取得了丰硕的成果
随着三维扫描技术和计算机图形学的发展以及三维模型数量的快速增加,三维网格模型分割技术已经成为近年来的一个热门的研究课题,并被广泛地应用于计算机图形学的许多领域中,
随着现代科学技术水平的不断发展,传统的科研手段已经不能适应当前的科研需求。而e-Science概念的出现,使得跨学科、跨地域和跨文化的科学家群体可以共同协作完成大型科学研