基于概念格的分类规则提取算法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:xxp520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概念格是一种有效的数据挖掘与知识发现工具,分类是数据挖掘中的重要研究内容之一。本文针对分类任务,从提高概念格的构造效率以及分类规则的分类效率角度出发,研究了面向分类的概念格批处理构造算法以及基于概念格和信息熵的分类规则提取算法,其主要研究成果如下:第一、面向分类的概念格批处理构造算法。该算法针对分类任务,在格的批处理构造过程中,仅生成含有分类属性的概念格结点,从而减少了建格过程中概念内涵的比较次数,有效地提高了概念格的构造效率。采用UCI数据作为形式背景,实验验证了该算法的正确性和有效性。第二、基于概念格和信息熵的分类规则提取算法。该算法首先通过引入外延支持度系数,来刻画概念格结点内涵的重要程度;其次扫描概念格结点,并依据外延支持度系数,提取出分类规则;然后计算分类规则的条件信息熵,并按照条件熵值对分类规则进行排序;最后采用UCI数据作为形式背景,实验验证了该算法所提取出的分类规则,在保证分类正确率的同时,有效地提高了分类规则的分类效率。
其他文献
随着计算机和网络技术的快速发展,信息系统的数量和规模越来越大,这些信息系统数据的分布性、异构性及大规模的特点使异构数据整合成为一个挑战性的问题。web数据的管理和处
树结构数据以其表达事物清晰、完整等优势,在计算机网络、Web挖掘、生物信息分析、XML文档挖掘等领域有着日趋重要的应用。本文针对有序标号树,以最右路径扩展技术为基础,从
概率密度的估计既是传统的概率论与数理统计的重点,也是统计学习理论的重要研究内容。概率密度的估计具有广泛的应用,它不仅是信息熵理论的基础,还可以应用到音频及视频信号的无
随着我国经济水平的不断提高,汽车保有量迅速增长,随之而来车辆的安全问题日益凸现,车辆遭受人为破坏的情况时有发生。目前已有的车载监控系统大多数是针对行驶车辆安全问题或车
随着Internet的迅速发展、网络带宽的提高以及音频视频编码技术的发展,VoIP(voice over internet protocol)在中国的业务也在迅速地增长。与传统PSTN电话相比,VoIP拥有方便快
越来越多的应用软件和应用系统走进了人们的生活并改变着人们的生活习惯,他们各自具有独立的优点和作用。但是人们的需求也是不断改变的,人们日益需要能实现各应用软件与系统之
煤炭业作为国民经济的支柱产业,安全生产和保障矿工的生命安全是一个永恒的主题,井下员工的具体位置与分布情况等重要数据不能及时传到井上监控中心,是矿难事故频发而营救效
秘密共享是信息安全和密码学领域中的重要研究方向,能够有效地保障信息在保存、传输和使用过程中的安全性,克服了传统密码体制中权利过于集中而被滥用的缺点,提高了系统的安
协进化算法是近年来兴起的一种算法,它的发展时间虽然不长,但已经成功地应用到一些优化问题中,包括许多NP问题。它从传统的进化算法发展而来,而又有自己的特点:在协进化算法
信息在计算机系统中存在的形式——数据,越来越成为企业、单位和个人最重要的财富,它是决策的依据,是无形的资产,而且具有准确性高和传递性快等特点,大大的提高了工作效率和