基于规则的面向属性归纳算法的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gaolch013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先介绍了知识发现和数据挖掘的出现,发展,现状,以及相关技术的主要内容和数据挖掘中的主要算法,包括:关联规则挖掘,多层数据归纳算法,数据分类和概念聚类,以及挖掘路径模式,并且详细介绍了多层数据归纳算法中的面向属性归纳算法.在此基础上,该文对基于规则的面向属性的归纳方法进行分析,提出一种概念层次优化技术.首先,将基于规则的概念图转化成一棵概念树,对于不平衡的概念树,再转化成平衡的概念树,最后,用节点集合来记录数据库中每个元组在概念层次中的泛化路径.在学习结果的表示中,该文采用结合 置信度,支持度,以及LS充分性因子的方法对学习结果进行评价.经过改进的基于规则的面向属性算法提高了原有算法的扩展性和有效性.最后,该文用Irish Educational Transitions Data作为算法的实例数据,分别分析了面向属性归纳方法从数据库中学习特征化规则和分类规则的方法,学习结果显示了算法的快速有效和适用性强的优点.
其他文献
学位
电话语音识别技术是语音识别技术在电话通信领域中的延伸和发展,随着越来越多的自动语音处理系统从实验室走向实际应用,由于信道噪声干扰造成系统性能严重下降,识别率降低.在
“U-计算”或“泛在计算”或“普适计算”是一种超越桌面计算的新技术,具有两个特点:随时随地访问信息,计算不可见。“泛在网络”(Ubiquitous Network)是在“泛在计算”基础上
数字图书馆作为重要的信息和知识的创建、检索、发布、存储和管理系统和应用环境. 该文主要围绕下面的研究内容展开:1.研究和分析了第一个纯XML数据库——Tamino(Transaction
学位
文章首先对e-Learning作概述性介绍,包括e-Learning的含义、特点以及和传统学习的比较等.然后针对当前e-Learning的缺点和不足,详细介绍了北京大学教育资源系统(ERSON)的解决方
城市规划信息系统所处理的数据往往是海量的,它包含有卫片,航片,矢量化地图等数据,而这些数量都是G或T级的数据.长期以来,特别是对空间地理数据,人们都是应用二叉树算法进行
主要的研究工作集中在以下几方面:第一对于基于网络的大规模三维自然环境场景漫游这一特定的应用领域,提出了对其进行数据组织的方法.它具有的开放性为我们以一致的方式对三维
该文由以下几部分内容组成:一、介绍虚拟现实的概念、组成、实现技术;课题背景以及当前VR在国内外的发展趋势;并给出了该文的总体结构.二、通过分析双视点实现文体视觉的图形
该文首先充分分析了大型单件小批生产类型企业生产的特点,并对比了目前比较流行的生产计划制定方法:网络计划技术与MRP技术各自的优势与不足,提出了一种网络计划与MRP相结合