一阶规则挖掘系统的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ning0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作者的论文题目为"一阶规则挖掘系统的研究与实现",该项目得到了国家自然科学基金、北京市自然科学基金的资助.该文是对作者研究生期间所作研究工作的总结.数据挖掘技术是当前计算机技术的研究热点之一.但当前的数据挖掘研究主要局限在命题逻辑(即属性-值表示)的框架内,随着数据挖掘技术处理对象范围的扩展,存在一定的局限性.表现在背景知识只能以相当有限的形式加以表示;缺乏关系使得概念描述语言不适合某些应用领域.随着归纳逻辑程序系统的不断完善,源于归纳逻辑程序的关系数据挖掘技术应运而生.其优越性表现在:ILP建立在一阶逻辑的基础上,一阶逻辑为ILP提供了大量的已被透彻理解的概念,技术和理论.一阶逻辑也为ILP提供了一致的和非常有表达力的表示手段,所以在挖掘过程中可非常自然地采用背景知识.而且得到的知识表示为相关谓词构成的规则和事实,比命题规则具有更强的表达能力,使知识的内涵更加丰富并易于人们理解.因此,ILP可克服命题规则挖掘方法的两个主要限制:描述能力的限制与背景知识利用的限制.该课题的主要研究内容是:一阶谓词逻辑是用来描述规则的最具有表现力和最能为人们所理解的表示方法之一,但是在现实世界数据中,经常会存在噪音数据和不完整数据影响规则学习的精确度.我们将研究一种算法使其能够根据概率的评价手段学习出较好的分类规则.该次研究将集中在根据FOIL系统和GDT思想,来构造一个新的原型系统foil-gdt.此系统是一个基于归纳逻辑程序设计的多表数据挖掘系统.它能够为学习出的规则显式地赋予概率规则强度值以此来评价规则的好坏,使得学习出的规则具有较高的精度值.最后,通过两个例子阐述了该方法的实施过程和实验结果,分析表明:该算法是一种新的有效地处理含有噪音数据的一阶规则学习系统.
其他文献
随着软件的规模越来越大,内容越来越庞杂,先进的软件开发过程和方法成为软件项目开发成败的关键。通过对国内一些中小软件企业的调研,结果显示我国的软件开发现状十分不容乐观,一
在现实世界中,很多问题都要涉及对多个目标进行优化。因此多目标优化也成为近30年来迅速发展起来的一门新兴学科。 本文提出了一种新的方法来进行多目标优化。根据对GA存在
该文首先介绍了移动Agent的基本概念、技术优势、面临的挑战.然后,该文提出一种基于Agent和Place的层次结构移动Agent模型,以及基于此模型的移动Agent系统FreeMA.在该模型中,
直接体绘制技术可以高效地对复杂的三维体数据进行部分或整体绘制,其较高的绘制速度以及灵活性可以满足用户不同的需要。直接体绘制的结果直观、立体,但往往缺乏一定的真实感,难
学位
本文作为国家高技术研究发展计划(863计划)课题“基于颅骨的身份认证与鉴别技术”的一部分,对计算机辅助颅像重合中的一些关键技术和主要算法做了深入的研究。主要工作包括以
随着国民经济的快速发展,高速公路以“高速”的突出优势日益成为公路运输的主要交通设施。如何减少交通拥挤和交通事故造成的损失,以更加科学的手段对高速公路状况进行监控和显
WWW是一个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据
本文对基于NewsML的新闻发布系统的研究与实现进行了研究。文章首先介绍了NewsML的文档结构和功能结构,描述了NewsML文档中各元素与新闻内容、新闻结构、新闻管理、新闻交换之
该课题来自国家"863"项目《多源空间数据挖掘技术》.数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一.随着INTERNET的大