约束归纳逻辑程序设计系统的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:flowerofwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大多数数据挖掘方法针对的对象是传统的单表形式的数据.然而,通常现实数据中包含很多不同类型的实体(多表).对这样的数据的挖掘形成了关系数据挖掘研究领域.关系数据挖掘主要技术之一是归纳逻辑程序设计(Inductive Logic Programming,ILP).ILP是机器学习(Machine Learning)与逻辑程序设计(Logic Programming)相交叉形成的研究领域.ILP借助逻辑程序设计的理论与方法,利用背景知识学习一阶规则.一阶规则较之基于属性-值表示方式的命题级规则具有更强的表达能力.随着ILP开始应用于数据挖掘问题,并成为关系数据挖掘的技术源泉,ILP技术研究的重要性也更加显著.由于以Prolog作为表示语言,ILP系统处理数值量的能力较弱.这使得数值量的处理问题成为将ILP技术应用于数据挖掘的瓶颈.约束归纳逻辑程序设计(Constraint Inductive Logic Programming,CILP)是ILP研究中较新的研究领域,致力于解决ILP中处理数值量的问题,即研究向数值约束方向扩充ILP.由于CILP是ILP研究的一个分支,ILP技术对于我们进行CILP研究有着重大的指导意义.国际上已有文献提出了一些CILP的方法.但是这些方法有很大的局限性,不能有效的处理现实世界的数据.针对当前CILP技术的局限性,我们提出了一种基于模式识别和多元统计分析的CILP新方法.与现有的CILP方法相比较,该方法可以在不需要模式说明,不需要约束求解器的情况下学习出含有多个变量的多种形式的约束.我们以这些新的CILP方法为基础设计并实现了一个CILP原型系统——BPU-CILP系统.针对BPU-CILP系统的系统设计,该文着重考察了BPU-CILP系统的偏向、搜索策略和有效构造候选句节的方法.BPU-CILP系统采用了面向对象的程序设计方法,在Windows操作系统平台上用ANSI C++和Matlab C++数学函数库开发.该文给出了BPU-CILP系统的详细设计方案,并针对搜索策略、绑定表的维护和候选句节的构造等BPU-CILP系统核心算法进行了讨论.实验表明,BPU-CILP系统能够克服现有CILP方法的局限性,有效地处理不精确数值,在不需要附加的背景知识、不依赖约束求解器的情况下,导出含多个变量的多种形式的多项式约束,从而为关系数据挖掘提供了新的有力的技术支持.
其他文献
IP多播是开放式的、尽力而为的模型。它没有为上层提供任何服务质量和投递保证。为了提高多播传输的可靠性,人们提出了大量的可靠多播协议。但是,由于不同应用的需求差异很大
随着Internet的迅速发展,网络安全问题日益突出,传统的访问控制方法DAC和MAC难以满足复杂环境的安全需求。基于角色的访问控制正成为安全可靠的应用系统的重要组成部分。构建一
本论文研究的内容是为了适应四川省网络通信技术重点实验室两项研究工作需要而提出的。首先协议测试系统需要易于修改适合用于测试系统调试的测试对象,其次新的单物理层平面体
随着计算机技术的广泛应用,人们在日常事务中积累了大量的数据.为了更有效地利用这些数据,越来越多的企业开始利用数据仓库技术对数据进行分析.数据仓库中一项很重要的技术是
近二十年来,人们逐渐认识到脑功能成像在认知过程中的科学意义及关于神经学方面的研究前景。脑神经成像技术是一项有研究潜力的技术,它可以确定与人类记忆和抽象思维相关的脑区
计算机和信息技术的飞速发展使我们的社会逐步演化为高度信息化的社会.随着政府职能从管理型向服务性的转变,新型的信息技术能够极大地提高政府依法行政的手段,更好更方便地
现代企业管理的信息化已经是大势所趋,而实施ERP是实现信息化的一条主要途径.J2EE标准的出现,为实施ERP提供了一个良好的选择.该文以一个中型企业的实际ERP项目为背景,分析了
在本论文中,笔者对目前递归立方环上存在的上述问题给出了详细的说明和论述,并针对递归立方环的对剖宽度和直径的定义给出了必要的修正。 同时,基于目前已有的递归立方环上的
该文提出了以电话程控交换机(PBX)技术为基础的一种新的移动办公概念.这种移动办公概念,将会大大地节约了企业的日常运营成本,节省了大量的劳动力,优化和整合了企业内部的语
缺陷在软件产品中扮演重要角色:一方面,在测试过程中检测到缺陷时,应该对缺陷进行处理,从而保证软件有一个较高的质量;另一方面,缺陷本身带有很多重要信息,可以用这些信息来