基于归纳逻辑程序设计的数据挖掘研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:ghosty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是当前计算机技术的研究热点之一。当前的数据挖掘研究主要在命题逻辑的框架内,存在描述能力弱和不便于利用背景知识的局限性。而且,这些方法多采用单表假设,算法寻找单表数据中的模式。但数据通常保存在关系数据库的多张表中,若想利用现有的数据挖掘算法,存在将数据转换到单表中的难题。 归纳逻辑程序设计(Inductive Logic Programming,ILP)是机器学习和逻辑程序设计的一个交叉研究领域。它使用归纳的思想,借助成熟的逻辑程序设计的理论与方法,克服了传统机器学习存在的问题,比传统经典的机器学习系统具有更强的表达力和普遍适用性。机器学习是数据挖掘采用的一种技术,因此,归纳逻辑程序设计能够自然地应用于数据挖掘。 基于一阶逻辑的一阶规则挖掘技术常被称作ILP。一阶逻辑为ILP提供了一致的和非常有表达力的表示手段:背景知识、例子以及挖掘到的知识都可表示为子句语言的公式,所以在挖掘过程中可非常自然地利用背景知识。另外得到的知识表示为相关谓词构成的一阶规则,比命题规则具有更强的表达能力,使知识的内涵更加丰富并易于人们理解。因此,ILP可克服传统命题规则挖掘方法的两个主要限制:描述能力的限制与背景知识利用的限制。此外,由于关系数据库的形式描述.“关系代数”与ILP的子句逻辑有着内在的关联性,ILP技术可被直接用于涉及关系数据库中多个关系(表)的数据挖掘任务。 本文通过对归纳逻辑程序设计和数据库以及数据挖掘两方面的了解和学习,总结了关系数据库与归纳逻辑程序设计之间的关系,分析了归纳逻辑程序设计系统和数据库系统结合的三种方法:数据库的直接转化法,prolog级与数据库连接法,子句级与数据库连接法。并采用第一种方法,通过数据库中关系属性与谓词之间的映射,完成了数据库管理系统与归纳逻辑程序设计系统之间松散耦合的接口。即根据数据库中关系属性与谓词的映射,把数据库的对应部分(对应ILP学习中的正负实例、背景知识、类型说明及模式说明)转换为归纳逻辑学习系统中需要的逻辑程序语句的形式,作为ILP系统的输入。该接口使用VC++6.0与ODBC实现。该接口使归纳逻辑学习系统对于数据库管理系统具有通用性和独立性。 采用更为高效的紧耦合方法实现归纳逻辑程序设计系统与数据库系统的结合将是后续工作中不断加以改进的课题。
其他文献
企业知识是企业创新的基石,在知识日渐丰富的今天,企业知识管理面临的问题不再是知识的缺乏,更多的是如何有效管理已有的知识。因此,对企业知识合理分类,让企业用户能迅速准确地搜
随着计算机技术的发展和互联网的普及,要求新的软件模式能够适应应用环境的不确定性,自主、有效地实现其功能。Web服务是目前最重要的Web资源,通过采用广泛接受的网络协议和技术
学位
时空白适应处理技术(Space-Time.Adaptive Processing,STAP)在时间和空间二维对阵列信号做耦合处理,由于其对系统误差的自调节性,信号检测的高精确性在动目标检测(Moving Tar
随着Web开发技术一直以来广泛深入的发展,各种网上应用铺天盖地。与此同时,各种各样为开发Web应用而设计的工具也层出不穷,有的是提出了新的开发语言,有的是提出了新的开发模式。
本文在Pandya提出的CTL*[DC]逻辑[1]的基础上,对其语法和语义进行扩展,在描述向前状态序列的性质前面引入量词,并对路径长度进行限制,定义了一个新的逻辑CTL*[k-QDDC],使其可以更
本文建立了集中器位置问题的数学最优化模型,它属于0-1整数线性规划问题.作为0—1规划的基本解法,隐枚举法被使用来解决该问题.给出它的基本流程后,原模型被重新整理以适合该方法
随着科技的发展,具有上网能力的移动终端品种越来越多,由于各种移动终端的显示屏幕、处理速度、内存大小及对各种多媒体格式的支持程度的不同,造成了移动终端的差异性,并且这种差
学位
真实感渲染技术是当今计算机图形学关注的一个热点,它被广泛地应用于电影制作、室内设计、工业展示等领域。路径跟踪算法是真实感渲染中一个重要的算法,它可以模拟真实场景中所
手机芯片检测技术是手机生产中的重要一环。对大批量手机芯片的检测不仅需要硬件设备的支持,还需要相应的软件平台的支持。然而,中国大陆的手机芯片检测技术比较落后,基本上
数据库压缩是一种常用的提升关系数据库性能和节省存储空间的技术。MySQL数据库几乎是应用最为广泛的开源数据库,针对目前MySQL数据库存在的磁盘访问密集且CPU利用率不足的情