基于领域知识和概念格模型的知识发现研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:LIU73558109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库中的知识发现(Knowledge Di scovery in Databases,简称KDD)是数据库和人工智能领域研究的热点课题,其目的是在数据库中提取隐含的,先前未知的,潜在有用的知识。数据挖掘领域的高速发展成为必然,高效的数据挖掘方法也越来越得到重视。目前的许多知识发现大多是“从零开始”的、无需领域知识的独立发现,既没有发挥已有知识的作用,也没有对以后的发现提供必要的积累。研究发现,领域知识在数据挖掘中具有至关重要的地位。 概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则问题的描述。在概念格的内涵中引入等价关系,可得到概念格的扩展形式,可以更清晰的表示概念内涵之间的关系,更有利于知识提取。在信息检索、软件工程和KDD等领域,概念格已经显示出一定的应用价值,但概念格有其局限性,由于概念格是描述属性与对象之间的完备分层次结构,其完备性导致格结构规模的庞大,一定程度上制约了其应用。 本文详细地讨论、分析了领域知识在数据挖掘中的作用、研究现状和应用前景等。把领域知识作为发现过程的重要组成部分,并将所发现的知识与原有知识融合,合理利用领域知识将有助于降低数据规模,提高知识发现的效率和质量。本文在此基础上将领域知识和概念格模型结合,提出了基于领域知识的概念格缩减算法。在数据挖掘中领域知识的表示方法有其不同特点,针对概念层次树形式的领域知识,提出两种算法DKLT和DKLTM,并通过实验加以验证;针对概念层次图形式的领域知识,初步讨论了算法DKLG。通过领域知识和概念格扩展模型的结合,来提升属性值的层次,从而提高发现的层次和质量,降低格的规模,以更有效的进行知识发现。 未来数据挖掘环境,将会把领域知识和挖掘过程更加灵活、有效的结合在一起,并将利用挖掘结果来更新领域知识。领域知识有希望同挖掘方法一样,成为挖掘环境中的核心部件。
其他文献
随着现代网络技术和通讯技术的高速发展,电子政务已成为“信息高速公路”五大应用领域(电子政务、电子商务、远程教育、远程医疗、电子娱乐)之首。通过电子政务系统可以极大地
地理信息系统(GIS)发展的40多年来,得到了越来越广泛的应用,可以说当今的地理信息系统规模很大,能够综合各种系统,能满足更多用户的需要.地理信息系统的广泛应用,使地理信息
随着网络时代的到来,网络规模的不断扩大,网络的结构和功能日益复杂,用户要求越来越高,计算机网络的管理和运行己经成为计算机网络领域的关键技术之一.网络管理技术随着网络
在传统的IP网络中,采用的是Best-effort服务,每个转发节点对所有的报文同等对待,采用先入先出的策略将报文送到目的地,不能对报文传送的可靠性、传输时延等性能提供任何保证。同
随着Internet技术的迅速发展和信息共享要求的不断提高,数据库与Web的结合日趋紧密,数据库系统由小型化向大型化发展,由集中式向分布式发展.能处理分散地域的分布式数据库系
随着社交网络的兴起以及高清数码相机的普及,图像数据的数量正以指数级的速度增长,如何快速有效地检索和管理这些海量的图像数据成为当今计算机视觉和大数据领域的研究热点。图
网络终端技术已经在我国迅速发展起来,智能化应用服务协议是智能化网络终端和服务器上的应用系统之间进行交互的机制,研究开发智能应用服务协议具有重要的意义。本文研究了智能
面向对象软件测试是面向对象软件开发方法中不可缺少的一环,是保证软件质量,提高软件可靠性的关键。面向对象的软件测试分为四级:方法级测试、类级测试、类簇级测试和系统级测试
随着计算机和微电子技术的迅速发展,软件和芯片技术已成为IT的核心技术,这些核心技术在很大程度上决定着一个国家的信息安全和综合国力。网络计算机是一种基于网络计算机环境的
J2EE规范定义了一套标准来简化N层企业级应用的开发;J2EE服务器提供了交易处理服务、数据存取服务、Java消息服务(JMS)、安全性服务等执行环境和系统服务.J2EE的最大优点是,