基于模式结构和已知匹配知识的模式匹配模型的研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:NK123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大量的数据库应用中,如面向 Web 的数据集成、电子商务、数据仓库、数据库设计等,都需要用到模式信息。而操作模式信息的一个最基本的操作就是匹配,即将两个模式作为输入,产生两个模式中互相对应的元素的映射。早期的模式匹配工作是为数据集成服务的,近年来,电子商务的出现进一步推动了模式匹配的研究,在电子商务应用中也需要通过模式匹配实现不同信息系统之间的数据转换。当今模式匹配技术仍存在许多问题,大多仍以人工 (领域专家或系统开发人员) 定义方式为主,费时费力且容易出错。这个问题也随着 Web 数据源的快速增加和电子商务的一体化而日益严峻。所以希望找到一种通用的、自动化程度高的、可应用于不同数据模型和应用领域的综合的匹配方法。 本文概要介绍了模式匹配问题及其应用,详细地阐述了实现模式匹配的不同方法以及它们所应用的结构。针对已有模式匹配方法的局限性,本着最大限度地减少人工干预使模式匹配尽可能做到自动化的原则,本文提出一种利用模式结构信息和已有匹配知识的模式匹配模型 SMGM。 SMGM 模型 (Schema Matching Graph Based Model) 借鉴神经元理论,采用智能推理机制,结合启发式思想,有效地实现了模式匹配和已有匹配知识的融合,提高了匹配模型的准确度。SMGM 模型主要由初始匹配矩阵模型、结构化语义推理模型、己知匹配知识重用模型、匹配知识自适应迭代模型、阈值确定策略和匹配类型选择策略组成。 本模型首先参照辅助信息库将模式元素分离成词条向量,并基于向量匹配计算模型计算各模式元素间的匹配度,进而生成初始匹配矩阵。结构化语义匹配推理模型是SMGM 的核心,是模拟神经元相互影响作用的语义推导模型。其基于匹配知识重用模型重用历史知识,基于高收敛阈值确定模型策略确定最终阈值,并基于匹配类型选择策略确定模式元素之间的最终匹配关系,进而获得最终的匹配结果。随后模式匹配知识库中的模式匹配知识被组织成图结构,基于自适应迭代模型,对模式匹配知识进行精化和深入挖掘,为结构化语义匹配推理和阈值区间自动缩减等操作提供快速准确的指导。 实验表明:SMGM 模型达到了预期目标。
其他文献
超宽带(UWB)作为一项新兴的无线定位通信技术,以其传输速率高、发射功率低、多径分辨率高、保密性好、抗干扰能力强等优点,受到越来越多的关注。在无线传感器,雷达,定位等领
动态提供计算和服务环境以满足开放环境下多变的应用服务需求,是现代计算技术的一个热点问题。传统的计算环境由存储部件与计算部件静态绑定形成,许多计算环境按需部署研究都采
聚类是数据挖掘领域中重要的技术之一,用于发现数据对象中未知的分类。聚类算法不仅可以作为发现数据库中数据分布的深层次信息的工具,还可以将其作为数据挖掘中的一个预处理
设备驱动程序是实现计算机与外部设备间正常通信的重要保障。本文介绍并且简要分析了PCI总线和USB总线协议;分析了WDM驱动程序的结构、工作原理和特点,介绍了WDM驱动程序设计中
本文以智能温室为研究对象,对智能温室的控制算法进行研究。温室环境系统是一个多变量的大惯性非线性系统,且有交连,时滞等现象。很难对这类系统建立数学模型及用经典控制方
目前,互联网上存在着各种各样的资源,而且信息量仍在快速增长着。在庞大的互联网中搜索自己所需要的信息,已经成为大部分用户经常性的操作。搜索引擎的出现,使用户搜索信息的
查询处理是任何信息管理系统的重要特征和组成部分。语义Web领域的智能查询处理问题已经成为研究热点,其与已有的查询处理工作最大的不同点是:使得基本的RDF数据存储具有重要
随着电信市场竞争的加剧,业务已经成为电信运营商参与市场竞争的关键元素。下一代网络以业务为驱动力,通过开放业务体系架构能够同时支持话音、数据和多媒体等多元化的业务。而
三维图形引擎是计算机硬件和软件开发的最新技术,实时性,交互性以及强大的漫游功能是其主要特点。三维图形引擎目前在很多领域内都有很广泛的应用,如军方的模拟实战系统以及
集数据采集、处理及通信于一体的无线集成传感器网络以其低廉的价格、便利的部署方式正得到越来越广泛的使用,对传感器网络各个方面的研究也成为目前学术界非常活跃的课题。