Deep Web查询接口匹配技术研究

来源 :江苏大学 | 被引量 : 1次 | 上传用户：tjpu0510420215

【摘要】

：

Internet技术的飞速发展便得web数据厍得到了广泛应用,这些数据库隐藏在查询接口之后,用户只能通过本地查询接口提交请求才能获得其中信息。这些信息无法被搜索引擎通过超链

【作者】

：

曹庆皇

【机构】

：

江苏大学

【出处】

：

江苏大学

【发表日期】

：

2009年01期

【关键词】

：

复杂匹配 Deep Web 关联挖掘聚类语义网互信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Internet技术的飞速发展便得web数据厍得到了广泛应用,这些数据库隐藏在查询接口之后,用户只能通过本地查询接口提交请求才能获得其中信息。这些信息无法被搜索引擎通过超链接检索到,称为Deep Web信息。由于Deep Web海量的信息,构建一个Deep Web信息集成系统显得尤为重要。在Deep Web信息集成系统中,将Web数据库按领域分类,为每个领域建立一个统一查询接口。通过对统一查询接口提交查询,就可以同时向多个本地查询接口发送请求。将统一查询接口的请求映射到各个本地查询接口,需要解决查询接口匹配问题。查询接口匹配是Deep Web信息集成系统的基础。针对现有方法不能有效处理查询接口复杂匹配问题,本文提出一种新的匹配方法,利用正相关关联挖掘发现潜在的成组属性组,并将成组属性作为单个属性,对具有相同语义的属性进行语义聚类,达到匹配目的。最后实现一个面向图书检索领域的Deep Web信息集成系统。主要研究工作包括:(1)提出一种利用关联挖掘思想生成成组属性的方法。针对属性相关度计算不精确问题,设计了一种基于互信息的属性相关度度量标准,该标准能够体现成组属性的特点,并能解决属性稀疏性问题和高频率属性问题。另外,为了提高算法效率,提出“属性矩阵”概念,所有的计算都在仅含有0和1的矩阵上进行,复杂的概率计算转为简单的与运算,有效提高效率。(2)提出一种采用语义聚类思想生成同义属性的方法。借助语义网计算属性间的语义相似度,同时为了弥补部分属性语义信息不足问题,在计算属性相似度时,加入数据域相似度。通过语义相似度和数据域相似度的加权计算,提高属性相似度计算的精度。(3)设计并实现一个面向图书检索领域的Deep Web信息集成系统,并将匹配技术在系统中的应用作了分析。另外所有领域相关的信息都存放在配置文件中,通过改变配置文件能够快速搭建一个面向新领域的信息集成系统。

其他文献

WMN应急通信及AODV协议改进研究

无线Mesh网络(Wireless Mesh Networks,WMN)也称为无线多跳网络,它是一种与传统网络完全不同的新型无线网络技术,是目前前沿的网络技术,具有容量大、速率高、易配置等优点,成

学位

无线Mesh网络应急通信AODV回复消息最大生存期

基于信誉的P2P网络环境下信任管理模型研究

P2P网络是近年来兴起的一种新的计算体系结构,它在很多领域得了广泛的应用,P2P网络本质上是一个开放的、动态的环境,所以在P2P网络的发展过程中,产生了很多需要研究和解决的

学位

P2P网络信任关系信任模型推荐信任可靠性和安全性

广域网络备份系统中数据备份代理的研究与实现

随着社会信息化建设的发展,信息变得越来越重要,甚至成为社会各领域赖以生存的基础。同时,系统的物理故障、人为恶意操作或误操作,以及自然灾害等都会对数据安全构成威胁,一

学位

网络备份系统备份代理数据一致性协同服务

面向个性化服务的学习资源管理系统的设计与实现

信息技术正在改变着人类社会的生产方式、工作方式、生活方式和学习方式。随着互联网络的飞速发展,人们获取知识的方法与手段发生极大改变,由传统的单一的文本知识学习转向集

学位

E-learning元数据用户建模个性化服务

基于FPGA的分子动力学计算系统

近年来,分子动力学的模拟仿真在生物分子、材料科学、物理科学等方向应用越来越广泛。使用FPGA加速分子动力学模拟的研究也逐渐成为高性能研究领域的热门话题之一,主要原因在

学位

分子动力学并行计算系统FPGALJ力

IPv6拓扑发现研究及网管系统实现

随着计算机网络技术的飞速发展和Internet在全球范围内的普及,网络的规模日益扩大和复杂化,使得网络管理的地位显得越来越重要。同时,由于IPv4网络的局限性日益突出,特别是地

学位

IPv6网络管理拓扑发现简单网络管理协议ICMPv6

基于P2P分层网络的Web服务发现研究与实现

近年来,随着Internet技术的飞速发展,Web服务已经成为蓬勃兴起的一种分布式计算模型。Web服务将程序封装成单个实体发布到网络上以供其他程序使用,它结合了面向组件的方法和W

学位

Web服务服务发现P2P网络Chord网络分层模型

基于弹性多尺度熵的网络流量时空特性研究

随着互联网的不断发展,网络已经成为人们生活中必不可少的部分。如何保证网络安全、稳定、高效的运行成为了当前网络中迫切需要解决的问题。网络流量作为网络中数据流动的载

学位

网络流量流样本熵多尺度熵弹性多尺度熵时空尺度变换

异结构混沌系统的广义同步研究

非线性科学是一门研究非线性现象共性的基础科学，其中混沌理论是非线性科学的一个重要分支。本文利用理论推导和数值模拟相结合的方法研究了异结构混沌系统的广义同步方法，取得

学位

异结构离散影射混沌系统广义同步模糊神经网络反馈控制自适应控制

神经构件模型和软件体系结构演化方法的研究

软件演化指的是软件进行变化并达到所希望形态的过程,可分为静态演化和动态演化两种类型。由于动态演化具有持续可用性的优点,已成为软件工程研究的热点。但动态演化比静态演

学位

软件动态演化神经传导神经构件模型NDSA模型反射配置模型

Deep Web查询接口匹配技术研究

与本文相关的学术论文