【摘 要】
:
随着World Wide Web的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速的增长。这些信息要通过查询接口在线访问其后端的Web数据库得到。尽管丰富的信息蕴藏在D
论文部分内容阅读
随着World Wide Web的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速的增长。这些信息要通过查询接口在线访问其后端的Web数据库得到。尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信息加以利用是一件十分具有挑战性的工作。目前,在Deep Web这个领域的研究中已经提出了Deep Web数据集成的系统架构,它分为两个大的模块:集成查询接口生成模块和集成查询接口查询处理模块。本文对Deep Web数据集成的系统架构中的各个组成部分作了论述和介绍,并重点针对查询处理模块中的Web数据库的选择和查询转换两个子模块进行详细介绍和深入的研究。由于Deep Web每个领域的数据库数量的不断快速增长,如果只是简单地把集成接口上的查询转换到对该领域每个Web数据库的查询,那么要访问该领域的每个数据库将花费大量的代价,并且一个领域中大部分的Web数据库之间存在着冗余的信息,这样查询结果也会产生大量的信息冗余。基于上述问题,本文给出了基于TOP-N查询的Deep Web数据库选择方法,并对其不相关度距离计算和Deep Web数据库选择方法进行了改进,使得在Deep Web数据库选择中减少了资源的浪费,提高了选择查询性能。查询转换也是Deep Web数据集成的系统架构中的重要组成部分,它负责将用户提交的查询转化为要访问的Web数据库的各个本地目标查询接口上的查询。随着DeepWeb数据源的迅速发展,每个主题领域内的数据源都在不断更新或增加,每个领域的本地目标查询接口也随之不断动态变化,因此要把用户提交的查询请求转化为要访问的Web数据库的各个本地目标查询接口上的查询存在很大困难。基于这个问题,本文对查询转换机制进行了模型化的深入研究,并给出了解决方案,提高了查询转换的准确率和性能。
其他文献
本文首先引入了企业信息门户(EIP)的概念并分析其研究的意义,论述了企业信息门户的功能和带来的优势。同时,提出构建企业信息门户的关键问题是:解决企业异构信息和企业应用的集成;企业信息门户作为企业单一的入口包括三方面的集成技术:Portal技术提供了界面的集成、EAI技术提供了应用的集成、目录服务技术提供了数据信息的集成。接着论述了Portal技术及单点登录、EAI涉及的面向服务架构(SOA)和We
车载自组织网络(VANET)有很多自己的特点:网络中没有可靠的网络基础设施可供使用,车辆间必须建立起自组织网络来实现相互通信,可能无法使用无线基站;车辆的快速运动使得网络
随着互联网的发展,云计算技术的使用日益广泛,公有云更是成为了很多小型企业部署业务的首选平台。由于云计算具有用户基数大,租户数量多以及高流量等特点,传统的负载均衡系统
图像配准是图像处理的基本任务之一,它的主要作用是将不同时间、不同传感器、不同视角及不同拍摄条件下获取的两幅或多幅图像进行匹配(主要是几何意义上的)。近年来对图像配
随着科技的发展,很多应用领域涉及到大量空间数据,空间数据库成为一个热门话题。空间关系是空间数据库和GIS领域的重要研究内容。拓扑关系作为最基本的空间关系,是其中的研究
运动目标的检测与跟踪是计算机视觉领域的一个重要课题,在智能视频监控、基于视频的人机交互、机器人视觉导航、虚拟现实、自动驾驶、医学图像及农业自动化等领域都有广泛的
聚类是用于数据分析的一种有着广泛应用的统计方法。随着数据收集技术的不断发展进步,数据集的维度越来越高,在高维数据集上进行聚类成为一个具有挑战性的课题,自适应降维聚类法
随着国内几家电信企业的重组和3G牌照的发放,我国通信行业的竞争也日趋激烈。与其他行业相比,电信运营商拥有更多关于用户的数据。谁能正确地挖掘出隐含于这些数据中的知识,
近年来,计算机通信技术的发展和Internet的普及,使数字信息和产品的传播更加方便和广泛,但与此同时,软件版权保护也成为人们亟待解决的问题。软件水印作为一门新兴的软件版权
软件演化在软件生命周期中必不可少,当前体系结构的运行时动态演化已经成为许多软件系统的根本需求,而支持动态体系结构的运行平台以及实现框架是其中的关键问题。另外,当前