Deep Web查询接口匹配技术研究

来源 :江苏大学 | 被引量 : 1次 | 上传用户:tjpu0510420215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet技术的飞速发展便得web数据厍得到了广泛应用,这些数据库隐藏在查询接口之后,用户只能通过本地查询接口提交请求才能获得其中信息。这些信息无法被搜索引擎通过超链接检索到,称为Deep Web信息。由于Deep Web海量的信息,构建一个Deep Web信息集成系统显得尤为重要。在Deep Web信息集成系统中,将Web数据库按领域分类,为每个领域建立一个统一查询接口。通过对统一查询接口提交查询,就可以同时向多个本地查询接口发送请求。将统一查询接口的请求映射到各个本地查询接口,需要解决查询接口匹配问题。查询接口匹配是Deep Web信息集成系统的基础。针对现有方法不能有效处理查询接口复杂匹配问题,本文提出一种新的匹配方法,利用正相关关联挖掘发现潜在的成组属性组,并将成组属性作为单个属性,对具有相同语义的属性进行语义聚类,达到匹配目的。最后实现一个面向图书检索领域的Deep Web信息集成系统。主要研究工作包括:(1)提出一种利用关联挖掘思想生成成组属性的方法。针对属性相关度计算不精确问题,设计了一种基于互信息的属性相关度度量标准,该标准能够体现成组属性的特点,并能解决属性稀疏性问题和高频率属性问题。另外,为了提高算法效率,提出“属性矩阵”概念,所有的计算都在仅含有0和1的矩阵上进行,复杂的概率计算转为简单的与运算,有效提高效率。(2)提出一种采用语义聚类思想生成同义属性的方法。借助语义网计算属性间的语义相似度,同时为了弥补部分属性语义信息不足问题,在计算属性相似度时,加入数据域相似度。通过语义相似度和数据域相似度的加权计算,提高属性相似度计算的精度。(3)设计并实现一个面向图书检索领域的Deep Web信息集成系统,并将匹配技术在系统中的应用作了分析。另外所有领域相关的信息都存放在配置文件中,通过改变配置文件能够快速搭建一个面向新领域的信息集成系统。
其他文献
无线Mesh网络(Wireless Mesh Networks,WMN)也称为无线多跳网络,它是一种与传统网络完全不同的新型无线网络技术,是目前前沿的网络技术,具有容量大、速率高、易配置等优点,成
P2P网络是近年来兴起的一种新的计算体系结构,它在很多领域得了广泛的应用,P2P网络本质上是一个开放的、动态的环境,所以在P2P网络的发展过程中,产生了很多需要研究和解决的
随着社会信息化建设的发展,信息变得越来越重要,甚至成为社会各领域赖以生存的基础。同时,系统的物理故障、人为恶意操作或误操作,以及自然灾害等都会对数据安全构成威胁,一
信息技术正在改变着人类社会的生产方式、工作方式、生活方式和学习方式。随着互联网络的飞速发展,人们获取知识的方法与手段发生极大改变,由传统的单一的文本知识学习转向集
近年来,分子动力学的模拟仿真在生物分子、材料科学、物理科学等方向应用越来越广泛。使用FPGA加速分子动力学模拟的研究也逐渐成为高性能研究领域的热门话题之一,主要原因在
随着计算机网络技术的飞速发展和Internet在全球范围内的普及,网络的规模日益扩大和复杂化,使得网络管理的地位显得越来越重要。同时,由于IPv4网络的局限性日益突出,特别是地
近年来,随着Internet技术的飞速发展,Web服务已经成为蓬勃兴起的一种分布式计算模型。Web服务将程序封装成单个实体发布到网络上以供其他程序使用,它结合了面向组件的方法和W
随着互联网的不断发展,网络已经成为人们生活中必不可少的部分。如何保证网络安全、稳定、高效的运行成为了当前网络中迫切需要解决的问题。网络流量作为网络中数据流动的载
非线性科学是一门研究非线性现象共性的基础科学,其中混沌理论是非线性科学的一个重要分支。本文利用理论推导和数值模拟相结合的方法研究了异结构混沌系统的广义同步方法,取得
软件演化指的是软件进行变化并达到所希望形态的过程,可分为静态演化和动态演化两种类型。由于动态演化具有持续可用性的优点,已成为软件工程研究的热点。但动态演化比静态演