元搜索引擎查询结果的合成方法

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:lang19870311
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎(SearchEngine)本质上是一种基于排序的因特网信息检索系统.它们接受用户的查询条件,计算文档与查询的相关性,以此为根据对文档集合进行排序,从中选取相关性超过特定标准的文档组成查询结果.由于因特网上的信息量十分巨大,没有一个搜索引擎能够覆盖整个网络.为了获得所需的信息,人们有时不得不使用多个搜索引擎. 元搜索引擎(Meta Search Engine)是多个搜索引擎的集成,其工作原理可以归纳为如下6步:(1)接受用户的原始查询;(2)把原始查询分别转换为各个成员搜索引擎能够接受的形式;(3)向成员搜索引擎发送查询;(4)收集各个搜索引擎的原始查询结果;(5)对原始查询结果进行合成、形成最终结果;(6)把最终查询结果递交给用户。 从元搜索引擎的工作原理可以看出,查询结果合成是其中的一个重要环节。在本文中,我们提出了一种基于公共次序不变性的元搜索引擎结果合成算法。它不仅概念简单、易于实现,而且满足基本的约束条件,其合理性有充分的理论保证。
其他文献
Web已成为人们获取信息的一个重要途径,由于Web信息的日益增长,人们不得不花费大量的时间去搜索浏览自己需要的信息.为了减轻这个困难,人们开发了许多工具来辅助寻找期望的信
会议
随着我国产业结构调整和优化升级,租格寄售这种新型的商业模式所展现出来的社会效益和经济效益是不可估量,寄售实体店内化妆品销售占据较大份额,成为化妆品流通的又一新兴业
数据仓库系统的特点主要是数据量大、要求查询速度快,用户的查询只关心综合数据,而很少关心细节数据.并行数据仓库系统的存储管理与以往的并行系统存在着很大的差异。由于数
会议
随着万维网的日益普及与强大,在网络上搜寻所需的信息变得越来越重要了.诸如AltaVista,Hotbot之类的搜索引擎应运而生.典型的搜索引擎是基于文本匹配的,针对用户的查询会返回
会议
随着新经济时代的到来,信息爆炸使得存储的扩容和升级已经远远超出了处理器和网络的升级速度.UCBerkeley的信息管理学院最新研究成果显示:全球每年产生15亿GB的信息,平均250M
Wrapper是Web数据集成的重要组成部分,然而众多的Wrapper生成方法都面临着维护的问题,因为Web页面经常发生变化,Wrapper的维护成为一项很难解决的问题.人们研究快速有效地自
会议
Peer-to-Peer(P2P)技术也被称为Peer计算,是当前最有潜力的网络技术之一.这种技术去除了集中式服务器,使节点之间可以直接交换资源和服务.同时,任何一个节点可以自由地加入和
本文使用语义近似度分析了集成信息的GV中数据项的语义原子性与关系数据源中数据项的结构原子性之间的各种映射关系,阐述了二者不一致性的产生原因以及解决途径,对集成信息的产
本文提出了一种自动从XML数据文件抽取其数据模式的算法。从实验结果和理论分析两个方面与Lore系统(斯坦福大学的XML数据库系统)中的DataGuides相比,表明本算法有更高的效率.
随着Internet技术的迅速发展和日益成熟,人们积聚了越来越多的半结构化数据,如HTML,SGML,XML等文件。本文研究了半结构化数据中模式的交互式开采问题并且给出了相应的开采算法,