基于Agent的分布式元搜索引擎架构研究与实现

来源 :东华大学 | 被引量 : 1次 | 上传用户:lt13770509399
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的搜索引擎在查全率和查准率方面很难满足用户的要求,为了查询到一个相关的内容,用户常常需要使用多个搜索引擎查询相同的内容,然后综合出最适合自己的结果。元搜索引擎通过调用多个成员搜索引擎来进行搜索,因此可以很好地解决上述问题。Web数据提取技术是元搜索引擎的核心,如何准确、高效地从Web页面中提取内容对于一个元搜索引擎来说至关重要。作者对开源的Web数据提取工具Web-Harvest进行了深入的研究,并在此基础上进行了二次开发,摒弃了以前的通过写配置文件(页面抽取规则)进行页面抽取的方式,改用API的方式重新封装了Web-Harvest的几个关键部分。这种方式不但提高了程序提取页面数据的效率,同时提高了程序开发人员的开发效率。智能Agent是人工智能领域发展起来的一个概念,它所特有的自主性、社会性、反应性和能动性可以大大提高系统的灵活性和智能性。作者将Agent技术应用于所构建的信息采集系统,通过实践证明,可以将整个信息采集任务分散到各个Agent上并发运行,这样可以极大提高信息采集的效率。元搜索引擎可以帮助用户整合来自不同搜索引擎的搜索结果,最关键的是重新给出相关度,按新的相关性排列查询结果后提交给用户。作者将Agent技术、Web技术和Web数据提取技术结合,构建了基于MAS的元搜索引擎。通过实验显示,系统在查全率方面有所提高,同时,重新给出了搜索结果的相关度,大大提升了用户的体验。在系统架构方面,这种方式极大地提高了整个系统架构的灵活性和可扩展性,为构建更加复杂、更加智能的系统提供了一种新的模式。
其他文献
医院要实现数字化管理是一个漫长、复杂的过程,发达国家医院信息系统的开发应用已经有三十多年的历史,至今已进入成熟时期。而国内在近20多年时间里,从第一阶段的单机收费管理逐
多目标优化问题是一类常见于各种科研以及工程应用中的问题,与经典单目标最优化问题不同,多目标问题中涉及到的各个目标相互之间存在着一定的冲突关系。目前在多目标领域存在
随着网络技术快速发展,大量在线社会网络的建立和使用,越来越多的人参加到社会网络中分享和交流信息,而在这种交互过程中,就会产生大量的数据。这些数据中包含有一部分是用户不想
无线传感器网络(WirelessSensorNetworks,WSNs)是一种综合了传感器技术、嵌入式技术、分布式处理技术和无线通信技术的新一代网络,有着广泛的应用前景。路由技术是无线传感器网络
随着Internet和数字化技术的快速发展,网上数字内容和信息的安全问题已成为人们所关注的重点。传统的信息安全技术包括传统的访问控制技术、信任管理、数字版权管理(DRM)三个
近几年来,随着智能移动设备在生活中的普及,移动GIS应用得到快速发展,需求也越来越广泛。在移动操作系统种类繁多且更新换代速度非常快的背景下,以往以单个应用作为整体的设
后基因组时代中,随着高通量实验技术的快速发展,大量的蛋白质数据被收集起来。然而,蛋白质数据与功能标注数据之间的差距却在不断变大。即使如酵母菌这样得到广泛研究的物种,
运动目标跟踪问题涉及到计算机图像处理、模式识别以及人工智能等诸多领域,是一门交叉性很强的学科。被跟踪目标本身形状的多样性、所处环境的复杂性和跟踪过程中的遮挡问题
软件复用是指重复使用已有的软件产品用于开发新的软件系统,以达到提高软件系统的开发质量与效率,降低开发成本的目的。构件技术是支持软件复用的核心技术。构件技术的不断发展
随着近年来无线通信技术、传感器技术、低功耗嵌入式技术以及一系列相关技术的高速发展和广泛应用,无线传感器网络的实用性和可靠性都得到极大提升,被广泛应用于环境监测、军