【摘 要】
:
互联网中拥有数量庞大的信息资源,而传统的基于网络爬虫的搜索引擎只能检索其中很少的一部分,而且它们不善于检索以动态网页形式存在的信息和存储在网络边缘的信息,但基于对
论文部分内容阅读
互联网中拥有数量庞大的信息资源,而传统的基于网络爬虫的搜索引擎只能检索其中很少的一部分,而且它们不善于检索以动态网页形式存在的信息和存储在网络边缘的信息,但基于对等网络(Peer-to-Peer,简称P2P)思想的新一代搜索技术可以将信息检索服务延伸到这些地方。P2P搜索技术具有良好的实时性、有效性,而且成本低廉,其搜索深度和广度是传统搜索技术难以企及的。本文首先介绍P2P搜索所涉及到的技术和理论,并讨论了现有的各种P2P搜索技术的原理和特点。然后分析了按关键词分割的P2P搜索技术在大规模P2P网络中的性能缺陷,进而提出按区域分割(Partition By Zone,简称PBZ)技术,PBZ技术基于结构化覆盖网络,它采用的索引数据分割策略结合了文献分割和语词分割的思想。在描述其区域划分规则、数据定位算法、索引构建和维护算法、搜索算法和自适应分区算法之后,对其负载均衡、网络开销、查询延迟和健壮性等性能进行了理论上的分析。接着,对一个采用PBZ技术的搜索引擎原型的架构设计和实现进行详细的论述。最后,通过仿真试验验证了PBZ搜索技术的可行性和优异的性能。
其他文献
伴随着国内外相关研究机构对高性能计算领域关注度的增强,处理器主频和芯片集成度得到极大地提升,目前由于芯片面积的限制以及集成度逐渐接近上限,处理器性能的提升遭遇瓶颈
对人脸的研究在身份验证,档案管理和可视化通讯等诸多领域有着巨大的应用前景。对于人脸的研究大致分为人脸检测,人脸跟踪和人脸识别三部分。人脸检测作为整个人脸分析过程的
随着仿真应用领域的不断拓展,分布式系统仿真技术已逐渐成为被广泛使用的主流技术。高层体系结构(High Level Architecture,HLA)成为了分布式仿真领域的标准体系结构。HLA重
现有的因特网基本上只提供尽力而为(Best-effort)服务,在这种服务模型下,所有的数据流(traffic)被“一视同仁”,公平地竞争网络资源。这对一些对带宽、延迟、延迟抖动等有特
协议分析仪是一种能够捕获网络中传输的数据并对其进行精确分析的网络设备。协议分析仪的主要用于捕获分析网络的流量,以便找出网络中存在的问题,进行网络健康检查,发现潜在
P2P(peer-to-peer)即点对点网络,是随着网络的普及以及追求网络信息资源的有效利用而产生的计算结构。P2P中节点(peer)是平等的,且可以同时作为服务器节点和客户端节点。虽然
自然背景中的文本识别具有巨大的应用价值。但由于场景非常复杂,字符又形态多样,其应用一直受限于定位和分割技术的不足。本文经过大量研究,提出了一种基于学习的自然场景中
随着网络技术的高速发展,人们对网络的传输信息种类和服务质量的要求越来越高。传统的网络管理是一种基于SNMP协议的集中式管理,它采用轮询机制,随着网络规模迅速扩大,它的时
随着计算机和通信技术的发展,无线广域网、无线城域网、无线局域网、卫星通信网、蓝牙网络等多种无线网络系统正逐步代替传统有线网络成为互联网接入的最后一跳。如何将这些
近年来,计算机及其相关技术的迅速发展及图形图像技术的日渐成熟,开创了数字图像处理的新时代,该技术也逐步渗入到医学领域中。借助计算机图像图形学、虚拟现实和计算机网络