基于Kademlia的FTP搜索引擎索引技术的研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:lb878719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于互联网资源的逐渐多样化与分布式存储,基于P2P技术的分布式FTP搜索引擎已成为FTP资源搜索的研究热点,其中,索引技术一直是提高FTP检索效率的关键。针对FTP资源检索对象的特点以及对等网络中的Kademlia模型存在的问题,本文提出了一种基于包含地理位置信息的Kademlia模型的分布式双字母倒排索引算法(a DistributedDouble-letters Inverted Indexing AlgorithmBased on a Containing Geographical Location Information Kademlia Model,简称为DGKAD)。为了提高资源检索效率,在DGKAD索引算法中,节点ID信息加入了节点的物理位置信息,从而改善了Kademlia层叠网(overlay network)逻辑结构和物理结构不匹配的问题,提高了网络通信效率,并且鉴于检索对象是字符长度较短的文件名,与基于标准Kademlia模型的DHT倒排索引算法(a DHTInverted Indexing AlgorithmBased on a Standard KademliaModel Based简称为DSKAD)相比,使用DGKAD索引算法可以避免分词,并提高了检索结果的查全率和准确率。最后,本文通过对DGKAD索引算法进行模拟仿真,结果表明,在FTP检索资源所需的逻辑路径跳数、检索查全率以及查准率各个方面,DGKAD索引算法具有消耗网络带宽少,资源定位速度快,查全率和查准率较高等方面的优点。
其他文献
计算机技术的发展,特别是网络技术发展,把IT技术推向了新的高度,甚至有人称其为第三次工业革命。随着人们对计算机要求越来越高,软件产品随着人们应用的增加,以井喷似的方式发展起
生物生态组合污水处理是将传统生物处理系统和生态处理系统联合起来对污水进行处理。如果能对其建立精确的污水处理模型,从而实现生物段生态段污水处理负荷的合理分配,在保证污
在如今信息爆炸的互联网时代,随着web文本数量的规模不断增大,人们要从这些海量的文本信息中快速有效地找到自己想要的信息,仅靠人工的分类方法是行不通的,而文本聚类技术正好凭
国民经济动员的目的是为了维护国家安全和非战争军事行动的需要,不断提高国民经济应急处理突发事件能力,将平时状态转换到战时状态时国民经济所进行的一系列活动,这个过程涉及军
自我复制是自然界中生物最基本的特点之一,是人工生命研究的重要内容。对自我复制的研究,不仅有助于探索生命的规律,促进生物学的发展,而且对新一代纳米计算机的实现起到推动作用
主题爬虫有选择性地采集互联网中网页资源,这些网页资源都必须是用户所给定主题相关的,即网页内容是用户所感兴趣的。在经典主题爬虫中,如果文档词项集与主题词项集没有相同词项
无线传感器网络(Wireless Sensor Networks, WSNs)是一种飞速发展的新兴网络,是将传感器节点随机部署在指定区域并自组织成的无线多跳通信网络。WSNs综合了传感、信息处理和嵌
随着计算机设备的不断更新换代和网络全球化的快速发展,数据库技术得到了越来越广泛的应用,数据库共享已经变成了一种普遍现象,越来越多的个人信息记录被不同的部门和机构大量收
近年来,无线传感器网络已经广泛应用于各种领域,且应用类型多种多样。无线传感器网络没有固定的基础设施,由一定数量的无线传感器组成。这些传感器节点是可移动的,带有RF收发器等
随着多媒体技术和计算机网络的发展,在数据库技术与计算机视觉的共同作用下,图像检索已经成数字图像处理的一个重要领域和研究热点。基于内容的图像检索技术优于传统的检索方法