基于小世界模型的P2P网络文本检索

来源 :天津大学 | 被引量 : 0次 | 上传用户:sjay357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与集中式搜索引擎相比,构建在P2P网络上的文本检索系统在可扩展性、数据更新、维护成本和安全性等方面具有与生俱来的优势。由于P2P网络中的节点缺乏全局网络的拓扑知识,如何定位节点资源、减少网络节点之间的通信开销成为P2P网络中文本检索的核心问题。本文基于小世界模型研究了P2P网络中的文本检索问题,主要贡献如下:针对向量空间模型中文档矩阵高维稀疏的问题,提出了一个P2P网络节点文档向量降维的方法。该方法将文档中词频出现两次以上的词条作为文档的摘要信息,来表示节点文档内容,然后根据改进的STC算法为选出的词条建立了一个树状的层次结构。在计算文档向量相似度时,采用sigmoid函数为不同层次的词条赋予不同的权重。针对Gnutella网络中转发消息的泛洪问题,基于小世界模型提出了一种无结构P2P网络文本检索的方法。该方法中,P2P网络的每个节点都维护一定数量的短程连接邻居节点和长程连接邻居节点,由此来构建具有小世界特性的网络。邻居节点的更新策略是在节点的查询和应答交互过程中进行的,每次查询结束后,都会更新邻居节点文档向量中关键词的权重,使得节点能够动态地快速了解网络的拓扑情况和其他节点的文档内容。实验结果显示,与Gnutella网络相比,小世界P2P网络具有更大的聚类系数、较小的特征路径长度和更高的文本检索查全率。针对基于DHT技术的结构化P2P网络在不支持复杂查询、负载不平衡和路由效率低等方面的问题,根据Kleinberg小世界模型设计了一个结构化P2P网络协议(SPPSW协议)。在SPPSW协议中,内容相近的节点被划分到相同的节点类中,在节点类的内部,节点可以根据相似程度选择邻居,网络由一些相互连接节点类构成。节点类可以动态地调整节点类的大小,能够自组织地分裂、合并,节点类之间存在一些长程连接,缩短了查询路由步数。实验结果显示,随着网络规模的扩大,在SPPSW协议网络中,搜索开销呈对数平方曲线增长,维护开销呈线性增长;选择一个合适的节点类内部节点的数量,可以使得整体的网络维护开销和搜索开销最小。
其他文献
公路作为连接和推动地区经济发展纽带的作用日益突出。然而,由于公路展布于各种复杂的地质环境中,将不可避免地受到各类地质灾害的威胁和破坏。在山区公路地质灾害中,公路滑
目的:探讨原发性高血压患者脑钠肽变化及其临床意义。方法:用放射免疫分析79例原发性高血压(EH)患者和49例非高血压患者的脑钠肽(BNP)水平,并进行对照统计分析。结果:EH组血清BNP
公用企业通常具有自然垄断属性和社会公益性,这种特殊地位决定了它是市场中的危险力量。在传统的垄断经营模式下,公用企业随时可能损害公平竞争,危及行业本身和消费者,最终损害社
首先,根据振动形成的条件和原理,证明了经济系统价格波动具备形成周期性的条件。其次,通过建立理想经济振动模型,研究了经济系统波动周期的本质规律,提出经济系统价格波动周
期刊
目的研究长期服用低剂量阿斯匹林是否须根除幽门螺杆菌(Hp)。方法Hp阳性患者先行根除后与未根除者同时服用低剂量阿斯匹林(75mg/d),观察两组出现胃肠黏膜损伤情况。结果根除Hp后,服
本论文以提高野战炮兵装备车辆在信息化作战背景条件下的综合保障效能为目标,首先建立了信息系统基于结构化生命周期的面向对象的开发方法,引入管理对象、管理中心和管理域的概
目的 评价不同剂量胰岛素治疗糖尿病酮症酸中毒的疗效。方法 采用随机抽样、配对分组法,将86例糖尿病酮症酸中毒(DKA)患者分为三组,应用不同剂量的胰岛素进行治疗。结果 不同剂量
从大学教育看,计算机文化已经愈来愈多地融入了各专业科研和专业课的教学过程之中。计算机教学已成为素质教育的必要组成部分,良好的信息素养是当代大学生可持续发展的重要基础
各有关单位:为加强环境与健康学术交流,促进环境与健康学科发展,我会定于2019年6月在深圳召开第二届中国环境与健康大会(CCEH-2019)暨空气污染、气候变化与健康国际研讨会。
随着社会的文明与进步,有了轮椅的帮助,已经有越来越多的残疾人参与社会活动。而运动轮椅的出现,不仅拉近了他们和正常人之间的差距,使他们能像正常人一样享受生活的乐趣,更给他们