基于语义聚类的无结构化P2P资源查找策略

来源 :东北大学 | 被引量 : 0次 | 上传用户:johnason1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
资源检索是P2P系统研究的热点之一,无结构化P2P资源查找普遍采用以泛洪机制为主的方法,然而,随着查询请求在网络中转发次数的增加,网络拥塞和带宽浪费严重,查询效率得不到保障,资源检索问题仍然是大规模无结构化P2P网络中信息共享所要面临的挑战。针对以上问题,本文提出了一种基于语义聚类的资源查找策略LSCS (Local semantic clustering search),主要工作如下:在网络结构方面,本文建立了一个双层的纯分布式结构,这种结构的特点是无中心服务器,节点间是完全对等的关系,不会产生性能瓶颈和单点失败的问题。在资源表示和本地聚类方面,针对很多以DHT为基础的资源表示方法对语义表达的不准确这个问题,本文改进了资源向量模型(VSM),在节点内部将资源向量转换成语义向量,避免了用特征值相近来代替语义相近的缺点;针对高维语义向量聚类困难的情况,本文提出一种通过构造语义森林的算法CSF (construct semantic forest)来对本地资源进行聚类,构造语义节点层,在聚类过程中节点间无信息交换,没有消耗网络带宽,使得系统有很好的扩展性。在资源查找方面,针对无结构化P2P系统中查询请求转发的盲目性,本文受寻找相似节点思想的启发,提出在节点间建立相似链接的方法,将网络中包含相似资源的节点聚到一起,形成语义相近的节点集合,同时对这些相似链接进行动态优化,使得相似节点集合在物理网络上更接近。查询请求在转发时,本文定义并结合了定向模式和泛洪模式,并增设了动态TTL机制,进一步提高资源查找的成功率和效率最后,通过性能分析和仿真实验,表明本文提出的基于语义聚类的无结构化P2P资源查找策略是切实可行的,能够有效提高系统的搜索效率,并提高查找成功率
其他文献
基于P2P的分布式存储技术与传统的集中式存储技术相比,具有容量大,可扩展性好,负载均衡,成本低等优势,完全适应了信息社会的发展趋势,能够满足人们日益增长的存储需求。然而P
对文档进行语义哈希是一种比较常见的加速相似性查找的方法。所谓语义哈希就是将文档进行哈希编码,并且使得在语义上相似的文档能够被映射到相近的哈希编码,即具有较短的海明距
随着计算机、网络技术的飞速发展,以及计算机图形学理论的日渐完善,三维模型已经逐渐成为继声音、图像和视频之后的第四种多媒体数据类型。其数量更是呈现爆炸性的增长,由于
随着计算机技术的飞速发展,数字媒体产业的兴起,视频处理技术逐渐成为数字图像处理和数字媒体领域的研究热点。视频分割技术在视频处理技术中占有很重要的地位,是其它一些视
作为二十一世纪教育改革和发展的主旋律之一,教育信息化早已成为一个热门话题。随着高等教育扩招使各高校的在校学生人数成倍增长。如何能够充分利用紧缺的教学资源,提高其使
分类体系作为知识图谱的骨干组成部分,对整个知识图谱的易用性和连通性具有起到决定性的作用。随着知识图谱应用的日益广泛,国内外都不断涌现出优秀的知识图谱项目。如何为知
随着人类基因组计划的顺利完成,不断积累的巨量生物学数据和快速发展的信息学技术,给后基因组时代的生物信息学研究带来了新的挑战。近年来,随着微阵列技术的快速发展,DNA微
三维人体重建是计算机图形学和3D视觉领域一个非常重要的研究课题,同时也是工程领域一个富有挑战性的研究方向。本文提出了一种基于多视图的鲁棒人体三维重建方法。该方法通
随着网络技术的迅速发展,搜索引擎已经成为用户获取网络信息的主要途径。然而,传统的搜索引擎的返回结果比较单调,通常返回与查询相关的网页列表,而忽略了网页中所蕴涵的丰富
随着语义Web的迅速应用与发展,我们需要对海量数据信息进行搜索,而本体是共享概念模型的明确的形式化规范说明,是语义Web应用的基础,其构建的质量直接影响着搜索的查全率和查