论文部分内容阅读
资源检索是P2P系统研究的热点之一,无结构化P2P资源查找普遍采用以泛洪机制为主的方法,然而,随着查询请求在网络中转发次数的增加,网络拥塞和带宽浪费严重,查询效率得不到保障,资源检索问题仍然是大规模无结构化P2P网络中信息共享所要面临的挑战。针对以上问题,本文提出了一种基于语义聚类的资源查找策略LSCS (Local semantic clustering search),主要工作如下:在网络结构方面,本文建立了一个双层的纯分布式结构,这种结构的特点是无中心服务器,节点间是完全对等的关系,不会产生性能瓶颈和单点失败的问题。在资源表示和本地聚类方面,针对很多以DHT为基础的资源表示方法对语义表达的不准确这个问题,本文改进了资源向量模型(VSM),在节点内部将资源向量转换成语义向量,避免了用特征值相近来代替语义相近的缺点;针对高维语义向量聚类困难的情况,本文提出一种通过构造语义森林的算法CSF (construct semantic forest)来对本地资源进行聚类,构造语义节点层,在聚类过程中节点间无信息交换,没有消耗网络带宽,使得系统有很好的扩展性。在资源查找方面,针对无结构化P2P系统中查询请求转发的盲目性,本文受寻找相似节点思想的启发,提出在节点间建立相似链接的方法,将网络中包含相似资源的节点聚到一起,形成语义相近的节点集合,同时对这些相似链接进行动态优化,使得相似节点集合在物理网络上更接近。查询请求在转发时,本文定义并结合了定向模式和泛洪模式,并增设了动态TTL机制,进一步提高资源查找的成功率和效率最后,通过性能分析和仿真实验,表明本文提出的基于语义聚类的无结构化P2P资源查找策略是切实可行的,能够有效提高系统的搜索效率,并提高查找成功率