论文部分内容阅读
随着peer-to-peer(P2P)技术的不断发展和成熟,互联网中出现了很多大规模(用户量大,跨地理区域大)的P2P系统,这些系统在用户交流、资源搜索和共享、分布式计算、流媒体等领域都具有突出的优势。P2P系统中的很多用户具有相同或相似的兴趣爱好(我们定义为“属性”),把这些用户组织成社区,能优化P2P系统的逻辑结构,让其发挥更大的作用。当前的大部分P2P系统中都不存在这样的社区,而某些其他类似的产品,例如web社区、QQ群,yahoo群等,都是由用户自己创建社区、选择社区和加入社区的,peer的兴趣、特性也是用户自己定义的,这在很大程度上限制了削弱了社区的优势。
本文定义了两种属性,分别是个人属性和社区属性;定义了属性树,研究了如何从用户自身的信息中提取出用户的属性,并提出了属性权重树的概念;提出了集中式的P2P社区发现算法,算法简单易于实现;研究了分布式的P2P社区发现,并提出两种算法;研究了如何根据用户的属性,以及用户之间的查询、下载关联,来计算用户之间的相关度;最后,把属性提取和集中式算法应用到北大网络实验室的Maze系统中,以及用仿真实验实现了分布式的P2P社区发现算法,都取得了很好的效果。