基于流行度和中心度的内容网络社区发现方法

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:abel1500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络通常具有内部链接紧密,外部链接稀疏的特性,探索复杂网络社区发现方法对分析论文引用网络、万维网、蛋白质交互网络和交通网络等具有重要意义。复杂网络节点间不仅存在链接关系,节点上还常常附着有属性信息。链接关系和节点内容相结合的复杂网络社区发现由于其社区划分的准确性而越来越受到人们的重视。  本研究主要内容包括:⑴由于近年来发展的社区发现概率模型的可解释性,我们对现有的性能较好的基于节点中心度和流行度的社区划分链接模型PPL进行了扩展,给出了一种新的可以结合节点内容的组合模型PPL-DC。该模型不但解决了节点属性的选择性问题,同时充分利用了节点间的链接关系,提高了算法的精确度。⑵为了进一步改善PPL-DC模型的性能,在不以牺牲社区划分质量的情况下,我们使用了一种简单的基于相似性的稀疏化启发式方法对边进行分类,然后对每一个节点,只在稀疏图里保留部分边,以迸一步提高社区划分的精度。⑶将以上两种方法相结合,并通过多个实验验证,实验结果表明:新给出的PPL-DC模型优于单纯的链接模型和已有的链接和内容相结合的组合模型,并且通过稀疏化方法可以进一步改善社区划分的性能。最后用实验验证了影响运行时间的因素不仅仅是采用了稀疏化方法。
其他文献
建立维护可靠的、可扩展、低成本、高性能的分布式存储系统是云计算、大数据以及互联网公司应用后台基础的主要目标。分布式存储系统拥有着传统集中式存储所无法比拟的优势,
伴随着环境保护、绿色发展和可持续发展的要求,增加计算机系统的能量效率对于研究者、架构师、系统设计者和软件开发者等人而言已经变成了最有价值的研究热点之一。目前已经
模糊限制信息,又被称为不确定信息,是自然语言文本中经常出现的一种语言现象。模糊限制信息通常出现在下列的情况下:事实不能被确定,或者说话人在表达时有意的省略某些信息,使
随着计算机辅助设计(CAD)的迅速发展,现代工业生产设计已渐渐离不开计算机辅助几何设计技术(CAGD)的理论支持和应用。作为计算机辅助几何设计领域中一个重要方面,参数插值曲
增强现实是近年来一直受到追捧的一个研究热点,可以将一个真实场景中不存在的物体通过计算机生成虚拟图像,叠加到真实存在的场景图像中,虚拟信息与现实世界的完美融合,创造出
流体模拟被广泛应用于电影动画特效、工业设计等领域,从早期的高度场方法到近年来流行的基于物理的模拟方法,流体模拟方法迅速发展。流体模拟涉及内容广泛,除了常见的烟雾、水流
古语云,“秀才不出门,全知天下事”,意思是学识渊博的人,即使不出门,也清楚的知道外面的世界所发生的事情。在遥远的过去,此言犹如痴人说梦。然而科技的发展一日千里。计算机
最近几年,在传感器领域、电子信息领域中,数据量每天以很大的规模增长,其中科学界可以从这些大规模的数据量中提取很多有用的信息,并用这些信息智能决策很多问题。怎样从获得的源
随着信息化的快速发展,出现了一种现象:虽然应用系统在增多但是信息共享的程度却并没有相应的增大,出现这种现象的原因在于系统之间没有提供共享的调用接口。因为这些系统是在
随着我国核技术、核工业和建设行业的迅速发展,环境放射性污染对环境保护、公众安全的影响增加,其逐渐被民众重视。为有效减少放射性核素的危害,建立辐射环境监测系统对区域