信息网络拓扑结构与内容相关性研究

被引量 : 18次 | 上传用户:zhangbaichi001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及大大推动了社会信息的网络化进程。包括Web、博客、即时通信、P2P资源共享等各种信息网络迅速发展。对大规模信息网络的规律性特征发现、信息网络的建模、信息网络社区发现以及信息网络应用研究,例如高效率信息搜索与信息定位、信息内容的深度挖掘以及信息动态传播机制和信息扩散行为的分析等是信息网络研究的现实需求,也是极具挑战性的研究问题。本文在详细观察了Web网络的拓扑结构特征以及拓扑结构与内容分布相互关系的基础上,以信息网络的物理连接拓扑结构与节点内容相关度分布之间的相互关系为主线,从网络特征、网络建模、社区分析及相关应用方面问题进行了深入细致地探讨:首先在验证了前人提出的Web网络拓扑结构特征基础上,进一步发现了信息网络所具有的一些新特征:1)网络微观颗粒度的拓扑结构聚团与内容聚团存在明显的映射关系,具体包括节点之间的物理连边概率与节点之间的内容相关度成指数比例关系、节点形成三角形拓扑结构的概率与节点内容相关紧密程度之间同样具有一种指数比例关系;2)网络节点连接度整体分布与节点内容相关度整体分布是线性无关的;3)网络微观拓扑结构中的存在很强的集聚性(平均聚团系数很高)。其次,针对当前的Web网络模型无法解释拓扑结构与内容分布之间的映射关系,提出了一种融合节点知名度和节点相关度的Web网络演化模型(PRCP Model)。从模型的理论推导、演化学习验证以及大规模实验验证表明,该模型既能解释网络节点连接度的幂律分布规律,又能产生与真实网络相类似的微观拓扑集聚现象;而更重要的是,PRCP模型能够很好地拟合真实网络中存在的网络微观粒度拓扑聚团与内容聚团之间的映射关系。由此,我们可以进一步推测出信息网络中“微观层次的结构与内容构造规则共同决定了网络整体的物理结构和内容分布”这一规律性的结论。最后针对信息网络社区发现和社区关系分析的实际需求,分析了当前基于物理连边密度这种单一尺度社区研究的不足,提出了一种多尺度、概率化的信息社区概念。新的社区概念考虑了物理连边密度和节点之间属性相关度等多种尺度,以连边和消息转移概率来综合定义信息网络中的社区,并在此基础上提出了相应的社区发现算法。从而可以发现更有实际价值的信息网络社区结构。
其他文献
本文的研究对象是吐鲁番地区公元前6世纪至公元1世纪时期的墓葬。以吐鲁番地区这一时期的墓葬研究为出发点,结合其他地区文化的考古资料,探讨当时东西交通路线上多种文化的联
随着市场经济的不断完善,人们逐渐认识到会计报表的局限性。在基本会计报表之外提供其他辅助性的信息成为顺其自然的选择,会计报表附注也显得越来越重要,其长度已大大超过会
本文提供了一个基于一阶搜索优化的有限元模型修正方法.它只需利用结构模态试验的部分固有频率,就能获得较精确的有限元模型.文中附有某无人机上垂尾有限元模型修正的实例.根
随着塑料制品在工业和民用上的不断应用和普及,注塑机的市场需求也不断地在提高。注塑机是一种"私人定制化"很高的产品,如何快速有效的实现客户的需求一直是一个大问题。本文
第三腰椎横突综合征是指过长的第三腰椎横突受到反复牵拉损伤而引起的局限性压痛及一系列综合征。主要表现为腰痛、腰臀痛和腰腿痛,是临床常见疾病之一。祖国医学中虽然没有
多约束服务质量(QoS)路由是要求在多个约束条件下计算满足所有独立限制条件的可行路径.将这种NPC问题转化为一种带约束条件的多目标优化问题,根据多目标遗传算法的智能优化原
职业倦怠是近年来西方职业压力和心理健康研究中较为流行的一个概念。已有的研究表明,教师是职业倦怠的高发人群。教师职业倦怠将会对教师本人、学生、学校乃至整个社会产生
中文分词是中文信息处理的一个基础环节。在中文信息检索的文本处理阶段,也常用到这项技术。学术界关于分词技术的研究一直比较多,但是目前的研究大多是通用的分词算法,专门针对
合同民事欺诈是我国民事欺诈法律制度的重要组成部分。我国《合同法》有关合同民事欺诈的规定较《民法通 则》有所突破。分析合同民事欺诈的法律特征及其构成,了解合同民事欺
<正> 原发于肺内的横纹肌肉瘤极罕见。国内文献仅报告5例(尸检1例、手术病理证实者4例),国外约报告18例。我院经手术病理确诊1例,兹结合文献复习,进行讨论。 病例介绍 患者女