基于时态主题模型的社区发现方法研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:su18tt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,各种类型的网络结构越来越复杂,用户难以直接从中发现有用的信息,因此对复杂网络的研究受到越来越多的国内外研究者的关注。研究人员发现大多数复杂网络都具有社区结构的共性。社区发现作为分析复杂网络结构的技术之一,通过发现网络中的社区结构,便于人们分析理解网络中的拓扑结构。同时现实生活中的网络结构总是随着时间的变化而变化。因此,通过追踪网络社区的演化,能够有效的了解社区结构的演变趋势。  本文通过分析目前复杂网络中的一些社区发现算法,发现传统的社区发现方法存在一些不足。为了能够更加准确的从大规模网络中发现社区结构,本文结合网络结构和节点的内容属性,提出了一种基于时态主题模型的社区发现方法。本文首先介绍了传统的一些主题模型和社区发现方法,分析比较各自存在的优缺点;然后在LDA主题模型的基础上引入引用论文信息和发表时间信息,根据动态主题模型划分时间片的思想,提出时态引用主题模型。再结合网络节点中用户的重要度,更加准确地获得各个时间段内作者的主题分布。最后克服传统的标签传播算法中没有考虑节点的内容属性以及标签更新过程的随机性等缺点,改进传统的标签传播算法,提出主题权重标签传播算法,发现各个时间段内不同主题下的社区结构,同时根据主题和社区结构随着时间的变化情况,分析演化过程。  本文以社交网络为背景,从用户对网络的影响出发,运用基于时态主题模型的社区发现方法对整个网络进行社区划分。本文首先根据DBLP文献数据集中论文作者之间的合作关系,构建作者合作网络的社交网络;然后利用论文标题、发表时间和论文作者信息,运用基于时态主题模型的社区发现方法,发现不同时间段内该网络下的社区结构并分析社区的演化情况。最后,对本文提出的方法进行实验验证,对主题模型的困惑度和社区发现的模块度指标进行对比和评估,证明了该方法在保证时间的前提下提高了社区发现结果的精确性。
其他文献
期刊
文章主要针对山西地区现存的古代壁画,分析古代壁画所具有的艺术性,了解其中蕴含的历史价值与美术价值,并对保护、修复工作展开探讨,分析壁画保护的一系列流程,提出了原地保
化学实验是化学课程的灵魂,又是进行科学探究的重要方式.在新一轮课程改革的推动下,各中学都在不断加强化学实验室的建设,为满足中学化学实验的需求,储备一定数量的化学仪器
近年来,生物特征识别技术受到了人们的普遍关注。与传统的基于物品的(例如身份证)或基于记忆的(例如密码)身份验证方式不同,生物特征是随身携带、不会丢失、不会被遗忘、不容
悠悠徐徐,一股新风扑面,叫人心神为之一振。这是近日喜读四川日报几条不起眼的短文带给我的感觉。这里试举二例。其一,载1986年9月3日,题为《望报考职中学生注意社会需求信
现今视频监控系统实时监控被监视对象的行为,在管理和监测城市的任务上具有越来越重要的地位,可以说是无处不在。而视频监控系统需要朝着智能化的方向前进,要尽可能地减少人工干预或完全自动化地完成所需的任务。智能视频监控技术主要是用计算机视觉的方法实现所需完成的视觉任务,例如场景中的目标定位、目标识别、目标跟踪等视觉任务,智能监控的过程不需要人为进行干预。智能视频监控技术在摄像机拍录的视频图像序列上进行自动
目前,中文信息处理的最大难题是如何实现汉语句子的自动标识。“句处理”主要分为单句处理和复句的处理,现在研究较多的是单句的处理。而复句是连接单句与篇章的桥梁,因而复
在化学计算中,随着形势的发展,又涌现出了一批新型的计算题——信息给予型计算题.本文谈谈信息给予型的无机化学计算题的类型及解题思路,供参考.一、有关滴定度的计算题例1滴
随着IT行业的发展,软件版权保护问题日益突出,由此需求而发展起来的软件版权保护技术也越来越受到人们的关注。其中的一款保护手段是基于软件水印的。软件水印技术是将拥有者的
近年来,随着片上多处理器(CMP)成为各种芯片设计的主流结构,如何提高串行程序的性能已成为迫待解决的问题。一些研究者提出了采用分布式动态可重构多核处理器(Distributed Dyna